一种基于双域转换特征提取模型的N糖图谱异常识别方法技术

技术编号:37666638 阅读:18 留言:0更新日期:2023-05-26 04:25
本发明专利技术公开了一种基于双域转换特征提取模型的N

【技术实现步骤摘要】
一种基于双域转换特征提取模型的N糖图谱异常识别方法


[0001]本专利技术涉及N糖组检测
,尤其涉及一种基于双域转换特征提取模型的N

糖组图谱异常识别方法。

技术介绍

[0002]糖基化修饰是蛋白质翻译后修饰的重要形式,约70%的蛋白需要经过糖基化修饰后,转移到细胞膜或分泌到细胞外行使功能。蛋白质N

糖基化是指将聚糖共价连接到蛋白质的天冬酰胺残基上,是细胞中最普遍的翻译后修饰类型。N

糖基化通过影响蛋白质构象、活性、运输、稳定性和与其他分子的相互作用来调节不同的细胞过程,在调节配体

受体相互作用、细胞间通讯、免疫反应、膜转运和细胞信号传导特别重要。N

糖蛋白组学就是以N

糖基化蛋白质为研究对象的科学,通过表征N

糖基化蛋白可以帮助人们了解机体生命活动过程的相关机制,更好的认识生命活动规律,为寻找疾病生物标志物和药物靶标提供了理论依据。
[0003]糖组泛指在特殊的时间、空间和环境下细胞和组织产生的所有糖链的集合。对比基因组、转录组和蛋白组的蓬勃发展,糖组研究受限于分析技术。近二十年来,由于分析技术的突飞猛进,糖组的研究也开始进入爆发期。包括质谱(M步骤)、毛细管电泳(CE)、高效液相色谱(HPLC)和凝聚素芯片等在内的新技术,推动了糖链新标志物在疾病领域的临床应用。临床应用场景中,操作简单、灵敏、可靠和高通量是决定检测能否大规模使用的先决条件。CE是以高压电场为驱动力,分离不同构型糖链的方法。只需微量样本,无需样本预处理,即可对样本进行高灵敏和高分辨率的检测,最终得到N

糖组图谱。
[0004]G

Te步骤t检测法(Glycan

Te步骤t)是基于DNA测序仪的毛细管微电泳技术(D步骤A

FACE),将血清样本中糖蛋白的N

糖链进行荧光标记后,用毛细管微电泳进行分离,通过测量荧光信号得到的N

寡糖链的含量从而得到N

糖组图谱。该检测技术具有灵敏度高、操作简单、微量(2ul血清)、重复性高、稳定性好、高通量(96

孔板)等其他糖链分析技术无法比拟的优点,适用于一般检验科室,可望用于临床推广使用。
[0005]然而在G

Te步骤t检测实际应用过程中受多因素的影响,会出现N

糖组图谱异常的问题,如果人工识别异常样本耗费大量时间成本且容易遗漏,因此提取糖组图谱中的特征,提高对N

糖组图谱异常样本的识别率,实现异常图谱的自动化识别,成为本领域技术人员急需解决的问题。

技术实现思路

[0006]本专利技术的目的是克服现有技术的不足,提供一种基于双域转换特征提取模型的N

糖组图谱异常识别方法,从而能自动化、标准化地实现N

糖组图谱异常检测。
[0007]为达到上述专利技术目的,本专利技术采用如下的技术方案。
[0008]一种基于双域转换特征提取模型的N

糖组图谱异常识别方法,包括如下步骤:
[0009]步骤1、对N糖组图谱数据进行采集和预处理;
[0010]步骤2、将处理后的数据输入到双域转换特征提取模型中;
[0011]步骤3、对双域转换模型输出异常图谱识别结果。
[0012]优选的,所述步骤1包括:
[0013]步骤101、通过实验与糖组荧光电泳,获取待检测样本的糖组图谱数据;
[0014]步骤102、采用样条插值法修补因采集设备异常产生的缺失值数据;
[0015]步骤103、对齐原始数据中的特征峰;
[0016]步骤104、截取原始数据中特征峰前后的重要数据段。
[0017]优选的,所述步骤2中双域转换特征提取模型包含两部分,第一部分为时域数据和频域数据转化机制,第二部分为频域特征构造和异常阈值设定。
[0018]优选的,所述步骤2包括:
[0019]步骤201、时域信号和频域的双域信号转换;
[0020]步骤202、频域信号转换,转换公式为:
[0021][0022]式中,x(n)表示N糖组图谱的时域信号,Y(jf)表示N糖组图谱的频域信号,通过转换公式,将N糖组图谱的时域信号转化为频域信号;
[0023]步骤203、频域特征提取,提取公式为:
[0024][0025]式中,F表示所设计的特征指标,λ表示指标调节因子,Y(k)表示图谱信号x(n)对应的频谱信号,k表示频谱信号的谱线数(k=1,2,

,N);f
k
表示第k根谱线对应的幅值;N糖组图谱质控指标构建过程中,通过改变调节因子大小,加剧正常图谱和异常图谱的特征值之间的差异,实现N糖组图谱异常的识别;
[0026]步骤204、异常特征阈值设定,公式为:
[0027]Threshold=μF
±
3σF
[0028]式中,μ和σ分表示特征指标F的均值和方差,设计的N糖组图谱质控指标是一个服从正态分布的变量,根据3σ标准,正态分布中99.74%的数据点分布在μ
±
3σ内,当单个图谱的特征值超过阈值时,则认为该N糖组图谱存在异常。
[0029]与现有技术相比,本专利技术具有如下有益效果:
[0030](1)本专利技术的基于双域转换特征提取模型的N

糖组图谱异常识别方法通过对血液数据时域和频域之间的相互转换,构建N

糖组图谱特征,并通过对所提特征的分析,实现异常信号的识别。
[0031](2)本专利技术的N

糖组图谱异常识别方法能自动化、标准化地实现N

糖组图谱异常检测,通过对频域信号特征提取,实现肝脏血液健康监测指标的构建。
[0032](3)本专利技术的N糖组图谱质控指标构建过程中,通过改变调节因子大小,加剧正常图谱和异常图谱的特征值之间的差异,方便快速的实现N糖组图谱异常的识别。
附图说明
[0033]图1为本专利技术的实施步骤流程图;
[0034]图2为N

糖组图谱原始信号;
[0035]图3为经过预处理后的N

糖组图谱;
[0036]图4为N糖组异常图谱识别结果图。
具体实施方式
[0037]下面结合附图对本专利技术的技术方案作进一步的详细说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0038]如图1所示,本专利技术公开了一种基于双域转换特征提取模型的N

糖组图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双域转换特征提取模型的N

糖组图谱异常识别方法,其特征在于,包括如下步骤:步骤1、对N糖组图谱数据进行采集和预处理;步骤2、将处理后的数据输入到双域转换特征提取模型中;步骤3、对双域转换模型输出异常图谱识别结果。2.根据权利要求1所述的基于双域转换特征提取模型的N

糖组图谱异常识别方法,其特征在于,所述步骤1包括:步骤101、通过实验与糖组荧光电泳,获取待检测样本的糖组图谱数据;步骤102、采用样条插值法修补因采集设备异常产生的缺失值数据;步骤103、对齐原始数据中的特征峰;步骤104、截取原始数据中特征峰前后的重要数据段。3.根据权利要求1所述的基于双域转换特征提取模型的N

糖组图谱异常识别方法,其特征在于,所述步骤2中双域转换特征提取模型包含两部分,第一部分为时域数据和频域数据转化机制,第二部分为频域特征构造和异常阈值设定。4.根据权利要求1所述的基于双域转换特征提取模型的N

糖组图谱异常识别方法,其特征在于,所述...

【专利技术属性】
技术研发人员:陈翠英周郁文张方红
申请(专利权)人:江苏先思达生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1