本发明专利技术提供一种基于分子间相对差异性变化的网络构建方法,利用机体不同状态下分子间差异性表达和相关性差异性变化,构建表征机体癌变的关键生物网络,探究抗坏血酸对于肺癌以及新型冠状病毒的治疗机制。包括:将肺癌的基因组学数据特征集合1、新型冠状病毒以及抗坏血酸相关的基因特征2、特征集合3取交集,作为输入特征集合F;计算一对特征f
【技术实现步骤摘要】
一种基于分子间相对差异性变化的网络构建方法
[0001]本专利技术涉及生物数据分析
,特别涉及一种基于分子间相对差异性变化的网络构建方法。
技术介绍
[0002]生命机体是一个复杂的网络系统,不同分子间相互关联、相互作用,协同完成各项生理功能。系统探究不同分子间关联关系的变化对于深入理解疾病的发生发展机制和治疗方案的研究具有重要的现实意义。高通量技术的快速发展为研究者们提供了更为丰富的分子信息,然而,也给数据分析带来了巨大的挑战,例如高维小样本引起的过拟合问题。此外,由于样本数量相对较少,单个样本质量的波动会影响数据分析结果的真实性,严重阻碍关键生物信息的筛选和临床应用研究的发展。为发现有效的生物信息可以用于指导在新冠病毒流行下肺癌患者临床管理方案的实施,本专利技术利用不同生理病理状态下分子间差异性表达并结合相关性的差异性变化研制新的网络构建方法,探究机体癌变过程中通路反应活动的异常,分析抗坏血酸治疗肺癌以及新型冠状病毒的基因靶点和作用机制。基于所得的生物网络信息,重点关注位于生化反应活动枢纽位置的基因,从而可以发现更为有效的生物信息用于指导肺癌患者临床管理方案的实施,助力提高肺癌患者的临床治疗效果。此外,本专利技术可以有效减少单个样本质量波动对于数据分析结果的影响,有助于积极推动生物信息学、数据挖掘、转化医学等多个相关学科的进一步发展。
技术实现思路
[0003]为了解决
技术介绍
提出的技术问题,本专利技术提供一种基于分子间相对差异性变化的网络构建方法,利用机体不同状态下分子间差异性表达和相关性的差异性变化,构建表征机体癌变的关键生物网络,探究抗坏血酸对于肺癌以及新型冠状病毒的治疗机制。
[0004]为了达到上述目的,本专利技术采用以下技术方案实现:
[0005]一种基于分子间相对差异性变化的网络构建方法,包括如下步骤:
[0006]1)输入肺癌的基因组学数据,数据包含样本集合与基因特征集合,其基因特征集合记为特征集合1。
[0007]2)利用NCBI数据库查找与新型冠状病毒以及抗坏血酸相关的基因,其基因特征集合分别记为特征集合2和特征集合3。
[0008]3)将特征集合1、特征集合2以及特征集合3取交集,将交集基因作为输入特征集合F。
[0009]4)根据公式(1)计算一对特征f
i
和f
j
在一类样本和另一类样本中事件f
i
<f
j
发生的概率p
ij
(c1)和p
ij
(c2)。
[0010]p
ij
(c
l
)=pr(f
it
<f
jt
|y
t
=c
l
,t=1,2,3
…
,n),l=1,2
ꢀꢀ
(1)
[0011]其中c
l
表示第l类样本的类别名称,c1和c2分别表示正常组和疾病组,f
it
和f
jt
表示特征f
i
和f
j
在第t个样本上的表达值,y
t
表示第t个样本的类标,n表示样本个数。
[0012]5)根据公式(2)计算一对特征f
i
和f
j
在一类样本和另一类样本中的相关性。
[0013][0014]其中μ
il
,μ
jl
为特征f
i
和f
j
在c
l
类样本上的均值;σ
il
,σ
jl
为特征f
i
和f
j
在c
l
类样本上的标准差,n
l
表示c
l
类的样本个数。
[0015]6)根据公式(3)计算一对特征f
i
和f
j
的差异性变化得分Score
ij
:
[0016][0017]其中分子表示不同生理病理状态下一对特征f
i
和f
j
在表达值上的差异性变化,该对特征表达值差异性越大,分子的绝对值越大,反之亦然;分母表示一对特征f
i
和f
j
的相关性差异变化,该对特征相关性差异越大,分母的绝对值越小,反之亦然;Score
ij
值越大,表明特征f
i
和f
j
之间所对应的生化反应活动越剧烈,越有可能成为癌症诊断、预后以及治疗的关键因素。
[0018]在网络中,以单基因特征作为网络结点,衡量一对基因在不同生理病理状态下的差异性变化得分Score
ij
,当Score
ij
大于等于设定阈值时,则一对特征f
i
和f
j
对应的两个网络结点间存在一条连边。
[0019]进一步地,还包括网络分析方法,包括如下:
[0020]为筛选有效用于肺癌临床诊断、预后以及治疗的标志物,本专利技术重点关注机体癌变过程中的核心基因。度最大的结点表明该分子参与多条通路反应活动,处于中心枢纽位置,在机体的生理病理变化中起着重要的生物学作用。本专利技术提取网络图G中度最大的k个结点作为指导肺癌患者临床管理的关键生物信息,用于肺癌的诊断、预后以及治疗。
[0021]与现有技术相比,本专利技术的有益效果是:
[0022]本专利技术利用不同生理病理状态下分子间差异性表达以及相关性的差异性变化构建表征肺癌发生发展的生物网络,并深入探究抗坏血酸对于新冠病毒的肺癌患者的治疗机制和作用靶点,从而提高肺癌患者临床诊断、预后以及治疗效果。分子间差异性表达和相关性的差异性变化两种统计方法可以有效消除单一样本质量波动对数据分析结果的影响,因此,本专利技术可以筛选出真实有效的临床潜在性标志物用于指导新冠病毒的肺癌患者的临床管理,以期提高肺癌患者的生存率,并且有助于积极推动生物信息学、数据挖掘、转化医学等多个相关学科的进一步发展。
附图说明
[0023]图1为本专利技术所选标志物在发现集上的生存曲线图;
[0024]图2为本专利技术所选标志物在验证集1上的生存曲线图;
[0025]图3为本专利技术所选标志物在发现集上区分肺癌样本和健康样本的实验结果;
[0026]图4为本专利技术所选标志物在发现集上区分早期肺癌样本和健康样本的实验结果。
具体实施方式
[0027]以下结合附图对本专利技术提供的具体实施方式进行详细说明。
[0028]基因之间相互关联、相互作用,当机体出现生理、病理变化时,发生扰动的不仅仅
是一个基因,而是整个基因模块或网络。本专利技术提出了一种基于分子间相对差异性变化的网络构建方法NNCM
‑
MDC,从网络的角度系统分析基因反应活动在肺癌发生发展中的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于分子间相对差异性变化的网络构建方法,其特征在于,包括如下步骤:1)输入肺癌的基因组学数据,数据包含样本集合与基因特征集合,其基因特征集合记为特征集合1;2)利用NCBI数据库查找与新型冠状病毒以及抗坏血酸相关的基因,其基因特征集合分别记为特征集合2和特征集合3;3)将特征集合1、特征集合2以及特征集合3取交集,将交集基因作为输入特征集合F;4)根据公式(1)计算一对特征f
i
和f
j
在一类样本和另一类样本中事件f
i
<f
j
发生的概率p
ij
(c1)和p
ij
(c2);p
ij
(c
l
)=pr(f
it
<f
jt
|y
t
=c
l
,t=1,2,3
…
,n),l=1,2
ꢀꢀꢀꢀꢀ
(1)其中c
l
表示第l类样本的类别名称,c1和c2分别表示正常组和疾病组,f
it
和f
jt
表示特征f
i
和f
j
在第t个样本上的表达值,y
t
表示第t个样本的类标,n表示样本个数;5)根据公式(2)计算一对特征f
i
和f
j
在一类样本和另一类样本中的相关性;其中μ
il
,μ
jl
为特征f
i
和f
j
在c
l
类样本上的均值;σ
...
【专利技术属性】
技术研发人员:黄鑫,苏本哲,王星宇,
申请(专利权)人:鞍山师范学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。