当前位置: 首页 > 专利查询>吉林大学专利>正文

肿瘤驱动基因识别方法及装置制造方法及图纸

技术编号:27979890 阅读:28 留言:0更新日期:2021-04-06 14:15
本申请公开了一种肿瘤驱动基因识别方法及装置。该方法包括基于样本基因构建共表达网络;根据不同时期的共表达网络的相关性变化通过对比共表达网络间的变化得到共表达变化网络;对共表达变化网络进行连通分量分析得到最大连通分量网络;根据最大连通分量网络获取肿瘤驱动基因。本申请通过构建共表达网络得到更全面的基因间的相互作用进而分析基因参与的癌症发展过程,并基于共表达变化模式划分得到共表达变化网络,对共表达变化网络进行连通分量分析以减少零散网络的干扰,并结合中心性度量指标获取肿瘤驱动基因,以提高识别肿瘤驱动基因的精准性。

【技术实现步骤摘要】
肿瘤驱动基因识别方法及装置
本申请涉及肿瘤基因的计算机分析
,特别的涉及一种肿瘤驱动基因识别方法及装置。
技术介绍
肿瘤是一种复杂的疾病,其发病过程是一个阶段性发展的过程,其初期表现为肿瘤细胞自身的异常增长,在发展过程中表现为对邻近正常组织的侵犯以及经血管、淋巴管和体腔转移到其他部位,并经过一系列病理生理的变化最终导致个体死亡。由于大多数技术目前还无法找出驱动肿瘤发生发展过程的关键基因,因此现在研究的重点倾向于获取肿瘤发展的驱动基因。我们发现,现有肿瘤驱动基因的挖掘多基于差异表达分析,但由于基因的差异表达往往在相同阶段的肿瘤样本中稳定性不高,且不同阶段间特异性不强,因此基于差异表达分析的分类性能并不令人满意,也很难实际应用于分析肿瘤的发展。
技术实现思路
本申请实施例提供了一种肿瘤驱动基因识别方法及装置,可更全面性的反应基因间的相互作用以及基因参与的生物过程,通过连通分量分析以减少零散网络的干扰,并结合中心性度量指标获取肿瘤驱动基因,以提高识别肿瘤驱动基因的精准性。第一方面,本申请实施例提供了一种肿瘤驱动基因识别方法,包括:基于样本基因构建共表达网络;样本基因包括正常时期的样本基因及肿瘤四个时期的样本基因;根据不同时期的共表达网络的相关性通过对比共表达网络间的变化得到共表达变化网络;共表达变化网络用于表征与癌症发展密切相关的样本基因的相关性变化趋势;对共表达变化网络进行连通分量分析得到最大连通分量网络;根据最大连通分量网络获取肿瘤驱动基因。r>在本申请实施例中,通过构建共表达网络可更全面的反应基因间的相互作用以及基因参与的生物过程,并基于共表达变化模式划分得到共表达变化网络,对共表达变化网络进行连通分量分析以减少零散网络的干扰,并结合中心性度量指标获取肿瘤驱动基因,以提高识别肿瘤驱动基因的精准性。在第一方面的一种可选方案中,基于样本基因构建共表达网络具体包括:获取不同时期的样本基因的样本数;对不同时期的样本基因的样本数进行采样,采样的个数基于不同时期的样本基因的样本数中最小的样本数确定;基于采样得到的不同时期的样本基因构建对应不同时期的共表达网络。在第一方面的又一种可选方案中,基于采样得到的不同时期的样本基因构建对应不同时期的共表达网络具体包括:基于采样得到的不同时期的样本基因构建对应不同时期的初始共表达网络;基于不同时期的初始共表达网络得到对应于不同时期的P值网络;根据不同时期的初始共表达网络及对应于不同时期的P值网络得到不同时期的共表达网络。在第一方面的又一种可选方案中,根据不同时期的共表达网络的相关性通过对比共表达网络间的变化得到共表达变化网络具体包括:对相邻时期的所述共表达网络进行相关性比较,得到所述肿瘤四个时期的四个共表达变化网络;基于所述肿瘤四个时期的四个共表达变化网络得到两个共表达变化网络;其中,共表达变化网络包括呈现递增的共表达变化网络及呈现递减的共表达变化网络。在第一方面的又一种可选方案中,对共表达变化网络进行连通分量分析得到最大连通分量网络具体包括:基于共表达变化网络得到每个样本基因所在连通分量中连接的样本基因数量;将样本基因数量最大的样本基因所在的所述连通分量作为最大连通分量;根据最大连通分量得到最大连通分量网络。在第一方面的又一种可选方案中,根据最大连通分量网络获取肿瘤驱动基因具体包括:计算最大连通分量网络中各个样本基因的中心性指数;基于各个样本基因的中心性指数确定肿瘤驱动基因。在第一方面的又一种可选方案中,中心性指数包括度中心性指数、紧密中心性指数及中介中心性指数。在第一方面的又一种可选方案中,基于超几何分布对肿瘤驱动基因进行富集分析。第二方面,本申请实施例提供了一种肿瘤驱动基因识别装置,包括:建立模块,用于基于样本基因构建共表达网络;样本基因包括正常时期的样本基因及肿瘤四个时期的样本基因;划分模块,用于根据不同时期的共表达网络的相关性通过对比共表达网络间的变化得到共表达变化网络;共表达变化网络用于表征与癌症发展密切相关的样本基因的相关性变化趋势;分析模块,用于对共表达变化网络进行连通分量分析得到最大连通分量网络;获取模块,用于根据最大连通分量网络获取肿瘤驱动基因。第三方面,本申请实施例还提供了一种肿瘤驱动基因识别装置,包括处理器、存储器以及通信接口;所述处理器与所述存储器、所述通信接口相连;所述存储器,用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行第一方面或第一方面的任意一种实现方式提供的肿瘤驱动基因识别方法。第四方面,本申请实施例还提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,可实现本申请实施例第一方面或第一方面的任意一种实现方式提供的肿瘤驱动基因识别方法。可以理解的,上述提供的第四方面提供的计算机存储介质,用于执行第一方面或第一方面的任意一种实现方式所提供的肿瘤驱动基因识别方法,因此,其所能达到的有益效果可参考第一方面或第一方面的任意一种实现方式所提供的肿瘤驱动基因识别方法中的有益效果,此处不再赘述。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种肿瘤驱动基因识别方法的流程示意图;图2为本申请实施例提供的一种构建共表达网络的流程示意图;图3为本申请实施例提供的一种共表达网络的示意图;图4为本申请实施例提供的一种共表达变化网络的示意图;图5为本申请实施例提供的一种反应共表达关系的变化趋势的示意图;图6为本申请实施例提供的又一种反应共表达关系的变化趋势的示意图;图7为本申请实施例提供的一种最大连通分量的矩阵示意图;图8为本申请实施例提供的一种肿瘤驱动基因识别装置的结构示意图;图9为本申请实施例提供的又一种肿瘤驱动基因识别装置的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。请参阅图1本文档来自技高网...

【技术保护点】
1.一种肿瘤驱动基因识别方法,其特征在于,包括:/n基于样本基因构建共表达网络;所述样本基因包括正常时期的样本基因及肿瘤四个时期的样本基因;/n根据不同时期的所述共表达网络的相关性通过对比所述共表达网络间的变化得到共表达变化网络;所述共表达变化网络用于表征所述与癌症发展密切相关的样本基因的相关性变化趋势;/n对所述共表达变化网络进行连通分量分析得到最大连通分量网络;/n根据所述最大连通分量网络获取肿瘤驱动基因。/n

【技术特征摘要】
1.一种肿瘤驱动基因识别方法,其特征在于,包括:
基于样本基因构建共表达网络;所述样本基因包括正常时期的样本基因及肿瘤四个时期的样本基因;
根据不同时期的所述共表达网络的相关性通过对比所述共表达网络间的变化得到共表达变化网络;所述共表达变化网络用于表征所述与癌症发展密切相关的样本基因的相关性变化趋势;
对所述共表达变化网络进行连通分量分析得到最大连通分量网络;
根据所述最大连通分量网络获取肿瘤驱动基因。


2.根据权利要求1所述的方法,其特征在于,所述基于样本基因构建共表达网络具体包括:
获取不同时期的样本基因的样本数;
对所述不同时期的样本基因的样本数进行采样,所述采样的个数基于所述不同时期的样本基因的样本数中最小的样本数确定;
基于采样得到的所述不同时期的样本基因构建对应不同时期的共表达网络。


3.根据权利要求2所述的方法,其特征在于,所述基于采样得到的所述不同时期的样本基因构建对应不同时期的共表达网络具体包括:
基于采样得到的所述不同时期的样本基因构建对应不同时期的初始共表达网络;
基于所述不同时期的初始共表达网络得到对应于不同时期的P值网络;
根据所述不同时期的初始共表达网络及所述对应于不同时期的P值网络得到不同时期的共表达网络。


4.根据权利要求1所述的方法,其特征在于,所述根据不同时期的所述共表达网络的相关性通过对比所述共表达网络的变化得到共表达变化网络具体包括:
对相邻时期的所述共表达网络进行相关性比较,得到所述肿瘤四个时期的四个共表达变化网络;
基于所述肿瘤四个时期的四个共表达变化网络得到两个共表达变化网络;
其中,所述共表达变化网络包括呈现递增的共表达变化网络及呈现递减的共表达变化网络。


5.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:孙慧妍姜弘扬王志航
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1