System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用基因联合共病分析识别疾病的方法技术_技高网

一种用基因联合共病分析识别疾病的方法技术

技术编号:44370655 阅读:2 留言:0更新日期:2025-02-25 09:48
本发明专利技术公开了一种用基因联合共病分析识别疾病的方法,将两种或多种存在共性的疾病使用DESeq2进行差异表达基因(DEGs)的筛选和提取。随后,这一过程产生了疾病之间的共享基因。将共享DEG提交到DSigDB数据库,并检索相关药物分子。Cytoscape中的MCODE和CytoHubba应用程序用于鉴定中枢基因。采用机器学习算法,包括LASSO分析和随机森林分析,来识别潜在的特征基因,并通过ROC曲线进一步评估诊断潜力,最终确定特征中枢差异表达基因。本发明专利技术能够筛选出能够用于疾病的共病分析识别的特征中枢差异表达基因,有望帮助医生识别出更多潜在的病因,为患者提供更加精准的医疗服务。

【技术实现步骤摘要】

本专利技术涉及基因数据分析,特别涉及一种用基因联合共病分析识别疾病的方法


技术介绍

1、许多疾病虽然在表型上看似不同,但实际上可能共享某些共同的遗传基础或病理机制。近年来,随着基因组学技术的发展,人们开始意识到许多疾病之间存在着潜在的共性。这些共性可能源于共同的遗传变异、相似的环境暴露或是共有的病理生理过程。例如,epl和ep都是妊娠并发症的一部分,尽管它们有着不同的病理特点——前者发生在子宫内正常着床的胚胎未能成功发育,而后者则是受精卵在子宫以外的地方着床发育。然而,在实际临床中,很多患者并没有明确的病因,这使得临床医生难以提供针对性的治疗方案。

2、传统的遗传学研究多集中于单一疾病模型,即试图寻找与某一特定疾病密切相关的遗传变异。然而,这种方法在面对那些病因不明的复杂疾病时显得力不从心。特别是对于epl和ep这样涉及多因素影响的情况,单病种研究可能无法全面揭示其背后的遗传机制。此外,传统研究方法往往忽略了不同疾病之间的潜在关联性,这限制了我们对疾病本质的理解以及开发有效治疗手段的能力。

3、为了克服上述局限,近年来兴起了一种新的研究方法——基因联合共病分析(gene joint comorbidity analysis)。这种方法通过整合不同疾病患者的基因组数据,寻找存在于多种疾病中的共同遗传变异,从而揭示不同疾病间的潜在联系。通过这种综合分析,研究人员能够更准确地识别出那些在多种疾病中发挥作用的关键基因或生物标志物,进而为临床实践提供更为坚实的基础。因此需要开发一种用基因联合共病分析识别疾病的方法,以更加精准的进行疾病诊断,并最终改进现有的治疗策略。


技术实现思路

1、本专利技术的目的是提供一种用基因联合共病分析识别疾病的方法,能够筛选出能够用于疾病的共病分析识别的特征中枢差异表达基因,有望帮助医生识别出更多潜在的病因,为患者提供更加精准的医疗服务。

2、本专利技术的上述技术目的是通过以下技术方案得以实现的:

3、一种用基因联合共病分析识别疾病的方法,其特征在于,包括以下步骤:

4、s1、将两种或多种存在共性的疾病分别筛选具有显著差异化表达的基因,并在疾病之间删选相同的具有显著差异化表达的基因,得到共享差异表达基因;

5、s2、通过string数据库构建了上述所有疾病中共享差异表达基因的蛋白质相互作用网络,利用cytoscape插件mcode识别蛋白质相互作用网络中靠前的模块,将排名靠前的模块定义为核心模块,核心模块由多个共享差异表达基因组成;

6、s3、使用cytoscape 3.8.2中的cytohubba应用程序,采用了多种不同的算法来进行选择,从每种算法中选择了靠前的几个基因,并根据它们的出现频率对其进行了排序,将这几个基因与核心模块中的共享差异表达基因交叉,最终获得了多个中枢差异表达基因;

7、s4、基于dsigdb数据库,将上述中枢差异表达基因上传到数据库,预测了多种候选药物,按综合得分排序,使用autodock tools,进行top1药物与上述中枢差异表达基因的分子对接;

8、s5、对这上述中枢差异表达基因进行了lasso回归分析,以识别特征基因,进行随机森林分析,以获得多个差异基因的meandiscoverygini值,然后根据重要性对其进行排序,结合lasso回归和随机森林分析的结果,最终确定特征中枢差异表达基因;

9、s6、使用roc曲线评估特征中枢差异表达基因的诊断性能,最终特征中枢差异表达基因能够用于上述疾病的共病分析识别。

10、进一步优选的,步骤s1中,通过deseq2评估微分表达式,进行差异表达基因筛选。

11、进一步优选的,步骤s1中,以>1和fdr<0.05为临界标准,进行差异表达基因筛选。

12、进一步优选的,步骤s3中,所采用的算法包括mcc、mnc、epc、应力、dmnc、度、间度、瓶颈、聚类系数、偏心度、紧密度和辐射度。

13、进一步优选的,步骤s5中,lasso分析中使用的参数是α=1和λ。

14、进一步优选的,使用“randomforest”函数进行随机森林分析,选择最小误差作为mtry节点值,选择趋于稳定的图像值作为ntree。

15、综上所述,本专利技术具有以下有益效果:

16、其一、通过对差异表达基因(degs)的识别和功能富集分析,能够深入了解特定疾病状态下基因表达的变化模式及其生物学功能,例如炎症反应、免疫反应等,这有助于揭示疾病的潜在机制。

17、其二、构建蛋白质-蛋白质相互作用(ppi)网络并鉴定出关键的中枢基因(hubgenes),为我们提供了一种新的视角去理解复杂疾病的分子基础及调控网络,从而帮助识别治疗的新靶点。

18、其三、利用机器学习技术如lasso回归和随机森林分析,可以筛选出与疾病高度相关的特征基因,提高了疾病诊断的准确性和预测能力,为疾病的早期诊断、预后评估乃至个性化治疗策略的制定提供了强有力的科学依据和技术支持。

19、其四、结合实验验证和免疫细胞浸润分析,不仅证实了关键基因在疾病中的作用,还进一步揭示了免疫细胞在疾病进程中的动态变化及其与基因表达之间的关系。

本文档来自技高网...

【技术保护点】

1.一种用基因联合共病分析识别疾病的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤S1中,通过DESeq2评估微分表达式,进行差异表达基因筛选。

3.根据权利要求2所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤S1中,以>1和FDR<0.05为临界标准,进行差异表达基因筛选。

4.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤S3中,所采用的算法包括MCC、MNC、EPC、应力、DMNC、度、间度、瓶颈、聚类系数、偏心度、紧密度和辐射度。

5.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤S5中,LASSO分析中使用的参数是α=1和λ。

6.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征在于:使用“RandomForest”函数进行随机森林分析,选择最小误差作为mtry节点值,选择趋于稳定的图像值作为ntree。

【技术特征摘要】

1.一种用基因联合共病分析识别疾病的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤s1中,通过deseq2评估微分表达式,进行差异表达基因筛选。

3.根据权利要求2所述的一种用基因联合共病分析识别疾病的方法,其特征在于:步骤s1中,以>1和fdr<0.05为临界标准,进行差异表达基因筛选。

4.根据权利要求1所述的一种用基因联合共病分析识别疾病的方法,其特征...

【专利技术属性】
技术研发人员:刘爱霞景梦钰陈曦周颖
申请(专利权)人:浙江大学医学院附属妇产科医院浙江省妇女医院浙江省妇女保健院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1