一种基于多组学的复杂性疾病预测及诊断方法技术

技术编号:15330146 阅读:88 留言:0更新日期:2017-05-16 13:40
本发明专利技术涉及一种基于多组学的复杂性疾病预测及诊断方法,包括:获取被试者的第一基因组信息;将第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算第一基因组信息对应的复杂性疾病判别评分CDDS值;比较CDDS值与预存的CDDS基准值的大小关系,得到比较结果;根据比较结果,确定被试者患所检测复杂性疾病的概率,从而可以对被试者是否患有所检测复杂性疾病进行预防和早期诊断,提高人群的健康水平,推进了从治病到防病的进程。

A complexity based disease prediction and diagnosis method based on multi omics

The invention relates to a more complex disease proteomics prediction and diagnosis methods, including: the first genome information acquisition based on subjects; to match the information relevance information has been obtained with the first genome genome variants and complex diseases, calculate the first base due to the high complexity of disease group information of the corresponding discriminant score CDDS value; comparison of CDDS values of relationship with the pre stored reference value of CDDS, to obtain a comparison result; according to the results, the subjects were to determine the detection probability of complex diseases, which can be the subjects suffering from complex disease prevention and detection to early diagnosis, improve the health level of people, promote the cure from diseases the process of.

【技术实现步骤摘要】
一种基于多组学的复杂性疾病预测及诊断方法
本专利技术涉及医学领域,尤其涉及一种基于多组学的复杂性疾病预测及诊断方法。
技术介绍
人类的疾病按照与遗传的关系分为两大类,孟德尔遗传性疾病和非孟德尔遗传性疾病,即:简单性疾病和复杂性疾病。前者更多属于少见病,且多数可以找到明确的遗传相关致病基因,并且发病情况符合孟德尔遗传规律,可以根据经典的基因遗传规律对疾病的发生进行较为准确的预测及诊断。而后者更多属于常见病,没有明显的孟德尔遗传现象,但有一定的遗传易感性,往往存在较多的疾病易感基因,无法通过经典的基因遗传规律对疾病的发生进行预测及诊断,如:肿瘤、糖尿病、结核病等。本申请专利主要针对复杂性疾病的预测和诊断提出可行的技术解决方案。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种基于多组学的复杂性疾病预测及诊断方法。本专利技术解决上述技术问题的技术方案如下:一种基于多组学的复杂性疾病预测及诊断方法,其特征在于,包括以下步骤:步骤1、获取被试者的第一基因组信息;步骤2、将所述第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算所述第一基因组信息对应的复杂性疾病判别评分CDDS值;步骤3、比较所述CDDS值与预存的CDDS基准值的大小关系,得到比较结果;步骤4、根据所述比较结果,确定所述被试者患所检测复杂性疾病的概率。本专利技术的有益效果是:通过将被试者的基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算该基因组信息对应的CDDS值,并比较CDDS值与预存的CDDS基准值的大小关系确定被试者患所检测复杂性疾病的概率,从而可以对被试者是否患有所检测复杂性疾病进行预防和早期诊断,提高人群的健康水平,推进了从治病到防病的进程。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步地,步骤4包括:当所述比较结果为所述CDDS值大于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率超过85%;或者,当所述比较结果为所述CDDS值小于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率低于15%。进一步地,在步骤1之前,还包括:步骤5、根据获取的健康人群基因组信息和目标疾病人群基因组信息,获得基因组变异位点与复杂性疾病关联性信息。进一步地,步骤5包括:步骤5.1、获取所述健康人群基因组信息和所述目标疾病人群基因组信息;步骤5.2、基于多组学构建目标疾病对应的多个模型;步骤5.3、分别将所述健康人群基因组信息和所述目标疾病人群基因组信息与所述多个模型进行映射,得到健康人群模型集合与目标疾病人群基模型集合;步骤5.4、对于所述多个模块中的每个模型,分别计算所述健康人群模型集合与所述目标疾病人群基模型集合中属于同一模型的第二基因组信息对应的CDDS值,得到多个所述第二基因组信息分别对应的多个CDDS值;步骤5.5、将多个所述第二基因组信息和多个所述CDDS值一一对应的存储,形成基因组变异位点与复杂性疾病的关联性信息,所述关联性信息为所述基因组信息与CDDS值的对应关系。进一步地,所述第一基因组信息、所述健康人群基因组信息和所述目标疾病人群基因组信息均通过芯片技术和/或测序技术获取。进一步地,步骤5还包括:步骤5.6、利用模型预测评价方法,计算多个所述CDDS值对应的多个受试者工作特征ROC曲线,以及与多个所述ROC曲线分别对应的多个AUC;步骤5.7、将多个所述ROC曲线中的第一ROC曲线所对应的模型确定为最优模型,所述最优模型对应的CDDS值为所述CDDS基准值,其中,所述第一ROC曲线的敏感性和特异性均大于85%,且所述第一ROC曲线对应的AUC大于90%。采用上述进一步方案的有益效果是:通过从利用模型预测评价方法计算得到的多个CDDS值对应的多个ROC曲线中的第一ROC曲线所对应的模型确定CDDS基准值,从而可以有效的提高复杂性疾病诊断的准确性。进一步地,利用朴素贝叶斯算法计算所述CDDS值。进一步地,利用朴素贝叶斯算法计算所述CDDS值,包括:计算所述被试者患所述复杂性疾病时第一基因变异的概率P1、所述被试者不患所述复杂性疾病时所述第一基因变异的概率P2,以及所述复杂性疾病的发病概率P3和不发病概率P4;根据所述P1、P2、P3和P4,计算所述CDDS值。进一步地,根据以下公式计算所述CDDS值:其中,Nυ为所述模块模型所包含的全部基因变异的数量。本专利技术附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术实践了解到。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种基于多组学的复杂性疾病预测及诊断方法的示意性流程图;图2为本专利技术另一实施例提供的一种基于多组学的复杂性疾病预测及诊断方法的示意性流程图;图3为本专利技术另一实施例提供的一种基于多组学的复杂性疾病预测及诊断方法的示意性流程图;图4为本专利技术实施例提供的第一ROC曲线示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。如图1所示的一种基于多组学的复杂性疾病预测及诊断方法100包括:110、获取被试者的第一基因组信息。具体的,在该实施例中,可以通过芯片技术和/或测序技术获取第一基因组信息,但本专利技术实施例并不局限于此。120、将第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算第一基因组信息对应的复杂性疾病判别评分CDDS值。具体的,在实施例中,复杂性疾病判别评分(ComplexDiseaseDiscriminationScore,CDDS)可以利用朴素贝叶斯算法计算,用来衡量被试者患所检测复杂性疾病的概率大小。130、比较CDDS值与预存的CDDS基准值的大小关系,得到比较结果。140、根据比较结果,确定被试者患所检测复杂性疾病的概率。上述实施例中提供的一种基于多组学的复杂性疾病预测及诊断方法,通过将被试者的基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算该基因组信息对应的CDDS值,并比较CDDS值与预存的CDDS基准值的大小关系确定被试者患所检测复杂性疾病的概率,从而可以对被试者是否患有所检测复杂性疾病进行预防和早期诊断,提高人群的健康水平,推进了从治病到防病的进程。具体的,在该实施例中,步骤140中,当比较结果为CDDS值大于CDDS基准值时,确定被试者患所检测复杂性疾病的概率超过85%。或者,当比较结果为CDDS值小于CDDS基准值时,确定被试者患所检测复杂性疾病的概率低于15%。需要说明的是,在该实施例中,利用朴素贝叶斯算法计算CDDS值的具体过程如下:计算被试者患复杂性疾病时第一基因变异的概率P1、被试者不患复杂性疾病时第一基因变异的概率P2,以本文档来自技高网...
一种基于多组学的复杂性疾病预测及诊断方法

【技术保护点】
一种基于多组学的复杂性疾病预测及诊断方法,其特征在于,包括以下步骤:步骤1、获取被试者的第一基因组信息;步骤2、将所述第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算所述第一基因组信息对应的复杂性疾病判别评分CDDS值;步骤3、比较所述CDDS值与预存的CDDS基准值的大小关系,得到比较结果;步骤4、根据所述比较结果,确定所述被试者患所检测复杂性疾病的概率。

【技术特征摘要】
1.一种基于多组学的复杂性疾病预测及诊断方法,其特征在于,包括以下步骤:步骤1、获取被试者的第一基因组信息;步骤2、将所述第一基因组信息与已获得的基因组变异位点与复杂性疾病的关联性信息进行匹配,计算所述第一基因组信息对应的复杂性疾病判别评分CDDS值;步骤3、比较所述CDDS值与预存的CDDS基准值的大小关系,得到比较结果;步骤4、根据所述比较结果,确定所述被试者患所检测复杂性疾病的概率。2.根据权利要求1所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,步骤4包括:当所述比较结果为所述CDDS值大于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率超过85%;或者,当所述比较结果为所述CDDS值小于所述CDDS基准值时,确定所述被试者患所检测复杂性疾病的概率低于15%。3.根据权利要求1所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,在步骤1之前,还包括:步骤5、根据获取的健康人群基因组信息和目标疾病人群基因组信息,获得基因组变异位点与复杂性疾病关联性信息。4.根据权利要求3所述的基于多组学的复杂性疾病预测及诊断方法,其特征在于,步骤5包括:步骤5.1、获取所述健康人群基因组信息和所述目标疾病人群基因组信息;步骤5.2、基于多组学构建目标疾病对应的多个模型;步骤5.3、分别将所述健康人群基因组信息和所述目标疾病人群基因组信息与所述多个模型进行映射,得到健康人群模型集合与目标疾病人群基模型集合;步骤5.4、对于所述多个模块中的每个模型,分别计算所述健康人群模型集合与所述目标疾病人群基模型集合中属于同一模型的第二基因组信息对应的CDDS值,得到多个所述第二基因组信息分别对应的多个CDDS值;步骤5.5、将多个所述第二基因组信息和多个所述CDDS值一一对应的存储,形成基因...

【专利技术属性】
技术研发人员:刘京铭李传友
申请(专利权)人:首都医科大学附属北京胸科医院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1