当前位置: 首页 > 专利查询>邢传华专利>正文

用于预测预定疾病风险的方法、计算设备和存储介质技术

技术编号:31015951 阅读:16 留言:0更新日期:2021-11-30 02:56
本公开涉及一种用于预测预定疾病风险的方法、计算设备和存储介质。该方法包括:生成每个待测样本的多个基因的基因突变数据;获取与每个待测样本相关联的多个非基因数据;经由回归算法,确定用于指示基因突变和非基因数据对每个待测样本的表型的影响的权重函数;针对每个待测样本,基于每个基因上的基因突变、非基因数据和对应权重,计算待测样本的所属对象发生预定疾病的风险分数;以及基于所计算的待测样本的所属对象发生预定疾病的风险分数,确定所属对象在预定时间内发生预定疾病的绝对风险,用以预测待测样本的预定疾病风险。本公开能够针对个体更早、更准确地预测发展为预定疾病的风险。病的风险。病的风险。

【技术实现步骤摘要】
用于预测预定疾病风险的方法、计算设备和存储介质


[0001]本公开总体上涉及生物信息处理,并且具体地,涉及用于预测预定疾病风险的方法、计算设备和存储介质。

技术介绍

[0002]即便在现代医学已经取得长足进步的当下,一些复杂的预定疾病(例如而不限于癌症)依然是导致人类死亡的重要原因之一。癌症源于正常细胞转变为肿瘤细胞的多阶段过程,从癌前病变发展到恶性肿瘤需要一个过程,而临床表现出现较晚的情况很常见。如果能早期发现和治疗预定疾病病例,可以一定程度降低癌症患者的死亡率。因此,预定疾病(例如癌症)风险的早期和准确预测变得尤为重要。
[0003]传统的用于早期筛查或者预测预定疾病(例如癌症)的风险的方案主要包括:影像学筛查、内镜筛查、肿瘤标志物筛查以及多基因风险分数(PRS)预测。对于影像学筛查而言,其通常需要肿瘤达到一定尺寸后才能有效检测,因此存在滞后性,另外,影像学筛查所采用的超声、X射线、CT、MRI等测试手段通常会伴随有辐射。对于内镜筛查而言,其所使用的胃镜、结直肠镜、膀胱镜等存在侵入性强、容易引发不适与交叉感染的不足,而且检测范围相对有限。对于肿瘤标志物筛查而言,其存在假阴性率及假阳性率偏高的不足之处。而多基因风险分数(PRS)主要是通过计算多个单核苷酸多态性(SNP)的效应大小加权的得分以计算出风险分数从而鉴别关于预定疾病发生的不同级别的风险。然而,PRS所反映的是遗传风险概率,而对于绝大部分复杂疾病(例如包括癌症)的发生都是遗传和环境等因素(比如吸烟、饮酒、空气污染等等)交互作用的结果,因此仅考虑遗传风险的PRS技术难以准确地预测个体发生预定疾病的风险。
[0004]综上,传统的用于预测预定疾病的风险的方案存在侵入性强、明显滞后性、或者准确性较差等不足之处,难以有效实现针对个体更早、更准确地预测发展为预定疾病的风险。

技术实现思路

[0005]本公开提供一种用于预测预定疾病风险的方法、计算设备和计算机存储介质,能够针对个体更早、更准确地预测发展为预定疾病的风险。
[0006]根据本公开的第一方面,提供了一种用于预测预定疾病风险的风险的方法。该方法包括:获取多个待测样本的基因测序数据,以便生成每个待测样本的多个基因的基因突变数据;
[0007]获取与每个待测样本相关联的多个非基因数据;经由回归算法,确定用于指示基因突变和非基因数据对每个待测样本的表型的影响的权重函数;针对每个待测样本,基于每个基因上的基因突变数据、非基因数据和对应权重,计算待测样本的所属对象发生预定疾病的风险分数;以及基于所计算的待测样本的所属对象发生预定疾病的风险分数,确定所属对象在预定时间内发生预定疾病的绝对风险,用以基于绝对风险和预定阈值的比较预测待测样本的预定疾病风险。
[0008]根据本专利技术的第二方面,还提供了一种计算设备,该设备包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得计算设备执行本公开的第一方面的方法。
[0009]根据本公开的第三方面,还提供了一种计算机可读存储介质。该计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面的方法。
[0010]在一些实施例中,用于预测预定疾病风险的方法还包括:获取与每个待测样本相关联的多个预定组学数据;以及将所生成的每个待测样本的多个基因的基因突变数据、所获取的多个非基因数据和多个预定组学数据进行归一化处理,以用于确定基因突变、非基因数据和预定组学数据每个待测样本的表型的协同影响。
[0011]在一些实施例中,确定用于指示突变和非基因数据对每个待测样本的表型的影响的权重函数包括:基于序列核关联性检验算法,确定多个稀有变异与多个稀有变异针对每个待测样本的表型的协同影响的权重函数。
[0012]在一些实施例中,基于绝对风险和预定阈值的比较预测待测样本的预定疾病风险包括:基于关于待测样本的风险分数、风险因素分布数据、预定年龄的目标人群发生预定疾病的发病率和死亡率,计算待测样本的所属对象在预定时间段内发生预定疾病的绝对风险;确定绝对风险是否大于或者等于预定阈值;响应于确定绝对风险大于或者等于预定阈值,确定待测样本的所属对象满足关于预定疾病的高风险条件;以及响应于确定绝对风险小于预定阈值,确定待测样本的所属对象不满足关于预定疾病的高风险条件。
[0013]在一些实施例中,计算待测样本的所属对象发生预定疾病的风险分数包括:基于每个基因上的基因突变数据与对应基因突变权重的加权和、非基因数据与对应非基因数据权重的乘积、预定组学数据与对应组学数据权重的乘积,计算待测样本的所属对象发生预定疾病的风险分数。
[0014]在一些实施例中,非基因数据是基于与待测样本相关联的微生物数据、细胞数据、临床信息、免疫标志物信息、待测样本的所属对象的目标区域的图像数据中的至少一项而生成。
[0015]在一些实施例中,预定组学数据包括转录组学数据、蛋白组学数据和代谢组学数据中的至少一种组学数据。
[0016]在一些实施例中,针对每个非基因数据,叠加每个基因所对应的非基因数据子权重,以便生成每个非基因数据的对应非基因数据权重;以及针对每个预定组学数据,叠加每个基因所对应的组学数据子权重,以便生成每个预定组学数据的对应组学数据权重。
[0017]提供
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
[0018]图1示出了根据本公开的实施例的用于预测预定疾病风险的方法的系统的示意图。
[0019]图2示出了根据本公开的实施例的用于预测预定疾病风险的方法的流程图。
[0020]图3示出了根据本公开的实施例的用于确定基因突变、所获取的多个非基因数据和多个预定组学数据与表型效应影响的方法的流程图。
[0021]图4示出了根据本公开的实施例的用于预测待测样本的预定疾病风险的方法的流程图。
[0022]图5示出了根据本公开的实施例的用于比较绝对风险与预定阈值的方法的示意图。
[0023]图6示意性示出了适于用来实现本公开实施例的电子设备的框图。
[0024]在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
[0025]下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0026]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于预测预定疾病风险的方法,包括:获取多个待测样本的基因测序数据,以便生成每个待测样本的多个基因的基因突变数据;获取与每个待测样本相关联的多个非基因数据;经由回归算法,确定用于指示基因突变和非基因数据对每个待测样本的表型的影响的权重函数;针对每个待测样本,基于每个基因上的基因突变数据、非基因数据和对应权重,计算待测样本的所属对象发生预定疾病的风险分数;以及基于所计算的待测样本的所属对象发生预定疾病的风险分数,确定所属对象在预定时间内发生预定疾病的绝对风险,用以基于所述绝对风险和预定阈值的比较预测待测样本的预定疾病风险。2.根据权利要求1所述的方法,还包括:获取与每个待测样本相关联的多个预定组学数据;以及将所生成的每个待测样本的多个基因的基因突变数据、所获取的多个非基因数据和多个预定组学数据进行归一化处理,用以确定基因突变、非基因数据和预定组学数据对每个待测样本的表型的协同影响。3.根据权利要求1所述的方法,其中确定用于指示突变和非基因数据对每个待测样本的表型的影响的权重函数包括:基于序列核关联性检验算法,确定多个稀有变异与多个稀有变异针对每个待测样本的表型的协同影响的权重函数。4.根据权利要求1所述的方法,其中基于所述绝对风险和预定阈值的比较预测待测样本的预定疾病风险包括:基于关于待测样本的风险分数、风险因素分布数据、预定年龄的目标人群发生预定疾病的发病率和死亡率,计算待测样本的所属对象在预定时间段内发生预定疾病的绝对风险;确定所述绝对风险是否大于或者等于预定阈值;响应于确定所述绝对风险大于或者等于预定阈值,确定...

【专利技术属性】
技术研发人员:邢传华王湧
申请(专利权)人:邢传华
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1