世系特异性遗传风险得分制造技术

技术编号:30656450 阅读:38 留言:0更新日期:2021-11-06 08:24
本文公开了用于计算遗传风险得分(GRS)的方法和系统,所述遗传风险得分表示基于个体的世系所述个体将发展特定性状的可能性。还提供了方法和系统,所述方法和系统用于基于所述个体的针对特定性状的GRS向所述个体提供建议以改变与所述性状相关的行为。改变与所述性状相关的行为。改变与所述性状相关的行为。

【技术实现步骤摘要】
【国外来华专利技术】世系特异性遗传风险得分
交叉引用
[0001]本申请要求于2018年11月28日提交的美国临时申请号62/772,565和于2018年12月11日提交的美国专利申请号16/216,940的权益,这些申请通过引用以其全部并入本文。序列表
[0002]即时申请包含序列表,其通过引用以其全部并入本文。所述ASCII副本创建于2019年10月28日,被命名为55075

701_601_SL.txt,并且大小是47.9KB。

技术实现思路

[0003]全基因组关联研究(GWAS)使科学家能够识别与广泛的表型性状相关的遗传变异。遗传风险得分(GRS)用于根据从个体获得的样品中检测某些遗传变体是否存在来预测所述个体是否会发展某个性状。然而,数据显示,离散世系群体潜在的遗传变异和模式是不同的。因此,检测到的遗传变体是否会给出个体发展所述性状的风险,在很大程度上取决于所述个体的世系(ancestry)。目前的遗传风险预测方法要么根本不考虑个体的世系,要么使用消费者调查表来考虑世系,导致不精确,而且往往不准确的遗传风险预测。
[0004]在某些实施方案中,本文公开了用于通过分析个体的基因型以确定个体的世系并基于源自与个体具有相同世系的受试者的GWAS的世系特异性遗传风险变体来计算GRS的方法、介质和系统。在一些实施方案中,GRS中考虑的遗传变体(多个)可以包括单核苷酸变体(SNV)、核苷酸碱基的插入或缺失(indel)、或拷贝数变体(CNV)。在一些实施方案中,如果在从个体获得的样品中检测到的遗传变体与世系特异性受试者组的GWAS中报告的遗传变体(未知遗传变体)不对应,则基于与用作风险预测的基础的特定世系群体内的未知遗传变体的非随机关联(称为连锁不平衡(LD))来选择代理遗传变体。研究表明,人类基因组中LD的模式在不同的世系群体中有所不同。
[0005]在一些实施方案中,本文公开了计算机实现的方法,所述方法包括:(a)使用基于距离或基于模型的计算机程序分配个体的世系,以分析所述个体的基因型,所述基因型包括一个或多个个体特异性遗传变体;以及(b)在所述个体的基因型中检测与特定表型性状相关联的世系特异性变体,所述世系特异性变体对应于:(i)在所述个体的基因型中可检测到的个体特异性遗传变体;或(ii)通过插补(imput)从世系特异性分型单倍型(ancestry

specific phased haplotypes)中缺失的个体特异性变体而确定的与所述个体特异性遗传变体处于连锁不平衡(LD)的遗传变体,所述世系特异性分型单倍型是使用与所述个体具有相同世系的个体的参考组确定的;和(c)基于在(b)中检测到的世系特异性变体计算所述个体的遗传风险得分(GRS),其中GRS指示所述个体具有或将发展所述特定表型性状的可能性。在一些实施方案中,世系特异性遗传变体和个体特异性遗传变体选自单核苷酸变体(SNV)、拷贝数变体(CNV)和indel。在一些实施方案中,步骤(ii)中的插补包括:(1)将来自所述个体的未分型基因型数据分型,以基于所述个体的世系产生世系特异性分型单倍型;和(2)使用来自与所述个体具有相同世系的参考组的分型单倍型数据,插补在所述世系特异性分型单倍型中不存在的个体特异性基因型,以选择与所述个体特异性遗传变体处于LD
的遗传变体。在一些实施方案中,LD由包括至少约0.80的D

值或包括至少0.80的r2值定义。在一些实施方案中,特定性状包括营养性状、临床性状、亚临床性状、体育锻炼性状、皮肤性状、过敏性状或精神性状,或其组合。在一些实施方案中,个体的基因型是通过对从个体获得的遗传物质进行或已经进行基因分型测定而获得的。在一些实施方案中,基因分型测定包括脱氧核糖核酸(DNA)阵列、核糖核酸(RNA)阵列、测序测定或其组合。在一些实施方案中,基于距离的计算机程序是主成分分析,并且其中基于模型的计算机程序是最大似然或贝叶斯方法。在一些实施方案中,所述个体的基于所述世系特异性变体的GRS比所述个体的基于非世系特异性变体的相应GRS更准确。在一些实施方案中,计算机实现的方法还包括提供包括个体的针对特定表型性状的GRS的通知。在一些实施方案中,通知还包括基于针对特定表型性状的GRS对个体的行为建议。在一些实施方案中,与特定表型性状相关的行为改变包括增加、减少或避免包括进行体育锻炼,摄入药物、维生素或补充剂,接触产品,使用产品,饮食改变,睡眠改变,酒精消耗或咖啡因消耗的活动。在一些实施方案中,亚临床性状包括疾病或病症的表型。在一些实施方案中,体育锻炼性状包括反感锻炼、有氧运动能力、减肥困难、耐力、力量、身体素质益处、对锻炼的心跳反应降低、瘦体重、肌肉酸痛、肌肉损伤风险、肌肉修复受损、应力性骨折、整体损伤风险、肥胖的可能性或静息代谢率受损。在一些实施方案中,皮肤性状包括胶原分解、干燥、抗氧化剂缺乏、解毒受损、皮肤糖化、色素斑点、年轻性、光老化、真皮敏感性或对阳光的敏感性。在一些实施方案中,毛发性状包括头发厚度、头发稀疏、头发脱落、秃顶、油性、干燥、头皮屑或发量。在一些实施方案中,营养性状包括维生素缺乏、矿物质缺乏、抗氧化剂缺乏、脂肪酸缺乏、代谢失衡、代谢受损、代谢敏感性、过敏、饱腹感或健康饮食的有效性。在一些实施方案中,维生素缺乏包括有包括维生素A、维生素B1、维生素B2、维生素B3、维生素B5、维生素B6、维生素B7、维生素B8、维生素B9、维生素B12、维生素C、维生素D、维生素E和维生素K的维生素的缺乏。在一些实施方案中,矿物质缺乏包括有包括钙、铁、镁、锌或硒的矿物质缺乏。在一些实施方案中,抗氧化剂缺乏包括有包括谷胱甘肽或辅酶Q10(CoQ10)的抗氧化剂的缺乏。在一些实施方案中,脂肪酸缺乏包括多不饱和脂肪酸或单不饱和脂肪酸的缺乏。在一些实施方案中,代谢失衡包括葡萄糖失衡。在一些实施方案中,代谢受损包括咖啡因或药物治疗的代谢受损。在一些实施方案中,代谢敏感性包括麸质敏感性、聚糖敏感性或乳糖敏感性。在一些实施方案中,过敏包括对食物的过敏(食物过敏)或对环境因素的过敏(环境过敏)。在一些实施方案中,所述方法还包括对个体进行有效地改善或防止个体中的特定性状的治疗,前提是遗传风险得分指示个体具有或将发展特定性状的高可能性。在一些实施方案中,治疗包括补充剂或药物疗法。在一些实施方案中,补充剂包括维生素、矿物质、益生菌、抗氧化剂、抗炎剂或其组合。在一些实施方案中,与特定性状相关的行为改变包括增加、减少或避免包括进行体育锻炼,摄入药物、维生素或补充剂,接触产品,使用产品,饮食改变,睡眠改变,酒精消耗或咖啡因消耗的活动。
[0006]在一些实施方案中,本文公开了系统,其包括:计算设备,其包括至少一个处理器、存储器和软件程序,软件程序包括可由至少一个处理器执行以评估个体具有或将发展特定表型性状的可能性的指令,所述指令包括以下步骤:(a)使用基于距离或基于模型的计算机程序分配个体的世系,以分析所述个体的基因型,所述基因型包括一个或多个个体特异性遗传变体;以及(b)在所述个体的基因型中检测与特定表型性状相关联的世系特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:a)使用基于距离或基于模型的计算机程序分配个体的世系,以分析所述个体的基因型,所述基因型包括一个或多个个体特异性遗传变体;以及b)在所述个体的所述基因型中检测与特定表型性状相关联的世系特异性变体,所述世系特异性变体对应于:i)在所述个体的所述基因型中可检测到的个体特异性遗传变体;或ii)通过插补从世系特异性分型单倍型中缺失的个体特异性变体而确定的与所述个体特异性遗传变体处于连锁不平衡(LD)的遗传变体,所述世系特异性分型单倍型是使用与所述个体具有相同世系的个体的参考组确定的;以及c)基于在(b)中检测到的所述世系特异性变体计算所述个体的遗传风险得分(GRS),其中所述GRS指示所述个体具有或将发展所述特定表型性状的可能性。2.如权利要求1所述的计算机实现的方法,其中所述世系特异性遗传变体和所述个体特异性遗传变体选自单核苷酸变体(SNV)、拷贝数变体(CNV)和indel。3.如权利要求1所述的计算机实现的方法,其中步骤(ii)中的插补包括:a)将来自所述个体的未分型基因型数据分型,以基于所述个体的所述世系产生所述世系特异性分型单倍型;以及b)使用来自与所述个体具有相同世系的所述参考组的分型单倍型数据,插补在所述世系特异性分型单倍型中不存在的个体特异性基因型,以选择与所述个体特异性遗传变体处于LD的所述遗传变体。4.如权利要求1所述的计算机实现的方法,其中所述LD由包括至少约0.80的D

值或包括至少0.80的r2值定义。5.如权利要求1所述的计算机实现的方法,其中所述特定性状包括营养性状、临床性状、亚临床性状、体育锻炼性状、皮肤性状、过敏性状或精神性状,或其组合。6.如权利要求1所述的计算机实现的方法,其中所述个体的所述基因型是通过对从所述个体获得的遗传物质进行或已经进行基因分型测定而获得的。7.如权利要求6所述的计算机实现的方法,其中所述基因分型测定包括脱氧核糖核酸(DNA)阵列、核糖核酸(RNA)阵列、测序测定或其组合。8.如权利要求1所述的计算机实现的方法,其中所述基于距离的计算机程序是主成分分析,并且其中所述基于模型的计算机程序是最大似然或贝叶斯方法。9.如权利要求1所述的计算机实现的方法,其中所述个体的基于所述世系特异性变体的所述GRS比所述个体的基于非世系特异性变体的相应GRS更准确。10.如权利要求1所述的计算机实现的方法,还包括提供包括所述个体的针对所述特定表型性状的所述GRS的通知。11.如权利要求10所述的计算机实现的方法,其中所述通知还包括基于针对所述特定表型性状的GRS对所述个体的行为建议。12.如权利要求11所述的计算机实现的方法,其中与所述特定表型性状相关的行为改变包括增加、减少或避免一活动,所述活动包括进行体育锻炼,摄入药物、维生素或补充剂,接触产品,使用产品,饮食改变,睡眠改变,酒精消耗或咖啡因消耗。13.一种系统,包括:
计算设备,所述计算设备包括至少一个处理器、存储器和软件程序,所述软件程序包括可由至少一个处理器执行以评估个体具有或将发展特定表型性状的可能性的指令,所述指令包括以下步骤:a)使用基于距离或基于模型的计算机程序分配个体的世系,以分析所述个体的基因型,所述基因型包括一个或多个个体特异性遗传变体;以及b)在所述个体的所述基因型中检测与特定表型性状相关联的世系特异性变体,所述世系特异性变体对应于:i)在所述个体的所述基因型中可检测到的个体特异性遗传变体;或ii)通过插补从世系特异性分型单倍型中缺失的个体特异性变体而确定的与所述个体特异性遗传变体处于连锁不平衡(LD)的遗传变体,所述世系特异性分型单倍型是使用与所述个体具有相同世系的个体的参考组确定的;以及c)基于在(b)中检测到的所述世系特异性变体计算所述个体的遗传风险得分(GRS),其中所述GRS指示所述个体具有或将发展所述特定表型性状的可能性。14.如权利要求13所述的系统,其中所述世系特异性遗传变体和所述个体特异性遗传变体选自单核苷酸变体(SNV)、拷贝数变体(CNV)和indel。15.如权利要求13所述的系统,其中步骤(2)中的插补包括:a)将来自所述个体的未分型基因型数据分型,以基于所述个体的所述世系产生世系特异性分型单倍型;以及b)使用来自与所述个体具有相同世系的所述参考组的分型单倍型数据,插补在所述世系特异性分型单倍型中不存在的个体特异性基因型,以选择与所述个体特异性遗传变体处于LD的遗传变体。16.如权利要求13所述的系统,其中所述LD由包括至少约0.80的D

值或包括至少0.80的r2值定义。17.如权利要求13所述的系统,其中所述特定性状包括营养性状、临床性状、亚临床性状、体育锻炼性状、皮肤性状、过敏性状或精神性状。18.如权利要求13所述的系统,还包括基因分型测定。19.如权利要求18所述的系统,其中所述基因分型测定包括脱氧核糖核酸(DNA)阵列、核糖核酸(RNA)阵列、测序测定或其组合。20.如权利要求13所述的系统,其中所述基于距离的计算机程序是主成分分析,并且其中所述基于模型的计算机程序是最大似然或贝叶斯方法。21.如权利要求13所述的系统,其中所述个体的基于所述世系特异性变体的所述GRS比所述个体的基于非世系特异性变体的相应GRS更准确。22.如权利要求13所述的系统,还包括报告模块,所述报告模块被配置为生成包括所述个体的针对所述特定表型性状的所述GRS的报告。23.如权利要求13所述的系统,还包括输出模块,所述输出模块被配置为向所述个体展示所述报告。24.如权利要求23所述的系统,其中所述报告包括所述个体具有或将发展所述特定性状的风险。25.如权利要求23所述的系统,其中所述报告还包括以下建议:基于针对所述特定表型
性状的所述GRS对所述个体的行为建议。26.如权利要求25所述的系统,其中与所述特定表型性状相关的行为改变包括增加、减少或避免一活动,所述活动包括进行体育锻炼,摄入药物、维生素或补充剂,接触产品,使用产品,饮食改变,睡眠改变,酒精消耗或咖啡因消耗。27.如权利要求13所述的系统的用途,用于基于在(c)中计算的所述GRS向所述个体建议行为改变或推荐产品。28.一种非暂时性计算机可读存储介质,包括计算机可执行代码,所述计算机可执行代码被配置为使至少一个处理器执行如权利要求1中提供的步骤。29.一种基于个体的世系确定所述个体具有或将发展特定表型性状的可能性的计算机实现的方法,所述方法包括:a)使用基于距离或基于模型的计算机程序分配所述个体的世系,以分析所述个体的基因型,所述基因型包括一个或多个个体特异性遗传变体;b)从包括源自与所述个体具有相同世系的受试者(受试者组)的世系特异性遗传变体的性状相关变体数据库,至少部分地基于所述个体的所述世系选择一个或多个世系特异性遗传变体,其中所述一个或多个世系特异性遗传变体中的每一个对应于:i)所述一个或多个个体特异性遗传变体中的个体特异性遗传变体,或ii)在与所述个体具有相同世系的受试者群体中与所述一个或多个个体特异性遗传变体中的个体特异性遗传变体处于连锁不平衡(LD)的预先确定的遗传变体,其中所述预先确定的遗传变体是通过以下预先确定的:1)将来自所述个体的未分型基因型数据分型,以基于所述个体的所述世系产生个体特异性分型单倍型;2)使用来自与所述个体具有相同世系的参考组的分型单倍型数据,插补分型的所述个体特异性分型单倍型中不存在的个体特异性基因型;以及3)从所述插补的个体特...

【专利技术属性】
技术研发人员:黄文耀哈嘉怡宝林
申请(专利权)人:亚洲基因私人有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1