一种系统性预测组学变异对药效影响的方法技术方案

技术编号:15983050 阅读:31 留言:0更新日期:2017-08-12 05:45
本发明专利技术涉及生物信息学技术领域,具体而言,涉及一种系统性预测组学变异对药效影响的方法,包括:1)、通过已知临床意义变异寻找决定药效的蛋白三维功能子区域,对基因/蛋白位点进行归类建立功能子区域数据库T2;2)、将未知临床意义变异与所述功能子区域数据库T2进行比对,通过分析未知临床意义变异与已知临床意义变异是否归属同一功能子区域、变异类型,以及氨基酸性质变化的是否相似预测未知临床意义变异是否和已知意义变异有相同的药效影响。本发明专利技术从多角度对未知临床意义变异对药效的可能的影响进行了预测,预测的准确度更高。

【技术实现步骤摘要】
一种系统性预测组学变异对药效影响的方法
本专利技术涉及生物信息学
,具体而言,涉及一种系统性预测组学变异对药效影响的方法。
技术介绍
全国肿瘤登记中心的陈万青等于2016年1月25日在CACancerJClin杂志上发表了2015中国癌症统计数据。据报告,中国2015年有429.2万例癌症新发病例,281.4万例癌症死亡。恶性肿瘤已经成为严重威胁人类健康的重大疾病之一,在癌症的传统治疗中,化疗是一种重要的治疗手段。但是,肿瘤对各种化疗药物的敏感性存在着明显的个体差异,通过检测患者化疗相关基因的单核苷多态性、微卫星不稳定性以及基因过表达情况,可以来预测患者对特定药物的敏感性和毒副作用的风险,从而对每个个体选择最合适的药物和剂量方案,最大化药物有效性且最小化毒副风险,以达到最佳的治疗效果。随着精准医学的发展,越来越多的靶向药物被开发,并应用在癌症的治疗中。提高靶向治疗效果的重要前提是明确患者的组学变异信息。以常见的肺癌为例,EGFR基因突变是东亚患者包括中国肺腺癌中最常见的基因变异,EGFR-TKIs能使70%左右的突变患者获益。而50-60%的EGFR基因突变患者EGFR-TKIs治疗失败是源于T790M突变。靶向T790M突变的三代EGFR-TKIs(AZD9291)将使30%的EGFR突变患者再度获得生存效益,但是,C797s突变是AZD9291治疗失败的重要机制。并且RAS,RAF基因的突变与EGFR-TKIs耐药性相关。因此NCCN等权威指南明确要求用药前进行EGFR、RAS、BRAF等相关基因检测。而已发现的对非小细胞肺癌靶向治疗效果、预后造成显著影响的组学变异多达一百五十多种,NCCN指南、FDA、CFDA标出的靶标变异只是其中很小一部分。需要检测、分析、解读这些相关组学变异,以明确能从该类药物治疗中获益的患者群体,避免无效治疗的毒副作用和经济损失。肿瘤的发生发展和肿瘤的治疗都与病人个体的组学变异紧密相关。一个肿瘤样本通过新一代测序技术(NextGenerationSequencing,NGS)检测分析可发现多个变异,其中只有不到10%的组学变异通过科研或临床研究已明确其意义和临床影响,另外90%的变异又称为未知意义变异(VUS,VariantofUncertainSignificance),急需对其研究以明确其对疾病发生和/或药物响应的影响。现有的一些技术或通过分析组学变异是否会使基因/蛋白失去功能,即预测变异是否为LossofFunctionVariation,或通过通路分析技术,基于基因/蛋白参与的通路识别失去功能/获得功能的通路和网络信号,从而预测组学变异对一些靶向药物药效的影响。这种分析方法的前提是一个基因/蛋白上的变异对药物响应的影响是同一个方向。而实际上同一个基因/蛋白内,甚至同一个蛋白结构域上不同的变异都可能具有截然相反的药效影响,如EGFR同一个激酶结构域上的两个变异L858R和T790M变异,L858R会加强对包括吉非替尼、厄洛替尼等TKI类药物的敏感性,而T790M会形成包括吉非替尼、厄洛替尼等TKI类药物的耐药。这些同一基因、同一结构域上不同变异对药效影响的不同,不是能仅凭基因/通路失去或获得功能分析所能解释和预测的。有鉴于此,特提出本专利技术。
技术实现思路
本专利技术的目的在于提供一种系统性预测组学变异对药效影响的方法,以解决上述问题。为了实现本专利技术的上述目的,特采用以下技术方案:依据本专利技术的一方面,本专利技术提供一种系统性预测组学变异对药效影响的方法,包括:1)、通过已知临床意义变异寻找决定药效的蛋白三维功能子区域,对基因/蛋白位点进行归类建立功能子区域数据库T2;2)、将未知临床意义变异与所述功能子区域数据库T2进行比对,通过分析未知临床意义变异与已知临床意义变异是否归属同一功能子区域、变异类型,以及氨基酸性质变化的是否相似预测未知临床意义变异是否和已知意义变异有相同的药效影响。作用于特定蛋白的靶向药物通常与该蛋白的某一个特定的结构域有相互结合作用,本专利技术通过对特定的结构域上的一个或多个已知临床意义变异位点,将这个特定的结构域再细化为功能子区域,再将位于此功能子区域的未知临床意义变异与已知临床意义变异位点进行比较,从而确定预测其对药效的影响。优选的,如上所述的系统性预测组学变异对药效影响的方法,在步骤1)中,所述功能子区域数据库的建立方法包括:a、确定已知临床意义变异VKi所位于的基因Gi、具体位于的外显子、对应的药物Dj以及对VKi变异对药物Dj的耐药或敏感影响;将上述信息汇总为已知意义变异相关数据库T1;b.通过判断或预测Gi所对应蛋白的三维结构,提取得到Gi与药物Dj直接结合的结构域,若存在该结构域,则判断Gi-Dj结合物为真,进入步骤c;c.对于步骤b判断为真的Gi-Dj结合物,通过循环分析Gi上各氨基酸位点与药物Dj的三维距离及其是否位于蛋白表面,以找到位于与药物Dj结合位点的氨基酸残基Rk;若找到氨基酸残基Rk,进入步骤d;d.根据所有步骤c中所有找到的氨基酸残基Rk的位置信息组成蛋白Gi与药物Dj的结合位点子区域,将这些位点与数据库T1进行检索匹配,如果数据库T1中有已知临床意义变异VKi位于所述结合位点子区域,则根据该VKi对药物Dj的耐药或敏感影响标记该所述结合位点子区域对药物Dj的影响;根据上面得到的基因Gi,药物Dj、功能子区域、该子区域包含的位点、该子区域包含的已知意义变异、药效影响标记之间的信息生成所述功能子区域数据库T2。其中,VKi、Gi、Dj、Rk表示都是集合的概念,例如VKi已知临床意义变异的集合;i、j、k可取不同值。例如某特定的突变位点VK1突变对应的基因为G1,可能有一个或多个药物如D1、D2……等与G1表达的蛋白相互作用,而G1表达的蛋白与某特定药物D1的结合物处可能存在若干个符合条件的氨基酸残基R1、R2、R3……优选的,如上所述的系统性预测组学变异对药效影响的方法,将未知临床意义变异与所述功能子区域数据库进行比对的方法具体包括:以所述功能子区域数据库T2作为输出,对患者个体未知意义变异药效影响进行预测;输入为患者个体检测到的未知意义变异VU,其初始权重值Wvu为0;将变异VU与所述功能子区域数据库T2进行检索匹配:e.如果VU落在某一功能子区域覆盖位点上,Wvu加1;f.VU与同一功能子区域中的已知临床意义变异VKi进行以下比较,如果VU与VKi属于同一种SNV类型的变异,则其权重值Wvu加1;g.如果VU和VKi同时属于错义突变,则对VU和VKi变异前后的氨基酸按氨基酸化学属性进行归类比较,如果VU与VKi变异前后的氨基酸化学属性变化方向一致,则Wvu加1;其中,步骤e、f、g无先后顺序;当比较完成时,若总Wvu≥2,则判定其与同功能子区域内匹配上的已知临床意义变异Vki对对应的药物Dj药效影响一致。优选的,如上所述的系统性预测组学变异对药效影响的方法,在步骤b中,若不存在或无法判断该结构域是否存在则进入步骤h,随后再进入步骤2);h.对于非药物Dj结合基因Gi,提取表1中基因Gi上已知临床意义变异VKi所在外显子,基于这些已知临床意义变异VKi对位于这些外显子上的位点对药物Dj的耐药或敏感影响进行标记,加入功能本文档来自技高网
...

【技术保护点】
一种系统性预测组学变异对药效影响的方法,其特征在于,包括:1)、通过已知临床意义变异寻找决定药效的蛋白三维功能子区域,对基因/蛋白位点进行归类建立功能子区域数据库T2;2)、将未知临床意义变异与所述功能子区域数据库T2进行比对,通过分析未知临床意义变异与已知临床意义变异是否归属同一功能子区域、变异类型,以及氨基酸性质变化的是否相似预测未知临床意义变异是否和已知意义变异有相同的药效影响。

【技术特征摘要】
1.一种系统性预测组学变异对药效影响的方法,其特征在于,包括:1)、通过已知临床意义变异寻找决定药效的蛋白三维功能子区域,对基因/蛋白位点进行归类建立功能子区域数据库T2;2)、将未知临床意义变异与所述功能子区域数据库T2进行比对,通过分析未知临床意义变异与已知临床意义变异是否归属同一功能子区域、变异类型,以及氨基酸性质变化的是否相似预测未知临床意义变异是否和已知意义变异有相同的药效影响。2.根据权利要求1所述的系统性预测组学变异对药效影响的方法,其特征在于,在步骤1)中,所述功能子区域数据库的建立方法包括:a.确定已知临床意义变异VKi所位于的基因Gi、具体位于的外显子、对应的药物Dj以及对VKi变异对药物Dj的耐药或敏感影响;将上述信息汇总为已知意义变异相关数据库T1;b.通过判断或预测Gi所对应蛋白的三维结构,提取得到Gi与药物Dj直接结合的结构域,若存在该结构域,则判断Gi-Dj结合物为真,进入步骤c;c.对于步骤b判断为真的Gi-Dj结合物,通过循环分析Gi上各氨基酸位点与药物Dj的三维距离及其是否位于蛋白表面,以找到位于与药物Dj结合位点的氨基酸残基Rk;若找到氨基酸残基Rk,进入步骤d;d.根据所有步骤c中所有找到的氨基酸残基Rk的位置信息组成蛋白Gi与药物Dj的结合位点子区域,将这些位点与数据库T1进行检索匹配,如果数据库T1中有已知临床意义变异VKi位于所述结合位点子区域,则根据该VKi对药物Dj的耐药或敏感影响标记该所述结合位点子区域对药物Dj的影响;根据上面得到的基因Gi,药物Dj、功能子区域、该子区域包含的位点、该子区域包含的已知意义变异、药效影响标记之间的信息生成所述功能子区域数据库T2。3.根据权利要求1所述的系统性预测组学变异对药效影响的方法,其特征在于,将未知临床意义变异与所述功能子区域数据库进行比对的方法具体包括:以所述功能子区域数据库T2作为输出,对患者个体未知意义变异药效影响进行预测;输入为患者个体检测到的未知意义变异VU,其初始权重值Wvu为0;将变异VU与所述功能子区域数据库T2进行检索匹配:e.如果VU落在某一功能子区域覆盖位点上,Wvu加1;f.VU与同一功能子区域中的已知临床意义变异VKi进行以下比较,如果VU与VKi属于...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:为朔医学数据科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1