System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于贝叶斯模型的证据优化方法、装置、计算机设备及存储介质制造方法及图纸_技高网

一种基于贝叶斯模型的证据优化方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:44791472 阅读:3 留言:0更新日期:2025-03-28 19:45
本发明专利技术公开了一种基于贝叶斯模型的证据优化方法、装置、计算机设备及存储介质,涉及医疗保健信息学技术领域。该方法包括以下步骤:获取含有变异分类结果的文本文件;计算ACMG/AMP指南给定的17个证据组合对应的后验概率,当选取的证据组合规则满足后验概率分类时,得到各证据强度等级对应的理论致病性几率;将临床意义不明变异VUS细分类为六个级别;通过比较阳性似然比或局部阳性似然比和各证据强度等级对应的理论致病性几率,确定不同证据强度等级对应的阈值;重新对变异标记ACMG/AMP证据标签,给出变异的致病性分类结果。本发明专利技术能够降低证据优化难度以及提升临床基因检测中遗传变异解读的准确性和一致性。

【技术实现步骤摘要】

本专利技术涉及医疗保健信息学,尤其涉及一种基于贝叶斯模型的证据优化方法、装置、计算机设备及存储介质


技术介绍

1、早期遗传学分子诊断对于尽早干预患者症状、提高患者生活质量至关重要。例如,孟德尔遗传病是由单个基因突变而导致的遗传性疾病,这类疾病常常给患者带来严重的健康危害,甚至可能导致先天缺陷、残疾或死亡。在临床实践中,通过靶向测序,全外显子组测序或全基因组测序,结合生物信息学分析及变异致病性解读可为患者鉴定遗传学分子病因。而如何对大量意义不明变异的致病性进行准确判定是临床基因诊断所面临的主要挑战之一。

2、为了辅助解读变异的临床意义,美国分子遗传学和基因组学(acmg)与分子病理学协会(amp)于2015年发布了遗传变异分类标准与指南。该遗传变异分类标准与指南根据人群频率、表型共分离、功能预测分数等八个方面共28个证据条目(涉及5个证据强度等级:独立、非常强、强、中等和支持)及18种证据组合规则,将变异分为五类:致病(pathogenic,p)、可能致病(likely pathogenic,lp)、良性(benign,b)、可能良性(likely benign,lb)和意义不明(uncertain significance,us)。acmg/amp指南发布后得到了国际同行的广泛认可,极大地提升了全球临床基因检测和数据解读的能力。然而,acmg/amp指南的证据组合规则仅仅根据简单的证据强度等级累加规则对变异的致病性进行定性分析,缺乏可证明其有效性的数学模型。2018年,clingen提出acmg/amp指南的定性框架可转化为基于朴素贝叶斯模型的定量框架,该定量框架根据变异的致病性先验概率及证据强度等级对应致病性几率来计算变异致病的后验概率(posterior probability,post_p),进而实现变异分类。具体来说,当post_p>0.99,0.90<post_p ≤0.99,0.001≤ post_p<0.10,post_p<0.001及0.10≤post_p ≤0.90时,变异对应的致病性分类分别为p,lp,lb,b及us。基于该定量框架,clingen svi展示了acmg/amp 遗传变异分类标准与指南提出的18个证据组合规则中,有16 个与贝叶斯模型计算得到的分类结果相吻合,证明了acmg/amp指南证据组合规则的合理性。2020年, clingen进一步将贝叶斯框架转换为打分框架,不同证据强度等级对应不同的分数,可通过分数加和后对变异进行分类。这些定量模型为进一步量化证据强度等级和扩展组合规则提供了数学基础。研究人员根据贝叶斯框架量化并扩展了多个证据条目的强度等级,如 ps1/pm5、ps3/bs3 和 pp3/bp4,提高了致病变异的识别率,证明了证据的规范和分层对于建立客观、无偏见和一致的变异分类至关重要。

3、 然而,目前缺乏专门用于量化证据强度和建立适当阈值以完善 acmg/amp指南的软件和工具,导致临床基因检测中遗传变异解读的准确性不高和一致性较差。


技术实现思路

1、针对现有技术中的上述不足,本专利技术提供了一种基于贝叶斯模型的证据优化方法、装置、计算机设备及存储介质,旨在通过扩大 acmg/amp 指南的证据强度等级,降低证据优化难度以及提升临床基因检测中遗传变异解读的准确性和一致性。

2、第一方面,本专利技术提供的一种基于贝叶斯模型的证据优化方法,包括以下步骤:

3、s10:获取含有变异分类结果的文本文件,所述变异分类结果包括变异、acmg/amp证据和变异致病性分类信息;

4、s20:在各证据强度等级间致病性几率存在指数关系时,按照预设循环次数计算在给定先验概率prior_p下,acmg/amp指南给定的17个证据组合对应的后验概率post_p,当选取的证据组合规则满足后验概率post_p分类时,得到各证据强度等级对应的最小致病性几率值,将所述最小致病性几率值作为各证据强度等级对应的理论致病性几率;

5、s30:将临床意义不明变异vus细分类为第一级别hot、第二级别warm、第三级别tepid、第四级别cool、第五级别cold和第六级别ice cold,将分类为第一级别hot、第二级别warm和第三级别tepid的临床意义不明变异vus作为倾向致病的临床意义不明变异pl-vus,将分类为第四级别cool、第五级别cold和第六级别ice cold的临床意义不明变异vus作为倾向良性的临床意义不明变异bl-vus,在证据优化时,过滤倾向致病的临床意义不明变异pl-vus;

6、s40:对于分类变量,计算阳性似然比lr+;对于连续变量,计算局部阳性似然比lr+,通过比较阳性似然比lr+或局部阳性似然比lr+和各证据强度等级对应的理论致病性几率,确定不同证据强度等级对应的阈值;

7、s50:根据优化后的证据强度对应等级及对应阈值,重新对变异标记acmg/amp证据标签,根据acmg/amp指南给出的证据组合规则、贝叶斯框架和分数系统分别给出变异的致病性分类结果。

8、进一步地,在步骤s20中,所述后验概率post_p分类具体为:致病组合的后验概率post_p满足:后验概率post_p>0.99;可能致病组合的后验概率post_p满足:0.90< 后验概率post_p ≤ 0.99;可能良性组合的后验概率post_p满足:0.001 ≤ 后验概率post_p<0.10;良性组合的后验概率post_p满足:后验概率post_p<0.001;

9、所述各证据强度等级对应的理论致病性几率的计算公式为:

10、;

11、其中,op:odds path,acmg/amp证据组合后得到的致病性几率;opvst:非常强(verystrong)致病性证据强度等级对应的致病性几率;npvst:致病性证据强度等级为非常强(very strong)的证据个数;npst:致病性证据强度等级为强(strong)的证据个数;npm:致病性证据强度等级为中等(moderate)的证据个数;npsu:致病性证据强度等级为支持(supporting)的证据个数;nbst:良性证据强度等级为强(strong)的证据个数;nbsu:良性证据强度等级为支持(supporting)的证据个数;

12、后验概率post_p的计算公式为:

13、;

14、其中,post_p:变异致病性后验概率;prior_p:变异致病性先验概率。

15、进一步地,在步骤s40中,对于分类变量,通过计算满足或不满足测试条件的p/lp和 bl-vus/b/lb 变异的数目来计算每个测试条件的各种统计指标,包括真阳性、假阳性、真阴性、准确性、真阳性率、真阴性率、阳性预测值、阴性预测值、f1 评分和阳性似然比lr+,通过bootstrapping算法获得阳性似然比lr+的95%置信区间估计值,然后通过比较阳性似然比本文档来自技高网...

【技术保护点】

1.一种基于贝叶斯模型的证据优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于贝叶斯模型的证据优化方法,其特征在于,在步骤S20中,所述后验概率Post_P分类具体为:致病组合的后验概率Post_P满足:后验概率Post_P >0.99;可能致病组合的后验概率Post_P满足:0.90 < 后验概率Post_P ≤ 0.99;可能良性组合的后验概率Post_P满足:0.001 ≤ 后验概率Post_P < 0.10;良性组合的后验概率Post_P满足:后验概率Post_P < 0.001;

3.根据权利要求1所述的基于贝叶斯模型的证据优化方法,其特征在于,在步骤S40中,对于分类变量,通过计算满足或不满足测试条件的P/LP和 BL-VUS/B/LB 变异的数目来计算每个测试条件的各种统计指标,包括真阳性、假阳性、真阴性、准确性、真阳性率、真阴性率、阳性预测值、阴性预测值、F1 评分和阳性似然比LR+,通过bootstrapping算法获得阳性似然比LR+的95%置信区间估计值,然后通过比较阳性似然比LR+的95%置信区间下限值与步骤S20中得到的各证据强度等级对应的理论致病性几率来确定证据强度等级和阈值。

4.根据权利要求3所述的基于贝叶斯模型的证据优化方法,其特征在于,所述阳性似然比LR+的计算公式为:

5.根据权利要求1所述的基于贝叶斯模型的证据优化方法,其特征在于,在步骤S40中,对于连续变量,对所有观测值进行排序,以每个观测值为中心,对于给定的滑动窗口,计算区间内每个测试值的致病性局部后验概率Local posterior probability,通过预设次数迭代估计每个测试值局部后验概率的95%置信区间,以评估证据强度等级对应阈值。

6.根据权利要求5所述的基于贝叶斯模型的证据优化方法,其特征在于,所述致病性局部后验概率Local posterior probability的计算公式为:

7.根据权利要求1所述基于贝叶斯模型的证据优化方法,其特征在于,所述分类变量的测试值是一个二分类变量;所述连续变量的测试值是一个连续变量。

8.一种基于贝叶斯模型的证据优化装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-7中任一项权利要求所述方法的步骤。

10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-7中任一项权利要求所述方法的步骤。

...

【技术特征摘要】

1.一种基于贝叶斯模型的证据优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于贝叶斯模型的证据优化方法,其特征在于,在步骤s20中,所述后验概率post_p分类具体为:致病组合的后验概率post_p满足:后验概率post_p >0.99;可能致病组合的后验概率post_p满足:0.90 < 后验概率post_p ≤ 0.99;可能良性组合的后验概率post_p满足:0.001 ≤ 后验概率post_p < 0.10;良性组合的后验概率post_p满足:后验概率post_p < 0.001;

3.根据权利要求1所述的基于贝叶斯模型的证据优化方法,其特征在于,在步骤s40中,对于分类变量,通过计算满足或不满足测试条件的p/lp和 bl-vus/b/lb 变异的数目来计算每个测试条件的各种统计指标,包括真阳性、假阳性、真阴性、准确性、真阳性率、真阴性率、阳性预测值、阴性预测值、f1 评分和阳性似然比lr+,通过bootstrapping算法获得阳性似然比lr+的95%置信区间估计值,然后通过比较阳性似然比lr+的95%置信区间下限值与步骤s20中得到的各证据强度等级对应的理论致病性几率来确定证据强度等级和阈值。

4.根据权利要求3所述的基于贝叶斯模型的证据优化方法,其...

【专利技术属性】
技术研发人员:刘思寒冯小殊卜枫啸
申请(专利权)人:四川大学华西医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1