System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() NGS测序中DNA损伤假阳性突变过滤的方法及应用技术_技高网

NGS测序中DNA损伤假阳性突变过滤的方法及应用技术

技术编号:44491239 阅读:6 留言:0更新日期:2025-03-04 17:56
本发明专利技术公开了一种NGS测序中DNA损伤假阳性突变过滤的方法及应用,属于基因检测技术领域。该方法包括:S1、基于正常样本的突变亚型分布构建基线;S2、对待测样本进行变异检测,通过二项式检验或负二项式检验判断该待测样本对应的突变亚型与基线之间的差异性,根据差异性判断该待测样本是否存在DNA损伤;S3、针对DNA损伤的样本,提取其中VAF≤5%的SNV突变,并确定相应突变亚型在基准测序深度下出现的基准错误率;S4、计算位点的DNA损伤显著性p值,基于p值判断相应位点是真实突变位点还是假阳性位点。本发明专利技术可以不限制DNA损伤的变异等位基因频率,同时能够适用于更多的技术平台,不受测序单端或者双端的限制。

【技术实现步骤摘要】

本专利技术属于基因检测,具体涉及一种ngs(next-generationsequencing,即下一代测序技术,也称为二代测序技术)测序中dna损伤假阳性突变过滤的方法及应用。


技术介绍

1、福尔马林固定石蜡包埋样本(ffpe)因其易于长期保存,因此在临床病理检验、肿瘤基因检测和医学科学研究过程中多采用此种方法保存患者的组织样本。在利用二代测序技术进行精准治疗时,很大程度上依靠这些组织样本。但是在ffpe dna样本中检测到的一些序列突变可能是样本处理过程中遭受损伤所致,其主要来源于以下几种情况:

2、1)氧化损伤

3、活性氧(ros)可使鸟嘌呤(g)氧化为8-氧鸟嘌呤(8-oxog),8-oxog不再与c配对,反而与a配对,因此经过两次复制可导致g:c配对转化为a:t配对而导致的假阳性突变(g:c/t:a g->t/c->a 突变),如图1所示。

4、2)ffpe处理导致的dna损伤

5、a.交联:即大分子(如蛋白质和核酸)两两之间发生交联。甲醛导致dna损伤的原因主要源自其羰基亲电性和较小的空间位阻,使其易于与核酸和蛋白质发生交联。在体外,甲醛先与蛋白质或核酸上自由的氨基反应生成不稳定的羟甲基加合物,然后再进一步与其他核酸或蛋白质反应形成稳定的交联物。导致dna局部变性,影响核酸提取的质量。

6、b.碱基转换:在ffpe dna样本中存在大量的c>u或c>t的突变。在体内,胞嘧啶自发水解脱氨变成尿嘧啶,发生频率约为每个细胞每天190次,可通过碱基切除修复恢复成胞嘧啶,而在体外则无法修复,因此测序数据中会发现存在大量的c:g/t:a突变假阳性(c->t/g->a)。如图2所示。

7、c.碱基脱落:dna分子丢失了嘌呤碱或嘧啶碱后形成的脱碱基位点。当组织在福尔马林中固定时,福尔马林中的甲醛在空气中容易被氧化成甲酸,甲酸降低了福尔马林的ph值。而嘌呤碱基与糖骨架的n-糖苷键易于在低ph下发生水解,致使dna碱基脱落。此外,脱碱基位点可以通过b-消除反应进行自发切割,导致dna链断裂。

8、3)dna片段化

9、ffpe dna的片段化程度会随着保存时间的延长和固定中使用的福尔马林ph值的降低而增加。与来自新鲜ffpe dna相比,保存时间长的ffpe dna进行pcr,成功率较低。说明样品在保存期间,dna片段化这一现象可能一直在发生。

10、根据dna损伤产生原因以及ngs测序原理,可以发现这种假阳性的位点具备链偏好性,即突变只存在于dna分子的正链或者负链上,在ngs测序过程得到的reads展现的特征为f1r2或者f2r1。

11、目前常用的过滤方式包括基于统计规律过滤初始候选变异,例如,yost等人通过使用二项式检验,测试每个变异的等位基因频率与其对应的突变类型在全局的错配率进行比较,从而控制福尔马林诱导的脱氨基化,然后移除不显著的等位基因频率。类似地,kerick等人采用了变异位点测序深度的截断值进行过滤。firevat算法则使用一系列过滤参数,包括vaf、比对质量以及参考序列与等位基因序列各自的深度。

12、此外,还有一些过滤算法用来识别低质量或ffpe测序数据中的假阳性变异。例如,ciscall算法通过应用连续的过滤器,如对于聚集的低vaf的突变,如果高于该聚集区间范围内突变发生的错误率期望值,则都会通过内部的统计计算进行过滤。另外也有使用贝叶斯变异检测算法,除了应用常见的质量过滤外,还结合了关于特定癌症相关突变的先验信息。另一种算法,lolopicker,使用ffpe样本panel范围内突变评估特定位点的背景错误率,然后将其纳入假设检验以识别变异真假。而pisces开发的突变检测软件包含一个基于每种可能的突变类型的平均突变率的偏差来重新校准变异质量的模型,从而最小化热损伤和ffpe脱氨基化。

13、ffpe相关的脱氨基化,与dna的氧化损伤等假阳性一样,通常只发生在原始dna模板的单链上,导致在进行双端测序时,reads1和reads2之间出现方向偏差。根据这种链偏好性,可以有效的度量dna 损伤。这种链不平衡的计算方式已经被多个软件所采用,比如gatk4的learnreadorientationmodel模块,用于过滤在测序过程中仅在单链上出现的假阳性突变。该工具主要使用贝叶斯统计模型计算单核苷酸替代在每三个碱基里面产生的链偏好性。此外,sobdetector软件也纳入了链偏好性参数,但它不是直接过滤,而是为每个变异计算链偏差的分值,并将该值添加到突变结果文件(vcf)中,以供手动筛选。

14、但以上部分算法会丢弃vaf <5%的变异或者只在vaf>5%上进行性能评估。因为,普遍的共识是当变异等位基因频率(vaf)<5%或<10%时,丢弃c:g>t:a变异,因为ffpe相关的假阳性通常只在低频率下存在。然而,这种限制不理想,因为它阻止了潜在临床相关低频变异的检测,并限制了低肿瘤含量样本的使用。此外,ffpe相关假阳性也已经在>10%的频率下被观察到。

15、由于dna损伤突变位于原始dna模板的单链上,目前的软件或者算法把dna 模板的偏好性纳入计算或者特征训练,对于单端测序的ngs数据则不适用。从目前的文献看,大部分的测试数据都是捕获法的数据,对于amplicon(扩增子)的数据比较少,对于单端测序的扩增子数据在dna损伤样本上的表现目前还未看到。


技术实现思路

1、本专利技术旨在至少在一定程度上解决上述相关技术中的技术问题之一。

2、为此,本专利技术的目的在于提供一种ngs测序中dna损伤假阳性突变过滤的方法及应用,能够不限制dna损伤的变异等位基因频率(vaf),同时能够适用于更多的技术平台,不受测序单端或者双端的限制。

3、为了解决上述技术问题,本专利技术是这样实现的:

4、本专利技术实施例提供了一种ngs测序中dna损伤假阳性突变过滤的方法,所述方法包括:

5、s1、基于正常样本的突变亚型分布构建基线;

6、s2、对待测样本进行变异检测,基于检测结果,通过二项式检验或负二项式检验判断该待测样本对应的突变亚型与基线之间的差异性,根据差异性判断该待测样本是否存在dna损伤;

7、s3、针对dna损伤的样本,提取其中vaf≤5%的snv突变,并确定相应突变亚型在基准测序深度下出现的基准错误率;

8、s4、根据所述基准错误率计算位点的dna损伤显著性p值,基于dna损伤显著性p值判断相应位点是真实突变位点还是假阳性位点,从而实现过滤。

9、另外,根据本专利技术的ngs测序中dna损伤假阳性突变过滤的方法,还可以具有如下附加的技术特征:

10、在其中的一些实施方式中,步骤s1中基于正常样本的突变亚型分布构建基线的内容包括:

11、选取若干例无dna损伤的正常样本进本文档来自技高网...

【技术保护点】

1.一种NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,步骤S1中基于正常样本的突变亚型分布构建基线的内容包括:

3.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,步骤S2的内容包括:

4.根据权利要求3所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,p-value对应的预设阈值为0.01。

5.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,所述基准测序深度的获得方式为:统计对应样本中所有SNV的测序深度的中位数作为基准测序深度。

6.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,步骤S3中统计所有待测突变亚型的测序深度、支持测序碱基序列以及VAF,基于统计的信息提取其中VAF≤5%的SNV突变,并选择95%分位数作为该样本中该待测突变亚型的在基准测序深度下出现的基准错误率。

7.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,所述基准错误率与log(测序深度)呈负相关。

8.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,所述基准错误率与测序深度关系为:

9.根据权利要求1所述的NGS测序中DNA损伤假阳性突变过滤的方法,其特征在于,预设超高深度截断值;

10.一种权利要求1-9任一项所述的NGS测序中DNA损伤假阳性突变过滤的方法的应用,其特征在于,所述方法应用在单端测序SE或者双端测序PE中。

...

【技术特征摘要】

1.一种ngs测序中dna损伤假阳性突变过滤的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的ngs测序中dna损伤假阳性突变过滤的方法,其特征在于,步骤s1中基于正常样本的突变亚型分布构建基线的内容包括:

3.根据权利要求1所述的ngs测序中dna损伤假阳性突变过滤的方法,其特征在于,步骤s2的内容包括:

4.根据权利要求3所述的ngs测序中dna损伤假阳性突变过滤的方法,其特征在于,p-value对应的预设阈值为0.01。

5.根据权利要求1所述的ngs测序中dna损伤假阳性突变过滤的方法,其特征在于,所述基准测序深度的获得方式为:统计对应样本中所有snv的测序深度的中位数作为基准测序深度。

6.根据权利要求1所述的ngs测序中dna损伤假阳性突变过滤的方法,其...

【专利技术属性】
技术研发人员:王世豪陈进祥程涛范新平韩天澄骆磊谭云涛夏艳黄宇陈维之杜波
申请(专利权)人:臻和北京生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1