一种用于提高二代测序检测准确度的方法技术

技术编号：39322866 阅读：22 留言：0更新日期：2023-11-12 16:02

本发明专利技术涉及医学分子生物学技术领域，特别涉及一种用于提高二代测序检测准确度的方法，本发明专利技术所提供的一种用于提高二代测序检测准确度的方法，利用生物信息学方法生成针对不同panel的易发生嵌合区域的黑名单，并设置过滤原则，仅将位于嵌合区域的突变进行过滤，捞回不处于嵌合区域的突变，提高检测的灵敏度和准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于提高二代测序检测准确度的方法

[0001]本专利技术涉及医学分子生物学
，特别涉及一种用于提高二代测序检测准确度的方法。

技术介绍

[0002]二代测序基于短读长、高通量测序平台，对于肿瘤DNA检测来说，先要进行DNA的片段化，片段化最经典的方法是基于超声破碎的机械打断法。但由于超声条件较为剧烈，会引起DNA损伤，一些DNA会形成局部单链，在修复酶和聚合酶的综合作用下，生成嵌合reads。一些嵌合reads在生成过程中会引入由于不配对而产生的人为突变。在常规生信过滤过程中，由于考虑到嵌合reads会引入人为突变，会将嵌合reads整体剔除，不再进行后续分析。现有的数据过滤方法，存在以不足：（1）笼统将嵌合reads全部去除，会丢到真实发生突变，造成灵敏度下降及检测频率不准确；（2）低质量样本中存在大量嵌合reads，全部删除会造成检测深度低，假阴性风险。

技术实现思路

[0003]针对上述
技术介绍
的不足，本专利技术提供了一种用于提高二代测序检测准确度的方法，通过建立黑名单的方式，过滤二代测序文库中人为引入的突变，提高检测准确度。
[0004]一种用于提高二代测序检测准确度的方法，包括以下步骤：S1. 对样品进行基因靶向测序，获取原始fastq文件；S2. 对原始fastq文件进行数据控制，筛除低质量数据；S3. 将质控后的fastq文件比对参考基因组获得bam文件，对bam文件进行数据过滤，去除重复序列；S4. 基于黑名单进行数据过滤，将样本中嵌合read上的阳性突变检出；过滤条...

【技术保护点】

【技术特征摘要】
1.一种用于提高二代测序检测准确度的方法，其特征在于包括以下步骤：S1. 对样品进行基因靶向测序，获取原始fastq文件；S2. 对原始fastq文件进行数据控制，筛除低质量数据；S3. 将质控后的fastq文件与参考基因组比对获得bam文件，对bam文件进行数据过滤，去除重复序列；S4. 基于黑名单进行数据过滤，将样本中嵌合read上的阳性突变检出；过滤条件为：当黑名单中的位点若突变频率小于等于10%将被过滤，大于10%则保留。2.根据权利要求1所述的一种用于提高二代测序检测准确度的方法，其特征在于：S2中数据控制具体为：去除接头序列、去除低质量数据、去除过短reads。3.根据权利要求1所述的一种用于提高二代测序检测准确度的方法，其特征在于，S3中所述参考基因组的序列为hg19。4.根据权利要求1所述的一种用于提高二代测序检测准确度的方法，其特征在于，S3中采用Picard软件进行重复序列去除，然后用Vardict软件去识别SNV变异。5.根据权利要求1所述的一种用于提高二代测序检测准确度的方法，其特征在于S4中黑名单采用以下方法确定：S41.将质控后的fastq文件与参考基因组比对获得bam文件，向上下游各延伸50bp，作为寻找IVS的参考序列；S42.将这些参考序列进行分割，得到n=∑[(L<...

【专利技术属性】
技术研发人员：王冰，陈慧娟，张怡然，商宇红，舒迎霜，蔡丽丽，周启明，
申请(专利权)人：北京求臻医学检验实验室有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人