一种检测靶序列的超低频突变的接头序列及方法技术

技术编号:16747396 阅读:47 留言:0更新日期:2017-12-08 14:52
本发明专利技术公开了一种检测靶序列的超低频突变的接头序列及方法。本发明专利技术的方法通过对打断后的基因组或者cfDNA进行末端修复,加A,接头连接,片段富集以及捕获等过程,从而获得了一定量的带有标签的分子,进行上机测序,结合后期的生物分析方法对正负链进行校正,分析出真实突变信息。

【技术实现步骤摘要】
一种检测靶序列的超低频突变的接头序列及方法
本专利技术属于高通量测序领域,具体而言涉及一种检测靶序列的超低频突变的接头序列及方法。
技术介绍
与一代测序技术相比较,二代测序技术一次可以花费较少的时间和费用检测到成百上亿的序列信息,正是随着测序成本的下降和通量的增加,使得人类医学由传统医学进入到了精准医疗时代成为了可能。目前,由于二代测序技术自身具有通量高、效率高、价格适中等优势,尤其在肿瘤的检测中得到更为广泛的应用,凸显了其优势。但是在文库构建过程中,高保真酶的复制错误率为10-6,错误率还会随着循环数的增加而增加,同时在测序过程中,仪器对碱基的读错率为0.01%-1%之间,这样很难区分当突变率在1%以下时,是测序本身的错误还是生物体内本来就存在的突变。然而人们逐渐认识到检测这些低频突变意义重大,通过对这些低频突变信息进行分析,更早期地发现肿瘤发生转移,出现耐药的分子机制,这样医生可以及早地更改治方案,减少了不必要的过渡治疗,节约了医疗成本和提高了患者的生活质量。对血浆中游离核酸突变信息的检测很好的证明了这一点,通过肿瘤组织取样除了会给患者带来痛苦之外,还会有很多局限性,例如,不能多次取样,突变信息的检测还会受制于取样的位置,并且肿瘤组织具有极强的异质性,借助于外周血来检测cfDNA,分析出低频突变信息,这与原发灶的突变信息的匹配度高达到90%以上,同时对于转移之后恶性程度高的肿瘤细胞来说,从外周血中可以获得更为丰富的突变信息,进而实时和真实地反映肿瘤患者当下的状态。然而只有有效地捕获到这些有用的突变信息,设计出有效的建库方法并结合有效的生物信息学流程和算法,这些突变才能够被准确检测到,为进一步的生物学和医学分析提供理论依据。目前解决超低频突变噪音问题的策略有两种:其一,提高测序深度,随着测序深度的提高,检出率并没有得到有效改善,同时还增加了测序成本。其二,引入分子标签,即对原始分子进行标记,通过引入分子标签,对原始的DNA分子进行标记,通过生物信息分析方法还原最原始的突变状态。通过后续的PCR扩增过程,将来源于不同的DNA分子带上了不同的分子标签,分析测序结果,筛选出相同的插入片段,通过聚类分析,再结合分子标签,随机碱基一样或者相似(8个简并碱基中只有一个不同)为重复,去除重复之后,如果同一个插入分子的两端带上带有互补配对的分子标签则为正负链。如果同一位置的突变碱基在正负链中都出现,则标记为真实突变。此方法可以检测出低至0.1%的突变率。然而当前引入分子标签有2种策略:其一,UMI(uniquemoleculeindex)方法,合成带有4-8个简并碱基的一条接头序列,和另一条带有与前一条4-8简并碱基配对的寡核苷酸,这样合成的接头种类数目为2×44-2×48种,缺点在于合成费用成本大大增加,很难得到实际应用。其二,MID(Molecularindex)方法,通过I5端加入8个随机简并碱基的方法,此方法合成接头具有简便、经济适用的优点,得到了广泛的应用。但是对于出现了1个以上同样大小的凋亡片段,都会带上不同的标记,无法跟踪原始的正负链信息,因此不能很好地将正负链信息进行较正。
技术实现思路
为了解决超低频突变检测的问题,本专利技术人提出了一种检测靶序列的超低频突变的接头序列及方法。因此,在第一方面,本专利技术提供了一种用于检测靶序列的超低频突变的方法,所述方法包括:1)针对靶序列设计用于捕获所述靶序列的探针捕获;2)设计1组或多组接头序列:其中,1组接头序列由部分互补的第一序列和第二序列退火形成,所述第一序列包括连续的4部分序列:27-31个(优选29个)碱基的A1、7-9个(优选8个)简并碱基B1、18-22个(优选20个)碱基的C1和18-26个(优选22个)碱基的D1;所述第二序列包括连续的3部分:17-25个(优选21个)碱基的D1-1、19-23个(优选21个)碱基的E1和30-34个(优选32个)碱基的F1,第一序列的B1中的简并碱基为随机序列,第一序列的D1与第二序列的D1-1互补,第一序列的D1在3’端具有非配对T;第一序列的D1的3’端开始的第6个碱基开始为Xn,第二序列的D1-1第5个碱基开始为Zn,n为4-8,Xn与Zn配对,优选n=4;每组接头序列中有4种以上Xn与Zn配对形式,优选8种以上,更优选16种以上;其他组接头序列与第一组接头序列相比,第二序列的F1的5’端开始的8个碱基有变化;3)将1个或多个DNA样品分别打断、进行末端修复并在3’末端加A;4)将步骤2)的接头序列与步骤3)中处理的DNA样品在连接酶的作用下进行连接反应,所述接头序列第一序列的D1在3’端的非配对T和DNA样品片断末端加的A配对,每个样品对应一组接头序列,对于多个样品的情况,分别对不同的样品分配不同组的接头进行连接;5)用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物对步骤4)的连接产物进行PCR扩增;6)以步骤1)中设计的探针对步骤5)的扩增产物进行捕获,获得捕获产物;7)以步骤6)获得的捕获产物为模板用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物进行PCR扩增,获得扩增产物;8)将步骤7)获得的扩增产物测序,获得测序结果;9)对步骤8)获得的测序结果与标准基因组序列比较获得突变位点:对于相同靶序列的相同位点的突变,如果对应于第一序列的B1的简并碱基不同,对应于第二序列的F1相同,且对应于第一序列的D1的Xn与对应于第二序列的D1-1的Zn配对形式相同,则所述靶序列的该位点的突变为超低频突变。在一个实施方案中,在步骤4)后包括将步骤4)获得的连接产物进行纯化的步骤;并且/或者在步骤6)后包括将步骤6)获得的扩增产物进行纯化的步骤。优选地,所述纯化是通过磁珠进行纯化。在一个实施方案中,在步骤2)中,A1:AATGATACGGCGACCACCGAGATCTACAC、B1:8个简并碱基NNNNNNNN、C1:ACACTCTTTCCCTACACGAC和D1:GCTCTTCCGATCTXnTGACT;D1-1:GTCAZnAGATCGGAAGAGC、E1:ACACGTCTGAACTCCAGTCAC和F1:AATGATGAATCTCGTATGCCGTCTTCTGCTTG;针对第一序列的A1的5’端的引物P5:AATGATACGGCGACCACCGA和针对第二序列的F1的3’端的引物p7:CAAGCAGAAGACGGCATACGA。在一个实施方案中,在步骤2)中,对于4种Xn与Zn配对形式,例如为AGCT-TCGA、TACG-ATGC、CAGC-GTCG和AGTC-TCAG。在一个实施方案中,在步骤6)中,将步骤5)中的扩增产物与链霉素标记的附着有探针的磁珠进行结合,与探针结合的靶片段通过链霉素和生物素间的亲和力,获取到靶片段,然后通过洗涤缓冲液将没有结合上探针的目标片段和干扰下一步反应的盐离子洗掉。在第二方面,本专利技术提供了一种检测靶序列的超低频突变的接头序列,所述接头序列包括1组或多组接头序列:其中,1组接头序列由部分互补的第一序列和第二序列退火形成,所述第一序列包括连续的4部分序列:27-31个(优选29个)碱基的A1、7-9个(优选8个)简并碱基B1、18-22个(优选20本文档来自技高网
...
一种检测靶序列的超低频突变的接头序列及方法

【技术保护点】
一种用于检测靶序列的超低频突变的方法,所述方法包括:1)针对靶序列设计用于捕获所述靶序列的探针捕获;2)设计1组或多组接头序列:其中,1组接头序列由部分互补的第一序列和第二序列退火形成,所述第一序列包括连续的4部分序列:27‑31个(优选29个)碱基的A1、7‑9个(优选8个)简并碱基B1、18‑22个(优选20个)碱基的C1和18‑26个(优选22个)碱基的D1;所述第二序列包括连续的3部分:17‑25个(优选21个)碱基的D1‑1、19‑23个(优选21个)碱基的E1和30‑34个(优选32个)碱基的F1,第一序列的B1中的简并碱基为随机序列,第一序列的D1与第二序列的D1‑1互补,第一序列的D1在3’端具有非配对T;第一序列的D1的3’端开始的第6个碱基开始为Xn,第二序列的D1‑1第5个碱基开始为Zn,n为4‑8,Xn与Zn配对,优选n=4;每组接头序列中有4种以上Xn与Zn配对形式,优选8种以上,更优选16种以上;其他组接头序列与第一组接头序列相比,第二序列的F1的5’端开始的8个碱基有变化;3)将1个或多个DNA样品打断、进行末端修复并在末端加A;4)将步骤2)的接头序列与步骤3)中处理的DNA样品在连接酶的作用下进行连接反应,所述接头序列第一序列的D1在3’端的非配对T和DNA样品片断末端加的A配对,每个样品对应一组接头序列,对于多个样品的情况,将所述连接产物混合;5)用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物对步骤4)的连接产物进行PCR扩增;6)以步骤1)中设计的探针对步骤5)的扩增产物进行捕获,获得捕获产物;7)以步骤6)获得的捕获产物为模板用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物进行PCR扩增,获得扩增产物;8)将步骤7)获得的扩增产物测序,获得测序结果;9)对步骤8)获得的测序结果与标准基因组序列比较获得突变位点:对于相同靶序列的相同位点的突变,如果对应于第一序列的B1的简并碱基不同,对应于第二序列的F1相同,且对应于第一序列的D1的Xn与对应于第二序列的D1‑1的Zn配对形式相同,则所述靶序列的该位点的突变为超低频突变。...

【技术特征摘要】
1.一种用于检测靶序列的超低频突变的方法,所述方法包括:1)针对靶序列设计用于捕获所述靶序列的探针捕获;2)设计1组或多组接头序列:其中,1组接头序列由部分互补的第一序列和第二序列退火形成,所述第一序列包括连续的4部分序列:27-31个(优选29个)碱基的A1、7-9个(优选8个)简并碱基B1、18-22个(优选20个)碱基的C1和18-26个(优选22个)碱基的D1;所述第二序列包括连续的3部分:17-25个(优选21个)碱基的D1-1、19-23个(优选21个)碱基的E1和30-34个(优选32个)碱基的F1,第一序列的B1中的简并碱基为随机序列,第一序列的D1与第二序列的D1-1互补,第一序列的D1在3’端具有非配对T;第一序列的D1的3’端开始的第6个碱基开始为Xn,第二序列的D1-1第5个碱基开始为Zn,n为4-8,Xn与Zn配对,优选n=4;每组接头序列中有4种以上Xn与Zn配对形式,优选8种以上,更优选16种以上;其他组接头序列与第一组接头序列相比,第二序列的F1的5’端开始的8个碱基有变化;3)将1个或多个DNA样品打断、进行末端修复并在末端加A;4)将步骤2)的接头序列与步骤3)中处理的DNA样品在连接酶的作用下进行连接反应,所述接头序列第一序列的D1在3’端的非配对T和DNA样品片断末端加的A配对,每个样品对应一组接头序列,对于多个样品的情况,将所述连接产物混合;5)用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物对步骤4)的连接产物进行PCR扩增;6)以步骤1)中设计的探针对步骤5)的扩增产物进行捕获,获得捕获产物;7)以步骤6)获得的捕获产物为模板用针对第一序列的A1的5’端的引物和第二序列的F1的3’端的引物进行PCR扩增,获得扩增产物;8)将步骤7)获得的扩增产物测序,获得测序结果;9)对步骤8)获得的测序结果与标准基因组序列比较获得突变位点:对于相同靶序列的相同位点的突变,如果对应于第一序列的B1的简并碱基不同,对应于第二序列的F1相同,且对应于第一序列的D1的Xn与对应于第二序列的D1-1的Zn配对形式相同,则所述靶序列的该位点的突变为超低频突变。2.权利要求1的方法,在步骤4)后包括将步骤4)获得的连接产物进行纯化的步骤;并且/或者在步骤6)后包括将步骤6)获得的扩增产物进行纯化的步骤。3.权利要求2的方法,所述纯化是通过磁珠进行纯化。4.权利要求1的方法,在步骤2)中,A1:AATGATACGGCGACCACCGAGATCTACAC、B1:8个简并碱基NNNNNNNN、C1:ACACTCTTTCCCTAC...

【专利技术属性】
技术研发人员:余越美王瑞超邵谦之屈武斌蔡万世
申请(专利权)人:艾吉泰康生物科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1