一种NGS建库分子接头及其制备方法和用途技术

技术编号:21881179 阅读:53 留言:0更新日期:2019-08-17 10:55
本发明专利技术提供了一种NGS建库分子接头及其制备方法和用途,所述分子接头包括5’端引物结合区、单分子标签区和共有连接区,所述共有连接区包括第一序列和第二序列,所述第一序列和第二序列互补连接。本发明专利技术的分子接头可以用于扩增子建库,通过特异性基因引物延伸从而富集建库,将相同的分子标签所有reads都包含的突变位点判定为真正的生物学突变,显著降低假阳性概率。

A kind of NGS library building molecular joint and its preparation method and Application

【技术实现步骤摘要】
一种NGS建库分子接头及其制备方法和用途
本专利技术属于分子生物学领域,涉及一种NGS建库分子接头及其制备方法和用途,尤其涉及一种NGS建库分子条形码接头及其制备方法和用途,具体涉及一种单分子标签扩增子建库接头及其制备方法和用途。
技术介绍
二代测序技术已经成为成熟有效的分子检测手段,应用大规模平行测序的策略,具备同时检测多个靶标和多个样品的能力,二代测序技术具有一代测序和PCR方法不可比拟的通量优势。采用高深度测序的方法,二代测序在肿瘤检测、产前诊断和病原体筛查方面都有广泛的应用。通过极高深度测序,二代测序可以达到极高的检测灵敏度。使得微小残留病灶检测,肿瘤突变液体活检、肿瘤早筛,以及可诉肿瘤突变负荷在治疗过程中的监控评估成为可能。然而极高深度测序亦存在其局限性,由于建库需要多轮的PCR扩增过程,底物分子片段在扩增过程中,由于扩增酶导致的的复制错误,会引入大量非自然的突变,在加上测序过程中的信号错误,会严重提升高深度测序的假阳性率。建库扩增加上测序过程中的团簇生长以及测序过程中的光信号错误,大约有1%的错误率,而很多检测领域如ctDNA突变一般会在1%以下。需要采取相应的手段降低假阳性,否则会显著降低检测结果的可靠程度。目前主要从建库方法设计和数据过滤方面来消除以上所述因素造成的影响。有代表性的是在建库接头中引入单分子识别标签。如采用多个随机兼并碱基构成的单分子标记标签。例如通过引物引入14个兼并碱基的单链分子标签可以使得错误率降低20倍。而在扩增前基于连接反应引入单分子标签的方法则更有利于去除PCR扩增偏好性带来的影响,有利于检测底物拷贝数变化和RNA测序的表达丰度。基于连接反应引入单分子标签的代表性方法为illumina的Y字形单分子标签接头,该技术同时将两个独立的长兼并序列单分子标签连接到底物双分子的两端。通过一对通用引物进行扩增后分别得到两组来自底物分子的序列。这种依赖通用引物复制底物分子的原理并不适用于基于特异性基因引物延伸的富集建库。另外,由于Y型duplex测序底物双分子两端都连接了长随机碱基标签,存在由于测序过程中固定的错误率导致的留存率过低的缺点,要达到足够符合分析要求的reads需要额外大幅度的提高测序深度,增加了使得测序成本。现有单分子标签接头由两部构成,如图1所示,A、B代表两个引物结合区;α和α'代表两个互相匹配的兼并序列互补对区,通过引物结合区和兼并序列区的组合作为一个特有的单分子标签。接头通过连接反应结合到底物分子上后形成如图2所示的结构;Y字形接头的制备工艺如图3所示,需要经过双链退火延伸及酶切后纯化的步骤。现有的Y字形接头的制备过程繁琐,基本原理是两个长短不同的单链序列通过共有的退火匹配序列进行退火然后进行延伸实现随机分子标签的复制,然后进行酶切和纯化。由于存在随机序列的自由匹配干扰,使得两个单链序列正确退火的效率非常低,这就要求非常严格的变性胶纯化程序,从而增加了接头制备的难度和延长了制备时间。现有的duplex建库接头及其实现工艺的局限性限制了其在实际科研或者医学诊断中的应用。因此,提供一种适用于扩增子建库的单分子标记测序接头和相匹配的制备工艺具有重要意义和广阔的应用前景。
技术实现思路
针对现有技术的不足及实际的需求,本专利技术提供一种NGS建库分子接头及其制备方法和用途,本专利技术的分子接头适用于扩增子建库,将相同的分子标签所有reads都包含的突变位点判定为真正的生物学突变,显著降低假阳性概率。为达此目的,本专利技术采用以下技术方案:第一方面,本专利技术提供一种NGS建库分子接头,所述分子接头包括5’端引物结合区、单分子标签区和共有连接区,所述共有连接区包括第一序列和第二序列,所述第一序列和第二序列互补连接。本专利技术的接头分子连接底物后,在建库过程中沿着5’到3’端的方向延伸,补齐末端突出的部分,基于特异性基因引物延伸的富集建库,可用于扩增子建库,适用范围广。优选地,所述5’端引物结合区的碱基数为10-40个,例如可以是10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个,优选为25-35个。优选地,所述单分子标签区由随机碱基构成。本专利技术中,通过加入随机碱基构成的单分子标签,有效区分来自不同模板的底物,具有相同标签的所有reads都包含的突变位点才判定为真正的生物学突变,显著降低假阳性概率。通过单分子标签可以有效的区别RNA表达量、基因组拷贝数扩增/缺失与测序深度不均衡造成的测序区域reads数量差异,提升目的片段量性检测的可靠度。优选地,所述随机碱基的个数为6-14个,例如可以是6个、7个、8个、9个、10个、11个、12个、13个或14个,优选为8-12个。优选地,所述共有连接区的互补碱基对数为4-8对,例如可以是4对、5对、6对、7对或8对。本专利技术中,共有连接区的互补碱基对数为4-8对,若共有连接区过短则影响接头双链的稳定性,若过长则影响后续上机测序的质量评估,也会降低有效reads长度。优选地,所述第一序列的3’末端突出一个粘性末端胸腺嘧啶。本专利技术中,分子接头的第一序列3’末端突出一个粘性末端胸腺嘧啶,与待测底物分子上的腺嘌呤互补结合,完成分子接头与底物的连接。优选地,所述胸腺嘧啶经过羟基化处理。优选地,所述第二序列的5’端进行磷酸化处理。优选地,所述5’端引物结合区的核苷酸序列如SEQIDNO.2所示,具体为5’-GTCTCGTGGGCTCGGAGATGTGCTCTTCCGATCT-3’;所述单分子标签区为12个随机碱基构成;所述共有连接区的第一序列如SEQIDNO.3所示,具体为5’-TGACTGTAGAAGA-3’;所述共有连接区的第二序列如SEQIDNO.4所示,具体为5’-TCTTCTACAGTCA-3’。第二方面,本专利技术提供一种用于制备如第一方面所述的分子接头的单链多核苷酸,所述单链多核苷酸按顺序依次包括引物结合区、单分子标签区、第一互补序列区、环形连接区和第二互补序列区。优选地,所述单分子标签区由随机碱基构成。优选地,所述第一互补序列区与第二互补序列区的碱基互补。优选地,所述第一互补序列区和第二互补序列区包含相同的酶切位点。优选地,所述环形连接区的碱基个数为20-60个,例如可以是20个、21个、23个、25个、28个、30个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、52个、53个、55个、56个、58个、59个或60个,优选为30-40个。优选地,所述环形连接区的核苷酸上具备生物素标记。优选地,所述生物素标记的核苷酸个数不少于一个,例如可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或13个等,优选为1-5个,进一步优选为2个。优选地,所述单链多核苷酸的核苷酸序列如SEQIDNO.1所示,具体如下:GTCTCGTGGGCTCGGAGATGTGCTCTTCCGATCTNNNNNNNNNNNNTGACTGTAGAA本文档来自技高网
...

【技术保护点】
1.一种NGS建库分子接头,其特征在于,所述分子接头包括5’端引物结合区、单分子标签区和共有连接区,所述共有连接区包括第一序列和第二序列,所述第一序列和第二序列互补连接。

【技术特征摘要】
1.一种NGS建库分子接头,其特征在于,所述分子接头包括5’端引物结合区、单分子标签区和共有连接区,所述共有连接区包括第一序列和第二序列,所述第一序列和第二序列互补连接。2.根据权利要求1所述的分子接头,其特征在于,所述5’端引物结合区的碱基数为10-40个;优选地,所述单分子标签区由随机碱基构成;优选地,所述随机碱基的个数为6-14个;优选地,所述共有连接区的互补碱基对数为4-8对。3.一种用于制备如权利要求1或2所述的分子接头的单链多核苷酸,其特征在于,所述单链多核苷酸按顺序依次包括引物结合区、单分子标签区、第一互补序列区、环形连接区和第二互补序列区;优选地,所述单分子标签区由随机碱基构成;优选地,所述第一互补序列区与第二互补序列区的碱基互补;优选地,所述第一互补序列区和第二互补序列区包含相同的酶切位点;优选地,所述环形连接区的碱基个数为20-60个;优选地,所述环形连接区的核苷酸上具备生物素标记;优选地,所述生物素标记的核苷酸个数不少于一个,优选为1-5个,进一步优选为2个。4.根据权利要求3所述的单链多核苷酸,其特征在于,所述单链多核苷酸的核苷酸序列如SEQIDNO.1所示。5.一种制备如权利要求1或2所述的分子接头的方法,其特征在于,所述方法包括如下步骤:(1)将权利要求3或4所述的单链多核苷酸退火;(2)加入限制性内切酶,酶切反应;(3)利用磁珠负选,纯化回收步骤(2)酶切产物。6.根据权利要求5...

【专利技术属性】
技术研发人员:庞震国刘萍萍张亚飞
申请(专利权)人:凯杰苏州转化医学研究有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1