分子标签接头及测序文库的构建方法技术

技术编号:30363483 阅读:15 留言:0更新日期:2021-10-16 17:25
本发明专利技术公开了分子标签接头和测序文库的构建方法。该分子标签接头包括第一接头和第二接头,第一接头包括:第一链,第一链包括从5

【技术实现步骤摘要】
分子标签接头及测序文库的构建方法


[0001]本申请涉及测序
,尤其是涉及分子标签接头及测序文库的构建方法。

技术介绍

[0002]循环肿瘤DNA(circulating tumor DNA,ctDNA)是指坏死或凋亡的肿瘤细胞释放到外周血中的肿瘤DNA片段。由于ctDNA包含了肿瘤特异性的表观遗传信息,利用ctDNA来实时检测肿瘤状态以避免穿刺手术给患者带来的痛苦也就成为了一种可行的非侵入式检测方法。但是,肿瘤的异质性使得外周血中ctDNA的含量极少,其突变频率一般也在1%以下,属于低频突变。因此,ctDNA液体活检虽然是目前精准肿瘤学应用中的热点,但如何准确检测仍然是亟待解决的问题。
[0003]下一代基因测序技术(NGS)是目前应用最广的测序技术,具有测序深度高、通量大、准确率高、灵敏度好等优势,然而NGS应用于ctDNA低频突变检测同样存在一定的技术难点。一方面,NGS不可避免地存在测序误差,单碱基错误率一般在0.1~1%之间;而另一方面,测序文库构建一般使用高保真酶进行PCR扩增,也存在10
‑6左右的复制错误率,并且随着PCR循环数增多而增大。这两方面的因素导致ctDNA低频突变测序分析时存在较大的背景噪音,特别是在0.1%及以下检测限的情况下,难以区分建库及测序过程中引入的错误与ctDNA本身的突变,容易出现假阳性结果。
[0004]目前,主要通过建库连接步骤,采用带有分子标签的接头,将待测核酸分子标记一个唯一可识别的序列编码,通过该唯一序列编码来区分真正的突变与建库及测序过程中引入的错误,实现低频突变的检测。带有分子标签的接头主要包括两类:一类是接头双链的随机碱基区域(用作分子标签)互补配对的,一类是接头双链的随机碱基区域不互补配对的。采用随机碱基区域互补配对的接头标记得到的最终测序数据,需要根据分子标签和起始位置进行互补双链的链间校正,随机碱基区域不互补配对的接头,同一模板DNA两条双链之间的分子标签没有对应关系,无法进行互补双链链间校正,而随机碱基区域互补配对的接头,可以进行链间校正。链间校正可以在链内校正的基础上进一步去除建库及测序过程引入的错误,识别原始模板携带极低频突变,提高ctDNA检测灵敏度。因而,选择能够进行链间校正的接头是提高检测准确性的有效方式。
[0005]链间校正时,需要来自同一原始DNA分子的两个聚簇同时存在,要求报证DNA双链同时被加上完整接头。然而现有的分子标签引入方法是在加接头时,直接连接上双链接头。因此,大量模板存在其中一条链连上完整接头、而另一条链没有完整接头的情况,这导致最终的测序数据中存在大量没有互补链聚簇的数据,占用了测序数据,影响了测序深度。

技术实现思路

[0006]本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种有效提高测序深度的分子标签接头。
[0007]本申请的第一方面,提供分子标签接头,该分子标签接头包括第一接头和第二接
头,第一接头包括:
[0008]第一链,第一链包括从5

端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列;
[0009]第二链,第二链包括从5

端依次的第二固定碱基序列和碱基T;
[0010]其中,第一链和第二链通过第一固定碱基序列和第二固定碱基序列的反向互补配对而结合;
[0011]第二接头包括第二引物结合序列,第二引物结合序列与第一引物结合序列至少部分反向互补。
[0012]根据本申请实施例的分子标签接头,至少具有如下有益效果:
[0013]采用该分子标签接头进行文库构建时,第一接头和第二接头必须报证连接上形成完整的接头才会开始第二轮的延伸与连接,而第一接头和第二接头的第一轮连接产物在第二轮连接失败时,其产物无法进入下一步扩增实验。从而使得测序数据中没有互补链的聚簇的占比显著降低,有效聚簇的数量得到提高,达到了提高测序数据利用率、降低测序成本、提高检测灵敏度和测序深度的效果。
[0014]在本申请的一些实施方式中,第一固定碱基序列和所述第二固定碱基序列的长度为6~12nt。
[0015]在本申请的一些实施方式中,第一固定碱基序列和所述第二固定碱基序列为任意碱基序列。其中,任意碱基序列是指对序列中碱基的种类和顺序无任何限定性要求。第一固定碱基序列和第二固定碱基序列作为任意碱基序列与随机碱基序列的区别在于,多个不同的分子标签接头的第一固定碱基序列和第二固定碱基序列为相同序列,而随机碱基序列作为分子标签在多个不同的分子标签接头中是不同的,从而在与DNA片段结合时,将不同的DNA片段区分开,使具有相同的随机碱基序列的归为同一聚簇。
[0016]在本申请的一些实施方式中,随机碱基序列的长度为8~16nt。
[0017]在本申请的一些实施方式中,第一引物结合序列包括从5

端依次的第三固定碱基序列和第四固定碱基序列。
[0018]在本申请的一些实施方式中,第二引物结合序列包括从5

端依次的第五固定碱基序列和第六固定碱基序列,第六固定碱基序列与第三固定碱基序列反向互补。
[0019]在本申请的一些实施方式中,第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT;或第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA,第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT。
[0020]本申请的第二方面,提供试剂盒,该试剂盒包括上述的分子标签接头。该试剂盒包括但不限于建库试剂盒、检测试剂盒等。
[0021]本申请的第三方面,提供测序文库的构建方法,该构建方法包括以下步骤:
[0022]提供模板、前述的第一接头、第二接头和建库引物;
[0023]使第一接头和模板接触并相互连接,得到第一连接产物;
[0024]使第一连接产物与第二接头结合,并开始延伸反应,补齐随机碱基序列在第二链上的互补序列,形成第二连接产物;
[0025]使第二连接产物中的第二固定碱基序列变性脱落,继续延伸反应,补齐第一固定
碱基序列在第二链上的互补序列,并与模板连接,形成第三连接产物;
[0026]使第三连接产物与建库引物接触,扩增得到测序文库。
[0027]在本申请的一些实施方式中,形成第二连接产物过程中的反应温度为10~30℃,形成第三连接产物过程中的反应温度为60~72℃。
[0028]本申请的第四方面,提供测序文库,该测序文库采用前述的构建方法构建得到。
[0029]本申请的第五方面,提供测序方法,该测序方法采用上述的测序文库进行测序。
[0030]本申请的第六方面,提供前述分子标签接头的制备方法,该制备方法包括合成第一接头的步骤,该步骤如下:
...

【技术保护点】

【技术特征摘要】
1.分子标签接头,其特征在于,包括第一接头和第二接头,所述第一接头包括:第一链,所述第一链包括从5

端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列;第二链,所述第二链包括从5

端依次的第二固定碱基序列和碱基T;其中,所述第一链和所述第二链通过所述第一固定碱基序列和所述第二固定碱基序列的反向互补配对而结合;所述第二接头包括第二引物结合序列,所述第二引物结合序列与所述第一引物结合序列至少部分反向互补;优选的,所述第一固定碱基序列和所述第二固定碱基序列的长度为6~12nt;优选的,所述第一固定碱基序列和所述第二固定碱基序列为任意碱基序列;优选的,所述随机碱基序列的长度为8~16nt。2.根据权利要求1所述的分子标签接头,其特征在于,所述第一引物结合序列包括从5

端依次的第三固定碱基序列和第四固定碱基序列。3.根据权利要求2所述的分子标签接头,其特征在于,所述第二引物结合序列包括从5

端依次的第五固定碱基序列和第六固定碱基序列,所述第六固定碱基序列与所述第三固定碱基序列反向互补。4.根据权利要求3所述的分子标签接头,其特征在于,所述第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,所述第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGA...

【专利技术属性】
技术研发人员:张核子巴颖程云阳卢晓萍操利超
申请(专利权)人:深圳市核子基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1