本发明专利技术提供了一种用于构建测序文库的接头,其通过第一核苷酸单链与第二核苷酸单链部分结合而形成,所述第一核苷酸单链包括第一通用引物序列、第一测序引物序列和位于所述第一通用引物序列与所述第一测序引物序列之间的单分子标签,所述第二核苷酸单链包括第二通用引物序列、与所述第一测序引物序列部分互补的第二测序引物序列和位于所述第二通用引物序列与所述第二测序引物序列之间的样本标签,所述第一通用引物序列为AATGATACGGCGACCACCGAGATCTACAC,所述第一测序引物为ACACTCTTTCCCTACACGACGCTCTTCCGATC T,所述第二通用引物序列为ATCTCGTATGCCGTCTT CTGCTTG,所述第二测序引物为GATCGGAAGAGCACA CGTCTGAACTCCAGTCAC。根据本公开,能够提供一种能够提高二代测序准确性的用于构建测序文库的接头和测序文库的构建方法。
【技术实现步骤摘要】
用于构建测序文库的接头和测序文库的构建方法本申请是申请日为2018年12月06日、申请号为201811483755.6、专利技术名称为含单分子标签的测序接头和测序文库的构建方法的专利申请的分案申请。
本专利技术属于基因测序领域,特别涉及一种用于构建测序文库的接头和测序文库的构建方法。
技术介绍
高通量测序技术(High-throughputsequencing,HTS)可以一次性对几十万到几百万条核酸分子进行序列测定,从而能够对一个物种的基因组、转录组和表观遗传改变等进行细致全貌的分析,高通量测序技术又被称为“深度测序”(Deepsequencing)。随着高通量测序技术的兴起以及测序成本的大幅降低,基因测序在精准医疗领域,如肿瘤基因检测、遗传病基因检测、产前检测等有着广阔的应用前景。以癌症早期筛查为例,在癌症患者的体液内,可以检测到由肿瘤细胞凋亡和裂解释放的循环肿瘤DNA(circulatingtumorDNA),约占cfDNA的1%,甚至0.01%,可以通过对肿瘤患者ctDNA进行测序,检测到癌症相关基因突变信息。而在孕妇的cfDNA中,约有10%-15%的cfDNA来自于胎儿,可以通过对孕妇cfDNA进行测序,筛查胎儿的遗传缺陷。然而,在上述测序中,例如cfDNA所包含的基因突变丰度较低,因此迫切需要测序精度更高,准确度更高的测序方法。目前,针对这种二代测序技术(Next-GenerationSequencing),具有通量高、成本低、准确性高等优点成为目前使用最为广泛的高通量测序技术。二代测序技术的基本原理是边合成边测序。在文库构建过程中,将DNA随机片段化,并在片段化后的DNA两端添加特定测序接头(Adaptor),然后进行文库PCR扩增。构建好的DNA文库在进行测序时通过捕捉新合成的末端的标记来确定DNA的序列。二代测序技术的准确性可达到98%以上。但是其文库在构建过程中引入了PCR扩增过程,而PCR扩增的偏好性和错误率,增加了二代测序的错误率。因此,需要开发一种精度更高准确度更高的建库技术,以适应低丰度DNA的测序要求。
技术实现思路
本专利技术是鉴于上述现有技术的状况而完成,其目的在于提供一种能够提高二代测序准确性的测序接头及测序文库的构建方法。为此,本公开提供了一种含单分子标签的测序接头,该测序接头通过第一核苷酸单链与第二核苷酸单链部分结合而形成,其中,第一核苷酸单链包括单分子标签和第一测序引物序列,并且第二核苷酸单链包括样本标签、以及与所述第一测序引物序列部分互补的第二测序引物序列。在本公开的一方面中,含单分子标签的测序接头由第一核苷酸单链与第二核苷酸单链部分结合而形成。其中,第一核苷酸单链包括单分子标签和第一测序引物序列,并且第二核苷酸单链包括样本标签、以及与所述第一测序引物序列部分互补的第二测序引物序列。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。另外,在本公开的一方面所涉及的测序接头中,所述测序接头可以为Y字型接头。在这种情况下,单分子标签和样本标签分别位于Y字型接头的两条单链上,因此能够有效地抑制单链上的单分子标签对样本标签的干扰。另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链还可以包括第一通用引物序列,并且所述第二核苷酸单链还可以包括第二通用引物序列。在这种情况下,能够将测序接头中未结合部分的两端的序列作为正反向引物。另外,在本公开的一方面所涉及的测序接头中,所述单分子标签可以为用于标记不同DNA片段的随机的碱基序列。在这种情况下,能够根据单分子标签识别重复的DNA片段,进一步提高测序的准确性。另外,在本公开的一方面所涉及的测序接头中,所述样本标签可以为用于区别不同样本的固定的碱基序列。在这种情况下,能够根据样本标签识别不同的样本,由此能够使用该测序接头能够同时操作多个样本。另外,在本公开的一方面所涉及的测序接头中,所述单分子标签的序列可以为SEQIDNO:5-10。在这种情况下,能够进一步提高测序的准确性。另外,在本公开的一方面所涉及的测序接头中,所述样本标签的序列可以为SEQIDNO:18-23。在这种情况下,能够进一步提高测序的准确性。另外,在本公开的一方面所涉及的测序接头中,所述单分子标签的长度可以为4bp至20bp。在这种情况下,通过将单分子标签的长度控制在适当的长度范围,能够不影响后续测序的效果。另外,在本公开的一方面所涉及的测序接头中,所述样本标签的长度可以为4bp至20bp。在这种情况下,通过将样本标签的长度控制在适当的长度范围,由此能够减少对后续测序效果的不良影响。另外,在本公开的一方面所涉及的测序接头中,所述第二核苷酸单链的5’端可以使用磷酸基团修饰。在这种情况下,有利于促进测序接头与DNA片段的连接反应。另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链可以与所述第二核苷酸单链通过退火而部分结合。在这种情况下,能够促进不同单链部分结合。另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链可以为5’-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’,所述第二核苷酸单链可以为5’PHO-GATCGGAAGAGCACACGTCTGAACTCCAGTCACXXXXXXXXATCTCGTATGCCGTCTTCTGCTTG-3’;在所述第一核苷酸单链中,所述第一测序引物序列可以为SEQIDNO:1,所述第一通用引物序列可以为SEQIDNO:2,其中,所述单分子标签可以为NNNNNNNN;在所述第二核苷酸单链中,所述第二测序引物序列可以为SEQIDNO:3,所述第二通用引物序列可以为SEQIDNO:4,其中,所述样本标签可以为XXXXXXXX。由此,能够更进一步提高后续的测序的精度和准确度。本公开的另一方面提供了一种测序文库的构建方法,所述方法可以包括:(a)提取DNA;(b)将DNA进行片段化处理;(c)对所获得的DNA片段进行末端修复和加A尾;(d)在步骤(c)所获得的DNA片段两端连接含单分子标签的测序接头;(e)以步骤(d)获得的DNA接头连接产物为模板,以两端接头的已知序列为正反向引物,进行PCR扩增并得到PCR产物;以及(f)进行PCR产物纯化。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。另外,在本公开的另一方面所涉及的测序文库的构建方法中,所述步骤(c)中,DNA片段的大小可以为100bp至250bp。在这种情况下,能够促进后续测序的反应。此外,在本公开的另一方面所涉及的测序文库的构建方法中,所述步骤(6)中,可以利用本文档来自技高网...
【技术保护点】
1.一种用于构建测序文库的接头,其特征在于:通过第一核苷酸单链与第二核苷酸单链部分结合而形成,所述第一核苷酸单链包括第一通用引物序列、第一测序引物序列和位于所述第一通用引物序列与所述第一测序引物序列之间的单分子标签,所述第二核苷酸单链包括第二通用引物序列、与所述第一测序引物序列部分互补的第二测序引物序列和位于所述第二通用引物序列与所述第二测序引物序列之间的样本标签,所述第一通用引物序列为AATGATACGGCGACCACCGAGATCTACAC,所述第一测序引物为ACACTCTTTCCCTACACGACGCTCTTCCGATCT,所述第二通用引物序列为ATCTCGTATGCCGTCTTCTGCTTG,所述第二测序引物为GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。/n
【技术特征摘要】
1.一种用于构建测序文库的接头,其特征在于:通过第一核苷酸单链与第二核苷酸单链部分结合而形成,所述第一核苷酸单链包括第一通用引物序列、第一测序引物序列和位于所述第一通用引物序列与所述第一测序引物序列之间的单分子标签,所述第二核苷酸单链包括第二通用引物序列、与所述第一测序引物序列部分互补的第二测序引物序列和位于所述第二通用引物序列与所述第二测序引物序列之间的样本标签,所述第一通用引物序列为AATGATACGGCGACCACCGAGATCTACAC,所述第一测序引物为ACACTCTTTCCCTACACGACGCTCTTCCGATCT,所述第二通用引物序列为ATCTCGTATGCCGTCTTCTGCTTG,所述第二测序引物为GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
2.如权利要求1所述的接头,其特征在于:
所述单分子标签为用于标记不同DNA片段的随机的碱基序列。
3.如权利要求1所述的接头,其特征在于:
所述样本标签为用于区别不同样本的固定的碱基序列。
4.如权利要求1或2所述的接头,其特征在于:
所述单分子标签的长度为4bp至20bp。
5.如权利要求1或3所述的接头,其特征在于:
所述...
【专利技术属性】
技术研发人员:许明炎,张晓妮,
申请(专利权)人:深圳海普洛斯医疗器械有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。