用于多重测序的方法和组合物技术

技术编号:8724402 阅读:204 留言:0更新日期:2013-05-22 21:54
衔接体与靶多核苷酸连接以产生衔接体标记的多核苷酸。同时对衔接体标记的多核苷酸进行测序,并且基于条码序列对样品来源进行鉴定。

【技术实现步骤摘要】
【国外来华专利技术】用于多重测序的方法和组合物 交叉引用本申请要求于2010年6月8日提交的美国临时申请号61/352,801的权益,该申请在此引入作为参考。 序列表本申请包含通过EFS-Web以ASCII格式提交的序列表,该序列表在此完整并入作为参考。所述ASCII副本创建于2011年6月8日,命名为25115-741-201.txt,大小为21Kb。
技术介绍
对DNA的大规模序列分析可有助于理解与人类及许多重要的经济植物和动物的健康和疾病状态有关的大量生物学现象,例如,参见Collins等(2003),Nature,422:835-847 !Service, Science,311:1544-1546(2006) ;Hirschhorn 等(2005),NatureReviews Genetics,6:95-108 ;National Cancer Institute,Report of Working Group onBiomedical Technology,“Recommendation for a Human Cancer Genome Project,,,(2005年 2 月);Tringe 等(2005), Nature Reviews Genetics, 6:805_814。对低成本高通量测序和再测序的需求已经导致开发了几种对很多靶DNA片段同时进行平行分析的新方法,例如 Margulies 等,Nature, 437:376-380 (2005) ;Shendure 等(2005), Science,309:1728-1732 ;Metzker (2005), Genome Research, 15:1767-1776 ;Shendure 等(2004),Nature Reviews Genetics, 5:335-344 ;Lapidus 等,美国专利公开号 US2006/0024711 ;Drmanac 等,美国专利公开号 US2005/0191656 ;Brenner 等,Nature Biotechnology, 18:630-634(2000);等等。 这些方法反映了用于增加靶多核苷酸密度和用于在特定序列检测化学的每个循环中获得数量增加的序列信息的多种解决方案。鉴于在给定反应中序列混合物的复杂性,一般限于每个反应室进行一个样品的测序。然而,使用这些下一代测序技术在给定反应中读取的碱基数量可能远远大于获得目标序列信息的实际需要,这实质上属于浪费测序空间。随着对来自多个来源的样品进行测序的需求越来越高,利用这些技术的费用可能很快会变得无法承受。测序运行也经常受限于能够平行运行的单独反应的数目,这进一步限制了可以处理大量样品的效率。解决这些挑战的一些方法涉及将额外的标识序列并入每个待分析的靶片段。在不同序列用于不同样品时,对合并的样品进行测序后,可以基于加入的序列将序列解析为对应样品来源的子集。然而,添加序列来解析样品来源面临着两个挑战。第一,当测序中的随机错误发生在太短的附加序列中或发生在不足以与对应于其他样品的序列进行区分的附加序列中时,该随机错误可能导致无法对附加的标识序列与其样品来源进行正确地鉴别。第二,考虑到此类测序错误而加入的较长序列占据了可短至20个碱基的目标读数的有价值测序空间。出于这些限制,需要增加下一代测序技术的效率,以便可以以较高的鉴别精度来测序较大数量的样品,同时使可获得的测序空间最大化。
技术实现思路
一方面,本专利技术提供了用于多重测序的方法、组合物和试剂盒。在一个实施方式中,该方法包括在单一反应室中对多个靶多核苷酸进行测序,其中所述靶多核苷酸来自两个或多个不同样品;以及基于所述靶多核苷酸的序列中含有的单一条码(barcode),以至少95%的准确度对每个所述测序的靶多核苷酸所源自的样品进行鉴定。在一些实施方式中,革G多核苷酸包含用于校正测序反应的一个或多个序列。在一些实施方式中,每个条码在至少三个核苷酸位点处不同于所有其它条码。在一些实施方式中,在条码中的核苷酸的突变或缺失后,样品来源的鉴定仍然是准确的。另一方面,本专利技术提供了用于从多个独立样品中产生衔接体(adapter)标记的靶多核苷酸的方法、组合物和试剂盒。在一个实施方式中,该方法包括:(a)提供多个第一衔接体寡核苷酸,其中每个所述第一衔接体寡核苷酸包含多个条码序列中的至少一个,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列;和(b)将至少一个所述第一衔接体寡核苷酸与每个所述样品的所述靶多核苷酸连接,从而没有条码序列与多于一个所述样品的所述靶多核苷酸连接。在一些实施方式中,该方法进一步包括(c)将多个第二衔接体寡核苷酸中的至少一个与来自步骤(b)的每个所述样品的所述靶多核苷酸连接,从而至少一些所述靶多核苷酸在一端包含所述第一衔接体寡核苷酸,并在另一端包含所述第二衔接体寡核苷酸。本专利技术的一个或多个衔接体寡核苷酸可包含SEQ ID N0:1。本专利技术的一个或多个衔接体寡核苷酸可包含SEQID N0:2。一个或多个衔接体寡核苷酸可包含发夹结构。一个或多个衔接体寡核苷酸可包含寡核苷酸双链体。在一些实施方式中,所述条码序列的长度为至少3个核苷酸。在一些实施方式中,所述多个条码序列包括选自下组的序列:AAA、TTT、CCC和GGG。在一些实施方式中,所述多个条码序列包括选自下组的序列:AAAA、CTGC、GCTG, TGCT, ACCC, CGTA, GAGT, TTAG, AGGG,CCAT, GTCA, TATC, ATTT, CACG, GGAC和TCGA。在一些实施方式中,所述多个条码序列包括选自下组的序列:AAAAA、AACCC, AAGGG, AATTT, ACACG, ACCAT, ACGTA, ACTGC, AGAGT, AGCTG,AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTA A、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。在一些实施方式中,所述方法进一步包括合并来自步骤(C)的靶多核苷酸。靶多核苷酸可以基于其所连接的条码序列进行合并,从而在合并池(pool)中沿着每个条码的一个或多个位点处均匀呈现所有四种碱基。在一些实施方式中,靶多核苷酸包含片段化的样品多核苷酸。片段化可包括对样品多核苷酸进行超声处理,和/或在适合一种或多种酶(其可以包括DNase 1、片段化酶及其变体)产生随机双链核酸断裂(break)的条件下使用一种或多种酶处理样品多核苷酸。在一些实施方式中,片段化包括使用一种或多种限制性内切酶本文档来自技高网
...

【技术保护点】
一种多重测序方法,包括在单一反应室中对多个靶多核苷酸进行测序,其中所述靶多核苷酸来自两个或多个不同样品;以及基于所述靶多核苷酸序列中含有的单一条码,以至少95%的准确度对每个所述测序的靶多核苷酸所源自的样品进行鉴定。

【技术特征摘要】
【国外来华专利技术】2010.06.08 US 61/352,8011.一种多重测序方法,包括在单一反应室中对多个靶多核苷酸进行测序,其中所述靶多核苷酸来自两个或多个不同样品;以及基于所述靶多核苷酸序列中含有的单一条码,以至少95%的准确度对每个所述测序的靶多核苷酸所源自的样品进行鉴定。2.权利要求1的方法,其中所述祀多核苷酸包含用于校正测序反应的一个或多个序列。3.权利要求1的方法,其中每个条码在至少三个核苷酸位点处不同于所有其它条码。4.权利要求1的方法,其中所述鉴定在所述条码中的核苷酸的突变或缺失之后是精确的。5.一种从多个独立样品中产生衔接体标记的靶多核苷酸的方法,该方法包括: a)提供多个第一衔接体寡核苷酸,其中每个所述第一衔接体寡核苷酸包含多个条码序列中的至少一个,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列;和 b)将至少一个所述第一衔接体寡核苷酸与每个所述样品的所述靶多核苷酸连接,从而没有条码序列与多于一个所述样品的所述靶多核苷酸连接。6.权利要求5的方法,进一步包括(c)将多个第二衔接体寡核苷酸中的至少一个与来自步骤(b)的每个所述样品的所述靶多核苷酸连接,从而至少一些所述靶多核苷酸在一端包含所述第一衔接体寡核苷酸,并在另一端包含所述第二衔接体寡核苷酸。7.权利要求6的方法,进一步包括合并来自步骤(c)的靶多核苷酸。8.权利要求7的方法,进一步包括对所述合并池中的一个或多个所述多核苷酸进行测序。9.权利要求8的方法,进一步包括基于其连接的条码序列鉴定靶多核苷酸所源自的样品O10.权利要求5或6的方法,其中一个或多个所述衔接体寡核苷酸包含SEQID NO:1。11.权利要求5或6的方法,其中一个或多个所述衔接体寡核苷酸包含SEQID NO:2。12.权利要求5或6的方法,其中一个或多个所述衔接体寡核苷酸包含发夹结构。13.权利要求5或6的方法,其中一个或多个所述衔接体寡核苷酸包含寡核苷酸双链体。14.权利要求1或5的方法,其中所述条码序列的长度为至少3个核苷酸。15.权利要求1或7的方法,其中基于所述条码序列合并所述靶多核苷酸,从而在合并池中所有四种碱基在沿着每个条码的一个或多个位点处均匀呈现。16.权利要求1或5的方法,其中所述祀多核苷酸包含片段化的样品多核苷酸。17.权利要求16的方法,其中所述片段化包括对所述样品多核苷酸进行超声处理。18.权利要求16的方法,其中所述片段化包括用一种或多种限制性核酸内切酶处理所述样品多核苷酸。19.权利要求16的方法,其中所述片段化包括在适合一种或多种酶产生随机双链核酸断裂的条件下用所述一种或多种酶处理所述样品多核苷酸。20.权利要求19的方法,其中所述一种或多种酶选自:DNase1、片段化酶及其变体。21.权利要求16的方法,其中所述片段具有10-10000个核苷酸的平均长度。22.权利要求16的方法,其中所述片段具有100-2500个核苷酸的平均长度。23.权利要求16的方法,其中所述片段具有50-500个核苷酸的平均长度。24.权利要求12或13的方法,进一步包括执行使用所述一个或多个连接的衔接体寡核苷酸作为模板来延伸所述靶多核苷酸的一个或多个3’末端的步骤。25.权利要求24的方法,进一步包括在所述延伸步骤后使用第一引物和第二引物扩增所述靶多核苷酸,其中所述第一引物含有可以与一个或多个所述第一衔接体寡核苷酸的互补序列的至少一部分杂交的序列,并且进一步地,其中所述第二引物含有可以与一个或多个所述第二衔接体寡核苷酸的互补序列的至少一部分杂交的序列。26.权利要求25的方法,其中一个或多个所述引物含有SEQID NO:1。27.权利要求2 5的方法,其中一个或多个所述引物含有SEQID NO:2。28.权利要求6的方法,其中每个所述第二衔接体寡核苷酸包含多个条码序列中的至少一个,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列。29.权利要求28的方法,其中所述第一和第二衔接体寡核苷酸对包含不同的条码序列。30.权利要求28的方法,其中所述第一和第二衔接体寡核苷酸对包含相同的条码序列。31.权利要求1或5的方法,其中所述靶多核苷酸包含基因组DNA。32.权利要求1或5的方法,其中所述靶多核苷酸包含线粒体DNA、叶绿体DNA、质粒DNA、细菌人工染色体、酵母人工染色体,或其组合。33.权利要求1或5的方法,其中所述靶多核苷酸包含cDNA。34.权利要求1或5的方法,其中所述样品包含由引物延伸反应产生的靶多核苷酸。35.权利要求8的方法,其中所述测序包括测序引物的延伸,所述测序引物含有可与所述第一衔接体寡核苷酸和/或所述第二衔接体寡核苷酸的互补序列的至少一部分杂交的序列。36.权利要求35的方法,其中所述测序引物含有SEQID NO:1或SEQ ID NO:2。37.权利要求1或8的方法,其中所述测序包括校正步骤,其中所述校正基于所述条码序列中的一个或多个核苷酸位点处的每个核苷酸。38.权利要求1或5的方法,其中每个所述样品包含少于500ng的核酸。39.权利要求1或5的方法,其中所述多个条码序列包括选自下组的序列:AAA、TTT、CCC 和 GGG。40.权利要求1或5的方法,其中所述多个条码序列包括选自下组的序列:AAAA、CTGC、GCTG、TGCT、ACCC、CGTA、GAGT、TTAG、AGGG、CCAT、GTCA、TATC、ATTT、CACG、GGAC 和 TCGA。41.权利要求1或5的方法,其中所述多个条码序列包括选自下组的序列:AAAAA、AACCC、AAGGG、AATTT、ACACG、ACCAT、ACGTA、ACTGC、AGAGT、AGCTG、AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTAA、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。42.一种为多重测序配置的组合物,其包含:多个靶多核苷酸,每个靶多核苷酸包含选自多个条码序列的一个或多个条码序列,其中所述靶多核苷酸来自两个或多个不同样品,并且进一步地,其中可在组合测序反应中基于所述靶多核苷酸的序列中所含的单一条码以至少95%的准确度鉴定每个所述多核苷酸所源自的样品。43.权利要求42的组合物,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列。44.一种用于产生衔接体标记的靶多核苷酸的组合物,该组合物包含多个第一衔接体寡核苷酸,其中每个所述第一衔接体寡核苷酸包含多个条码序列中的至少一个,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列。45.权利要求44的组合物,还包含多个第二衔接体寡核苷酸。46.权利要求42或44的组合物,其中所述靶多核苷酸包含于流动池中。47.权利要求44或45的组合物,其中一个或多个所述衔接体寡核苷酸包含SEQID NO:1o48.权利要求44或45的组合物,其中一个或多个所述衔接体寡核苷酸包含SEQID NO:2。49.权利要求44或45的组合物,其中一个或多个所述衔接体寡核苷酸包含发夹结构。50.权利要求44或45的组合物,其中一个或多个所述衔接体寡核苷酸包含寡核苷酸双链体。51.权利要求42或44的组合物,其中所述条码序列的长度为至少3个核苷酸。`52.权利要求44的组合物,其中所述第一衔接体寡核苷酸以4的倍数分组,从而在沿着每个条码的每个位点处均匀呈现所有四种碱基。53.权利要求45的组合物,其中每个所述第二衔接体寡核苷酸包含多个条码序列中的至少一个,其中所述多个条码序列中的每个条码序列在至少三个核苷酸位点处不同于所述多个条码序列中的所有其它条码序列。54.权利要求53的组合物,其中所述第一和第二衔接体寡核苷酸对包含相同的条码序列。55.权利要求53的组合物,其中所述第一和第二衔接体寡核苷酸对包含不同的条码序列。56.权利要求49或50的组合物,还包含第一引物和第二引物,其中所述第一引物含有可以与一个或多个所述第一衔接体寡核苷酸的互补序列的至少一部...

【专利技术属性】
技术研发人员:克里斯多佛·莱蒙德努里斯·库恩吉尔·马格努斯
申请(专利权)人:纽亘技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1