本公开提供了用于当原始核酸靶标破裂成小片段时通过加靶特异性引物条形码标签追踪核酸片段起源的方法和组合物。核酸靶标在体外被捕获在具有克隆定位的核酸条形码模板的固体支持物上。可以以大规模平行方法同时加工许多核酸靶标而无需分区。例如,这些核酸靶标追踪方法可以在全基因组测序和靶向测序二者中有多种应用,以准确地鉴定基因组变体、单倍型定相和组装。定相和组装。
【技术实现步骤摘要】
【国外来华专利技术】用于核酸测序用于追踪核酸片段起源的方法和组合物
[0001]本专利技术一般涉及用于核酸测序的方法和组合物。具体地,本文提供的方法和组合物涉及核酸文库的制备和由其产生测序数据。
技术介绍
[0002]核酸测序可以为很多种生物医学应用提供信息,包括诊断、预后、药物基因组学和法医生物学。测序可能涉及基础的低通量方法,包括Maxam
‑
Gilbert测序(化学修饰的核苷酸)和Sanger测序(链终止)法,或高通量的下一代方法,包括大规模平行焦磷酸测序、合成测序、连接测序、半导体测序和其他。对于大多数测序方法,样品(如核酸靶标)在测序仪器上被测序之前需要被加工成测序文库。例如,样品可以被片段化、扩增或附接至标识符。独特标识符通常被用来鉴定特定样品的起源。
[0003]大多数市售测序技术的测序读数长度有限。具体地,第二代测序技术只能测序几百个碱基,很难达到上千个碱基。然而,基因的核酸序列可以跨越从几千碱基到几十千和几百千碱基,这意味着几十千碱基的测序读数长度对于成功确定所有基因的单倍型是必要的。
[0004]为了克服短测序读数长度问题,已经开发了许多方法以靶特异性地标记长核酸靶标,当它们被打破成为小片段时用于测序文库制备。此类方法包括完全基因组公司(Complete Genomics)的长片段读数、亿明达(Illumina)的合成性长读数、10x基因组公司(Genomics)的链接读数(linked
‑
read)(Zheng等,2016)、亿明达的单管方法(Zhang等,2017)和我们自己的单管方法(WO2017/151828)。这些靶特异性标记是短核酸序列,称为条形码。这些短核酸片段的起源可以基于其独特的、相关联的条形码鉴定。该方法中使用的条形码群体的多样性越广泛,它提供的鉴定特异性就越好。10x基因组公司(Genomics)的链接读数(linked
‑
read)方法已经被广泛使用。然而,它需要一种油包水乳液方法以保持靶特异性条形码标记反应的克隆性。这一需求显著地增加了其样品制备过程的复杂度和成本。几种方法,包括属于完全基因组公司(Complete Genomics)(美国专利9328382)的方法、亿明达的单管方法(Zhang等,2017)和我们的方法(WO2017/151828)使用基于转座酶系统和无需在反应中用乳液液滴分区核酸靶标。这些方法原则上可以在单管反应格式中实现靶特异性条码化。本专利技术提供了新的基于转座酶的单管条码化方法,在反应效率上具有显著改进并简化了工作流程。
技术实现思路
[0005]一方面,本文描述的是通过加条形码标签追踪核酸片段起源的方法。该方法包括提供多个其上固定化有克隆条形码模板或半克隆条形码模板的固体支持物,其中条形码模板包含至少两种不同的条形码序列,多数条形码序列和少数条形码序列;条码化的固体支持物上的多数条形码序列与其他条码化固体支持物的多数条形码序列基本不同,少数条形码序列与其他条码化固体支持物的少数条形码序列相同,并提供多个转座体,每个转座体
包含可转座DNA和转座酶,其中转座体中的至少一个可转座DNA能够通过杂交或亲和部分直接或间接地被固体支持物上的条形码模板捕获。在一个反应容器中核酸靶标接触固体支持物和转座体,以通过同时的链转移和捕获反应,将固体支持物上的条形码信息附接至核酸靶标。前述反应基本上同时发生,无需在总体的多个核酸靶标中额外将每个核酸靶标与另一核酸靶标分区。通过打破链转移复合物,核酸靶标被打破成片段,其中至少一个片段被附接至固体支持物上的条形码模板。
[0006]在一些情况下,在固体支持物上固定化的克隆条形码模板或半克隆条形码模板是通过直接合成、克隆扩增或其组合方法生成的。克隆扩增可以是乳液PCR、桥式PCR、等温PCR、模板行走(template walking)、纳米球生成,及其组合。在特定情况下,条码化的固体支持物是通过克隆扩增方法制备的,无需分离扩增的和未扩增的群。其他情况下,条码化的固体支持物是用仅具有或主要富含扩增群的克隆扩增制备的。
[0007]一方面,该反应是在具有受控粘度的缓冲体系中,以通过添加物质减少扩散和增加悬浮,所述物质选自下组:聚乙二醇、pluronic、纤维素、琼脂糖及其衍生物和其他聚合物及其组合,优选体系粘度约2
‑
200mPa
·
s。
[0008]一方面,用个体的可转座DNA和转座酶替换转座体,而无需将它们预先组装成转座体。
[0009]另一方面,在反应容器中的初始反应之后添加第二转座体;其中,之前添加的转座体称为第一转座体,第一和第二转座体可以是相同类型或不同类型,或相同类型的不同转座子序列。另一方面,在将核酸靶标打破成片段之后添加第二转座体。
[0010]另一方面,核酸靶标可以通过非特异性结合被预附接至固体支持物上。
[0011]另一方面,容器内的捕获反应是通过连接、或通过杂交、或通过亲和标签、或通过抗体和抗原反应、或通过点击化学或其组合。
[0012]另一方面,捕获反应包括首先杂交然后连接。
[0013]另一方面,条码化的固体支持物具有预附接至固体支持物上固定化的一些条形码模板的末端的可转座的DNA或转座体。
[0014]在另一方面,所述转座酶选自下组:野生型或突变的或其加标签版本的Tn、Mu、Ty和Tc转座酶及其组合。具体地,转座酶是野生型的、或突变的、或其加标签版本的MuA转座酶,或Tn5转座酶,或其组合。
[0015]另一方面,所述可转座DNA包含转座子,其中所述转座子选自下组:野生型或其突变版本的Tn、Mu、Ty和Tc转座子DNA及其组合。具体地,转座子是野生型或突变的MuA转座子,或Tn5转座子,或其组合。
[0016]另一方面,所述可转座DNA进一步包含衔接子序列。
[0017]另一方面,所述能够被所述条形码模板捕获的可转座DNA具有与所述条形码模板非互补的序列,并且所述可转座DNA至所述条形码模板的捕获被接头所促进。
[0018]另一方面,所述转座体包含至少一种类型的转座酶,至少一种类型的可转座DNA或其组合。
[0019]一方面,本文描述的是通过加条形码标签追踪核酸片段起源的方法。该方法包括提供多个其上固定化有克隆条形码模板或半克隆条形码模板的固体支持物,其中条形码模板包含至少两种不同的条形码序列,多数条形码序列和少数条形码序列;条码化的固体支
持物上的多数条形码序列与其他条码化固体支持物的多数条形码序列基本不同,少数条形码序列与其他条码化固体支持物的少数条形码序列相同,并通过非特异性结合将核酸靶标捕获至固体支持物,并提供多个转座体,每个转座体包含可转座DNA和转座酶,其中转座体中的至少一个可转座DNA能够直接或间接地被固体支持物上的条形码模板特异性捕获。在一个反应容器中将固体支持物上的非特异性结合的核酸靶标接触转座体,以通过同时的链转移和捕获反应,将固体支持物上的条形码信息附接至核酸靶标。通过打破链转移复合物,本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于通过条码化来追踪核酸片段起源的方法,其包括:a.提供反应混合物,其包含多个双链核酸片段和多个珠,其中每个珠包含来自至少两种不同的条形码模板群的至少两种不同的固定化条形码模板,其中每个条形码模板群包含相同条形码模板的多个拷贝,其中每个条形码模板包含条形码序列,其中所述条形码序列被配置为所述条形码模板的标识符,b.从所述核酸片段产生至少两种附接条形码的亚片段,其中所述来自同一核酸片段的至少两种附接条形码的亚片段各自附接至所述具有来自同一珠的相同序列的条形码序列;和c.通过它们的所述条形码序列追踪/鉴定所述附接条形码的亚片段的起源,其中具有相同序列的附接条形码的亚片段追踪至所述同一核酸片段。2.如权利要求1所述的方法,其中所述反应混合物未被隔室化成等分或液滴。3.如权利要求1所述的方法,其中在所述反应混合物中的所述珠包含总计至少约1000个不同的条形码序列。4.如权利要求1所述的方法,其中在每个珠上至少一个所述条形码模板群也存在于至少另一个珠上以在所述多个珠之间作为共同共有条形码模板群。5.如权利要求4所述的方法,其中所述共同共有条形码模板的数量少于在所述珠上总条形码模板的约50%。6.如权利要求4所述的方法,其中所述共同共有条形码模板的数量少于在所述珠上总条形码模板的约10%。7.如权利要求1所述的方法,其中所述双链核酸包含双链DNA,或DNA/RNA杂交体,或其组合。8.如权利要求7所述的方法,其中所述双链核酸为大于约1000bp。9.如权利要求1所述的方法,其中所述双链核酸片段包含核酸分子,其包括天然的、修饰的、扩增的或其他化学处理形式的DNA或RNA或其组合。10.如权利要求1所述的方法,其中所述双链核酸片段在权利要求1所述的任何反应之前首先非特异性结合至所述珠。11.如权利要求1所述的方法,其中所述双链核酸片段用转座体链转移,并在与所述珠相互作用之前形成链转移复合物。12.如权利要求1所述的方法,其中所述产生附接条形码的亚片段包括步骤:连接、杂交、链转移反应、...
【专利技术属性】
技术研发人员:陈宙涛,吴采芹,L,
申请(专利权)人:通用测序技术公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。