用于核酸测序用于追踪核酸片段起源的方法和组合物技术

技术编号：33906932 阅读：31 留言：0更新日期：2022-06-25 18:49

本公开提供了用于当原始核酸靶标破裂成小片段时通过加靶特异性引物条形码标签追踪核酸片段起源的方法和组合物。核酸靶标在体外被捕获在具有克隆定位的核酸条形码模板的固体支持物上。可以以大规模平行方法同时加工许多核酸靶标而无需分区。例如，这些核酸靶标追踪方法可以在全基因组测序和靶向测序二者中有多种应用，以准确地鉴定基因组变体、单倍型定相和组装。定相和组装。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于核酸测序用于追踪核酸片段起源的方法和组合物

[0001]本专利技术一般涉及用于核酸测序的方法和组合物。具体地，本文提供的方法和组合物涉及核酸文库的制备和由其产生测序数据。

技术介绍

[0002]核酸测序可以为很多种生物医学应用提供信息，包括诊断、预后、药物基因组学和法医生物学。测序可能涉及基础的低通量方法，包括Maxam
‑
Gilbert测序(化学修饰的核苷酸)和Sanger测序(链终止)法，或高通量的下一代方法，包括大规模平行焦磷酸测序、合成测序、连接测序、半导体测序和其他。对于大多数测序方法，样品(如核酸靶标)在测序仪器上被测序之前需要被加工成测序文库。例如，样品可以被片段化、扩增或附接至标识符。独特标识符通常被用来鉴定特定样品的起源。
[0003]大多数市售测序技术的测序读数长度有限。具体地，第二代测序技术只能测序几百个碱基，很难达到上千个碱基。然而，基因的核酸序列可以跨越从几千碱基到几十千和几百千碱基，这意味着几十千碱基的测序读数长度对于成功确定所有基因的单倍型是必要的。
[0004]为了克服短测序读数长度问题，已经开发了许多方法以靶特异性地标记长核酸靶标，当它们被打破成为小片段时用于测序文库制备。此类方法包括完全基因组公司(Complete Genomics)的长片段读数、亿明达(Illumina)的合成性长读数、10x基因组公司(Genomics)的链接读数(linked
‑
read)(Zheng等，2016)、亿明达的单管方法(Zhang等，201...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于通过条码化来追踪核酸片段起源的方法，其包括：a.提供反应混合物，其包含多个双链核酸片段和多个珠，其中每个珠包含来自至少两种不同的条形码模板群的至少两种不同的固定化条形码模板，其中每个条形码模板群包含相同条形码模板的多个拷贝，其中每个条形码模板包含条形码序列，其中所述条形码序列被配置为所述条形码模板的标识符，b.从所述核酸片段产生至少两种附接条形码的亚片段，其中所述来自同一核酸片段的至少两种附接条形码的亚片段各自附接至所述具有来自同一珠的相同序列的条形码序列；和c.通过它们的所述条形码序列追踪/鉴定所述附接条形码的亚片段的起源，其中具有相同序列的附接条形码的亚片段追踪至所述同一核酸片段。2.如权利要求1所述的方法，其中所述反应混合物未被隔室化成等分或液滴。3.如权利要求1所述的方法，其中在所述反应混合物中的所述珠包含总计至少约1000个不同的条形码序列。4.如权利要求1所述的方法，其中在每个珠上至少一个所述条形码模板群也存在于至少另一个珠上以在所述多个珠之间作为共同共有条形码模板群。5.如权利要求4所述的方法，其中所述共同共有条形码模板的数量少于在所述珠上总条形码模板的约50％。6.如权利要求4所述的方法，其中所述共同共有条形码模板的数量少于在所述珠上总条形码模板的约10％。7.如权利要求1所述的方法，其中所述双链核酸包含双链DNA，或DNA/RNA杂交体，或其组合。8.如权利要求7所述的方法，其中所述双链核酸为大于约1000bp。9.如权利要求1所述的方法，其中所述双链核酸片段包含核酸分子，其包括天然的、修饰的、扩增的或其他化学处理形式的DNA或RNA或其组合。10.如权利要求1所述的方法，其中所述双链核酸片段在权利要求1所述的任何反应之前首先非特异性结合至所述珠。11.如权利要求1所述的方法，其中所述双链核酸片段用转座体链转移，并在与所述珠相互作用之前形成链转移复合物。12.如权利要求1所述的方法，其中所述产生附接条形码的亚片段包括步骤：连接、杂交、链转移反应、...

【专利技术属性】
技术研发人员：陈宙涛，吴采芹，L，
申请(专利权)人：通用测序技术公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人