本发明专利技术涉及用于捕获和分析包含在基因组的靶区域中的序列信息的方法、组合物和系统。这样的靶区域可包括外显子组、部分外显子组、内含子、外显子区和内含子区的组合、基因、基因的组以及可能感兴趣的全基因组的任何其它子集。集。
Methods and compositions for target nucleic acid sequencing
【技术实现步骤摘要】
用于靶核酸测序的方法和组合物
[0001]相关申请的交叉引用
[0002]本申请要求于2014年10月29日提交的美国临时申请号62/072,164的权益,其明确地通过引用整体并入本文用于所有目的。
[0003]专利技术背景
[0004]精确并快速地对基因组进行测序的能力正在彻底改变生物学和医学。复杂基因组的研究,特别是对人类疾病的遗传基础的探索涉及大规模的遗传分析。在全基因组水平的这样的遗传分析不仅在金钱上而且在时间和劳资方面花费高。这些成本随着涉及不同个体DNA样品分析的方案而增加。基因组中与疾病发展相关的多态性区的测序(和重测序)将极大地有助于理解例如癌症的疾病和治疗剂研发,并且将有助于应对鉴定与药物反应的变化性相关的基因和功能多态性的药物基因组学挑战。在给定基因型与特定疾病之间可建立关联之前,需要对大到足以产生统计学显著数据的群体进行大量遗传标记的筛选。
[0005]降低与基因组测序相关的成本同时保留大规模基因组分析的益处的一种方法是对基因组的靶区域进行高通量、高精确度测序。广泛使用的方法捕获基因组的整个蛋白质编码区(外显子组)的大部分,外显子组占人类基因组的约1%;并且已经成为临床和基础研究中的常规技术。外显子组测序提供了优于全基因组测序的优点:它显著不那么贵、功能解释更易理解、分析显著更快、使得非常深入的测序负担得起,并且得到更易于管理的数据集。需要用于富集感兴趣的目标区域的方法、系统和组合物用于高精确度和高通量测序和遗传分析。
[0006]专利技术概述
[0007]因此,本专利技术提供了用于获得基因组靶区域的序列信息的方法、系统和组合物。
[0008]在一些方面,本公开提供了一种用于对基因组的一个或多个选定部分进行测序的方法,所述方法大体上包括以下步骤:(a)提供起始基因组材料;(b)将来自所述起始基因组材料的个体核酸分子分配到离散分区中,使得每个离散分区包含第一个体核酸分子;(c)将所述离散分区中的所述个体核酸分子片段化以形成多个片段,其中每个片段还包含条形码,并且其中给定离散分区内的片段各自包括共同条形码,由此将每个片段与其所源自的个体核酸分子相关联;(d)提供富集包含基因组的一个或多个选定部分的至少一部分的片段的群体;(e)从所述群体获得序列信息,从而对基因组的一个或多个选定部分进行测序。
[0009]在另一些实施方案中并且根据上述,提供富集包含基因组的一个或多个选定部分的至少一部分的片段的群体包括以下步骤:(i)使与所述基因组的一个或多个选定部分中或附近的区域互补的探针与所述片段杂交以形成探针
‑
片段复合物;和(ii)将探针
‑
片段复合物捕获到固体支持物的表面;从而使所述群体富集包含基因组的一个或多个选定部分的至少一部分的片段。在另一些实施方案中,所述固体支持物包括珠。在另一些实施方案中,所述探针包括结合部分,而所述表面包括捕获部分,并且所述探针
‑
片段复合物通过结合部分与捕获部分之间的反应而捕获在表面上。在另一些实例中,所述捕获部分包括链霉亲和素,而所述结合部分包括生物素。在另一些实例中,所述捕获部分包括链霉亲和素磁珠,而所述结合部分包括生物素化RNA文库饵。
[0010]在一些实施方案中并且根据任意上述,本专利技术的方法包括使用捕获部分,其涉及全外显子组或部分外显子组捕获、组捕获(panel capture)、靶向外显子捕获、锚定外显子组捕获或瓦片式覆盖(tiled)基因组区域捕获。
[0011]在另一些实施方案中并且根据任意上述,本文公开的方法包括获得步骤,所述获得步骤包括测序反应。在另一些实施方案中,测序反应是短读取长度测序反应或长读取长度测序反应。在另一些实例中,测序反应提供起始基因组材料的小于90%、小于75%或小于50%的序列信息。
[0012]在另一些实施方案中,本文所述的方法还包括基于分离的片段的重叠序列在推断的重叠群中连接两个或更多个个体核酸分子,其中所述推断的重叠群包含至少10kb、20kb、40kb、50kb、100kb或200kb的长度N50。
[0013]在另一些实施例中并且根据任意上述,本文公开的方法还包括基于分离的片段的序列内的重叠定相变体(phased variants)在相区块(phase block)中连接两个或更多个个体核酸分子,其中相区块包含至少10kb、至少20kb、至少40kb、至少50kb、至少100kb或至少200kb的长度N50。
[0014]在另一些实施方案中并且根据任意上述,本文公开的方法提供来自一起覆盖外显子组的基因组的选定部分的序列信息。在另一些实施方案中,离散分区中的个体核酸分子包括来自单细胞的基因组DNA。在另一些实施方案中,离散分区各自包括来自不同染色体的基因组DNA。
[0015]在另一些方面,本公开提供了一种从基因组样品的一个或多个靶部分获得序列信息的方法。这样的方法包括但不限于以下步骤:(a)在离散分区中提供基因组样品的个体第一核酸片段分子;(b)将所述离散分区内的所述个体第一核酸片段分子片段化以由所述个体第一核酸片段分子中的每一个产生多个第二片段;(c)将共同条形码序列附接到离散分区内的所述多个第二片段,使得所述多个第二片段中的每一个可归属于其中包含它们的离散分区;(d)将针对所述基因组样品的一个或多个靶部分的探针文库应用于所述第二片段;(e)进行测序反应以鉴定与探针文库杂交的多个第二片段的序列,从而从基因组样品的一个或多个靶部分获得序列信息。在另一些实施方案中,将探针文库连接到结合部分,并且在进行步骤(e)之前,通过结合部分与捕获部分之间的反应,在包含捕获部分的表面上捕获第二片段。在另一些实施方案中并且在进行步骤(e)之前,第二片段在第二片段被捕获在表面上之前或之后被扩增。在另一些实施方案中,结合部分包含生物素,而捕获部分包含链霉亲和素。在另一些实施方案中,测序反应是短读取、高精确度测序反应。在另一些实施方案中,扩增第二片段以使得所得扩增产物能够形成部分或完整的发夹结构。
[0016]在另一些方面并且根据任意上述,本公开提供了用于从基因组样品的一个或多个靶部分获得序列信息同时保留分子背景的方法。这样的方法包括以下步骤:(a)提供起始基因组材料;(b)将来自所述起始基因组材料的个体核酸分子分配到离散分区中,使得每个离散分区包含第一个体核酸分子;(c)将所述离散分区中的所述第一个体核酸分子片段化以形成多个片段;(d)提供富集包含基因组的一个或多个选定部分的至少一部分的片段的群体;(e)从所述群体获得序列信息,由此对基因组样品的一个或多个靶部分进行测序同时保留分子背景。在另一些实施方案中,在获得步骤(e)之前,用条形码标记多个片段以将每个片段与其形成于其中的离散分区相关联。在另一些实施方案中,将步骤(b)中的个体核酸分
子分配以使得保持每个第一个体核酸分子的分子背景。
[0017]在一些方面,本公开提供了从基因组样品的一个或多个靶部分获得序列信息的方法。这样的方法包括但不限于以下步骤:(a)提供基因组样品的个体核酸分本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于对基因组的一个或多个选定部分进行测序的方法,所述方法包括:(a)提供起始基因组材料;(b)将来自所述起始基因组材料的个体核酸分子分配到离散分区中,使得每个离散分区包含第一个体核酸分子;(c)将所述离散分区中的所述个体核酸分子片段化以形成多个片段,其中每个所述片段还包含条形码,并且其中给定离散分区内的片段各自包含共同条形码,由此将每个片段与其所源自的个体核酸分子相关联;(d)提供富集包含所述基因组的所述一个或多个选定部分的至少一部分的片段的群体;(e)从所述群体获得序列信息,从而对基因组的一个或多个选定部分进行测序。2.根据权利要求1所述的方法,其中所述提供步骤(d)包括:(i)将与所述基因组的所述一个或多个选定部分中或附近区域互补的探针与所述片段杂交以形成探针
‑
片段复合物;(ii)将探针
‑
片段复合物捕获到固体支持物的表面;从而使所述群体富集包含所述基因组的所述一个或多个选定部分的至少一部分的片段。3.根据权利要求2所述...
【专利技术属性】
技术研发人员:M贾罗什,M施纳尔莱文,S萨克索诺夫,B欣森,郑新颖,
申请(专利权)人:一零X基因组学有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。