当前位置: 首页 > 专利查询>埃默里大学专利>正文

混合物及其相关组合物中的核酸的测序方法技术

技术编号:12425471 阅读:135 留言:0更新日期:2015-12-03 11:02
本公开内容涉及分析多核苷酸的异质混合物中的端到端序列和相对分布,及其相关方法和促成试剂。在某些实施方案中,该方法涉及对细胞和组织的转录组中存在的mRNA进行完整的全长测序和定量分析,所述细胞和组织来自但不限于高等多细胞生物,其具有经过复杂的转录后RNA加工的断裂基因。

【技术实现步骤摘要】
【国外来华专利技术】混合物及其相关组合物中的核酸的测序方法相关申请的交叉引用本申请要求于2013年2月20日提交的美国临时申请号61/766,841的优先权,所述临时申请以引用的形式全文纳入本文。
技术介绍
单个基因可经常在不同的细胞或分化阶段产生新蛋白,包括在生物的生命周期中通常不会遇到的细胞(例如,癌细胞、培养物中的细胞、发育的神经解剖异常结构中的细胞)。不同的蛋白来自指定所述表达细胞中的蛋白的信使RNA(mRNA)的转录激活和转录后RNA加工的差异模式。细胞中存在的mRNA“转录物”的群体在本文被称为“转录组”。转录组测序的当前最先进的技术是“RNA-Seq”。参见NatureMethods(2008)5,621-628。在该方法中,将分离自组织或细胞培养物的mRNA逆转录成互补的DNA(cDNA),对该cDNA进行加工并扩增以产生短片段的文库,对所述短片段进行测序。通过使cDNA片段的序列重叠并将其与基因组中的序列比对无法分析(profile)细胞中的mRNA。实际上,使用复杂的统计学算法来组装最可能的mRNA的群体,所述算法的有效性是目前研究的活跃主题。RNA-Seq确实提供关于组织特异性“外显子组”的信息,包括信使RNA中保留的基因组序列,包括指定蛋白编码结构域的片段。RNA-Seq方法不保留关于序列变体的某些信息,主要是因为单个mRNA转录物通常包含若干可变区,其通常由远超过测序仪cDNA读段长度(readlength)的距离隔开。因此,可变区的哪些组合存在于同一mRNA转录物上是不清楚的。以编码具有分隔开1500个核苷酸的如下两个“任选的”结构域的蛋白的基因为例:氨基端附近的钙结合结构域(C)和羧基端的钙调蛋白结合结构域(M)。该基因的转录物可被选择性地剪接,以在最终的mRNA中保留两个结构域(CM),仅保留一个结构域(cM或Cm)或都不保留(cm)。所表达的蛋白可具有四种非常不同的生理学行为,这取决于存在哪个结构域。如果RNA-Seq实验揭示出两个结构域的两种变化,则一种完全无法推论出哪些转录物真正存在于最初的mRNA池中,数据支持任一以下转录物组:{CM,cm}、{cM,Cm}、{CM,cm,cM,Cm}等。这是因为连接结构域C和M的长区域在所有转录变体中包含相同的序列。如前面的说明书所证明的,大规模cDNA测序的挑战本质上与高等物种的基因生物学有关。关于哪些信息将在给定的细胞中或细胞分化阶段中表达的不确定性与哪些来自高度平行的cDNA测序的短读段(read)可被指定给具体的转录物的不确定性相匹配。因此,需要在基因组和蛋白质组之间的生物化学通道(conduit)中捕获更多的信息。Fu等人报道了分子索引,其使得能够进行定量的靶向RNA测序并揭示出标准文库制备中的低效率。ProcNatlAcadSciUSA.2014,111(5):1891-6。某些方法已被描述为可能提供大规模转录组测序。这些方法在其应用上受到限制。Zamore等人在题目为“通过以RNA为模板的DNA连接/测序来推断外显子连通性(DeducingExonConnectivitybyRNA-TemplatedDNALigation/Sequencing)”的PCT公开文本WO2011/049955中提供了某些测序方法,包括其中将RNA退火至与每一种均含有随机条形码的已知选择性剪接点互补的低聚物的方法。然后进行连接和随后的测序。这种方法受到限制,因为它需要事先了解外显子连接点,并且无法对每一种mRNA的全长进行测序。平行标记测序(PTS)也是分子条形码方法。参见Meyeretal.,NatureProtocols,20073,267-278。这种方法依赖于通过连接和链置换将包含序列标签和限制性位点的样品特异性条形码衔接体连接到平末端修复的DNA样品上。通过使用所述标签序列来追踪每一种DNA序列的样品源。Parameswaranetal.,NucleicAcidsRes.,2007,35(19):e130公开了这样一种方法,其通过组合提高条形码多样性以使得能够对来自样品源的文库进行混合测序。仅使用样品特异性标签。单个的转录物是不可区分的,或无法完全测序的。Craigetal.,NatMethods.,2008,5(10):887-893记载了使用简并索引DNA序列条形码在Illumina基因组分析仪上对人类基因组的靶区域进行多重测序的方法,所述DNA序列条形码在测序前连接至片段化的DNA。Halbritter等人报道了使用基于多重条形码阵列的PCR扩增和下一代测序在患有肾消耗病相关的纤毛疾病患者中进行高通量突变分析。参见JMedGenet.2012,49:756-767。Sharon等人报道了人类转录组的单分子长读段测量。NatBiotechnol,2013,31:1009-14。本文所引用的参考文献并非是对现有技术的承认。
技术实现思路
本公开内容涉及获得存在于异质混合物中的单一多核苷酸的全长(端到端)序列。还涉及使得能够进行此类分析的专用试剂的设计、合成和制备方法。在某些实施方案中,本公开内容涉及对高等多细胞生物的细胞或组织的转录组中的mRNA进行完全测序和定量。所公开的方法使得能够对全长mRNA进行有效、经济的测序,所述全长mRNA确定高等多细胞生物的细胞或组织的分子表型。在某些实施方案中,本公开内容涉及包括试剂的商业试剂盒,以及进行此类分析的应用方法。在某些实施方案中,本公开内容涉及包括以下步骤的方法:a)混合样品和一组标记多核苷酸,其中所述样品包括不同长度和/或不同序列的核酸的混合物,其中所述标记多核苷酸单独地包括重叠序列和随机序列部分,并且其中所述混合在使得所述标记多核苷酸与所述核酸结合以形成单独地被随机序列标记的核酸的条件下进行;b)将单独地被随机序列标记的核酸混合物复制成同聚物的混合物,其中所述同聚物包括重复的核酸和重复的序列标签;c)断裂同聚物,例如,通过酶促片段化、加热、剪切、超声或暴露于一种或多种限制性酶,提供了同聚物片段;以及d)对同聚物片段进行测序。所述同聚物片段的长度通常少于1000、2000或5000个核苷酸碱基。在某些实施方案中,断裂同聚物是随机进行的。在某些实施方案中,使用切割标记多核苷酸的重叠序列内的位点的限制性核酸酶或等同试剂来进行断裂同聚物,提供了经切割的同聚物片段。在某些实施方案中,所述方法还包括以下步骤:将同聚物片段与切割标记多核苷酸上的重叠序列内的位点的限制性核酸酶混合,提供了在一端具有标记序列并且在另一端具有靶核酸的随机内部断裂点的经切割的同聚物片段。在某些实施方案中,所述方法还包括对经切割的同聚物片段进行测序的步骤。在某些实施方案中,所述方法还包括以下步骤:鉴定同聚物片段内的标记序列,分离随机序列部分内的相同序列,以及根据靶核酸的相关随机内部序列重新构建样品中的核酸序列。在某些实施方案中,所述标记多核苷酸包含被配置为自身杂交成为双链片段的回文序列,其中所述双链片段包含限制性位点。通常,所述限制性位点为不常见的限制性位点。在某些实施方案中,本公开内容涉及试剂盒,其包括本文公开的标记多核苷酸和任选的逆转录酶,其他病毒逆转录酶,或从单链RNA生成双链核酸的其他来源的任何同等的酶,核苷酸,以及本文公本文档来自技高网
...

【技术保护点】
一种方法,其包括a)混合样品和一组标记多核苷酸,其中所述样品包括不同长度和/或不同序列的核酸混合物,其中所述标记多核苷酸单独地包括重叠序列和随机序列部分,并且其中所述混合是在使得所述标记多核苷酸与所述核酸结合以形成单独地被随机序列标记的核酸的条件下进行;b)将单独地被随机序列标记的核酸混合物复制成同聚物的混合物,其中所述同聚物包括重复的核酸和重复的序列标签;c)断裂所述同聚物,提供了同聚物片段;以及d)对同聚物片段进行测序。

【技术特征摘要】
【国外来华专利技术】2013.02.20 US 61/766,8411.一种方法,其包括a)混合样品和一组标记多核苷酸,其中所述样品包括不同长度和/或不同序列的核酸混合物,其中所述标记多核苷酸单独地包括不变碱基和随机序列部分,其中所述标记多核苷酸包含被配置为自身杂交成为双链片段的回文序列,并且其中所述双链片段包含限制性位点,并且其中所述混合是在使得所述标记多核苷酸与所述核酸结合以形成单独地被所述随机序列标记的核酸的条件下进行;b)用滚环扩增(RCA)将单独地被随机序列标记的核酸扩增成同多联体的混合物,其中所述同多联体包括重复的来自样品的核酸和重复的标记多核苷酸;c)断裂所述同多联体,提供了同多联体片段;以及d)对同多联体片段进行测序。2.权利要求1的方法,其还包括在步骤c)之后且在步骤d)之前将所述同多联体片段与切割所述标记多核苷酸上不变碱基内的位点的限制性核酸酶混合,提供了经切割的同多联体片段。3.权利要求1的方法,其还包括以下步骤:鉴定所述同多联体片段内的单独地被所述随机序列标记的核酸,通过分离包含相同随机序列的单独标记的核酸进行鉴定,以及重新构建样品中的核酸序列。4.权利要求1的方法,其中所述限制性位点是不常见的限制性位点。5.一种方法,其包括:a)提供包括标记部分和靶标部分的双链核酸片段,其中所述标记部分包含被配置为自身杂交成为双链片段的回文序列,其中所述双链片段包含限制性位点,其中所述标记部分包含不变碱基片段和随机序列,其中所述不变碱基包含第一引物位点和限制性位点;b)将所述双链片段与针对所述限制性位点的限制性酶混合,提供了经切割的片段;c)将所述经切割的片段在使所述经切割的片段形成环状片段的条件下与酶混合;d)使所述环状片段在随机点断裂,提供了经剪切的片段;e)将衔接体连接到所述双链核酸的末端,其中所述衔接体包含第二引物位点,从而产生衔接体-核酸缀合物;f)使用针对第一和第二引物位点的引物来扩增所述衔接体核酸缀合物,其中所述第一引物在5'端包含第一捕获序列,所述第二引物在5'端包含第二捕获序列,以提供捕获靶标标记的缀合物;以及g)对所述捕获靶标标记的缀合物进行测序。6.权利要求5的方法,其中所述随机序列位于所述第一引物位点和所述靶标部分之间。7.权利要求5的方法,其中所述第一引物位点位于所述随机序列和所述靶标部分之间。8.权利要求5的方法,其中所述限制性位点位于所述随机序列和所述第一引物位点之间。9.权利要求5的方法,其中所述随机序列位于所述限制性位点和所述第一引物位点之间。10.权利要求5的方法,其中所述核酸片段包含两个随机序列,其中所述两个随机序列是相同的序列并且所述限制性位点在所述两个随机序列之间。11.一种方法,其包括:a)将样品和一组标记多核苷酸混合...

【专利技术属性】
技术研发人员:M·C·埃默里克W·S·安格纽
申请(专利权)人:埃默里大学约翰斯·霍普金斯大学
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1