参考梯状物和衔接子制造技术

技术编号:36582886 阅读:9 留言:0更新日期:2023-02-04 17:43
本公开总体上涉及可用于确定样品中多核苷酸的身份和/或数量的校准方法的多核苷酸。特别地,本公开涉及包含用作参考梯状物或参考衔接子的校准序列的多核苷酸。所述多核苷酸可用于校准各种各样的测序方法,包括高通量测序方法(例如,称为下一代测序或NGS方法的那些方法)。本公开还总体上涉及这些多核苷酸在各种各样的应用中,包括例如在各种各样的测序方法的校准中的用途。的校准中的用途。的校准中的用途。

【技术实现步骤摘要】
【国外来华专利技术】参考梯状物和衔接子
[0001]相关申请的交叉引用
[0002]本申请要求于2020年2月13日提交的澳大利亚临时专利申请第2020900400号和第2020900401号的优先权,其每一个的内容通过引用以其整体并入本文。


[0003]本公开总体上涉及可用于确定样品中多核苷酸的身份和/或数量的校准方法的多核苷酸。所述多核苷酸可用于校准各种各样的测序方法,包括高通量测序方法(例如,称为下一代测序或NGS方法的那些)。本公开还总体上涉及这些多核苷酸在各种各样的应用中,包括例如在各种各样的测序方法的校准中的用途。
[0004]背景
[0005]NGS技术(以由诸如以下的公司提供的服务和产品为例:Illumina、Oxford Nanopore、PacBio、Ion Torrent、Roche 454Pyrosequencing(参见例如,Bentley,D.R.等人,2008;Clarke,J.等人,2009;Ronaghi,M.等人,1998;Eid,J.等人,2009;Rothberg,J.M.等人,2011)和其他公司)使核酸分子的高通量、大规模并行测序成为可能。这些技术有能力在单个样品中确定数百万RNA和DNA分子的核苷酸碱基序列。此外,确定单个RNA或DNA序列的速率与样品中该单个RNA或DNA序列的相对丰度成比例。因此,NGS也可用于测定样品中一种或更多种核酸序列的数量。
[0006]NGS被广泛用于确定从天然来源(诸如动物、植物、微生物或环境样品中的不同微生物种群(Edwards,R.A.等人,2006))采集的样品中发现的核酸的序列和/或测量所述核酸的数量。这些用途包括确定生物体的全基因组序列(参见例如Bentley,D.R.等人,2008),确定存在于样品内的信使RNA的序列和丰度(参见,例如,Mortazavi,A等人,2008),或鉴定与疾病相关的遗传变体,或对一系列细胞特征(诸如表观遗传修饰(参见,例如,Bernstein,B.E.等人,2005)、蛋白质结合位点(参见,例如Johnson,D.S.等人,2007)、三维DNA结构(参见,例如,Lieberman

Aiden,E.等人,2009),以及其他特征)进行测序和测量。
[0007]由NGS确定的数百万的个体RNA或DNA序列可以通过从头组装合并成更长的序列(称为重叠群)或与已知的参考序列匹配。DNA序列的从头组装可以用来组装生物体的基因组;RNA序列的从头组装可以指示基因序列、长度和同种型。DNA序列与参考基因组的匹配或比对可以鉴定个体之间遗传差异或变异的位置。DNA序列和参考基因组之间匹配的位置可以指示表观遗传特征(诸如组蛋白修饰)或蛋白结合位点的位置。RNA序列与参考基因组的比对可以指示在基因剪接过程期间被切除的内含子序列的存在。
[0008]在一些情况下,在这样的测序方法的操作期间,已知数量或序列的核酸(称为标准品)被添加(或“加标(spiked

in)”)到天然核酸样品中。然后,可以使用一系列基因技术(诸如NGS技术),包括微阵列技术、定量聚合酶链式反应方法和其他方法,对所得的组合混合物进行分析。样品核酸的数量或序列可以与添加的核酸标准品的已知数量或序列进行比较,以便提供可用于测量和确定天然核酸样品的数量或序列的参考标尺。
[0009]先前使用的RNA和DNA标准品来源于天然来源。例如,从最初来源于高加索裔女性
人类的NA12878细胞系中提取的DNA序列已经被广泛地表征,并被用于评估分析工具鉴定遗传变异的性能(Zook,J.M.等人,2014)。包含来源于古生菌詹氏甲烷球菌(Methanocaldococcus jannaschii)的序列的核糖核酸标准品(称为ERCC加标)为微阵列和qRT

PCR技术而开发(Baker,S.C.等人,2005年;Consortium E.R.C.,2005),并已与RNA测序(Jiang,L.等人,2011)一起使用。最近,已经设计了人工校准序列,以解决由于使用天然序列作为标准品而导致的一个或更多个缺点。在公开为WO2016/094947的国际专利申请第PCT/AU2015/050797号中描述了这样的人工校准序列。
[0010]衔接子(adaptor或adapter)序列通常是已知用于制备用于下一代测序的靶多核苷酸的DNA序列。下一代测序期间的文库制备过程产生包含在靶DNA或RNA序列上游(即在5'方向)和/或下游(即在3'方向)的衔接子序列的DNA序列。然后使用下一代测序方法对这些产生的DNA序列进行测序。
[0011]尽管取得了这些进展,但NGS数据的分析仍然具有挑战性。测序错误可能导致错误检测的(假阳性)突变,从而导致不必要的和昂贵的治疗,并且遗漏的突变(假阴性)可能导致漏诊和遗漏的患者治疗的机会。因此,进一步提高NGS方法的准确性将是有益的。
[0012]概述
[0013]本公开总体上涉及多核苷酸序列,其可用于校准各种各样的测序方法。这些多核苷酸序列在本文中也称为“标准品”、“参考标准品”或“对照品”,并且这些术语在本文中可互换使用。因此,本公开提供了可用于校准各种各样的高通量测序方法诸如NGS方法的参考标准品。本文公开的多核苷酸序列包含两种或更多种校准序列,每种校准序列独立地代表一种天然存在的多核苷酸序列,并以在任何天然存在的基因组中都没发现的排列连续地排列在多核苷酸序列中。不同的校准序列可以以单个拷贝存在。可选地,校准序列中的一种或更多种可以在多核苷酸序列中以两个或更多个拷贝数存在。因此,本公开提供了包含多于一种校准序列的多核苷酸“梯状物”,每种校准序列以相同拷贝数或以不同拷贝数独立存在。
[0014]在一方面,本公开提供了一种分离的多核苷酸序列,其包含两种或更多种校准序列,其中每种校准序列独立地代表一种天然存在的多核苷酸序列,并且其中校准序列以在任何天然存在的基因组中都没发现的排列连续地排列在多核苷酸序列内。校准序列中的一种或更多种可以在多核苷酸序列内以两个或更多个拷贝数存在。
[0015]第一校准序列可以代表外显子、内含子、基因、等位基因、染色体或基因组序列,并且第二校准序列可以不同于第一校准序列并且可以代表不同的外显子、内含子、基因、等位基因、染色体或基因组序列。第二校准序列可以代表第一校准序列的变体。
[0016]校准序列中的一种或更多种可以指示感兴趣的特征,诸如癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA、或其他感兴趣的属性中的任何一种或更多种。
[0017]当本文公开的多核苷酸包含以两个或更多个拷贝数存在的校准序列时,可以选择这些拷贝数以复制由校准序列代表的天然存在序列的天然存在频率。例如但不限于,可以选择两个或更多个拷贝数来复制天然存在的人类多核苷酸序列的纯合、杂合和/或体细胞等位基因频率中的任何一种或更多种。本文描述了其他拷贝数表示。
[0018]校准序列的长度可以独立地在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种分离的多核苷酸序列,包含两种或更多种校准序列,其中所述校准序列各自独立地代表天然存在的多核苷酸序列,并且其中所述校准序列以在任何天然存在的基因组中都没发现的排列连续地排列在所述多核苷酸序列内。2.根据权利要求1所述的多核苷酸序列,其中所述校准序列中的一种或更多种以两个或更多个拷贝数存在于所述多核苷酸序列内。3.根据前述权利要求中任一项所述的多核苷酸序列,其中第一校准序列代表外显子、内含子、基因、等位基因、染色体或基因组序列,并且其中第二校准序列不同于所述第一校准序列并且独立地代表不同的外显子、内含子、基因、等位基因、染色体或基因组序列。4.根据权利要求3所述的多核苷酸序列,其中所述第二校准序列代表所述第一校准序列的变体。5.根据权利要求4所述的多核苷酸序列,其中所述第二校准序列与所述第一校准序列至少90%相同。6.根据权利要求5所述的多核苷酸序列,其中与所述第一校准序列相比,所述变体包含一个或更多个SNP、一个或更多个插入、一个或更多个缺失、一个或更多个微卫星、多于一种核苷酸多态性、一个或更多个重复、一个或更多个串联重复计数变体、一个或更多个倒位、一个或更多个转换、一个或更多个颠换和/或一个或更多个易位。7.根据权利要求3

6中任一项所述的多核苷酸序列,其中所述第一校准序列和/或所述第二校准序列指示癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA或其它感兴趣的属性中的任何一种或更多种。8.根据权利要求2

7中任一项所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制由所述校准序列代表的天然存在序列的天然存在频率。9.根据权利要求8所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制天然存在的人类多核苷酸序列的纯合、杂合和/或体细胞等位基因频率中的任何一种或更多种。10.根据权利要求8所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制以下中的任何一种或更多种:基因组丰度、染色体丰度、基因表达水平、同种型表达水平、变体等位基因频率、纯合基因型、杂合基因型、体细胞突变频率、拷贝数变异、基因扩增、基因缺失、三体性、染色体非整倍性、微生物丰度、病毒丰度或变化的mRNA表达水平。11.根据任一项前述权利要求所述的多核苷酸序列,其中一种校准序列代表母体来源的多核苷酸,并且另一种校准序列代表父体来源的多核苷酸。12.根据任一项前述权利要求所述的多核苷酸序列,其中所述天然存在的多核苷酸序列来源于人类、原核生物、细菌、病毒、噬菌体或细胞器基因组。13.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列的长度独立地在18个核苷酸和20,000个核苷酸之间。14.根据权利要求13所述的多核苷酸序列,其中所述校准序列的长度独立地在100个核苷酸和2,000个核苷酸之间。15.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列中的两个或更多个被间隔物序列分开。16.根据任一项前述权利要求所述的多核苷酸序列,所述多核苷酸序列包含位于所述
校准序列中的一种或更多种的5'和/或3'的一种或更多种旁侧或末端序列。17.根据权利要求1

14中任一项所述的多核苷酸序列,其中所述校准序列中的两种或更多种在所述多核苷酸序列内连续排列。18.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列中的至少两种具有不同的核苷酸长度。19.根据任一项前述权利要求所述的多核苷酸序列,所述多核苷酸序列为DNA或RNA多核苷酸序列。20.一种载体,包含编码任一项前述权利要求所述的多核苷酸序列的DNA序列,所述DNA序列可操作地连接到以下中的任何一种或更多种:5'启动子;旁侧(3'和5')内切核酸酶位点;和3'聚腺嘌呤重复段。21.一种制备权利要求1

19中任一项所述的多核苷酸序列的方法,包括提供和连接所述两种或更多种...

【专利技术属性】
技术研发人员:T
申请(专利权)人:加尔文医学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1