嵌合扩增子阵列测序制造技术

技术编号:37060596 阅读:10 留言:0更新日期:2023-03-29 19:37
本公开涉及用于核酸测序的组合物和方法,且具体地,至少在某些方面,提供通过提供输入序列的嵌合阵列来增强已知长程测序平台的功效、通量和/或产率的方法和组合物。此类组分核酸序列元件的阵列可经由最小化偏倚引入的方法制备。还特别提供使用本公开方法获取(例如从患者样品获取)同种型测序信息的应用,以及采用本公开嵌合扩增子测序过程的线粒体谱系追踪的方法。还提供用于阵列核酸序列处理和解释的方法和系统。释的方法和系统。释的方法和系统。

【技术实现步骤摘要】
【国外来华专利技术】嵌合扩增子阵列测序
[0001]相关申请的交叉引用
[0002]本申请主张2020年6月15日提交的题为“Chimeric Amplicon Array Sequencing”的美国专利临时申请号63/039,004的权益。前述申请的整体内容通过引用并入本文。
[0003]关于联邦资助研究的声明
[0004]本专利技术在美国国家卫生研究院提供的政府支持(项目号U19AI082630)下完成。政府拥有本专利技术的某些权利。


[0005]本专利技术大体涉及用于核酸测序的方法和组合物,特别是用于测序的核酸群体的制备。

技术介绍

[0006]尽管下一代DNA测序的出现已经彻底改变了生物学研究,但目前的测序平台仍未能很好地解决一些关键的遗传特征。例如,选择性剪接是一种核心生物学过程,其通过mRNA成熟过程中外显子的差异剪接实现基因功能深刻和必要的多样化,但无法经由已知的单细胞测序方法充分捕获。对于肿瘤克隆进化的研究,从单细胞的标记等位基因获得克隆关系的能力需要强大的测序覆盖率,这是迄今为止单细胞基因表达工作流程所无法实现的。再者,由潜在遗传疾病引起的疾病需要忠实地重建基因组组成的能力,以便诊断和揭示病因。特别是,表征体细胞嵌合体(这是合子后突变的结果,已知会导致严重的神经系统疾病)需要对大量单个细胞进行采样,这一任务远不能用当前的方法来处理。先前描述的方法无法解决这些关键特征,这突出了该领域忠实描述复杂生物系统的能力的严重不足。这些限制源于现有测序技术无法有效地捕获长程DNA信息。据此,需要能够优化在当前长读段测序平台上捕获长程DNA信息的方法。

技术实现思路

[0007]本公开至少部分地涉及用于进行核酸测序,特别是使用长读段测序平台对嵌合核酸进行核酸测序的组合物和方法。在某些方面,本公开提供用于(经由本文中称为“嵌合阵列测序”或“CAseq”的过程)进行核酸的嵌合阵列的高通量构建和使用的方法和组合物,其用于应用于长读段测序平台。此类嵌合阵列允许对先前被掩盖的遗传特征进行解析,包括对选择性剪接的检测;对克隆进化的改良检测,包括肿瘤克隆进化;基因组组成的忠实重建,例如,用于疾病诊断和揭示疾病病因;表征体细胞嵌合现象;以及更广泛地提升的基因组单倍型评估等。
[0008]本公开利用长读段平台的独特特征的优点来提供用于提高多个通用测序库的输出的可推广工作流程。尽管长读段测序仪具有非常大的测序输出(例如,Sequel II为约300GB),但它们受限于每次运行的读段总数(例如,Sequel II为约4M)。为了使输出最大化,可以将较小片段的库组装为阵列并且在长读段测序仪上有效地测序,
从而相对于阵列中的片段数量线性地增加已测序的库成员的数量。因此,本公开的某些方面详细描述一种用于组装阵列进行高效长读段测序的简化且可推广的方法,本公开的主要优点是能够从单细胞基因表达样品进行高通量全转录物测序。
[0009]一方面,本公开提供一种用于制备阵列核酸序列的方法,该方法涉及:(i)获得多个输入核酸序列,其中每个输入序列的长度为大约300千碱基或更短(任选地长度为30千碱基或更短);(ii)将一个或多个衔接子序列附接至该多个核酸序列,从而生成衔接的核酸序列的群体;(iii)使该衔接的核酸序列的群体与能够在给衔接的核酸序列的群体内的每个双链衔接的核酸序列的至少一端上生成单链端的酶接触,从而形成具有单链端的核酸序列的群体;以及(iv)使该具有单链端的核酸序列的群体与连接酶接触,从而形成阵列核酸序列。
[0010]在一些实施方案中,衔接子序列中的至少一个序列在一条链上包含内部dU。
[0011]在实施方案中,阵列核酸序列的长度为至少20千碱基。任选地,阵列核酸序列的长度为至少50千碱基。在相关实施方案中,阵列核酸序列的长度为大约100千碱基或更长。
[0012]在一个实施方案中,该多个输入核酸序列的长度为大约0.5kb至20kb。
[0013]在某些实施方案中,该多个输入核酸序列是从一个或多个cDNA库获得的。任选地,该多个输入核酸序列是从一个或多个单细胞空间cDNA库获得的。
[0014]在一些实施方案中,步骤(ii)包含使该多个核酸序列与成对扩增引物接触,其中该成对扩增引物中的至少一个包含衔接子序列,该衔接子序列在一条链上涉及内部dU,以及执行至少一轮扩增,从而生成衔接的核酸序列的群体。
[0015]在一些实施方案中,每对扩增引物中的至少一个是生物素化的。任选地,对衔接子序列收尾的扩增子进行生物素介导的选择。
[0016]在实施方案中,步骤(iii)包含使核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的核酸序列的群体。
[0017]在一些实施方案中,衔接子序列包含5至30个碱基对的长度(排除靶核酸序列)。任选地,衔接子序列的长度为6至25个碱基对。任选地,衔接子序列具有结构5'

N6

16_dU_靶

DNA

3'。
[0018]在实施方案中,在一条链上具有内部dU的衔接子序列包含SEQ ID NO:1至18的序列。
[0019]在一些实施方案中,对于多个具有衔接子序列的核酸序列,每个衔接子序列具备一个或两个指定序列,该指定序列与该具有衔接子序列的多个核酸序列中的至少一个其他序列互补,其中该多个衔接子序列因此形成互补衔接子序列的群体。任选地,该互补衔接组序列的群体的每个互补衔接子序列与该互补衔接子序列的群体中的每个其他互补衔接子序列具备最低限度的相似性。在相关实施方案中,该互补衔接子序列的群体的每个互补衔接子序列与该互补衔接子序列的群体中的全部其他互补衔接子序列相距至少11个汉明距离单位。
[0020]在某些实施方案中,该多个输入核酸序列;该衔接的核酸序列的群体和/或该具有单链端的核酸序列的群体中的一个或多个是经过尺寸选择的。任选地,该尺寸选择是经由电泳进行的。在相关实施方案中,该尺寸选择是使用琼脂糖凝胶上进行的。
[0021]在某些实施方案中,获得了阵列核酸序列的序列信息。任选地,阵列核酸序列的序
列信息是使用长读段测序平台获得的。
[0022]在相关实施方案中,单倍型分相的序列信息是跨阵列核酸序列获得的。
[0023]在另一实施方案中,所形成的阵列核酸序列包含五个或更多个输入核酸序列。任选地,所形成的阵列核酸序列包含六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个、十一个或更多个、十二个或更多个、十三个或更多个、十四个或更多个、十五个或更多个、十六个或更多个、十七个或更多个、十八个或更多个、十九个或更多个、二十个或更多个输入核酸序列。
[0024]在某些实施方案中,靶向同种型测序信息是经由在步骤(i)获得多个输入核酸序列期间靶向基因群组而获得的。
[0025]在实施方案中,该多个输入核酸序列包含用于免疫应答途径的cDNA。
[0026]在一些实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入核酸序列中的每个输入核酸序列的长度为大约30千碱基或更短;ii)将一个或多个衔接子序列连接至所述多个输入核酸序列,从而生成衔接的核酸序列的群体;iii)使所述衔接的核酸序列的群体与能够在所述衔接的核酸序列的群体内的每个衔接的核酸序列的至少一段生成单链端的酶接触,从而形成具有单链端的核酸序列的群体;以及iv)使所述具有单链端的核酸序列的群体与连接酶接触,从而形成阵列核酸序列。2.根据权利要求1所述的方法,其中所述一个或多个衔接子序列中的至少一个包括在一条链上的内部dU。3.根据权利要求1所述的方法,其中所述阵列核酸序列的长度为至少20千碱基,任选地为至少50千碱基,任选地为大约100kb或更长。4.根据权利要求1所述的方法,其中所述多个输入核酸序列的长度为大约0.5kb至20kb。5.根据权利要求1所述的方法,其中所述多个输入核酸序列是从一个或多个cDNA库获得的,任选地是从一个或多个单细胞或空间cDNA库获得的。6.根据权利要求1所述的方法,其中步骤(ii)包括使所述多个核酸序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的核酸序列的群体。7.根据权利要求6所述的方法,其中所述成对扩增引物中的至少一个引物是生物素化的,任选地其中对衔接子序列收尾的扩增子进行生物素介导的选择。8.根据权利要求2、6或7中任一项所述的方法,其中步骤(iii)进一步包括使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的核酸序列的群体。9.根据权利要求1所述的方法,其中所述衔接子序列包含5至30个碱基对的长度(排除靶核酸序列),任选地其中所述衔接子序列的长度为6至25个碱基对,任选地其中所述衔接子序列具有结构5'

N6

16_dU_靶

DNA

3'。10.根据权利要求1所述的方法,其中所述包括在一条链上的内部dU的衔接子序列包括选自由SEQ ID NO:1至18所组成的组的序列。11.根据权利要求1所述的方法,其中对于具有衔接子序列的多个核酸序列,每个衔接子序列具备一个或两个指定序列,所述指定序列与所述具有衔接子序列的多个核酸序列中的至少一个其他核酸序列互补,其中所述多个衔接子序列因此形成互补衔接子序列的群体,任选地其中所述互补衔接子序列的群体内的每个互补衔接子序列与所述互补衔接子序列的群体内的每个其他互补衔接子序列具备最低限度的相似性,任选地其中所述互补衔接子序列的群体内的每个互补衔接子序列与所述互补衔接子序列的群体内的全部其他互补衔接子序列相距至少11个汉明距离单位。12.根据权利要求1所述的方法,其中以下中的一个或多个是经过尺寸选择的:所述多
个输入核酸序列;所述衔接的核酸序列的群体;和/或所述具有单链端的核酸序列的群体,任选地其中所述尺寸选择是经由电泳进行的,任选地在琼脂糖凝胶上进行。13.根据权利要求1所述的方法,其中所述阵列核酸序列的序列信息是任选地使用长读段测序平台获得的。14.根据权利要求13所述的方法,其中单倍型分相的序列信息是跨所述阵列核酸序列获得的。15.根据权利要求1所述的方法,其中所形成的所述阵列核酸序列包括五个或更多个输入核酸序列,任选地六个或更多个、任选地七个或更多个、任选地八个或更多个、任选地九个或更多个、任选地十个或更多个、任选地十一个或更多个、任选地十二个或更多个、任选地十三个或更多个、任选地十四个或更多个、任选地十五个或更多个、任选地十六个或更多个、任选地十七个或更多个、任选地十八个或更多个、任选地十九个或更多个、任选地二十个或更多个。16.根据权利要求13所述的方法,其中靶向同种型测序信息是经由在步骤(i)获得所述多个输入核酸序列期间靶向基因群组而获得的。17.根据权利要求1所述的方法,其中所述多个输入核酸序列包括用于免疫应答途径的cDNA。18.根据权利要求1所述的方法,其中所述多个输入核酸序列是从线粒体DNA获得的,任选地其中所述阵列核酸序列的测序用于线粒体DNA谱系追踪。19.根据权利要求1所述的方法,其中所述衔接的核酸序列的群体经由吉普森组装接合。20.根据权利要求1所述的方法,其中所述阵列核酸序列为线性阵列。21.根据权利要求1所述的方法,其中所述阵列核酸序列为环状阵列。22.一种制备核酸序列的线性阵列的阵列的方法,所述方法包括:i)通过根据权利要求20所述的方法从输入核酸序列的第一群体制备第一线性阵列;ii)通过根据权利要求20所述的方法从输入核酸序列的第二群体制备第二线性阵列,其中所述第一线性阵列和所述第二线性阵列各自具备相容的互补侧翼序列;iii)将所述第一线性阵列和所述第二线性阵列在溶液中合并;以及iv)使所述第一线性阵列和所述第二线性阵列在溶液中与连接酶接触,从而形成核酸序列的线性阵列的阵列。23.根据权利要求22所述的方法,其中所述第一线性阵列或所述第二线性阵列或两者包含线性阵列的阵列。24.根据权利要求22或权利要求23所述的方法,进一步包括:v)通过根据权利要求20所述的方法从输入核酸序列的第三群体制备第三线性阵列,其中所述线性阵列的阵列和所述第三线性阵列各自具备相容的互补侧翼序列;vi)将所述线性阵列的阵列和所述第三线性阵列在溶液中合并;以及vii)使所述线性阵列的阵列和所述第三线性阵列在溶液中与连接酶接触,从而形成核酸序列的线性阵列的更大阵列,任选地其中重复步骤(v)至(vii)以将第四线性阵列、第五线性阵列和/或更多线性阵列引入所述线性阵列的更大阵列中。25.一种从输入cDNA序列的群体获得同种型测序信息的方法,所述方法包括:
i)获得多个输入cDNA序列;ii)使所述多个输入cDNA序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的cDNA序列的群体;iii)使所述衔接的cDNA序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的cDNA序列的群体;iv)使所述具有单链端的衔接的cDNA序列的群体与连接酶接触,从而形成线性阵列核酸序列;v)从所述线性阵列核酸序列获得序列信息,任选地经由长读段测序获得;以及vi)分析从所述线性阵列核酸序列获得的所述序列信息,以获得同种型测序信息,从而从所述输入cDNA序列的群体获得同种型测序信息。26.一种从输入线粒体cDNA序列的群体进行线粒体谱系追踪的方法,所述方法包括:i)获得多个输入线粒体cDNA序列;ii)使所述多个输入线粒体cDNA序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的线粒体cDNA序列的群体;iii)使所述衔接的线粒体cDNA序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的线粒体cDNA序列的群体;iv)使所述具有单链端的衔接的线粒体cDNA序列的群体与连接酶接触,从而形成阵列核酸序列;v)从所述阵列核酸序列获得序列信息,任选地经由长读段测序获得;以及vi)分析从所述线性阵列核酸序列获得的所述序列信息,以追踪线粒体谱系,从而从所述输入线粒体cDNA序列的群体进行线粒体谱系追踪。27.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入序列中的每个输入核酸序列的长度为大约300千碱基或更短;ii)使所述多个输入核酸序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的核酸序列的群体;iii)使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的核酸序列的群体;以及iv)使所述具有单链端的衔接的核酸序列的群体与连接酶接触,从而形成阵列核酸序列。28.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入序列中的每个输入核酸序列的长度为大约300千碱基或更短;ii)使所述多个输入核酸序列与包括在一条链上的内部dU的衔接子序列和连接酶接触,从而生成衔接的核酸序列的群体;
iii)使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的核酸序列的群体;以及iv)使所述具有单链端的衔接的核酸序列的群体与连接酶接触,从而形成线性阵列核酸序列。29.根据权利要求27或权利要求28所述的方法,其中所述多个输入序列中的每个输入核酸序列的长度为大约30千碱基或更短;30.一种包括多个核酸序列的组合物,其中所述多个核酸序列中的至少两个包含选自由SEQ ID NO:1至18所组成的组的衔接子序列。31.一种试剂盒,其包含选自由SEQ ID NO:1至18所组成的组的多个衔接子序列和它的使用说明书。32.一种鉴定核酸序列读段的群体的个体核酸序列读段内的离散序列元件的方法,所述个体核酸序列读段具有序列...

【专利技术属性】
技术研发人员:N
申请(专利权)人:麻省理工学院总医院公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1