【技术实现步骤摘要】
【国外来华专利技术】嵌合扩增子阵列测序
[0001]相关申请的交叉引用
[0002]本申请主张2020年6月15日提交的题为“Chimeric Amplicon Array Sequencing”的美国专利临时申请号63/039,004的权益。前述申请的整体内容通过引用并入本文。
[0003]关于联邦资助研究的声明
[0004]本专利技术在美国国家卫生研究院提供的政府支持(项目号U19AI082630)下完成。政府拥有本专利技术的某些权利。
[0005]本专利技术大体涉及用于核酸测序的方法和组合物,特别是用于测序的核酸群体的制备。
技术介绍
[0006]尽管下一代DNA测序的出现已经彻底改变了生物学研究,但目前的测序平台仍未能很好地解决一些关键的遗传特征。例如,选择性剪接是一种核心生物学过程,其通过mRNA成熟过程中外显子的差异剪接实现基因功能深刻和必要的多样化,但无法经由已知的单细胞测序方法充分捕获。对于肿瘤克隆进化的研究,从单细胞的标记等位基因获得克隆关系的能力需要强大的测序覆盖率,这是迄今为止单细胞基因表达工作流程所无法实现的。再者,由潜在遗传疾病引起的疾病需要忠实地重建基因组组成的能力,以便诊断和揭示病因。特别是,表征体细胞嵌合体(这是合子后突变的结果,已知会导致严重的神经系统疾病)需要对大量单个细胞进行采样,这一任务远不能用当前的方法来处理。先前描述的方法无法解决这些关键特征,这突出了该领域忠实描述复杂生物系统的能力的严重不足。这些限制源于现有测序技术无法有效地捕获长程DNA信息。据此,需要能够 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入核酸序列中的每个输入核酸序列的长度为大约30千碱基或更短;ii)将一个或多个衔接子序列连接至所述多个输入核酸序列,从而生成衔接的核酸序列的群体;iii)使所述衔接的核酸序列的群体与能够在所述衔接的核酸序列的群体内的每个衔接的核酸序列的至少一段生成单链端的酶接触,从而形成具有单链端的核酸序列的群体;以及iv)使所述具有单链端的核酸序列的群体与连接酶接触,从而形成阵列核酸序列。2.根据权利要求1所述的方法,其中所述一个或多个衔接子序列中的至少一个包括在一条链上的内部dU。3.根据权利要求1所述的方法,其中所述阵列核酸序列的长度为至少20千碱基,任选地为至少50千碱基,任选地为大约100kb或更长。4.根据权利要求1所述的方法,其中所述多个输入核酸序列的长度为大约0.5kb至20kb。5.根据权利要求1所述的方法,其中所述多个输入核酸序列是从一个或多个cDNA库获得的,任选地是从一个或多个单细胞或空间cDNA库获得的。6.根据权利要求1所述的方法,其中步骤(ii)包括使所述多个核酸序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的核酸序列的群体。7.根据权利要求6所述的方法,其中所述成对扩增引物中的至少一个引物是生物素化的,任选地其中对衔接子序列收尾的扩增子进行生物素介导的选择。8.根据权利要求2、6或7中任一项所述的方法,其中步骤(iii)进一步包括使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的核酸序列的群体。9.根据权利要求1所述的方法,其中所述衔接子序列包含5至30个碱基对的长度(排除靶核酸序列),任选地其中所述衔接子序列的长度为6至25个碱基对,任选地其中所述衔接子序列具有结构5'
‑
N6
‑
16_dU_靶
‑
DNA
‑
3'。10.根据权利要求1所述的方法,其中所述包括在一条链上的内部dU的衔接子序列包括选自由SEQ ID NO:1至18所组成的组的序列。11.根据权利要求1所述的方法,其中对于具有衔接子序列的多个核酸序列,每个衔接子序列具备一个或两个指定序列,所述指定序列与所述具有衔接子序列的多个核酸序列中的至少一个其他核酸序列互补,其中所述多个衔接子序列因此形成互补衔接子序列的群体,任选地其中所述互补衔接子序列的群体内的每个互补衔接子序列与所述互补衔接子序列的群体内的每个其他互补衔接子序列具备最低限度的相似性,任选地其中所述互补衔接子序列的群体内的每个互补衔接子序列与所述互补衔接子序列的群体内的全部其他互补衔接子序列相距至少11个汉明距离单位。12.根据权利要求1所述的方法,其中以下中的一个或多个是经过尺寸选择的:所述多
个输入核酸序列;所述衔接的核酸序列的群体;和/或所述具有单链端的核酸序列的群体,任选地其中所述尺寸选择是经由电泳进行的,任选地在琼脂糖凝胶上进行。13.根据权利要求1所述的方法,其中所述阵列核酸序列的序列信息是任选地使用长读段测序平台获得的。14.根据权利要求13所述的方法,其中单倍型分相的序列信息是跨所述阵列核酸序列获得的。15.根据权利要求1所述的方法,其中所形成的所述阵列核酸序列包括五个或更多个输入核酸序列,任选地六个或更多个、任选地七个或更多个、任选地八个或更多个、任选地九个或更多个、任选地十个或更多个、任选地十一个或更多个、任选地十二个或更多个、任选地十三个或更多个、任选地十四个或更多个、任选地十五个或更多个、任选地十六个或更多个、任选地十七个或更多个、任选地十八个或更多个、任选地十九个或更多个、任选地二十个或更多个。16.根据权利要求13所述的方法,其中靶向同种型测序信息是经由在步骤(i)获得所述多个输入核酸序列期间靶向基因群组而获得的。17.根据权利要求1所述的方法,其中所述多个输入核酸序列包括用于免疫应答途径的cDNA。18.根据权利要求1所述的方法,其中所述多个输入核酸序列是从线粒体DNA获得的,任选地其中所述阵列核酸序列的测序用于线粒体DNA谱系追踪。19.根据权利要求1所述的方法,其中所述衔接的核酸序列的群体经由吉普森组装接合。20.根据权利要求1所述的方法,其中所述阵列核酸序列为线性阵列。21.根据权利要求1所述的方法,其中所述阵列核酸序列为环状阵列。22.一种制备核酸序列的线性阵列的阵列的方法,所述方法包括:i)通过根据权利要求20所述的方法从输入核酸序列的第一群体制备第一线性阵列;ii)通过根据权利要求20所述的方法从输入核酸序列的第二群体制备第二线性阵列,其中所述第一线性阵列和所述第二线性阵列各自具备相容的互补侧翼序列;iii)将所述第一线性阵列和所述第二线性阵列在溶液中合并;以及iv)使所述第一线性阵列和所述第二线性阵列在溶液中与连接酶接触,从而形成核酸序列的线性阵列的阵列。23.根据权利要求22所述的方法,其中所述第一线性阵列或所述第二线性阵列或两者包含线性阵列的阵列。24.根据权利要求22或权利要求23所述的方法,进一步包括:v)通过根据权利要求20所述的方法从输入核酸序列的第三群体制备第三线性阵列,其中所述线性阵列的阵列和所述第三线性阵列各自具备相容的互补侧翼序列;vi)将所述线性阵列的阵列和所述第三线性阵列在溶液中合并;以及vii)使所述线性阵列的阵列和所述第三线性阵列在溶液中与连接酶接触,从而形成核酸序列的线性阵列的更大阵列,任选地其中重复步骤(v)至(vii)以将第四线性阵列、第五线性阵列和/或更多线性阵列引入所述线性阵列的更大阵列中。25.一种从输入cDNA序列的群体获得同种型测序信息的方法,所述方法包括:
i)获得多个输入cDNA序列;ii)使所述多个输入cDNA序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的cDNA序列的群体;iii)使所述衔接的cDNA序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的cDNA序列的群体;iv)使所述具有单链端的衔接的cDNA序列的群体与连接酶接触,从而形成线性阵列核酸序列;v)从所述线性阵列核酸序列获得序列信息,任选地经由长读段测序获得;以及vi)分析从所述线性阵列核酸序列获得的所述序列信息,以获得同种型测序信息,从而从所述输入cDNA序列的群体获得同种型测序信息。26.一种从输入线粒体cDNA序列的群体进行线粒体谱系追踪的方法,所述方法包括:i)获得多个输入线粒体cDNA序列;ii)使所述多个输入线粒体cDNA序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的线粒体cDNA序列的群体;iii)使所述衔接的线粒体cDNA序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的线粒体cDNA序列的群体;iv)使所述具有单链端的衔接的线粒体cDNA序列的群体与连接酶接触,从而形成阵列核酸序列;v)从所述阵列核酸序列获得序列信息,任选地经由长读段测序获得;以及vi)分析从所述线性阵列核酸序列获得的所述序列信息,以追踪线粒体谱系,从而从所述输入线粒体cDNA序列的群体进行线粒体谱系追踪。27.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入序列中的每个输入核酸序列的长度为大约300千碱基或更短;ii)使所述多个输入核酸序列与成对扩增引物接触,其中所述成对扩增引物中的至少一个引物包括衔接子序列,所述衔接子序列包括在一条链上的内部dU,以及进行至少一轮扩增,从而生成衔接的核酸序列的群体;iii)使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的核酸序列的群体;以及iv)使所述具有单链端的衔接的核酸序列的群体与连接酶接触,从而形成阵列核酸序列。28.一种制备阵列核酸序列的方法,所述方法包括:i)获得多个输入核酸序列,其中所述多个输入序列中的每个输入核酸序列的长度为大约300千碱基或更短;ii)使所述多个输入核酸序列与包括在一条链上的内部dU的衔接子序列和连接酶接触,从而生成衔接的核酸序列的群体;
iii)使所述衔接的核酸序列的群体与尿嘧啶DNA糖苷酶和核酸内切酶VIII接触,从而形成具有单链端的衔接的核酸序列的群体;以及iv)使所述具有单链端的衔接的核酸序列的群体与连接酶接触,从而形成线性阵列核酸序列。29.根据权利要求27或权利要求28所述的方法,其中所述多个输入序列中的每个输入核酸序列的长度为大约30千碱基或更短;30.一种包括多个核酸序列的组合物,其中所述多个核酸序列中的至少两个包含选自由SEQ ID NO:1至18所组成的组的衔接子序列。31.一种试剂盒,其包含选自由SEQ ID NO:1至18所组成的组的多个衔接子序列和它的使用说明书。32.一种鉴定核酸序列读段的群体的个体核酸序列读段内的离散序列元件的方法,所述个体核酸序列读段具有序列...
【专利技术属性】
技术研发人员:N,
申请(专利权)人:麻省理工学院总医院公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。