一种单细胞内RNA全转录组标记和测序的方法技术

技术编号:37974013 阅读:17 留言:0更新日期:2023-06-30 09:49
本申请一种单细胞内RNA全转录组标记的方法。进一步的,涉及一种单细胞内RNA全转录组测序的方法,以及一种单细胞内RNA m6A修饰测序方法和一种单细胞内RNA结合蛋白结合位点的测序方法。本申请的方法实现了单细胞水平的RNA标记,并且提供了高通量单细胞RNA m6A标记及测序的方法。测序的方法。测序的方法。

【技术实现步骤摘要】
一种单细胞内RNA全转录组标记和测序的方法


[0001]本申请涉及测序领域。具体涉及一种单细胞内RNA全转录组标记的方法。进一步的,涉及一种单细胞内RNA全转录组测序的方法,以及一种单细胞内RNA m6A修饰组的测序方法和一种单细胞内RNA结合蛋白结合位点的测序方法。

技术介绍

[0002]表观遗传学是经典遗传学的重要补充,在不改变DNA序列的情况下,核酸、蛋白质等生物大分子时刻处于时空特异、双向可逆的动态修饰之中,可遗传的调控着基因表达的变化。随着人类基因组计划的完成和测序技术的进步,核酸修饰逐渐成为了新的研究热点。在核酸表观遗传领域中,RNA修饰引发的表观转录组学在近些年受到大量的关注。RNA中除了常规的四种组成碱基之外,在碱基和糖环上还存在着一些化学修饰。目前,研究人员已经在RNA分子上发现了170多种化学修饰,这些修饰广泛存在于各种RNA类型中,包括转运RNA(tRNA)、核糖体RNA(rRNA)、信使RNA(mRNA)、长链非编码RNA(lncRNA)、核内小RNA(snRNA)和核仁小RNA(snoRNA)等。在RNA修饰的早期发展阶段,相关研究主要集中在含量丰富的非编码RNA上,例如tRNA、rRNA和snRNA等。随着RNA化学修饰在全转录组水平上的发现与鉴定,RNA修饰相关酶和识别蛋白的发现,以及潜在生物医学功能的揭示,引发了“表观转录组学”的研究热潮。
[0003]目前,在真核生物的mRNA上已经发现了包括端帽结构处的7

甲基鸟嘌呤(m7G),N6,2
’‑r/>O

二甲基腺嘌呤(m6A
m
),2

氧甲基化(Nm),还包括内部的N6‑
甲基腺嘌呤(m6A)、次黄嘌呤(I)、N1

甲基腺嘌呤(m1A)、5

甲基胞嘧啶(m5C)、假尿嘧啶(Ψ)和N4

乙酰胞嘧啶(ac4C)。其中,m6A修饰是mRNA上含量最丰富且研究最广泛的一种甲基化修饰。目前发现m6A可以影响RNA的剪接、稳定性和翻译等代谢过程,进而调控组织分化、记忆形成、肿瘤发生、病毒感染等重要的生理和病理过程。
[0004]对于RNA m6A修饰来说,目前基于抗体、酶和化学分子开发了多种各具特色的全转录组检测方法(Hartstock K.,et al.2019,Chemistry),但是目前仍然没有能在单细胞中检测m6A修饰的测序方法。
[0005]为开发单细胞RNA m6A修饰的检测方法,需要开发一种能够实现单细胞内全转录组标记的测序的方法。

技术实现思路

[0006]本申请的专利技术人在研究过程中注意到,在单细胞测序过程中,现有技术普遍利用随机引物或者混合的随机引物和多聚T的引物,但是这些方法逆转录都会造成polyA尾巴RNA较多的系统偏差。而且由于二代测序的读长限制,这些方法建立的RNA文库不能覆盖完整的转录组,只能对转录本的一侧进行测序。所以本申请的专利技术人对RNA片段进行打断,以多轮RNA连接标记RNA分子,保证测序的均一性,并设计了独特的接头组(第一接头组至第四接头组)。例如,在第一接头组的第一链中的第一个碱基设置为任意的随机碱基(序列表中
用N表示),这是为了排除碱基的差异所带来的连接效率的差别。本专利技术的标记方法实现了标记链和RNA链在同一链,这种标记不会受到高温加热导致解链的影响。
[0007]进一步的,本申请的方法与现有技术的主要区别在于本申请使用了连接法标记细胞而不是基于碱基配对和逆转录,而且标记信息链和RNA处于同一链,实现稳定的标记,有利于后续提取RNA和抗体富集等操作。现有技术在标记过程中使用了RNA逆转录酶会导致RNA以DNA:RNA杂合链的形式存在,造成RNA修饰信息的识别困难,也可能造成RNA的降解。本专利技术保证了RNA完整的单链状态。在标记RNA的同时不影响RNA的状态。
[0008]因此,在第一方面,本申请提供了一种单细胞内RNA全转录组标记的方法,所述方法包括:
[0009](1)提供含有细胞的样品,对所述细胞进行固定和通透;
[0010](2)将细胞内RNA打断,并进行3

末端修复,获得多个RNA片段;
[0011](3)对所述RNA片段进行标记,具体步骤如下:
[0012](a)提供第一接头组,所述第一接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第一链,以及第二链,
[0013]其中,所述第一链包含连接序列以及模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第一链含有不同的连接序列以及相同的模板序列;所述第二链包含第一模板序列和第二模板序列,且第二链的第一模板序列与第一链的模板序列互补,
[0014]将腺苷酰化酶(Adenylase)和第一链接触,在允许核酸杂交或退火的条件下,将所述第一接头组与所述RNA片段接触,以使得所述第一接头组的第一链与RNA片段的3

末端连接;
[0015](b)提供第二接头组,所述第二接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第三链,
[0016]其中,所述第三链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第三链含有不同的连接序列以及相同的第一模板序列和第二模板序列;所述第三链的第一模板序列与所述第一接头组中的第二链的第二模板序列互补,
[0017]在允许核酸杂交或退火的条件下,将所述第二接头组与步骤(a)的产物接触,以使得所述第二接头组与第一接头组的第一链的3

末端连接;
[0018]任选地,在允许核酸杂交或退火的条件下,将第一中和引物(例如,第二链)与上述退火后获得的产物接触,所述第一中和引物(例如,第二链)与第三链的第一模板序列、第二模板序列或它们的部分序列互补;
[0019](c)提供第三接头组,所述第三接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第四链,以及第五链,
[0020]其中,所述第四链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第四链含有不同的连接序列以及相同的第一模板序列和第二模板序列,
[0021]所述第五链包含第一模板序列和第二模板序列,其中,第五链的第一模板序列与第三链的第二模板序列互补,第五链的第二模板序列与第四链的第一模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种单细胞内RNA全转录组标记的方法,所述方法包括:(1)提供含有细胞的样品,对所述细胞进行固定和通透;(2)将细胞内RNA打断,并进行3

末端修复,获得多个RNA片段;(3)对所述RNA片段进行标记,具体步骤如下:(a)提供第一接头组,所述第一接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第一链,以及第二链,其中,所述第一链包含连接序列以及模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第一链含有不同的连接序列以及相同的模板序列;所述第二链包含第一模板序列和第二模板序列,且第二链的第一模板序列与第一链的模板序列互补,将腺苷酰化酶(Adenylase)和第一链接触,在允许核酸杂交或退火的条件下,将所述第一接头组与所述RNA片段接触,以使得所述第一接头组的第一链与RNA片段的3

末端连接;(b)提供第二接头组,所述第二接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第三链,其中,所述第三链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第三链含有不同的连接序列以及相同的第一模板序列和第二模板序列;所述第三链的第一模板序列与所述第一接头组中的第二链的第二模板序列互补,在允许核酸杂交或退火的条件下,将所述第二接头组与步骤(a)的产物接触,以使得所述第二接头组与第一接头组的第一链的3

末端连接;任选地,在允许核酸杂交或退火的条件下,将第一中和引物(例如,第二链)与上述退火后获得的产物接触,所述第一中和引物(例如,第二链)与第三链的第一模板序列、第二模板序列或它们的部分序列互补;(c)提供第三接头组,所述第三接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第四链,以及第五链,其中,所述第四链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第四链含有不同的连接序列以及相同的第一模板序列和第二模板序列,所述第五链包含第一模板序列和第二模板序列,其中,第五链的第一模板序列与第三链的第二模板序列互补,第五链的第二模板序列与第四链的第一模板序列互补,在允许核酸杂交或退火的条件下,将所述第三接头组与步骤(b)的产物接触,以使得所述第三接头组的第四链与第二接头组的3

末端连接;任选地,在允许核酸杂交或退火的条件下,将第二中和引物(例如,第五链)与上述退火后获得的产物接触,所述第二中和引物(例如,第五链)与第三接头组中的第四链的第一模板序列、第二模板序列或它们的部分序列互补;(d)提供第四接头组,所述第四接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第六链,以及第七
链,其中,所述第六链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为14至20个(例如,14个,15个,16个,17个,18个,19个,20个)碱基的随机排列,且每一条第六链含有不同的连接序列以及相同的第一模板序列和第二模板序列,所述第七链包含第一模板序列和第二模板序列,其中,第七链的第一模板序列与第四链的第二模板序列互补,第七链的第二模板序列与第六链的第一模板序列互补,在允许核酸杂交或退火的条件下,将所述第四接头组与步骤(c)的产物接触,以使得所述第四接头组的第六链与第三接头组的第四链的3

末端连接;任选地,在允许核酸杂交或退火的条件下,将第三中和引物(例如,第七链)与上述退火后获得的产物接触,所述第三中和引物(例如,第七链)与第四接头组中的第六链的第一模板序列、第二模板序列或它们的部分序列互补;(e)提供第五接头组,所述第五接头组包含至少1条(例如,2条至30条,30条至60条,60条至90条,90条至120条,120条至150条,150条至180条,180条至210条)第八链,其中,所述第八链包含第一模板序列、连接序列以及第二模板序列,所述连接序列为6至12个(例如,6个,7个,8个,9个,10个,11个,12个)碱基的随机排列,且每一条第八链含有不同的连接序列以及相同的第一模板序列和第二模板序列;所述第八链的第一模板序列与第六链的第二模板序列互补,在允许核酸杂交或退火的条件下,将所述第五接头组与步骤(d)的产物接触,以使得所述第五接头组与第四接头组的第六链的3

末端连接;(f)在允许核酸连接的条件下,将DNA聚合酶与步骤(g)获得的产物接触;(4)分选单细胞,即获得RNA全转录组标记的单细胞。2.一种单细胞内RNA全转录组测序的方法,所述方法包括:(1)通过权利要求1所述的方法对单细胞内RNA全转录组标记;(2)富集权利要求1中步骤(4)获得的单细胞中的RNA;(3)对所述RNA进行测序,即实现单细胞内RNA全转录组测序。3.一种单细胞内RNA m6A修饰组测序的方法,所述方法包括:(1)通过权利要求1所述的方法对单细胞内RNA全转录组标记;(2)富集权利要求1中步骤(4)获得的单细胞中的RNA;(3)对所述RNA进行测序,即实现单细胞内RNA m6A修饰组测序;任选地,对上述步骤(2)的产物进行醇沉以及rRNA去除。4.一种单细胞内RNA结合蛋白结合位点的测序方法,所述方法包括:(1)通过权利要求1所述的方法对单细胞内RNA全转录组标记;(2)富集步骤(1)获得的单细胞中的RNA;(3)对步骤(5)获得的产物进行洗脱,获得RNA

蛋白质复合物;(4)将步骤(3)获得的RNA

蛋白质复合物进行凝胶电泳并转膜,选择目标蛋白上方区域的RNA

蛋白质复合物产物进行切胶回收;(5)提取步骤(4)获得的产物中的RNA,并建立RNA文库;(6)对步骤(5)获得的产物进行醇沉以及rRNA去除;(7)对步骤(6)获得的RNA进行测序,即实现单细胞内RNA结合蛋白结合位点的测序。
5.权利要求2或3的方法,其中,在步骤(2)中,富集具体包括如下步骤:(i)对步骤(4)获得的单细胞进行醇沉;(ii)去除步骤(i)获得的产物中的DNA;(iii)利用步骤(ii)获得的产物建立RNA文库。6.权利要求2

4任一项的方法,其中,在步骤(2)中,富集具体包括如下步骤:(i)对步骤(4)获得的单细胞进行RNA提取纯化和醇沉;(ii)对步骤(i)获得的产物进行免疫沉淀(例如,充分洗涤并用m6A核苷类似物进行竞争洗脱释放含有m6A修饰的RNA);(iii)对步骤(ii)获得的产物进行洗脱;优选地,对(iii)获得的产物进行醇沉以及去除rRNA。7.权利要求4

6任一项的方法,所述建立RNA文库的方法包括:(a)对(ii)获得的产物中的RNA进行反转录;(b)对步骤(a)获得的产物进行PCR扩增;(c)对步骤(b)获得的产物进行T7

RNA聚合酶扩增;(d)去除步骤(c)获得的产物中的rRNA;(e)对步骤(d)获得的产物进行反转录以及PCR扩增。8.权利要求3

7任一项的方法,其中,所述醇沉的步骤包括:将SDS、蛋白酶K和Triton X

100溶液与细胞接触;然后提取RNA;然后加入乙醇、醋酸钠以及糖原。9.权利要求1

8任一项的方法,在步骤(3)中,具有选自下列的一项或多项特征:(1)步骤(a)中,所述连接序列为9个碱基的随机排列;(2)步骤(b)和(c)中,所述连接序列为8个碱基的随机排列;(3)步骤(d)中,所述连接序列为16个碱基的随机排列;(4)步骤(e)中,所述连接序列为8个碱基的随机排列;(5)所述第一链的模板序列的长度为16

22个碱基(例如,19个碱基);(6)所述第二链的第一模板序列的长度16

22个碱基(例如,19个碱基);(7)所述第二链的第二模板序列的长度为13

18个碱基(例如,15个碱基);(8)所述第三链的第一模板序列的长度为13

18个碱基(例如,15个碱基);(9)所述第三链的第二模板序列的长度为13

18个碱基(例如,15个碱基);(10)所述第四链的第一模板序列的长度为13

18个碱基(例如,15个碱基);(11)所述第四链的第二模板序列的长度为13

18个碱基(例如,15个碱基);(12)所述第五链的第一模板序列的长度为13

18个碱基(例如,15个碱基);(13)所述第五链的第二模板序列的长度为13

18个碱基(例如,15个碱基);(14)所述第六链的第一模板序列的长度为13

18个碱基(例如,15个碱基);(15)所述第七链的第二模板序列的长度为18

22个碱基(例如,20个碱基);(16)所述第八链的第一模板序列的长度为20

24个碱基(例如,22个碱基);(17)所述第八链的第二模板序列的长度为30

36个碱基(例如,33个碱基);(18)所述第一接头组包含96条第一链,所述第一链具有如SEQ ID NO:1至SEQ ID NO:96所示的序列;或者,所述第一接头组包含70条第一链,所述第一链具有如SEQ ID NO:1至SEQ ID NO:70所示的序列;
(19)第二链具有如SEQ ID NO:97所示的序列...

【专利技术属性】
技术研发人员:杨运桂姚欢杨莹王梦柯宋鸽鸽
申请(专利权)人:中国科学院北京基因组研究所国家生物信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1