本发明专利技术涉及一种构建多样品全长转录组混合文库的方法,其在逆转录过程中使用带有鉴别标签的引物分别对不同样品中的mRNA进行逆转录,合成cDNA,然后将所述来自不同样品中的cDNA混合并进行处理得到所述文库。本发明专利技术的方法通过在逆转录引物中加入一段特异的标签序列,使得逆转录产物带上特有的标签,在对不同样品使用带有不同标签序列的引物逆转录以及后续PCR扩增后,都可通过该标签来鉴别逆转录产物和PCR产物初始来自于哪个样品,从而实现混合样品建库。
【技术实现步骤摘要】
一种构建多样品全长转录组混合文库的方法
本专利技术涉及分子生物学
,更特别地,涉及一种用于构建多样品全长转录组混合文库的方法。
技术介绍
转录组测序(Transcriptomesequencing)主要通过高通量测序研究特定组织或细胞在某个时期转录出来的mRNA。转录组测序可全面快速地获得某一物种特定细胞或组织在某一状态下的几乎所有的转录本及基因序列,可以用于研究基因结构和基因功能、可变剪接和新转录本预测等。传统的二代转录组测序由于其读长短的特点,建库时需要进行打断,无法直接获得单个RNA分子由5ˊ到3ˊ的全部序列。基于PacBio三代测序平台的全长转录组测序,无需打断,能够直接读取反转录的全长cDNA,能够有效的获取高质量的单个RNA分子的全部序列,准确辨别二代测序无法识别的同源异构体(isoform)、同源基因、超家族基因或等位基因表达的转录本。目前已有的全长转录组建库并不支持多样品混合建库流程,即使混样建库,也仅仅是将样品混合到一起,测序数据并不能进行有效区分。在二代转录组测序技术中,是可以进行多样品混合建库的,但由于三代测序的全长转录组建库并不需要进行打断,按照二代建库的方法添加标签序列会非常繁琐,因此,需要一种新的构建多样品全长转录组混合文库的方法。
技术实现思路
为解决以上问题,本专利技术提供了一种构建多样品全长转录组混合文库的方法,在逆转录过程中使用带有鉴别标签的引物分别对不同样品中的mRNA进行逆转录,合成cDNA,然后将所述来自不同样品中的cDNA混合并进行处理得到所述文库。本专利技术的方法通过在逆转录引物中加入一段特异的标签序列,使得逆转录产物带上特有的标签,在对不同样品使用带有不同标签序列的引物逆转录以及后续PCR扩增后,都可通过该标签来鉴别逆转录产物和PCR产物初始来自于哪个样品,从而实现混合样品建库。优选地,所述带有鉴别标签的引物按5’-3’的顺序包括以下区段:扩增区序列、标签区序列和Poly(A)锚定区序列,所述Poly(A)锚定区序列包括多个胸苷,所述标签区序列为区别来自不同样品的cDNA的特异性序列,所述扩增区序列为用于PCR扩增的序列。其中扩增区序列用于在逆转录后进行PCR扩增时扩增引物的锚定,Poly(A)锚定区序列用于锚定mRNA上的Poly(A),标签区序列用于区分样品的来源。优选地,所述带有鉴别标签的引物的3’末端还依次包含核苷酸V和N,其中,V表示A、C或G,所述N表示A、T、C或G,并且所述带有鉴别标签的引物为满足V和N的条件的所有序列的混合物。通过在引物3’末端加入V和N,使得逆转录的起始位点位于mRNA的Poly(A)的5’端,而不是Poly(A)中部或3’端,减小了逆转录产物的无效长度。优选地,所述标签区序列的长度为10-18nt,标签区序列需要有合适的长度以保持其相互之间的特异性,以及与基因组序列之间的特异性。具体地,所述方法包括以下步骤:S1:使用所述带有不同标签的引物别对不同样品中的mRNA进行逆转录,合成cDNA;S2:取得自各样品的cDNA等量混合;S3:按片段大小筛选片段;S4:PCR扩增所筛选的片段;S5:向S4扩增的片段添加接头;S6:用核酸外切酶消化S5得到的片段,消化后纯化DNA片段即得到所述文库。进一步地,S3筛选的片段的大小为0.5-10KB。优选地,S4PCR扩增时所用的混合cDNA的总量为0.1-10μg,该cDNA总量的设置有助于将PCR过程中的循环数限制在合理范围。优选地,在S4PCR扩增后,S5添加测序接头之前,还包括以下步骤:S7:DNA损伤修复;S8:末端修复。优选地,在S6后还包括S9:文库质检,确定文库大小。本专利技术基于三代全长转录组建库无需进行打断的特征,在实验开始的第一步-全长cDNA的扩增中引入标签序列,加入标签序列后即可进行混样,有效的简化了操作流程,节约了试剂耗材用量,降低了实验成本,并且实现了在同一个文库中进行多个样本混合建库的流程。附图说明图1为构建多样品转录组混合文库的方法的流程图;图2为带有鉴别标签序列的引物的示意图;图3为单个样品PCR扩增后的安捷伦2100检测图;图4为混合样品片段筛选后PCR扩增的安捷伦2100检测图。具体实施方式以下结合实例对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。对植物不同的6个组织-根、木质茎、树皮、叶、花、果实分别提取总RNA后进行混合文库构建,建立三个文库,1-1.5kb,1.5-2kb,2-6kb,采用PACBIORSII分别各测序1个cell,流程图如图1所示。具体实验过程如下:1.合成带标签的cDNA本步操作在无RNase的超净台中进行,不同组织样本分开单独操作,且每个样本对应的标签是唯一无重复的,本次实验使用的逆转录引物的结构示意图如图2所示,具体序列如表1所示。表1逆转录使用的带标签的引物1)将6个0.2mL的PCR管置于冰上,加入以下试剂:样品1-6的总RNA1μg(按浓度换算体积)、带标签的引物(12μM,BC1-BC6)1μL、无核酸酶水补充至4.5μL。2)轻柔涡旋混匀,瞬时离心,置于PCR仪上,运行如下程序:72℃3min,42℃2min,72℃到42℃降温速率设置为0.1℃/s;3)上述反应结束后,将反应产物添加至表2所示的逆转录反应体系中,轻柔涡旋混匀,瞬时离心,在PCR仪上运行如下程序:42℃90min,70℃10min;表2逆转录反应体系4)单样品的PCR扩增取新的1.5mLEP管,按表3配制PCR体系,充分混匀,瞬时离心,PCR程序为:98℃2min;98℃20s、65℃30s、72℃3.5min,15循环;72℃5min。反应完成后按照AMPurePB磁珠的操作说明使用1倍体积的磁珠进行纯化,最后加入11μL的无核酸酶水洗脱;取1μL纯化产物,使用无核酸酶水稀释10倍,取2μL稀释液进行Qubit定量,确定PCR产物的浓度与总量;取1μL稀释液进行安捷伦2100检测,确定片段的大小分布。如图3所示,所有PCR产物的安捷伦2100检测片段分布非常一致,片段大小分布由0.7K-5K,其主峰在1.8K。表3单样品PCR扩增体系2.等量混样根据Qubit定量结果,每个样本各取500ng的PCR产物进行混样,混样后的PCR产物总量为3μg。3.BluePippin片段筛选按照Bluepippin的操作说明进行目的片段的筛选,本次筛选的片段范围为1-1.5KB、1.5-2KB、2-6KB;筛选完成后按照AMPurePB磁珠的操作说明使用1倍体积的磁珠进行纯化,最后加入20μL的无核酸酶水洗脱。4.混合样品的PCR扩增放大按表4配制PCR体系,2)充分混匀,瞬时离心,进行如下PCR程序:98℃2min;98℃20s、65℃30s、72℃Zmin,X循环;72℃5min。其中,1-2K的延伸时间为2min,6循环;2-3K的延伸时间为3min,8循环;3-6K的延伸时间为5min,8循环。反应完成后使用1倍体积的AMPurePB磁珠进行纯化,最后使用37uL的无核酸酶水进行洗脱;使用安捷伦2100检测筛选后扩增的PCR产物长度分布,结果如图4所示,其第一个峰为扩增的1-1.5K的PCR产物,第二个峰为扩本文档来自技高网...
【技术保护点】
一种构建多样品全长转录组混合文库的方法,其特征在于,在逆转录过程中使用带有鉴别标签的引物分别对不同样品中的mRNA进行逆转录,合成cDNA,然后将所述来自不同样品中的cDNA混合并进行处理得到所述文库。
【技术特征摘要】
1.一种构建多样品全长转录组混合文库的方法,其特征在于,在逆转录过程中使用带有鉴别标签的引物分别对不同样品中的mRNA进行逆转录,合成cDNA,然后将所述来自不同样品中的cDNA混合并进行处理得到所述文库。2.根据权利要求1所述的方法,其特征在于,所述带有鉴别标签的引物按5’-3’的顺序包括以下区段:扩增区序列、标签区序列和Poly(A)锚定区序列,所述Poly(A)锚定区序列包括多个胸苷,所述标签区序列为区别来自不同样品的cDNA的特异性序列,所述扩增区序列为用于PCR扩增的序列。3.根据权利要求2所述的方法,其特征在于,所述带有鉴别标签的引物的3’末端还依次包含核苷酸V和N,其中,V表示A、C或G,所述N表示A、T、C或G,并且所述带有鉴别标签的引物为满足V和N的条件的所有序列的混合物。4.根据权利要求2所述的方法,其特征在于,所述标签区序列的长度为10-...
【专利技术属性】
技术研发人员:方涛,
申请(专利权)人:武汉菲沙基因信息有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。