适用于PacBio测序平台的原核全长初始转录本建库方法及应用技术

技术编号:24989301 阅读:35 留言:0更新日期:2020-07-24 17:52
本发明专利技术提供一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用,包括:依次在原核生物总RNA的3’末端加尾、5’末端添加生物素标记帽子,然后捕获带有生物素标记的初始转录本,最后合成初始转录本全长cDNA并构建其PacBio文库。该方法在原核转录组的3’末端加尾作为cDNA全长扩增一链合成的引物位点,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。同时,在初始转录本5’末端添加生物素标记的帽子,然后富集目标全长初始转录本,从而去除总RNA中的rRNA,极大的提高了数据有效率;合成全长cDNA时,在第一条链的末端添加额外核苷酸序列作为第二链引物的结合位点,避免SMARTer技术的偏好性问题,使测序更加均一。

【技术实现步骤摘要】
适用于PacBio测序平台的原核全长初始转录本建库方法及应用
本专利技术涉及高通量测序文库构建
,更具体地,涉及一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用。
技术介绍
随着第二代基因测序技术的发展,对生物样本的转录组测序也日趋成熟。科学家对所研究的样本进行转录组测序,探究不同品系、不同外界条件处理、不同发育时期、不同组织或不同细胞之间的基因表达差异。利用二代测序平台的转录组测序技术可针对基因结构进行研究,如发现cSNP、SSR、预测ORF等。二代测序技术的优势在于通量高,能比较精确地反映不同样本之间的基因表达差异,但基于读长的限制,在文库构建过程中需要对mRNA样本进行打断,并在信息分析过程中进行重新拼接,这样就会导致存在一定的误差;另外,对于测序结果中的5’端和3’端的信息不完整,往往得不到mRNA的全长序列。针对二代测序平台进行转录组测序的弊端,美国PacBio公司的三代测序平台可以针对真核生物的全长转录组进行直接测序。基于PacBio三代测序读长长的优势,mRNA序列无需打断即可测通,获得全长转录本,提供精确的可变剪接和转录起始位点信息,准确分辨同源异构体,同源基因,家族基因和等位基因,为下游分子克隆实验提供极佳序列文库。对于特异种质资源,可以发现鉴定新基因。通过对样本的全长转录组测序,可以获得物种大量的mRNA全长序列。全长mRNA的获得,将为广大的科研工作者提供更好的技术支持。在很多科研项目中,尤其涉及到基因功能的研究,需要获得靶基因的mRNA全长序列,对于基因组序列未知的物种,需要通过RACE(cDNA末端快速扩增)技术来获得mRNA全长,而该方法技术难点高,实验周期长,往往成为获得靶基因mRNA全长序列的瓶颈。基于三代测序平台的全长转录组测序,将很好地解决这一技术问题,通过该技术获得大量的真核生物mRNA全长序列,科学家可以从中选取感兴趣的基因进行后续研究。三代全长转录组测序,即利用PacBio三代测序平台对某一物种的mRNA进行测序研究。凭借超长读长的优势,无需打断RNA分子,直接对反转录的全长cDNA测序,即可得到从5’末端到3’PolyA尾的高质量全长转录本序列,从而对同源异构体(isoform)、可变剪接、融合基因、同源基因、超家族基因、等位基因表达等进行精确分析。三代全长转录组测序以平均超长读长10-15kb的优势、结合多片段文库筛选技术,实现了无需拼接的转录本分析,克服了传统二代转录组Unigene拼接较短、转录本结构不完整的缺陷,也由于其可直接获得单个RNA分子从5’端到3’端的高质量全部转录组信息而得名。相比二代的转录组测序,三代全长转录组的优势说明如下:a.超长读长(平均读长20-30K,最长读长300K),可一次将真核生物的全长转录本信息读取完整;b.无需进行片段打断和拼接,避免出现组装错误;c.基于全长转录组测序得到的完整准确的转录本信息,结合二代数据,方便识别特异性表达且做更加精确的基因和转录本表达定量。d.针对有参考基因组的物种,全长转录组信息可以纠正基因组的错误组装、更准确地发现新的转录本和基因、分析基因融合事件等。e.无需链特异性建库,全长转录组测序可直接获取正义链、反义链及部分LncRNA信息。目前的全长转录组测序都是基于真核生物的mRNA具有poly(A)结构设计的,真核生物的成熟mRNA在3’端存在poly(A)尾巴,使用Clontech的SMARTerPCRcDNASynthesisKit可以直接合成真核生物的全长cDNA。对于原核转录组,由于没有poly(A)尾巴的存在,无法适用真核全长转录组的流程,同时,由于SMARTer技术的链转换效率,在转录本的5’端测序存在偏好性,部分全长转录组很难测序到。针对这些技术缺陷,本专利开发出一种基于原核生物的原核全长初始转录本建库技术。
技术实现思路
针对现有技术中存在的技术问题,本专利技术提出了一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用,该方法解决SMARTer技术的链转换效率低、转录本测序存在偏好性的问题,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。为实现上述目的,本专利技术是通过以下技术方案实现的:本专利技术的第一个目的是提出一种适用于PacBio测序平台的原核全长初始转录本建库方法,包括:1)在原核生物的总RNA的3’末端加尾;2)3’末端加尾的原核总RNA的5’末端添加生物素标记帽子;3)捕获带有生物素标记的初始转录本;4)合成初始转录本全长cDNA;5)全长cDNA的PacBio文库构建。进一步地,所述合成初始转录本全长cDNA包括以下步骤:(1)合成初始转录本全长cDNA的第一条链;(2)cDNA的第一条链末端添加额外的核苷酸序列,作为第二条链的引物结合位点;(3)合成初始转录本全长cDNA的的第二条链;(4)扩增并纯化全长cDNA。更进一步地,所述步骤(2)中采用末端转移酶TdT给cDNA的第一条链末端添加额外的核苷酸序列更进一步地,使用TdT进行末端碱基添加的反应体系为:初始转录本全长cDNA的第一条链纯化产物39μL、TdTBuffer(10X)5μL、CoCl2solution(2.5mM)5μL、10mMdCTP或dGTP0.5μL、TerminalTransferase(20units/μl)0.5μL。进一步地,所述全长cDNA的PacBio文库构建包括以下步骤:(1)初始转录本全长cDNA损伤修复;(2)末端修复;(3)对末端修复产物连接测序接头;(4)核酸外切酶消化及纯化。进一步地,所述文库构建还包括文库质检以确定文库大小。本专利技术的第二个目的是提出一种适用于原核生物的全长转录组测序方法,包括采用上述任一项所述的建库方法进行原核生物全长初始转录本建库,然后采用高通量PacBio测序平台进行测序。与现有技术相比,本专利技术的有益效果在于:(1)本专利技术提出的适用于PacBio测序平台的原核全长初始转录本建库方法,以原核生物总RNA为检测样本,在原核转录组的3’末端加尾作为后续cDNA全长扩增时一链合成的引物位点,使原核转录组可以适用真核生物的建库流程,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。(2)基于TotalRNA中含有90%以上对测序数据无用的rRNA的原因,本申请针对原核生物的初始转录本在5’端存在三磷酸基团,而降解的转录本与成熟的核糖体RNA的5’端仅存在一个磷酸基团的这一特征,通过在具有三个磷酸基团的5’端加上具有生物素标记的帽子结构,然后通过链酶亲和素磁珠可以捕获全长初始转录本,实现核糖体RNA的去除,同时也确定捕获的为RNA的全长序列。(3)本专利技术在逆转录合成cDNA的第一条链后,使用TdT酶在末端添加额外的核苷酸序列作为第二链的引物的结合位点,实现cDNA的全长扩增。可以避免SMARTer技术的扩增选择偏好性问题,使本文档来自技高网
...

【技术保护点】
1.一种适用于PacBio测序平台的原核全长初始转录本建库方法,其特征在于,包括:1)在原核生物的总RNA的3’末端加尾;2)3’末端加尾的原核总RNA的5’末端添加生物素标记帽子;3)捕获带有生物素标记的初始转录本;4)合成初始转录本全长cDNA;5)全长cDNA的PacBio文库构建。/n

【技术特征摘要】
1.一种适用于PacBio测序平台的原核全长初始转录本建库方法,其特征在于,包括:1)在原核生物的总RNA的3’末端加尾;2)3’末端加尾的原核总RNA的5’末端添加生物素标记帽子;3)捕获带有生物素标记的初始转录本;4)合成初始转录本全长cDNA;5)全长cDNA的PacBio文库构建。


2.根据权利要求1所述的一种适用于PacBio测序平台的原核全长初始转录本建库方法,其特征在于,所述合成初始转录本全长cDNA包括以下步骤:
(1)合成初始转录本全长cDNA的第一条链;
(2)cDNA的第一条链末端添加额外的核苷酸序列,作为第二条链的引物结合位点;
(2)合成初始转录本全长cDNA的的第二条链;
(3)扩增并纯化全长cDNA。


3.根据权利要求2所述的一种适用于PacBio测序平台的原核全长初始转录本建库方法,其特征在于,所述步骤(2)中采用末端转移酶TdT给cDNA的第一条链末端添加额外的核苷酸序列


4.根据权利要求3所述的一种适用于PacBio测序平台的原核全长初始转录本建...

【专利技术属性】
技术研发人员:方涛
申请(专利权)人:嘉兴菲沙基因信息有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1