本发明专利技术涉及一种适用于高通量测序的全基因组mRNA3′末端文库的制备方法,通过模板转换合成cDNA一链及PCR引入突变,获取全基因组mRNA3′非翻译区DNA序列。本发明专利技术全基因组mRNA3′末端文库的制备方法制得的文库数据产出量大,样品准备步骤简便、经济,便于后期生物信息学分析,易于大规模应用。
【技术实现步骤摘要】
本专利技术涉及一种基因文库的构建方法,尤其涉及一种适用于高通量测序的全基因组mRNA 3'末端文库的制备方法。
技术介绍
3’非翻译区(简称3’UTR)是信使RNA(mRNA)的一个特殊部分,位于基因编码区的 3’末端。3’UTR是mRNA功能的重要调控元件,具有如下调控序列多聚腺苷酸化位点,通常为AAUAAA ;蛋白结合位点和miRNA靶标位点等。3’ UTR不仅可以控制mRNA的体内稳定性和降解速率、调节mRNA亚细胞定位和翻译水平,还能决定其所表达的细胞种类、控制mRNA 的利用效率、协助辨认特殊密码子。3’UTR的突变可以影响一或多个基因的表达,从而导致疾病的发生。人类基因往往有多个多聚腺苷酸化位点,在不同位点发生多聚腺苷酸化从而产生不同长度的3’ UTR是人类基因转录中的普遍现象,也被认为是可选择性剪切的类型之一-串联3,UTRs (tandem 3,UTRs)。3,UTR长度受到精确的调控,一个基因3,UTR长度的改变会引起多个基因的表达改变,会对细胞的调控网络及生理功能造成重大影响。对酵母、 果蝇及人类基因组的3’UTR多态性长度已成为当前的研究热点之一,如Sandberg等通过基因芯片技术对mRNA进行分析发现,增殖的CD4+淋巴细胞中存在较多的具有短的3’ UTR的转录本,强迫表达全长的3’UTR会造成蛋白表达量的减少。经过实验证明,具有短的3’UTR 的转录本的大量存在可能是由于较短的3’ UTR含有比较少的microRNA结合位点而减弱了 microRNA的调控作用造成,暗示了我们3’ UTR长度多态性可能参与调控了细胞的增殖。基因芯片及大规模测序技术已经被应用于全基因组3’ UTR长度多态性研究。但是,基因芯片受到技术本身的限制,对研究3’UTR长度多态性有一些不利因素1)基因芯片技术过于依赖于现有的基因组信息,无法发现新的多聚腺苷酸化位点、3’UTR区域序列的突变;2)由于基因芯片荧光信号采集的需要,如需要较多的RNA样本,不利于较难获得的样本的研究;3)基因芯片的杂交信号易被背景干扰、检测基因表达量有上限和下限,限制了其敏感度,因此使用基因芯片进行分析实验的重复性较差。大规模测序技术也被广泛应用在转录组研究中,但对于UTR区域的研究来说,依然存在一定缺陷。首先,RNA-seq获得的序列包括了整个转录组的信息,而UTR区域只是其中一部分,故利用RNA-seq直接对转录组进行测序无法获得足够的3’UTR的序列信息。其次,在常用的RNA-seq方案中,由于测序技术读长的限制,所获得均为打断后的转录本序列,在后期的数据处理中,需要对其进行拼接后估计基因的表达变化,存在一定局限性。鉴于此,利用大规模测序技术的检测全基因组的3’ UTR区域是非常必要的。最简单方法是利用mRNA的polyA尾进行反转录,然后直接进行测序,获得mRNA3’最末端的序列。 但由于大规模测序技术原理本身的限制,这种直接测序的方法较难实现。如大规模测序技术的代表之一 454的GS FLX系统采用的是焦磷酸测序技术,是由4种酶催化的同一反应体系中的酶级联化学发光反应,在每一轮测序反应中,只加入一种dNTP,若该dNTP与模板配对,聚合酶就可以将其掺入到引物链中并释放出等摩尔数的焦磷酸基团(PPi)。PPi可最终转化为可见光信号,并由PyrogramTM转化为一个峰值。每个峰值的高度与反应中掺入的核苷酸数目成正比。然后加入下一种dNTP,继续DNA链的合成。但是如果遇到连续的几个甚至十几个碱基,可见光信号会过强,无法分辨掺入的核苷酸数目,甚至影响其他临近孔内的可见光信号的检测,造成测序失败。同样是大规模测序技术,Illumina的Genome Analyzer 系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性, 继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。与454的GS FLX类似,如果遇到连续的几个甚至十几个碱基,相同位置过强的荧光信号,也会影响测序的过程和结果
技术实现思路
本专利技术的目的在于提供一种利用组织或细胞总RNA构建全基因组mRNA 3’末端的基因文库的方法,以进行高通量的深度测序,获得全基因组mRNA 3'末端的真实数据。本专利技术一种全基因组mRNA 3’末端基因文库的构建方法,包括以下步骤(a)将基因组的核酸采用DNase消化;(b)将消化后的总RNA高温94_95°C加热,随机片段化至约 200-500bp的片段;(c)利用模板转换技术进行反转录反应合成cDNA第一链,所述的cDNA 第一链的两端连有高通量测序引物;(d)利用在cDNA第一链两端接上的测序引物通过高保真DNA聚合酶进行PCR扩增;(e) PCR产物用10%聚丙烯酰胺凝胶电泳分离,选择200_300bp 或300-500bp的大小进行回收,得到目的片段。本专利技术全基因组mRNA 3'末端文库的制备方法制得的文库数据产出量大,样品准备步骤简便、经济,便于后期生物信息学分析,易于大规模应用。本专利技术步骤(C)中,利用模板转换技术进行反转录反应,使用的反转录酶 SuperScriptII能在合成的cDNA —链的末端加上3_6个胞嘧啶(C),再加入一端接有3个鸟嘌呤(GGG)的Solexa或454测序引物,鸟嘌呤序列(GGG)锚定到cDNA —链的胞嘧啶序列(CCC),再在反转录酶的作用下通过碱基互补原理在cDNA —链上的(CCC)的另一端合成与其互补配对的测序引物。作为本专利技术全基因组mRNA 3’末端基因文库的构建方法的优选实施方式,所述构建方法还包括以下步骤(f)对(e)步骤得到的目的片段进行检测。检测可以为将文库与载体连接转化感受态细胞,挑选50个阳性克隆提取质粒测序,看其两端是否带有高通量测序的接头序列。将测出的序列在基因组中进行检索,统计测出序列为已知3’ UTR的比例大于60%。测出序列为过长的ployA的比例小于5%。作为本专利技术全基因组mRNA 3’末端基因文库的构建方法的优选实施方式,步骤 (c)中反转录反应的反转录弓丨物为 gccttgccag cccgctcagt tttttttttt tttttttttv η, 或 gccttgccag cccgctcagt tttttctttt ttcttttttv η,或 gcctccctcg cgccatcagg g, 或 gcctccctcg cgccatcaga gg, 或 acactctttc cctacacgac gctcttccga tctttttttt tttttttttt ttvn, 或 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctcttccgatcttt tttctttttt cttttttvn, caa本文档来自技高网...
【技术保护点】
1.一种全基因组mRNA 3’末端基因文库的构建方法,其特征在于,包括以下步骤:(a) 将基因组的核酸采用DNase消化;(b) 将消化后的总RNA高温94-95℃加热,随机片段化至约200-500bp的片段;(c) 利用模板转换技术进行反转录反应合成cDNA第一链,所述的cDNA第一链的两端连有高通量测序引物;(d) 利用在cDNA第一链两端接上的测序引物通过高保真DNA聚合酶进行PCR扩增;(e) PCR产物用10%聚丙烯酰胺凝胶电泳分离,选择200-300bp或300-500bp的大小进行回收,得到目的片段。
【技术特征摘要】
1.一种全基因组mRNA 3’末端基因文库的构建方法,其特征在于,包括以下步骤(a)将基因组的核酸采用DNase消化;(b)将消化后的总RNA高温94-95°C加热,随机片段化至约200_500bp的片段;(c)利用模板转换技术进行反转录反应合成cDNA第一链,所述的cDNA第一链的两端连有高通量测序引物;(d)利用在cDNA第一链两端接上的测序引物通过高保真DNA聚合酶进行PCR扩增;(e)PCR产物用10%聚丙烯酰胺凝胶电泳分离,选择200-300bp或300_500bp的大小进行回收,得到目的片段。2.如权利要求1所述的全基因组mRNA3’末端基因文库的构建方法,其特征在于,还包括以下步骤(f)对(e)步骤得到的目的片段进行检测。3.如权利要求1所述的全基因组mRNA3’末端基因文库的构建方法,其特征在于,步骤(c)中反转录反应的反转录引物为 gccttgccag cccgctcagt tttttttttt tttttttttv η,或 gccttgccag cccgct...
【专利技术属性】
技术研发人员:徐安龙,付永贵,孙雨,李宇新,万谅,饶兴蔷,
申请(专利权)人:中山大学,
类型:发明
国别省市:81
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。