本发明专利技术属于基因组学技术领域,具体涉及一种利用高通量测序同时测定真核生物基因组中基因的表达量和多聚腺苷酸加尾的方法。本方法在逆转录时引入可被切除的特殊碱基,从而去除多余的腺苷酸,达到直接测定PolyA位点的目的。本方法无需信使RNA的纯化,直接进行逆转录,因此更简单;由于采用双端测序,因此更精确;本方法既能精确测定PolyA位点,又能可靠确定基因表达量,因此更省钱。该文库经高通量测序后获得基因表达及PolyA加尾的基础数据,再经过生物信息学分析获得基因的表达量和PolyA加尾的详细信息,为人类重要疾病的早期诊断和预后预测提供分析依据。
【技术实现步骤摘要】
本专利技术属于基因组学
,具体涉及一种利用高通量测序(或下一代测序)技术同时测定真核生物基因组中基因的表达量和多聚腺苷酸加尾的方法。
技术介绍
中心法则是现代分子生物学最重要也是最基本的规律。遗传信息通过转录从DNA到RNA,再通过翻译从RNA到蛋白质。而转录是遗传信息流的第一步,对于转录的调控也是基因表达最重要的调控手段之一。近年来高通量测序技术(或下一代测序),特别是RNA测序(RNA-seq)技术的飞速发展,给真核生物转录组的研究带来了的革命性的影响。由于RNA测序技术通量更高、更准确、更灵敏,同时价格还在不断下降,因此已经日渐成为基础生物 学研究和生物医学研究的常规技术。与微阵列(Microarray)技术不同,RNA测序不依赖于已有的基因注释,因此除了检测已知基因,还能够发现许多新的转录体。近些年,许多研究已经利用RNA-seq发现了新的选择性剪接异构体(Alternative splicing isoform)、基因间的长链非编码RNA (longintergenic non-coding RNA, IincRNA)以及短链非编码RNA。为了进一步验证天然反义转录体(Natural Antisense Transcripts)在许多物种中的广泛性,研究人员进一步开发了链特异性的RNA测序技术(Strand-specific RNA-seq)。由于在测序文库的构建过程中保留了 RNA的链信息,因此这种改进的RNA测序技术不仅能够发现新的反义转录体,同时也能够区分内含子中的信号是来源于内含子保留还是反义转录体。可以说,目前对于转录组的研究正经历着一场革命,许多以前所没有发现的转录体由于下一代测序技术愈来愈高的通量而被不断发现。这些新转录体的生物学功能也被越来越多的研究证实。由于选择性启动子、选择性剪接和选择性PolyA加尾是引起众多转录异构体的原因,因此研究者们开发了许多RNA测序的变种用于专门研究转录的起始位点(从而确定选择性启动子)、3’末端形成(从而确定选择性PolyA加尾)。众所周知,不同的PolyA加尾位点可以导致同一转录体不同的3’UTR (3,Untranslated Region, 3端非翻译区)长度。由于3’ UTR含有众多的RNA顺式调控元件,比如亚细胞定位元件、RNA稳定性元件、微RNA(microRNA, miRNA)结合元件及PolyA加尾信号等,因此3’ UTR的长度对于基因的转录后调控具有重要的作用。研究发现,3’UTR的某些点突变可导致严重的疾病。不少基因中3’UTR上的DNA删除与癌症的产生密切相关。Adrian Wiestner等人发现在细胞周期蛋白Dl (CCNDl)上的点突变和DNA删除可以导致具有较短3’ UTR的信使RNA的表达,并与套细胞淋巴瘤的高增殖性和低存活率密切相关。因此,全基因组PolyA位点的精确定位对于深入理解疾病产生的机制具有重要意义。
技术实现思路
本专利技术的目的在于提供一种能够简单、精确、经济的同时检测基因表达量和多聚腺苷酸加尾位点的方法。本专利技术提供的同时检测基因表达量和多聚腺苷酸加尾位点的方法,采用高通量测序技术。本方法的关键之处是在逆转录时引入可被切除的特殊碱基,从而去除多余的腺苷酸,达到直接测定PoIyA (PA)位点的目的。同已有方法相比,本方法更为简单、精确和省钱。由于本方法无需polyA+ RNA的纯化,直接进行逆转录,因此更简单;由于采用双端测序策略从而能进一步增加可用的序列,因此更精确;由于这一方法既能精确测定PA位点,又能可靠确定基因表达量,因此更省钱。同时本方法具有的链特异性巧妙设计还有一个额外好处,就是能够测定反义转录体的PA位点。本专利技术方法主要为一种高通量测序文库的构建新方法(简称PA_seq)。起始材料为总RNA,终产物为扩增后的双链DNA测序文库。该文库经高通量测序(比如Illumina的GAIIx测序平台或HiSeq2000/HiSeq2500测序平台)后获得基因表达及多聚腺苷酸(PolyA)加尾的基础数据,再经过生物信息学分析获得真核生物基因组中基因的表达量和多聚腺苷酸加尾的详细信息,从而可用于人类重要疾病(如癌症、心血管相关疾病、糖尿病、神经退行 性疾病、出生缺陷疾病等)的早期诊断、治疗中对药物的反应和预后预测。利用高通量测序同时测定真核生物基因组中基因的表达量和多聚腺苷酸加尾的方法,具体步骤如下直接片段化总RNA,在逆转录时引入可被切除的特殊碱基dUTP,用磁珠纯化双链DNA,用USER酶识别dUTP并释放磁珠上的双链DN ;该双链DNA经末端补平后加上一个3端腺苷酸突出;连接反应经纯化和片段大小选择后用相应的PCR引物扩增,获得可用于高通量测序的文库;构建的文库可以单端测序,也可以双端测序;该文库经高通量测序(比如Illumina的GAIIx测序平台或HiSeq2000/HiSeq2500测序平台)后获得基因表达及多聚腺苷酸(PolyA)加尾的基础数据,再经过生物信息学分析获得真核生物基因组中基因的表达量和多聚腺苷酸加尾的详细信息。高通量测序文库构建的具体操作过程如下总RNA经TRIzoI试剂或其它常规方法提取后,用DNaseI酶处理以便除去混有的基因组DNA污染。纯化后的总RNA在镁离子作用下高温片段化,之后用于逆转录。逆转录采用经过生物素和脱氧尿嘧啶(dUTP)修饰的寡聚胸腺嘧啶(oligo(dT)),并用DNA polymerase I和RNase H进行双链DNA的合成。产生的双链DNA在磁珠(Streptavidin MyOne magnetic beads)的结合纯化后用一种特殊的酶(USER,尿苷酸特异的糖苷酶和内切酶)消化,从而释放出切除后的双链DNA。该双链DNA经末端补平后加上一个3端腺苷酸突出,用于连接Illumina接头或SOLiD接头或454接头。连接反应经纯化和片段大小选择后用相应的PCR引物扩增,从而获得可用于高通量测序的特殊文库。该文库可以单端测序,也可以双端测序。文库构建的细节见具体实施方式部分。所述总RNA来源所涉及的物种包括人、猩猩、猕猴、大鼠、小鼠、果蝇、斑马鱼、线虫、拟南芥、水稻、棉花、油菜、酵母及疟原虫。文库适用的平台包括Illumina GAIIx 平台、Illumina HiSeq2000、IlluminaHiSeq2500、Illumina MySeq 平台、454 测序平台、ABI S0LiD4、ABI 5500 系列测序平台及ABI Ion Torrent的高通量测序。附图说明图I是PA-seq方法不意图。其中磁珠为Invitrogen公司的Dynabeads MyOne Cl。图2是利用PA-seq方法测定人胰腺中的基因多聚腺苷酸位点在基因组浏览器上的信号。图中举例列出了 2号染色体上约20kb的一段区域,由4个基因组成。左侧的数字表示短序列数,可以反应表达量。基因注释采用RefSeq系统,最粗的实线表示基因的外显子,基因两侧的较粗实线表示5端和3端的非翻译区。最细的实线表示内含子,上面的箭头表不基因转录的方向。每个基因的名字在左侧显不。图3 是 PA-seq 方法和微阵列(Affymatrix Microarry, Affy本文档来自技高网...
【技术保护点】
一种利用高通量测序同时测定真核生物基因组中基因的表达量和多聚腺苷酸加尾的方法,其特征在于具体步骤为:直接片段化总RNA;在逆转录时引入可被切除的特殊碱基dUTP;用磁珠纯化双链DNA,用USER酶识别dUTP并释放磁珠上的双链DNA;该双链DNA经末端补平后加上一个3端腺苷酸突出;连接反应经纯化和片段大小选择后用相应的PCR引物扩增,获得可用于高通量测序的文库;构建的文库可以单端测序,也可以双端测序;该文库经高通量测序,获得基因表达及多聚腺苷酸加尾的基础数据,再经过生物信息学分析获得真核生物基因组中基因的表达量和多聚腺苷酸加尾的详细信息。
【技术特征摘要】
1.ー种利用高通量测序同时测定真核生物基因组中基因的表达量和多聚腺苷酸加尾的方法,其特征在于具体步骤为直接片段化总RNA ;在逆转录时引入可被切除的特殊碱基dUTP ;用磁珠纯化双链DNA,用USER酶识别dUTP并释放磁珠上的双链DNA ;该双链DNA经末端补平后加上ー个3端腺苷酸突出;连接反应经纯化和片段大小选择后用相应的PCR引物扩增,获得可用于高通量测序的文库;构建的文库可以单端测序,也可以双端测序;该文库经高通量测序,获得基因表达及多聚腺苷酸加尾的基础数据,再经过生物信息学分析获得真核生物基因组中基因的表达量和多聚腺苷酸加尾的详细信息。2.根据权利要求I所述的方法,其特征在于高通量测序文库构建的具体过程如下总RNA经TRIzol试剂或其它常规方法提取后,用DNaseI酶处理以便除去混有的基因组DNA污染;纯化后的总RNA在镁离子作用下高温片段化,之后用于逆转录;逆转录采用经过生物素和脱氧尿嘧啶修饰的寡聚胸...
【专利技术属性】
技术研发人员:倪挺,魏刚,
申请(专利权)人:复旦大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。