本发明专利技术提供了一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法。该方法包括感染DNA病毒样品的转录组测序,病毒序列的比对和拼接,病毒基因组序列空白区域填补等三个步骤。本发明专利技术的方法不仅可以获得香蕉束顶病毒的全基因组序列,还可以通过该方法拼接其他矮缩病毒或双生病毒全基因组,从而获得病毒全基因组序列。本发明专利技术在国内外首次报道了利用转录组高通量测序拼接DNA病毒基因组的方法,填补了国内外该领域的空白。本发明专利技术还可以应用于DNA病毒鉴定和检测。
【技术实现步骤摘要】
一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
本申请属于基因组测序及生物信息学
,具体涉及一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法。
技术介绍
DNA病毒是指一类含有脱氧核糖核酸遗传物质的生物病毒,广泛存在于人、脊椎动物、昆虫、植物以及微生物中。根据最新ICTV国际病毒分类标准,DNA病毒按寄主类型可分为脊椎动物DNA病毒、植物DNA病毒、无脊椎动物DNA病毒、原核微生物(细菌和古细菌)DNA病毒和真核微生物DNA(藻类、真菌和原生动物)病毒。基因在结构上,分为编码区和非编码区。编码区是指能够转录信使RNA(mRNA)的部分,它能够指导合成有一定功能作用的蛋白质,而非编码区是不能够转录mRNA的DNA序列(部分非编码可以产生RNA,如mRNA的5’UTR和3’UTR),对基因的表达主要起调控作用,如启动子等位于该区。自从1977年以Sanger法对目标基因进行测序以来,随着测序技术的不断发展,出现了以第二代测序技术为代表的高通量方法,它使得核酸序列数据高通量化和单碱基测序费用的急剧下降,给基因组学、转录组学和小RNA深度测序等研究带来了更多的新思路和新发现。转录组测序,又称RNA-seq或mRNA-seq,即从生物总RNA中富集出mRNA,经反转录得到双链cDNA,而后对其进行高通量测序分析。IlluminaHiSeqTM2000深度测序是第二代测序技术,可以同时对数十万乃至数百万条DNA进行大规模同时测序。目前,该测序平台在国内被广泛使用,在病毒鉴定、检测和RNA病毒全基因组序列拼接等方面也普遍应用。矮缩病毒科病毒基因组是由多个环状单链DNA组分所组成,每个组分大小为1100nt,其病毒基因组的获得主要通过聚合酶链式反应(PolymeraseChainReaction,PCR)方法。近年来滚环PCR(rollingcircleamplification,RCA)也逐渐用来扩增环状病毒DNA,从而得到病毒全基因组序列。双生病毒科病毒基因组是由单分子或两分子闭环状ssDNA组成,每分子DNA长2.5~3.0nt,总基因长约2.5~5.2nt,也可以通过PCR或RCA的方法获得双生病毒全基因组序列。然而,由于矮缩病毒科不同种病毒之间和双生病毒科不同属病毒之间的同源性差异较大,通过设计简并引物的方式并不能很好的获得新病毒的全基因组序列;且传统病毒鉴定方法,如病毒提纯、电镜观察和病毒基因组测序耗时费力。本专利技术通过对感染疑似DNA病毒样品进行转录组高通量测序,揭示了DNA病毒所有非编码区序列也能进行转录,从而利用转录组高通量测序可以拼接DNA病毒全基因组,填补了国内外该领域的空白。另外,利用本专利技术还可以应用于DNA病毒鉴定和检测。
技术实现思路
本专利技术的目的在于提供了一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法,方法简单。为了达到上述目的,本专利技术采取以下技术措施:本专利技术思路:申请人首次发现,矮缩病毒科和双生病毒科DNA病毒的所有非编码区也可以产生RNA,因此通过拼接病毒的编码区和非编码区的的高通量转录组,即可获得该病毒的全基因组序列。一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法,将感染病毒样品的叶片总RNA反转录成cDNA,构建cDNA文库并进行高通量测序;通过与所有已知所有病毒种的核苷酸序列进行比对,筛选出高度匹配的转录组测序片段,然后按本领域的常规方式进行比对和拼接;所述的病毒为矮缩病毒科或双生病毒科病毒。具体包括下述步骤:(1)提取感染病毒样品的叶片总RNA;(2)将RNA反转录成cDNA,构建cDNA文库并进行高通量测序(3)运行Bowtie软件(默认参数),将步骤(2)中的转录组测序片段与GenBank中所有已知所有病毒种的核苷酸序列进行比对,筛选出高度匹配(优选的,同源性95%及以上)的转录组测序片段;(4)运行Velvet软件,参数设置为k-mer=17和minimumcoverage=5,以步骤(3)筛选获得的RNA片段为输入,拼接成短的重叠群序列(contig);(5)运行Blast软件(默认参数),将步骤(4)获得的短的重叠群序列与Genbank数据库中的已知病毒基因组序列进行比较,同源性在95%及以上的,以此推测序列的来源物种;(6)从Genbank数据库下载所有可疑来源病毒的全长基因组序列并以此数据为基础,建立可以用于Bowtie软件进行序列比对的病毒数据库;(7)运行Bowtie软件(默认参数),将步骤(2)种转录组测序的片段与步骤(6)所建立的病毒数据库进行比对(即与特定病毒物种的基因组序列进行比对),筛选出高度匹配(本专利技术优选同源性在95%及以上)的转录组测序的片段;(8)根据步骤(7)的比对结果,将能够匹配到最多转录组测序的片段的病毒株系默认为最可能的候选病毒;(9)将最有可能的候选病毒命名进行简单标记,对转录组测序的片段也进行标记;(10)运行Velvet软件,参数设置为k-mer=17和minimumcoverage=5,以步骤(9)中标记后的转录组测序的片段为输入,将其拼接成短的重叠群序列;(11)运行Velvet软件,参数设置为k-mer=17和minimumcoverage=5,以步骤(10)中获得的短的重叠群序列为输入,拼接成更长的重叠群序列;(12)从未能拼接好的空白区域(gap)两侧设计特异性PCR引物,通过基因克隆和测序获得gap区域的核苷酸序列,填充gap区域;最后将获得的重叠群序列最终连接成一条完整的核苷酸序列,即待测DNA病毒基因组中某一组分的全长核苷酸序列,其它组分也通过该方法获取,所有组分即为该病毒的基因组序列。同时依据该基因组序列对病毒进行确定鉴定和分类。所述病毒属于矮缩病毒科或双生病毒科。以上所述的方法还能用于病毒的鉴定和检测。与现有技术相比,本专利技术具有以下优点:本专利技术首次证实高通量转录组测序可以用来对DNA病毒进行基因组序列拼接,进而获得病毒全基因组序列,同时还能对疑似病毒样品进行病毒病原鉴定和检测;且RNA-Seq技术在鉴定DNA病毒和克隆病毒基因组中具有诸多独特优势,具体而言:(1)高通量:可一次获得几十万个乃至数百万个的转录组序列,能够快速准确地鉴定被测样品中含有的全部转录组mRNA序列;(2)快速、自动化:只要数据量足够,无需预先设计特异性引物,即可通过生物信息学软件拼接病毒全基因组序列;(3)重复性好:无需技术重复,而且起始样品比芯片技术要少得多,尤其适用于来源极为有限的生物样品分析。(4)适用范围广,矮缩病毒科或双生病毒科的病毒都可用本专利技术的技术方案进行测序。(5)本专利技术提供的DNA病毒基因组拼接的高通量转录组测序方法,该方法适用于在GenBank中登陆的已知或未知的DNA病毒甚至其他未知病毒。应用时,理论而言,只要有足够的转录组数据,不但可以获得一个与Genbank中有匹配的病毒全基因组序列,还可以根据重叠群序列通过基因克隆技术获得未知的新病毒全基因组序列。(6)申请人首次发现DNA病毒的所有非编码区也可以产生RNA,因此利用转录组高通量测序拼接可得到DNA病毒基因组,填补了国内外该领域的空白。同时以引起香蕉严重病害的香蕉束顶病毒为例,通过利本文档来自技高网...
【技术保护点】
一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法,包括下述步骤:将感染病毒样品的叶片总RNA反转录成cDNA,构建cDNA文库并进行高通量测序;通过与所有已知所有病毒种的核苷酸序列进行比对,筛选出高度匹配的转录组测序片段,然后按本领域的常规方式进行筛选和拼接;所述的病毒为矮缩病毒科或双生病毒科病毒。
【技术特征摘要】
1.一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法,包括下述步骤:将感染病毒样品的叶片总RNA反转录成cDNA,构建cDNA文库并进行高通量测序;通过与所有已知所有病毒种的核苷酸序列进行比对,筛选出高度匹配的转录组测序片段,然后按本领域的常规方式进行筛选和拼接;所述的病毒为矮缩病毒科或双生病毒科病毒。2.根据权利要求1所述的方法,其特征在于:(1)提取感染病毒样品的叶片总RNA;(2)将RNA反转录成cDNA,构建cDNA文库并进行高通量测序;(3)运行Bowtie软件,将步骤(2)中的转录组测序片段与GenBank中所有已知所有病毒种的核苷酸序列进行比对,筛选出高度匹配的转录组测序片段;(4)运行Velvet软件,参数设置为k-mer=17和minimumcoverage=5,以步骤(3)筛选获得的RNA片段为输入,拼接成短的重叠群序列;(5)运行Blast软件,将步骤(4)获得的短的重叠群序列与Genbank数据库中的已知病毒基因组序列进行比较,同源性在95%及以上的,以此推测序列的来源物种;(6)从Genbank数据库下载所有可疑来源病毒的全长基因组序列并以此数据为基础,建立可以用于Bowtie软件进行序列比对...
【专利技术属性】
技术研发人员:余乃通,刘志昕,熊忠国,张雨良,周朋,
申请(专利权)人:中国热带农业科学院热带生物技术研究所,
类型:发明
国别省市:海南,46
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。