利用全基因组和EST数据开发多态性EST‑SSR标记的方法技术

技术编号:11549842 阅读:146 留言:0更新日期:2015-06-03 23:36
本发明专利技术公开了利用全基因组和EST数据开发多态性EST‑SSR标记的方法,属于分子生物学领域。本发明专利技术首先获取基因组序列与EST数据;接着在全基因组中搜索SSR位点,并鉴定、筛选基因组单一SSR位点;然后设计单一SSR位点比对引物,以EST序列数据为模版进行比对;统计比对结果,筛选在EST模板中有2个以上模拟扩增产物且具有多态性的SSR位点;最后设计多态性EST‑SSR位点引物,得到多态性EST‑SSR标记。利用本发明专利技术开发EST‑SSR标记高效、简便,并且能防止因供验证的基因组序列或实验材料遗传差异不足而淘汰掉具有潜在利用价值的EST‑SSR标记。所开发的EST‑SSR标记与单一基因紧密关联,具有更高的遗传与育种应有价值。

【技术实现步骤摘要】
利用全基因组和EST数据开发多态性EST-SSR标记的方法
本专利技术涉及利用全基因组和EST数据开发多态性EST-SSR标记的方法,属于分子生物学领域。
技术介绍
SSR标记的原理是与微卫星序列相邻的两侧区域保守性通常较高,可以在此保守区域设计一对特异的PCR引物,扩增其中的微卫星序列,通过聚丙烯酰胺凝胶电泳,即可显示出个体间在此位点的微卫星序列的多态性。由于SSR在基因组中大量地、随机地分布,具有广泛的位点变异,揭示比RAPD、RFLP更多的多态性,并且SSR标记为共显性标记,能够区分纯合型和杂合型,提供完整的遗传信息,在检测多态性时可以采用PCR方法,不需要过多的分子克隆手段,对DNA模板的要求不高,重复性好。因此成为日前运用最广泛的分子标记之一,广泛地运用于动植物、微生物鉴定、遗传多样性分析、分子标记连锁图的构建和群体遗传学等遗传与育种研究领域。传统的SSR标记是通过构建小片段或大片段的基因组,筛选阳性克隆。通过传统的影印或挑单菌落点膜的方法,把克隆转移到尼龙膜上,经过固定后,用标记过的序列重复寡核苷酸或含微卫星序列的探针与尼龙膜上的克隆点杂交,筛选出其中的阳性克隆,然后测序、设计引物、优化PCR反应条件,获得的阳性克隆经过确认后,全部或经过随机挑选后测序,然后根据微卫星序列两侧保守区域的序列设计引物,获得稳定、可靠的SSR标记,耗时耗力,而且成本非常高。随着测序技术的不断发展,基因组序列数据资源不断增加,人们开始利用生物信息学方法基于基因组序列数据筛选SSR位点,采用遗传差异足够大的多个基因组序列或生物样本对候选SSR标记进行多态性筛选和鉴定。基因组序列或生物样本间遗传差异小会导致具有潜在利用价值的多态性SSR标记被误淘汰;仅采用基因组序列数据开发的多态性分子标记通常位于基因间序列,通常只适合于遗传多样性及其相关研究,在与基因(遗传功能)有关的研究(如功能基因克隆)中应用价值有限。现在开发SSR标记的序列的另一种来源是EST,由于基因功能组学的快速发展,EST被大量测序,并存放在公共序列数据库中,利用EST序列,筛选开发SSR标记的方法简单易行,已发展成为开发SSR标记的主要方法。但是建库时,数据库中的EST是由不同的研究者用随机或鸟枪法获得的,这就会造成EST的冗余性。在进行EST-SSR标记开发时,SSR位点搜索前要先对EST数据进行比对、拼接,去除冗余序列否则极有可能对同一个SSR位点设计不同的引物,并且费时费力存在错误拼接的可能,而且去除的冗余序列中可能含有SSR长度的多态性。综合现在所有的SSR标记方法,新开发的标记通常都需要采用两个以上不同基因组序列对候选SSR标记进行多态性筛选和鉴定,否则就需要运用基因型差异足够大的多个样本DNA进行实验室筛选和验证,其间供试基因组序列、样本间无差异的SSR标记必然会被淘汰。而对于基因组序列数据来源较少、差异小和供试基因型样本的差异不大、代表性不足、具有潜在利用价值的多态性SSR标记极有可能被误淘汰。因此,现有技术还有待于改进和发展。
技术实现思路
有鉴于此,本专利技术目的在于:提供利用全基因组和EST数据开发多态性EST-SSR标记的方法,该方法可以大大提高全基因组数据来源较少、实验室验证时供试样本间差异较小,但EST数据较丰富的物种EST-SSR标记的开发效率,并防止因供试验证基因组序列或实验材料遗传差异不足而淘汰具有潜在利用价值的SSR标记。所开发的多态性EST-SSR标记与单一基因紧密关联,具有更高的遗传与育种应有价值。为实现上述目的,本专利技术采用如下之技术方案:利用全基因组和EST数据开发多态性EST-SSR标记的方法,包括下述步骤:一种利用全基因组和EST数据开发多态性EST-SSR标记的方法,其特征在于,包括下述步骤:①获取基因组序列与EST数据,从公共数据库下载基因组序列数据、相应的基因注释信息和EST数据,用基因组注释信息进行基因组外显子、内含子序列分析,选取基因TSS转录起始位点前2000bp作为启动子序列;②将步骤①获得的全基因组数据进行SSR位点搜索与分析,采用MISA程序扫描全基因组染色体DNA序列,搜索、分析基因组序列中包含的SSR位点。采用MISA程序的默认SSR扫描参数:单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复以及六核苷酸重复,重复单元分别大于10、7、6、5、4、4次重复;距离100bp的视为一个SSR位点;每种重复基元的各种变异类型及其反向互补类型均归为一类;③单一SSR位点筛选,采用Perl编写程序,从每个SSR位点前5bp开始,提取18~24bp的序列作为电子模拟PCR扩增的上引物;从SSR位点后间隔10~24bp提取18~24bp序列,反向互补后作为下引物;采用Bowtie软件将引物序列比对到步骤①所下载的参考基因组上,根据需要允许若干(如1~3)个碱基的错配;采用Perl语言编写程序,鉴定、筛选单一SSR位点;④EST中多态性SSR位点鉴定与分析,采用序列比对软件Bowtie以EST序列为模板,以具有单一侧翼序列的SSR比对引物进行比对,采用Perl语言编程统计匹配区域长度信息;⑤多态性EST-SSR位点筛选,筛选EST模板中有2个以上模拟扩增产物,且产物具有多态性(长度差异)的EST-SSR位点;⑥多态性EST-SSR标记引物设计,采用引物设计软件设计多态性EST-SSR标记引物。上述方法中所述基因组和EST数据可以是植物基因组和EST数据;也可以是动物基因组和EST数据;也可以是微生物基因组和EST数据。在获得一定数量的EST数据的基础上,该方法适用于所有物种,更特别地适用于基因组序列数据来源较少、差异小和供试基因型样本的差异不大、代表性不足的物种,具体如马铃薯。本专利技术所提供的利用全基因组和EST数据开发多态性EST-SSR标记的方法,由于采用了首先在全基因组序列中进行SSR位点搜索、筛选,筛选到基因组中单一SSR位点,然后以EST序列为模板进行SSR标记的多态性筛选、验证。充分利用了EST的冗余性中对SSR标记筛选验证所需的多态性,大大提高了SSR标记的开发效率,而且对于全基因组数据来源较少、实验室验证时供试样本间差异较小,但EST数据较丰富的物种EST-SSR标记的开发和防止因供试验证基因组序列或实验材料遗传差异不足而淘汰具有潜在利用价值的SSR标记具有重要作用。由于所开发的SSR标记均为EST-SSR标记,且与单一基因直接关联,因而具有更高的遗传与育种应有价值。附图说明图1.在EST模版中比对产物不同长度差异的马铃薯SSR标记数图2.引物5在20份材料中的扩增条带具体实施方式本专利技术提供的利用全基因组和EST数据开发多态性EST-SSR标记的方法。为使本专利技术的目的、技术方案及优点更加清楚明确,以下以马铃薯为实例并参照附图进一步详细说明。下述实验方法如无特殊说明,均为常规方法,材料和试剂如无特殊说明均可从商业途径获得。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例:马铃薯EST-SSR标记的开发与验证利用全基因组和EST数据开发EST-SSR标记1.1获取马铃薯基因组序列和EST数据:从公共数据库(http://solanaceae.p本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/27/CN104673884.html" title="利用全基因组和EST数据开发多态性EST‑SSR标记的方法原文来自X技术">利用全基因组和EST数据开发多态性EST‑SSR标记的方法</a>

【技术保护点】
利用全基因组和EST数据开发多态性EST‑SSR标记的方法,其特征在于,包括下述步骤:①获取基因组序列与EST数据,从公共数据库下载基因组序列数据、相应的基因注释信息和EST数据,用基因组注释信息进行基因组外显子、内含子序列分析,选取基因TSS转录起始位点前2000bp作为启动子序列;②将步骤①获得的全基因组数据进行SSR位点搜索与分析,采用MISA程序扫描全基因组染色体DNA序列,搜索、分析基因组序列中包含的SSR位点;③单一SSR位点筛选,采用Perl编写程序,从每个SSR结构域前若干碱基对开始,提取18~24bp的序列作为电子模拟PCR扩增的上引物;间隔10~24bp后,提取18~24bp序列,反向重复后作为下引物;采用Bowtie软件将引物序列比对到步骤①所下载的参考基因组上,根据需要允许若干个碱基的错配;采用Perl语言编写程序,鉴定、筛选单一SSR位点;④EST中多态性SSR位点鉴定与分析,采用序列比对软件Bowtie以EST序列为模板,以具有单一侧翼序列的SSR比对引物进行比对,采用Perl语言编程统计匹配区域长度信息;⑤多态性EST‑SSR位点筛选,筛选EST模板中有2个以上模拟扩增产物,且产物具有多态性的EST‑SSR位点;⑥多态性EST‑SSR标记引物设计,采用引物设计软件设计多态性EST‑SSR标记引物。...

【技术特征摘要】
1.利用全基因组和EST数据开发多态性EST-SSR标记的方法,其特征在于,包括下述步骤:①获取基因组序列与EST数据,从公共数据库下载基因组序列数据、相应的基因注释信息和EST数据,用基因组注释信息进行基因组外显子、内含子序列分析,选取基因TSS转录起始位点前2000bp作为启动子序列;②将步骤①获得的全基因组数据进行SSR位点搜索与分析,采用MISA程序扫描全基因组染色体DNA序列,搜索、分析基因组序列中包含的SSR位点;③单一SSR位点筛选,采用Perl编写程序,从每个SSR位点前5bp开始,提取18~24bp的序列作为电子模拟PCR扩增的上引物;从SSR位点后间隔10~24bp提取18~24bp序列,反向互补后作为下引物;采用Bowtie软件将引物序列比对到步骤①所下载的参考基因组上,根据需要允许若干个碱基的错配;采用Perl语言编写程序,鉴定、筛选单一SSR位点;④EST中多态性SSR位点鉴定与分析,采用序列比对软件Bowtie以EST序列为模...

【专利技术属性】
技术研发人员:杨先泉刘坚瞿静涛王西瑶刘春雷倪苏李立芹易游人袁娟
申请(专利权)人:四川农业大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1