基于RAD图谱完善SSR图谱的方法技术

技术编号:10662400 阅读:213 留言:0更新日期:2014-11-20 09:29
本发明专利技术涉及一种基于RAD图谱完善SSR图谱的方法,获得样品的SSR图谱和RAD图谱,判断各scaffold所对应的真实连锁群和冲突连锁群,建立SSR连锁群和RAD连锁群的一一对应关系;根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,通过计算确定各scaffold在连锁群内的排列顺序和方向,已建立一一对应关系的SSR连锁群和RAD连锁群,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱,从而得到染色体组装序列。本发明专利技术的基于RAD图谱完善SSR图谱的方法将SSR图谱信息和RAD图谱信息整合在一起,相互纠正,相互补充,可以有效地提高图谱精度和图谱长度的。

【技术实现步骤摘要】
基于RAD图谱完善SSR图谱的方法
本专利技术涉及一种测序结果的处理方法,尤其是基于RAD图谱完善SSR图谱连接并辅助组装的方法,属于生物信息学领域。
技术介绍
简单序列重复SSR(SimpleSequenceRepeats)标记是近年来发展起来的一种以特异引物PCR为基础的分子标记技术,也称为微卫星DNA(MicrosatelliteDNA),是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列。每个SSR两侧的序列一般是相对保守的单拷贝序列。目前,该技术广泛应用于遗传连锁图谱构建、种质鉴定、遗传多样性及基因定位与克隆等研究。具有以下优点:(1)数量丰富;(2)具有多等位基因的特性,提供的信息量高;(3)以孟德尔方式遗传,呈共显性;(4)每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。但是,SSR标记仍然存在以下不足之处:(1)SSR标记的开发局限于已知基因组信息的物种;(2)序列去冗余拼接软件和SSR搜索及引物设计软件存在一定的局限性,从而影响SSR标记的准确性;(3)SSR标记多态性较低;(4)SSR标记密度一般比较低。SSR测序方法是现有公知的测序方法,可参见外文文献《High-throughputtargetedSSRmarkerdevelopmentinpeach(Prunuspersica)》出版于《Genome》杂志2002年第45卷第2期319~328页,作者为YingWang、LauraLGeorgi等;外文文献《SSRmarkerbasedDNAfingerprintinganddiversitystudyinrice(Oryzasativa.L)》出版于《AfricanJournalofBiotechnology》2006年第5卷第9期684~688页,作者为B.KalyanChakravarthi和RambabuNaravaneni。中国专利文献CN102936627(申请号:201210465639.8)公开了一种香菇香九菌种的SSR标记指纹图谱与应用,该指纹图谱由7对基于香菇基因组序列开发的SSR标记的特异等位片段组合而成。RAD(Restriction-siteAssociatedDNA)是与限制性核酸内切酶识别位点相关的DNA。基于酶切的简化基因组测序(RAD-Seq)对酶切获得的RADtag进行高通量测序,大幅降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的SNP位点。基于高密度的SNP位点通过图谱构建方法得到高密度遗传图谱。RAD-seq技术具有操作简便,周期短,实验成本低,不受参考基因组的限制,一次实验即获得的大量SNP信息,可以用于任何物种的高密度图谱的构建、基因(QTLs)定位及群体遗传分析等优点。但是,RAD图谱准确度相对SSR图谱有些差距。RAD测序方法是现有公知的测序方法,可参见外文文献《Rapidandcost-effectivepolymorphismidentificationandgenotypingusingrestrictionsiteassociatedDNA(RAD)markers》出版于《GenomeResearch》杂志2007年第17卷240~248页,作者为MichaelR.Miller、JosephP.Dunham、AngelAmores等;外文文献《RADmarkermicroarraysenablerapidmappingofzebrafishmutations》出版于《GenomeBiology》杂志2007年第8卷第6期,作者为MichaelRMiller、TressaSAtwood、BFrankEames等。
技术实现思路
本专利技术解决的技术问题是,提出一种将SSR图谱信息和RAD图谱信息整合在一起,相互纠正,相互补充,可以有效地提高图谱精度和图谱长度的基于RAD图谱完善SSR图谱的方法。为了解决上述技术问题,本专利技术提出的技术方案是:一种基于RAD图谱完善SSR图谱的方法,包括以下具体步骤:A.采用现有的SSR测序方法和RAD测序方法分别对样品进行测序获得样品的SSR图谱和RAD图谱;B.在SSR图谱和RAD图谱中,分别确定标记在各scaffold上的物理位置,统计scaffold在连锁群上的分布,确定scaffold与连锁群的对应关系;C.在SSR图谱和RAD图谱中,判断各scaffold所对应的真实连锁群和冲突连锁群;当真实SSR连锁群和真实RAD连锁群有共有的scaffold时,建立真实SSR连锁群和真实RAD连锁群的一一对应关系;当scaffold有冲突连锁群时,去除冲突连锁群中所述scaffold的标记,得到无冲突的scaffold的标记;D.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离,确定各scaffold在连锁群内的排列顺序;E.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,确定各scaffold在连锁群内的方向;F.已建立一一对应关系的SSR连锁群和RAD连锁群,根据SSR图谱和RAD图谱中各scaffold在连锁群内的排列顺序和方向,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱;G.将整合图谱中的scaffold连接起来,得到染色体组装序列。上述技术方案的一种优选是:上述步骤E中,判断所述scaffold在连锁群内的方向的具体步骤是:分别计算出无冲突的scaffold的标记的遗传距离,将各标记的遗传距离从小到大排列得到标记在连锁群内的遗传距离序号,再根据所述标记在连锁群内的遗传距离序号和在所述scaffold上的物理位置计算出相关系数;所述相关系数的计算公式是:,其中,xi是所述scaffold上的第i个标记的遗传距离序号,yi是所述scaffold上的第i个标记在scaffold上的物理位置,n是所述scaffold上的标记数,rx,y是所述scaffold的相关系数;当相关系数为正数时,所述scaffold的方向是正向的;当相关系数为负数时,所述scaffold的方向是反向的;当无法计算出相关系数时,所述scaffold的方向默认是正向的。上述技术方案的一种优选是:上述步骤E中,当共有scaffold在SSR图谱和RAD图谱中都能计算出相关系数时,所述scaffold的方向是scaffold在SSR图谱中的方向;当共有scaffold在SSR图谱和RAD图谱中都不能计算出相关系数时,所述scaffold的方向默认是正向的;当共有scaffold在SSR图谱中能计算出相关系数,在RAD图谱中不能计算出相关系数时,所述scaffold的方向是scaffold在SSR图谱中的方向;当共有scaffold在SSR图谱中不能计算出相关系数,在RAD图谱中能计算出相关系数时,所述scaffold的方向是scaffold在RAD图谱中的方向。上述技术方案的一种优选是:上述步骤C中,判断所述scaffold所对本文档来自技高网
...
基于RAD图谱完善SSR图谱的方法

【技术保护点】
一种基于RAD图谱完善SSR图谱的方法,其特征在于,包括以下具体步骤:A.采用现有的SSR测序方法和RAD测序方法分别对样品进行测序获得样品的SSR图谱和RAD图谱;B.在SSR图谱和RAD图谱中,分别确定标记在各scaffold上的物理位置,统计scaffold在连锁群上的分布,确定scaffold与连锁群的对应关系;C.在SSR图谱和RAD图谱中,判断各scaffold所对应的真实连锁群和冲突连锁群;当真实SSR连锁群和真实RAD 连锁群有共有的scaffold时,建立SSR连锁群和RAD连锁群的一一对应关系;当scaffold有冲突连锁群时,去除冲突连锁群中所述scaffold的标记,得到无冲突的scaffold的标记;D.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离,确定各scaffold在连锁群内的排列顺序;E.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,确定各scaffold在连锁群内的方向;F. 已建立一一对应关系的SSR连锁群和RAD连锁群,根据SSR图谱和RAD图谱中各scaffold在连锁群内的排列顺序和方向,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱;G.将整合图谱中的scaffold连接起来,得到染色体组装序列。...

【技术特征摘要】
1.一种基于RAD图谱完善SSR图谱的方法,其特征在于,包括以下具体步骤:A.采用现有的SSR测序方法和RAD测序方法分别对样品进行测序获得样品的SSR图谱和RAD图谱;B.在SSR图谱和RAD图谱中,分别确定标记在各scaffold上的物理位置,统计scaffold在连锁群上的分布,确定scaffold与连锁群的对应关系;C.在SSR图谱和RAD图谱中,判断各scaffold所对应的真实连锁群和冲突连锁群;当真实SSR连锁群和真实RAD连锁群有共有的scaffold时,建立SSR连锁群和RAD连锁群的一一对应关系;当scaffold有冲突连锁群时,去除冲突连锁群中所述scaffold的标记,得到无冲突的scaffold的标记;D.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离,确定各scaffold在连锁群内的排列顺序;E.在SSR图谱和RAD图谱中,分别根据无冲突的scaffold的标记的遗传距离和标记在scaffold上的物理位置,确定各scaffold在连锁群内的方向;F.已建立一一对应关系的SSR连锁群和RAD连锁群,根据SSR图谱和RAD图谱中各scaffold在连锁群内的排列顺序和方向,以SSR图谱中的SSR连锁群内的scaffold为骨架,将RAD连锁群内除共有scaffold外的其他scaffold补充到SSR图谱的SSR连锁群中,组装成整合图谱;G.将整合图谱中的scaffold连接起来,得到染色体组装序列;所述步骤E中,判断所述scaffold在连锁群内的方向的具体步骤是:分别计算出无冲突的scaffold的标记的遗传距离,将各标记的遗传距离从小到大排列得到标记在连锁群内的遗传距离序号,再根据所述标记在连锁群内的遗传距离序号和在所述scaffold上的物理位置计算出相关系数;所述相关系数的计算公式是:,其中,xi是所述scaffold上的第i个标记的遗传距离序号,yi是所述scaffold上的第i个标记在scaffold上的物理位置,n是所述scaffold上的标记数,rx,y是所述scaffold的相关系数;当相关系数为正数时,所述scaffold的方向是正向的;当相关系数为负数时,所述scaffold的方向是反向的;当无法计算出相关系数时,所述scaffold的方向默认是正向的。2.根据权利要求1所述的基于RAD图谱完善SSR图谱的方法,其特征在于:所述步骤E中,当共有scaffold在SSR图谱和RAD图谱中都能计算出相关系数时,所述scaffold的方向是scaffold在SSR图谱中的方向;当共有scaffold在SSR图谱和RAD图谱中都不能计算出相关系数时,所述scaffold的方向默认是正向的;当共有scaffold在SSR图谱中能计算出相关系数,在RAD图谱中不能计算出相关系数时,所述scaffold的方向是scaffold在SSR图谱中的方向;当共有scaffold在SSR图...

【专利技术属性】
技术研发人员:曾亮陶晔陈华林芹
申请(专利权)人:上海美吉生物医药科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1