一种利用SLAF‑seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法技术

技术编号:15973925 阅读:534 留言:0更新日期:2017-08-11 23:44
本发明专利技术公开了一种利用SLAF‑seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法。包括以下步骤:1)设计标记开发方案;2)选择最适的酶切方案;3)分别提取基因组DNA进行酶切,构建SLAF‑seq测序文库后测序;4)先对单个样品进行SLAF标签的开发,然后得到的所有SLAF标签进行相似性聚类得到该群体的SLAF标签;5)对群体SLAF标签进行等位基因数和基因序列差异等多态性分析,将其中SNP作为多态性标记;6)对亲本编码基因型,一个字母代表一种基因型,确定分离类型后,再检测子代基因型,用相应字母表示SNP编码基因型;7)选取样品缺失数较少的SNP Marker,提取所有的SNP位点,统计子代的SNP异常分型比率,通过子代SNP异常分型比率是否高于阈值,判断子代和亲本的亲缘关系。

【技术实现步骤摘要】
一种利用SLAF-seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法
本专利技术涉及植物分子生物学
,特别涉及芒属植物亲缘关系鉴定及系统进化研究的方法。
技术介绍
芒属植物(MiscanthusAnderss.)是一种新型的纤维能源植物,其基因组较大,大约为2.65Gb,且有性繁殖以异交为主,存在大量种内和种间杂交的现象,遗传背景相当复杂,这给系统进化研究及后续基因功能开发带来极大困难。分子标记技术已广泛应用于遗传学、分子群体遗传学、物种的形成、进化及亲缘关系、系统发育和分子分类学等许多研究领域。目前,已开发出的分子标记技术包括以RFLP、RAPD和AFLP为代表的第一代分子标记技术,以SSR和ISSR为代表的第二代分子标记技术,这些标记因自身存在的局限性限制了其进一步的发展与应用,如通量小、精确性低、耗时耗力、成本高等。以SNP(singlenucleotidepolymorphisms)为代表的第三代分子标记技术,相比之前的标记不仅具有多态性好、能广泛分布于全基因组的特点,而且随着高通量测序及生物信息学数据分析技术的发展,可以实现大规模自动化监测。因而SNP标记在遗传图谱构建、种质资源的DNA指纹分析和生物多样性检测、连锁不平衡的关联分析等农作物育种领域发挥着重要作用。但是SNP标记主要应用于一些模式物种(拟南芥、水稻)或已具有参考基因组的物种,在非模式物种(芒属植物)的研究与应用中仍存在一定的困难和挑战。
技术实现思路
本专利技术旨在克服现有技术的不足,提供一种利用SLAF(Specific-LocusAmplifiedFragmentSequencing)-seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法。为了达到上述目的,本专利技术提供的技术方案为:所述利用SLAF-seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法包括如下步骤:(1)对芒属植物近缘物(MiscanthusAnderss.)种基因组、BAC或Fosmid序列进行系统分析,根据基因组的GC含量、重复序列情况和基因特点等信息,设计标记开发方案;(2)对参考基因组进行系统分析,根据基因组大小、重复序列比例,选择酶切方案;要求酶切结果重复序列比例越小越好,SLAF标签在基因组上分布足够均匀;(3)分别提取芒属植物样本的基因组DNA,根据SLAF-seq技术对DNA进行酶切,构建SLAF-seq测序文库后测序;(4)将测序结果进行SLAF标签的开发,先对单个样品进行SLAF标签的开发,然后将单样品开发得到的所有SLAF标签进行相似性聚类得到该群体的SLAF标签;(5)对样品群体SLAF标签进行等位基因数和基因序列差异等多态性分析,将其中SNP作为多态性标记;(6)开发多态性标记后,首先对亲本编码基因型,一个字母代表一种基因型,确定分离类型后,再检测子代基因型,用相应字母表示SNP编码基因型;(7)在多个具有多态性SNP的Marker中,选取样品缺失数较少的Marker,提取所有的SNP位点,统计子代的SNP异常分型比率;通过子代SNP异常分型比率是否高于阈值,判断子代和亲本的亲缘关系。其中,所述芒属植物近缘物种基因组为高粱(Sorghumvulgare)、甘蔗(Saccharumofficinarum)或玉米(ZeamaysL.)基因组。步骤(2)所述酶切方案中限制性内切酶为EcoRV+ScaI,将酶切片段长度在264-364bp的序列定义为SLAF标签。步骤(3)所述测序为IlluminaHiseq2500测序,每个样品的平均测序深度为7x-16x。步骤(4)所述进行SLAF标签的开发是以每个SLAF标签中深度最高的序列类型作为参考序列,利用bwa将测序reads比对到参考序列上,并使用GATK和samtools两种方法开发SNP,以两种方法得到的SNP标记交集作为最终可靠的SNP标记数据集,并根据完整度>0.8,MAF>0.05过滤,得到高一致性的群体SNP。在步骤(5)之后、步骤(6)之前,基于SNP标记,通过MEGA5软件,neighbor-joining算法,做芒属植物不同样品的进化分析,计算得到样品的进化树;利用SNP标记,通过cluster软件,进行主元成分分析(Principalcomponentsanalysis,PCA)分析,得到不同芒属植物的主元成分聚类情况,辅助进化分析。步骤(7)中所述阈值为0.03,若子代SNP异常分型比率高于0.03,则判断子代不是亲本所生,或者亲本不是子代的亲本。早期科学家们通过EST序列开发SNP标记,应用于物种亲缘关系、进化的研究,但这些方法获得的SNP数量一般都较少,本专利技术采用高通量测序技术对个体测序,在全基因组范围内开发SNP标记,鉴定更为丰富的遗传变异信息,由此推测芒属植物混交群体产生的杂交种的父本血统,同时,利用本专利技术开发的SNP标记同样可以解决那些不确定的系统发生关系,尤其是芒属植物中的近缘种。本专利技术通过简化基因组技术SLAF-seq开发和鉴定SNP标记,通过特异性酶切降低基因组复杂度,利用高通量测序技术对代表性文库测序,对芒属植物进行标记开发及基因型分型,实现对其亲缘关系鉴定和系统进化研究的目标。使用本专利技术进行芒属植物亲缘关系鉴定,可以降低芒属植物庞大的基因组复杂度,精确性高、检测迅速、成本较低。附图说明图1为SLAF实验流程;图2为SLAF标签开发流程图;图3为测序质量值分布图;图中,横坐标为reads的碱基位置,纵坐标为单碱基的质量值。前100bp为双端测序序列的第一端测序reads的质量值分布,后100bp为另一端测序reads的质量值分布。每个bp代表测序所有reads的每个碱基,同一位置的各个质量颜色越深表示在数据中这个质量值得比例越高。如第一个bp即表示该项目所有测序reads的第一个碱基在测序时的质量值分布;图4为碱基含量分布图;图中,横坐标为reads的碱基位置,纵坐标为碱基所占的比例;不同颜色代表不同的碱基类型,绿色代表碱基A,蓝色代表碱基T,红色代表碱基C,橙色代表碱基G,灰色代表测序中识别不出的碱基N。前100bp为双端测序序列的第一端测序Reads的碱基分布,后100bp为另一端测序reads的碱基分布。每个bp代表测序的每个碱基,如第一bp即表示该项目所有测序reads在第一个碱基的A、T、G、C、N的分布情况;图5为50个样品的进化树;图中,每个分枝为一个样品。0.05表示在固定长度的样品间的遗传距离;图6为50个样品分群数为1-10的聚类图;图中,上图中每种颜色代表一个群,每行代表一个分群值的情况,例如K=1是表示每个样品在一个群体结构中分别占的比例;图中展示了50个样品分群值从1-10的聚类情况。下图中为每个K值对应的ΔK值,K为4的时候ΔK最小;图7为50个样品的PCA聚类图;图中,通过PCA分析将50个样品聚为三维,pca1代表第一主元成分,pca2代表第二主元成分,pca3代表第三主元成分;一个点代表一个样品,一种颜色代表一个分组。具体实施方式选取芒属植物已知母本为南荻的子代样本19份,和母本花期相遇的芒、荻、南荻样本作为疑似父本30份,母本1份,共50份材料。1参考基因组确定根据芒属植物基因本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/27/201710422851.html" title="一种利用SLAF‑seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法原文来自X技术">利用SLAF‑seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法</a>

【技术保护点】
一种利用SLAF‑seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法,其特征在于,所述方法包括如下步骤:(1)对芒属植物近缘物种基因组、BAC或Fosmid序列进行系统分析,根据基因组的GC含量、重复序列情况和基因特点信息,设计标记开发方案;(2)对参考基因组进行系统分析,根据基因组大小、重复序列比例,选择酶切方案;(3)分别提取芒属植物样本的基因组DNA,根据SLAF‑seq技术对DNA进行酶切,构建SLAF‑seq测序文库后测序;(4)将测序结果进行SLAF标签的开发,先对单个样品进行SLAF标签的开发,然后将单样品开发得到的所有SLAF标签进行相似性聚类得到该群体的SLAF标签;(5)对样品群体SLAF标签进行等位基因数和基因序列差异多态性分析,将其中SNP作为多态性标记;(6)开发多态性标记后,首先对亲本编码基因型,一个字母代表一种基因型,确定分离类型后,再检测子代基因型,用相应字母表示SNP编码基因型;(7)在多个具有多态性SNP的Marker中,选取样品缺失数较少的Marker,提取所有的SNP位点,统计子代的SNP异常分型比率;通过子代SNP异常分型比率是否高于阈值,判断子代和亲本的亲缘关系。...

【技术特征摘要】
1.一种利用SLAF-seq技术开发芒属植物SNP分子标记进行亲缘关系鉴定的方法,其特征在于,所述方法包括如下步骤:(1)对芒属植物近缘物种基因组、BAC或Fosmid序列进行系统分析,根据基因组的GC含量、重复序列情况和基因特点信息,设计标记开发方案;(2)对参考基因组进行系统分析,根据基因组大小、重复序列比例,选择酶切方案;(3)分别提取芒属植物样本的基因组DNA,根据SLAF-seq技术对DNA进行酶切,构建SLAF-seq测序文库后测序;(4)将测序结果进行SLAF标签的开发,先对单个样品进行SLAF标签的开发,然后将单样品开发得到的所有SLAF标签进行相似性聚类得到该群体的SLAF标签;(5)对样品群体SLAF标签进行等位基因数和基因序列差异多态性分析,将其中SNP作为多态性标记;(6)开发多态性标记后,首先对亲本编码基因型,一个字母代表一种基因型,确定分离类型后,再检测子代基因型,用相应字母表示SNP编码基因型;(7)在多个具有多态性SNP的Marker中,选取样品缺失数较少的Marker,提取所有的SNP位点,统计子代的SNP异常分型比率;通过子代SNP异常分型比率是否高于阈值,判断子代和亲本的亲缘关系。2.根据权利要求1所述的方法,其特征在于,所述芒属植物近缘物种基因组为高粱、甘蔗或玉米基因组。3.根据权...

【专利技术属性】
技术研发人员:陈智勇胡忠红
申请(专利权)人:湖南农业大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1