当前位置: 首页 > 专利查询>广西大学专利>正文

一种提高GWAS致因突变定位效率的方法技术

技术编号:26480680 阅读:47 留言:0更新日期:2020-11-25 19:26
本发明专利技术公开了一种提高GWAS致因突变定位效率的方法,先从GWAS得到的显著相关位点分型中筛选纯合突变且表型值高和低的个体,将其分为高组、低组,混合构建DNA混池:再计算LD,根据计算出来的LD确定候选区域;然后扩增候选区域的基因外显子、启动子、5’UTR和3’UTR区并进行测序,将测序结果与上述基因的参考序列对比,筛选出高、低组突变完全不同,或者高、低组套峰峰高按低组→高组组程规律递增/递减的SNP位点做为相关SNP位点,对得到的位点进行分析,将P值小于原显著相关位点的分型位点作为候选致因突变位点,用于后续的验证。本方法可以有效地在SNP筛选阶段初步筛选出可能与性状相关的SNP位点,减少致因突变位点筛选的工作量,节省分型所需的科研经费。

【技术实现步骤摘要】
一种提高GWAS致因突变定位效率的方法
本专利技术涉及生物信息学
,特别涉及一种提高GWAS致因突变定位效率的方法。
技术介绍
人类基因组计划完成以后,各物种的基因组图谱被迅速绘制,目前对一个物种的从头测序也从原本的鸟枪法发展到了二代测序甚至到了通量更高的三代测序。对基因组的研究发现任何物种的基因组中都存在着大量的单核苷酸多态性(singlenucleotidepolymorphism,SNP),在基因编码区的SNP可以通过影响氨基酸的组成导致蛋白质结构的改变从而影响机体的生理生化特征;在基因调控区的SNP可以通过影响调控元件的活性影响基因的转录水平进而影响机体的生理生化特征。而SNP是一种可以稳定遗传的标记,因此将SNP作为性状的遗传标记进而研究其分子机理是科研工作的重要组成部分。随着分子技术的发展,SNP的分型技术也从原本的限制性片段长度多态性(RestrictionFragmentLengthPolymorphism,PFLP)发展到了现在飞行时间质谱、磁珠芯片分型等,其通量越来越大,分型速度越来越快,为在全基因组水平上研究SNP对性状的影响,检测致因突变提供了基础支撑。研究发现,在基因组上两个等位基因同时出现的概率有时候与随机出现的概率并不一致,这说明这两个等位基因相互之间纯在着一定的关系,一个基因的出现频率会影响另外一个基因的出现频率,也就是存在连锁不平衡现象。根据连锁不平衡理论,研究人员设想只要在基因组中存在密度足够的标记就可以将某种疾病、性状的致因突变检测出来,从而诞生了全基因组关联分析(Genome-WideAssociationStudies,GWAS),目前GWAS已经广泛地运用到了生物领域和医学领域,利用GWAS研究疾病的遗传机理、肿瘤的发生机制和性状的遗传机制等已经成为了常用的研究手段。由于GWAS本身是根据基因组上标记的连锁不平衡理论设计的,其分析出来的显著性位点基本不是致因突变位点,因此致因突变位点的定位尤为重要。目前定位致因突变位点的方法是将显著位点上下游500Kb左右的基因进行富集分析后,选择与性状可能相关的基因设计引物以随机DNA混池作为模板扩增其外显子,后随机选择SNP或将SNP全部进行分型,分型结果使用SAS等软件进行关联分析。但是此方法存在如下问题:1.由于不同群体的连锁不平衡区间并不是一致的,因此选择500Kb左右的区间进行富集,并不适合所有的品种和群体,例如中国地方猪的LD区域比西方商业猪种小很多,使用500Kb距离进行富集并不符合中国地方猪的实际情况;2.使用随机混池进行PCR扩增,测序后会得到大量的SNP位点,但是这些位点对于所研究的性状是否真的有潜在关联性却不得而知,如果对所有位点都进行分型,必然会导致人力物力的浪费;3.使用SAS等软件对分型结果进行后续分析,即使得到的P值小于0.05或0.01在全基因组范围内也说明不了这些位点性状的致因突变位点,因为在GWAS中一般都是采用Bonferroni法计算,其阈值比较严格,比0.01水平高很多。综上所述,现有的定位致因突变位点的方法其流程繁琐、效率低,急需开发一种能够提高GWAS致因突变定位效率的方法。公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
本专利技术针对上述技术问题,专利技术一种提高GWAS致因突变定位效率的方法。本专利技术的方法是通过以下步骤实现的:(1)从GWAS得到的显著相关位点分型中筛选纯合突变且表型值高和低的个体,将其分为高组、低组,混合构建DNA混池:(2)计算LD,根据计算出来的LD确定候选区域;(3)扩增候选区域的基因外显子、启动子、5’UTR和3’UTR区并进行测序,将测序结果与与上述基因的参考序列对比,筛选出高、低组突变完全不同,或者高、低组套峰峰高按低组→高组组程规律递增/递减的SNP位点做为相关SNP位点;(4)对步骤(3)得到的相关SNP位点进行分析,将P值小于原显著相关位点的分型位点作为候选致因突变位点,用于后续的验证。其中,在步骤(1)中,先将GWAS得到的显著相关位点分型信息删除CHROM、POS等信息,只保留ID和个体分型结果;选择1个P值最低且哈德温伯格平衡检验卡方值X2<5.991或者P值P>0.05的显著相关位点,将其分型结果和表型值一一对应;使用SPSS19.0软件对三种基因型对应的表型值进行单因素方差分析,比较两种纯合基因型的表型值差异和显著性;将方差分析结果从高到低排队,选择纯合基因型个体的高、低组作为DNA模板;其中,步骤(1)中纯合基因型个体的高、低组分组方法为:将两种纯合基因型的表型值从高到低排队,选择方差分析中高表型纯合基因型中最高的10-15个个体作为高组,选择方差分析中低表型纯合基因型中最低的10-15个个体作为低组作为DNA模板。例如:纯合突变组在方差分析中比纯合野生组低,则挑选纯合突变中表型值最低的15个个体作为极低组(1组),表型值次低的15个个体作为低组(2组);挑选纯合野生中表型值最高的15个个体作为极高组(4组),表型值次高的15个个体作为高组(3组);将挑选出来的高、低组个体的DNA样品浓度调整到统一的浓度,抽取每个个体同样的DNA样品量进行混样构建DNA混池,每一组得到一个DNA混池;其中,在步骤(2)中,使用PopLDdecay软件对存有GWAS数据的vcf文件进行LD衰减计算;使用R语言ggplot2软件包进行可视化并对PopLDdecay计算的结果进行拟合;根据计算出来的LD,选取LD>0.2的上下游距离作为候选区域;如LD>0.2时距离为25Kb,则选择显著相关位点上下游25Kb共50Kb的距离作为候选区域;其中,在步骤(3)中,设计引物扩增候选区域内包含的基因外显子、启动子、5’UTR区和3’UTR区;以DNA混池为模板进行PCR扩增,对PCR扩增的产物进行测序;使用Megalign和Seqman软件对测序结果与上述基因的参考序列进行比对,筛选高、低组突变完全不同,或者高、低组套峰峰高按低组→高组组程规律递增/递减的SNP位点做为相关SNP位点;其中,在步骤(4)中使用多重PCR或飞行时间质谱的手段对相关SNP位点进行分型,将分型结果整理成为vcf文件,使用bcftools软件进行vcf文件合并和位点排序;使用Tassel、GEMMA等软件重新进行GWAS分析;使用R语言CMplot包对分析结果进行可视化,将P值小于原显著相关位点的分型位点作为候选致因突变位点,用于后续验证。与现有技术相比,本专利技术具有如下有益效果:(1)本专利技术的方法据显著相关位点的分型结果和性状高低进行高低分组,可以有效地在SNP筛选阶段初步筛选出可能与性状相关的SNP位点,减少致因突变位点筛选的工作量,节省分型所需的科研经费;(2)本专利技术的方法对研究的群体进行LD衰减的计算,使候选区域定位更有科学依据;本文档来自技高网
...

【技术保护点】
1.一种提高GWAS致因突变定位效率的方法,其特征在于,包括以下步骤:/n(1)从GWAS得到的显著相关位点分型中筛选纯合突变且表型值高和低的个体,将其分为高组、低组,混合构建DNA混池:/n(2)计算LD,根据计算出来的LD确定候选区域;/n(3)扩增候选区域的基因外显子、启动子、5’UTR和3’UTR区并进行测序,将测序结果与与所述基因的参考序列对比,筛选出高、低组突变完全不同,或者高、低组套峰峰高按低组→高组组程规律递增/递减的SNP位点做为相关SNP位点;/n(4)对步骤(3)得到的相关SNP位点进行分析,将P值小于原显著相关位点的分型位点作为候选致因突变位点,用于后续的验证。/n

【技术特征摘要】
1.一种提高GWAS致因突变定位效率的方法,其特征在于,包括以下步骤:
(1)从GWAS得到的显著相关位点分型中筛选纯合突变且表型值高和低的个体,将其分为高组、低组,混合构建DNA混池:
(2)计算LD,根据计算出来的LD确定候选区域;
(3)扩增候选区域的基因外显子、启动子、5’UTR和3’UTR区并进行测序,将测序结果与与所述基因的参考序列对比,筛选出高、低组突变完全不同,或者高、低组套峰峰高按低组→高组组程规律递增/递减的SNP位点做为相关SNP位点;
(4)对步骤(3)得到的相关SNP位点进行分析,将P值小于原显著相关位点的分型位点作为候选致因突变位点,用于后续的验证。


2.按照权利要求1所述的方法,其特征在于:在步骤(1)中,先将从GWAS得到的显著相关位点分型信息删除CHROM、POS等信息,只保留ID和个体分型结果;选择1个P值最低且哈德温伯格平衡检验卡方值X2<5.991或者P值P>0.05的显著相关位点,将其分型结果和表型值一一对应;使用SPSS19.0软件对三种基因型对应的表型值进行单因素方差分析,比较两种纯合基因型的表型值差异和显著性;将两种纯合基因型的表型值从高到低排队,分别选择纯合基因型个体的高、低组作为DNA模板。


3.按照权利要求2所述的方法,其特征在于:将两种纯合基因型的表型值从高到低排队,选择方差分析中高表型纯合基因型...

【专利技术属性】
技术研发人员:兰干球梁晶莫家远
申请(专利权)人:广西大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1