当前位置: 首页 > 专利查询>罗晗专利>正文

一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法技术

技术编号:19160739 阅读:35 留言:0更新日期:2018-10-13 12:54
本发明专利技术公开了一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,包括:S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;S2:用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子以及阶层式分群法,从所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。依据本发明专利技术所述设计方法设计的家犬品种鉴定专用的SNP芯片,在满足分类精度的前提下,筛选出品种分类所需要最小数据集,并根据该数据集开发一款专用于家犬品种鉴定低成本且高效的SNP芯片。

【技术实现步骤摘要】
一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法
本专利技术涉及全基因组SNP芯片
,具体涉及一种家犬全基因组品种鉴定专用SNP芯片,特别涉及一种家犬品种鉴定专用的全基因组低密度SNP芯片设计方法、依据该设计方法设计出的SNP芯片,及其对应的家犬品种鉴定SNP检测方法。
技术介绍
家犬是人类忠实的动物伙伴,经过200多年的培育,目前共有400多个品系,由于他们可爱的外形、温顺忠诚的性格有很大一部分家犬成为了我们的密不可分家庭伴侣,还有一部分经过特殊训练承担着某种其他物种难以替代的工作,例如导盲、搜救、缉毒。据不完全统计,在世界范围内,约有5.25亿只家犬,不少欧美国家平均每人拥有一只家犬。家犬的血统来源或品系是否纯正常常决定着犬只的外型、性格特点、训练价值、市场价格等,也是饲养者非常关心的问题。SNP芯片检测技术是一种常用的遗传多样性检测技术,其根据已知的SNP位点构造固定的、等位基因特异的探针,通过与荧光染料染色的样品DNA杂交,读取杂交信号的方式检测遗传多样性位点在群体或个体中的基因型。由于其高效的检测方式、低廉的成本、简易的数据读取流程,该技术已经被广泛的用于大规模的家犬的遗传学研究,其中包括品系分类、性状相关基因/突变检测等方面。目前常用的家犬SNP芯片主要是由Illunima、ThermoFisher和affymatrix公司提供。Illunima公司开发了CanineSNP20和CanineHD芯片,其中CanineSNP20包括约22000个从多个品种犬中选取的探针,约每1M区域中分布8个探针;该公司最新推出的CanineHD芯片共包括172115个SNP位点,其包含的SNP位点选自BroadInstitute家犬基因组项目提供的2500000个SNP,还有~1600个位点来源于一个靶向重测序项目。样本来自于多个品种的犬只,每1M区域中至少分布70个位点。而由affymatrix公司与BroadInstitute联合开发的两个版本的芯片,第一版和第二版分别包括约27000和50000个SNP位点。这两款芯片的SNP位点同样选自于BroadInstitute家犬基因组项目提供的2500000个SNP,包含不低于10个品种的信息。ThermoFisher也提供了两个版本的芯片,AxiomTMCanineGenotypingArraySetsA和B,其中A包含约1100000个位点,B包含约670,000个位点,这些位点都来源于>300只家犬的基因组数据。纵观现有常用家犬品种分析SNP芯片,大都是以提供更大的数据量,从而更精确的定位性状相关位点为目的而构建的。然而,高密度、均匀分布的SNP芯片可以提供更丰富的遗传信息,为下一步的分析研究提供更多的基础数据支持的同时,更高的密度、更多的数量也无可避免的提高了检测和下游分析的成本,这类型的芯片在实际用于家犬品种分类时,往往造成不必要的经费及数据浪费。
技术实现思路
本专利技术的目的在于克服现有技术中所存在的上述不足,本专利技术提供一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,该方法通过搜集已经发表的、经过严格质量控制的、多品种的家犬SNP数据,在满足分类精度的前提下,筛选出品种分类所需要最小数据集,并根据该数据集开发一款专门为家犬品种分类制作的、低成本的、高效的SNP芯片。本专利技术另一目的在于,提供依据该设计方法设计的SNP芯片及其对应的检测方法。为了实现上述专利技术目的,本专利技术提供了以下技术方案:一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,包括如下步骤:S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;S2:利用PLINK软件滑动窗口程序,并结合不同的方差膨胀因子以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。进一步,所述步骤S1中的SNP分子库,具体指从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。进一步,在所述步骤S2中,利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点筛选的过程,具体包括:S201:设定方差膨胀因子标准值;S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于步骤S201中设定的方差膨胀因子标准值的SNP分子位点删除,从而保留方差膨胀因子低于和等于所述标准值的SNP分子位点;S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于所述标准值的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。其中,所述方差膨胀因子值代表解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,在回归分析过程中方差膨胀因子越低,则意味着该解释变量在与其他解释变量共同建模时不产生多重共线性的问题,因而是较佳的解释变量。所述步骤S202中的各SNP位点对应的方差膨胀值,具体是通过选定窗口中的一个SNP作为被解释变量,其他所有SNP作为解释变量,进行回归分析以及方差膨胀因子估计,接着将方差膨胀因子大於指定数值的SNP去除。完成筛选後,按照指定步长向下一个窗口重复同样步骤,直到所有SNP均经过筛选。进一步,当选用1作为方差膨胀因子标准值后,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括10659个SNP分子位点。经检测该10659个SNP分子位点搭配阶层式分群法,家犬品种鉴定正确率能够达到97.4%。进一步,当选用1.58作为方差膨胀因子标准值后,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括49580个SNP分子位点。经检验,该49580个SNP分子位点搭配阶层式分群法,家犬品种鉴定正确率能够达到99.07%。进一步,依据本专利技术所述设计方法制备的一种家犬全基因组低密度品种鉴定专用SNP芯片,该芯片包括10659个SNP分子位点,所述10659个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于96%。进一步,依据本专利技术所述设计方法制备的一种家犬全基因组低密度品种鉴定专用SNP芯片,该芯片包括49580个SNP分子位点,所述49580个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于98%。进一步,基于相同专利技术构思下,本专利技术进一步公开一种家犬品种鉴定专用的SNP检查方法,该方法包括如下步骤:Sa:从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库;Sb:利用PLINK软件滑动窗口程序,结合设定的方差膨胀因子以及阶层式分群法,从步骤Sa所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;Sc:依据Sb中选出的SNP标记分子位点,设计SNP探针,并将该探针用于被检测家犬品种鉴定。与现有技术相比,本专利技术的有益效果:1、依据本专利技术所述家犬全基因组低密度家犬品种鉴定专用SNP芯片设计方法,首次在现有家犬本文档来自技高网
...

【技术保护点】
1.一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,包括如下步骤:S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;S2:利用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子标准值以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。

【技术特征摘要】
1.一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,包括如下步骤:S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;S2:利用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子标准值以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。2.根据权利要求1所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,所述步骤S1中的SNP分子库,具体指从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。3.根据权利要求1所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,在所述步骤S2中,利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点进行筛选的过程,具体包括:S201:设定方差膨胀因子标准值;S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到与各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于步骤S201中设定的方差膨胀因子标准值的SNP分子位点删除,从而保留方差膨胀因子低于和等于所述标准值的SNP分子位点;S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于所述标准值的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。4.根据权利要求3所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,...

【专利技术属性】
技术研发人员:罗晗刘星彤白冰林书弘
申请(专利权)人:罗晗
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1