一种山猪鉴定方法技术

技术编号:37048279 阅读:8 留言:0更新日期:2023-03-29 19:26
本发明专利技术涉及一种山猪鉴定方法,首先采集山猪的特异性遗传标签组合,经全基因组测序后,通过线性混合模型进行全基因组关联分析,筛选显著值前10的SNP位点构成鉴定数据集;再通过鉴定数据集利用支持向量机构建机器学习模型,鉴定时,提取待测肉制品的基因组DNA进行测序,并获得待测肉制品的特异性遗传标签组合中位点的基因型;将待测肉制品的SNP位点的基因型输入机器学习模型进行鉴别;输出鉴别结果。本发明专利技术提供的山猪鉴定方法操作简单、价格低廉、具有很高的准确性,填补了市场的空缺,有效解决了山猪品系的鉴伪问题。决了山猪品系的鉴伪问题。

【技术实现步骤摘要】
一种山猪鉴定方法


[0001]本专利技术关于一种猪鉴定方法,特别是有关于一种山猪鉴定方法。

技术介绍

[0002]山猪主要分布在南京市六合县北部丘陵山区。当地农民有放牧与圈养生猪的习惯,且山猪还是当地人民传统的年猪,这促使群众选育体型中等的肉脂兼用型猪,形成了体格健壮、善于奔跑、产仔数多、肉质好、早熟、抗病力强的山猪。由于六合区北部丘陵山区交通不便,群众有不吃白猪肉的习惯等多因素的影响,外来猪种很难进入这一这一地区,纯种山猪得以保存下来。山猪对当地生态条件有良好适应性,繁殖性能和育肥性能较好。另一方面,自90年代后,各县的山猪种猪场先后转产,山猪饲养量逐步减少,群体已经较小,处于濒临灭绝状态,亟须加强保种。如何快速准确的鉴别山猪是目前亟需解决的一个问题,山猪的鉴定是可靠的食品追溯手段,有利于规范种业发展,推进中国地方猪保护工作。

技术实现思路

[0003]要解决的技术问题:本专利技术的目的在于提供一种山猪鉴定方法,对山猪的品种进行快速鉴别,填补市场空缺,有效解决山猪品系的鉴伪问题。
[0004]技术方案:一种山猪鉴定方法,包括以下步骤:S1:采集山猪的特异性遗传标签组合;S2:特异性遗传标签组合构成鉴定数据集;S3:利用鉴定数据集构建机器学习模型;S4:提取待测肉制品的基因组DNA并进行测序;S5:获得待测肉制品的特异性遗传标签组合中位点的基因型;S6:将位点的基因型输入机器学习模型进行鉴别;S7:输出鉴别结果。进一步的,所述步骤S1通过线性混合模型对全基因组数据进行全基因组数据关联分析获得品种基因组数据,选取显著值前10的特异性遗传标签组合。进一步的,所述步骤S1中全基因组数据包括76个地方猪品种,1305个个体。进一步的,所述步骤S1中线性混合模型表达式为:y=μ+xb+∑
k
W
ik
U
k
+e,其中,y代表个体品种,编码为1或0,当y值为1时代表个体品种为山猪,当y值为0时代表个体品种为其他,μ是一个固定的均值项,x是位点的基因型变量,b表示两个群体之间的等位基因频率差的函数,∑
k
W
ik
U
k
是模型中其他染色体上的所有SNP位点用来控制群体分化的项,k表示全基因组数据的所有位点,Wik表示SNP位点的标准化基因型变量,Uk表示对应不同位点的效果大小,e表示残差。进一步的,所述显著值前10的特异性遗传标签组合包括:山猪1号染色体第43847366位位点,山猪1号染色体第44516841位位点,山猪1号染色体第44963748位位点,山
猪1号染色体第269790760位位点,山猪2号染色体第121164841位位点,山猪2号染色体第135626913位位点,山猪15号染色体第106101687位位点,山猪15号染色体第106667763位位点,山猪16号染色体第7112890位位点,山猪16号染色体第7114591位位点。进一步的,所述显著值通过软件gemma

0.98.5

linux

static

AMD64采取瓦尔德检验法获得。进一步的,所述瓦尔德检验法先假设检验结果为0,此时SNP位点不影响表型,再假设检验结果为1,此时SNP位点与表型显著关联。进一步的,所述步骤S3构建机器学习模型通过R语言中的svm()函数进行支持向量机模型的构建。进一步的,所述R语言中svm()函数支持向量机模型的构建具体为:model.svm<

svm(x=trX,y=factor(as.character(try)),kernel="linear",scale=T),其中,model.svm为构建的机器学习模型,svm为R语言内置的支持向量机函数,x=trX代表显著值前10的SNP位点作为训练集,trX为输入的模型,y=factor(as.character(try))代表包含训练集的表型值,即具体品种输入模型,kernel="linear"代表选取"linear"模式的支持向量机,scale=T表示对变量进行缩放。有益效果:本专利技术提供一种山猪鉴定方法,首先采集山猪的特异性遗传标签组合,经全基因组测序后,通过线性混合模型进行全基因组关联分析,筛选显著值前10的SNP位点构成鉴定数据集;再利用鉴定数据集构建机器学习模型,鉴定时,提取待测肉制品的基因组DNA进行测序,并获得待测肉制品的特异性遗传标签组合中位点的基因型;将待测肉制品的SNP位点的基因型输入机器学习模型进行鉴别;输出鉴别结果。本专利技术提供的山猪鉴定方法操作简单、鉴定结果准确、价格低廉,填补了市场的空缺,有效解决了山猪品系的鉴伪问题。
具体实施方式
为使对本专利技术的目的、构造、特征、及其功能有进一步的了解,兹配合实施例详细说明如下。实施例一种山猪鉴定方法,包括以下步骤:S1:采集山猪的特异性遗传标签组合:通过线性混合模型y=μ+xb+∑
k
W
ik
U
k
+e对全基因组数据进行全基因组数据关联分析获得品种基因组数据,其中,y代表个体品种,编码为1或0,当y值为1时代表个体品种为山猪,当y值为0时代表个体品种为其他,μ是一个固定的均值项,x是SNP位点的基因型变量,一个个体的的基因型有三种,分别为AA、AC和CC,当基因型为AA时,x赋值0,当基因型为AC时,x赋值1,当基因型为CC时,x赋值2,b表示两个群体之间的等位基因频率差的函数,∑
k
W
ik
U
k
是模型中其他染色体上的所有SNP位点用来控制群体分化的项,k表示全基因组数据的所有位点,W
ik
表示SNP位点的标准化基因型变量,U
k
表示对应不同位点的效果大小,e表示残差;全基因组数据包括76个地方猪品种,1305个个体,主要来自网络下载和自测全基因组数据。通过软件gemma

0.98.5

linux

static

AMD64采取瓦尔德检验法获得显著值,瓦尔德检验法先假设检验结果为0,此时SNP位点不影响表型,再假设检验结果为1,此时SNP位点与表型显著关联。选取显著值前10的特异性遗传标签组合,也
就是显著值前10的SNP位点,显著值前10的特异性遗传标签组合如表1所示,在实际实验过程中,选取了显著值前100的SNP位点,显著值前50的SNP位点,显著值前40的SNP位点,显著值前10的SNP位点,显著值前25的SNP位点,显著值前10的SNP位点,在效果测试时发现显著值前10的SNP位点是能够达到准确鉴定结果所需的最少SNP位点数目。表1显著值前10的SNP位点信息序号染色体信息SNP位点物理距离次要等位基因主要等位基因11pig1_4384736643847366GT21pig1_4451684144516841CT31pig1_4496374844963748本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种山猪鉴定方法,其特征在于,该方法包括以下步骤:S1:采集山猪的特异性遗传标签组合;S2:特异性遗传标签组合构成鉴定数据集;S3:利用鉴定数据集构建机器学习模型;S4:提取待测肉制品的基因组DNA并进行测序;S5:获得待测肉制品的特异性遗传标签组合中位点的基因型;S6:将位点的基因型输入机器学习模型进行鉴别;S7:输出鉴别结果。2.根据权利要求1所述的一种山猪鉴定方法,其特征在于,所述步骤S1通过线性混合模型对全基因组数据进行全基因组数据关联分析获得品种基因组数据,选取显著值前10的特异性遗传标签组合。3.根据权利要求1所述的一种山猪鉴定方法,其特征在于,所述步骤S1中全基因组数据包括76个地方猪品种,1305个个体。4.根据权利要求1所述的一种山猪鉴定方法,其特征在于,所述步骤S1中线性混合模型表达式为:y=μ+xb+∑
k
W
ik
U
k
+e,其中,y代表个体品种,编码为1或0,当y值为1时代表个体品种为山猪,当y值为0时代表个体品种为其他,μ是一个固定的均值项,x是位点的基因型变量,b表示两个群体之间的等位基因频率差的函数,∑
k
W
ik
U
k
是模型中其他染色体上的所有SNP位点用来控制群体分化的项,k表示全基因组数据的所有位点,Wik表示SNP位点的标准化基因型变量,Uk表示对应不同位点的效果大小,e表示残差。5.根据权利要求2所述的一种山猪鉴定方法,其特征在于,所述显著值前10的特异性遗传标签组合包括:山猪1号染色体第43847366位位点,山猪1号染色体第44516841位位点,山猪1号染色体第44963748位位点,山猪1号染...

【专利技术属性】
技术研发人员:王振徐跃进程洪潘玉春王起山张哲
申请(专利权)人:扬州市峰豪生态农业科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1