基于SNP位点数据的系谱推断方法、装置及电子设备制造方法及图纸

技术编号:30309863 阅读:25 留言:0更新日期:2021-10-09 22:50
本发明专利技术涉及基于SNP位点数据的系谱推断方法、装置、电子设备及存储介质,该方法包括:获取待构建基因组系谱的育种群体及所述育种群体中每个个体的SNP数据;在所述育种群体中,基于每个目标子代样本与候选亲本的SNP数据,使用亲子鉴定方法,确定每个目标子代样本的目标亲本,从而推断出所述育种群体的基因组系谱。本发明专利技术通过使用SNP数据进行亲子鉴定,能够推断出育种群体的基因组系谱,从而得到育种群体的高质量的系谱记录。的高质量的系谱记录。的高质量的系谱记录。

【技术实现步骤摘要】
基于SNP位点数据的系谱推断方法、装置及电子设备


[0001]本专利技术涉及遗传学以及农业动物育种领域,特别地涉及一种基于SNP位点数据的系谱推断方法、装置、电子设备及存储介质。

技术介绍

[0002]农业动物系谱记录是群体信息的最基本材料之一,根据动物系谱确定血缘关系、进行选种留种、品种改良、保种选育等,对于生产生活有重要意义。高质量的系谱资料对于农业动物育种选择、维持群体遗传多样性、避免近亲交配等工作意义重大。
[0003]传统育种选择方法基于系谱构建亲缘关系矩阵估计个体育种价值,系谱记录的准确性极大地影响育种值估计的效果,家系组建、近交控制等工作,因此高准确性的系谱资料是育种工作的基本保障。
[0004]然而在现代化大规模养殖场种,由于规模较大、动物数目多、引种次数多以及品系较为杂乱等原因,育种现场人工系谱记录极易出现错误,这对各个方面的育种工作带来不利的影响,因此对于系谱记录进行清洗和纠错尤为重要。

技术实现思路

[0005]本专利技术的目的是提供一种基于SNP位点数据的系谱推断方法、装置、电子设备及存储介质,以解决现有技术中存在的问题。
[0006]第一方面,本专利技术提供一种基于SNP位点数据的系谱推断方法,其特征在于,包括:
[0007]获取待构建基因组系谱的育种群体及所述育种群体中每个个体的SNP数据;
[0008]在所述育种群体中,基于每个目标子代样本与候选亲本的SNP数据,使用亲子鉴定方法,确定每个目标子代样本的目标亲本,从而推断出所述育种群体的基因组系谱。
[0009]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述每个目标子代样本与候选亲本的SNP数据包括:
[0010]从所述SNP数据的所有SNP位点中随机选择的预设数目的SNP位点,所述预设数目使得所述基于SNP位点数据的系谱推断方法达到准确性要求。
[0011]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述使用亲子鉴定方法,确定每个目标子代样本的目标亲本包括:
[0012]比较目标子代样本和第一类候选亲本的预设数目的SNP位点,基于比较结果计算孟德尔错误得分,选取得分最低并且得分小于预设阈值的第一候选亲本作为第一目标亲本;
[0013]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述使用亲子鉴定方法,确定每个目标子代样本的目标亲本进一步包括:
[0014]比较所述目标子代样本、所述第一目标亲本和第二类候选亲本的预设数目的SNP位点,基于比较结果计算孟德尔错误得分,选取得分最低并且得分小于预设阈值的第二候选亲本作为第二目标亲本。
[0015]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述亲子鉴定方法包括:
[0016]比较目标子代样本和候选亲本对的预设数目的SNP位点,基于比较结果计算孟德尔错误得分,选取得分最低并且得分小于预设阈值的候选亲本对作为目标亲本。
[0017]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述育种群体中的个体根据亲缘关系分为至少两代。
[0018]根据本专利技术提供的基于SNP位点数据的系谱推断方法,所述推断出所述育种群体的基因组系谱包括根据每个个体间的亲子关系构建所述育种群体的基因组系谱。
[0019]第二方面,本专利技术提供一种基于SNP位点数据的系谱推断装置,包括:
[0020]获取模块,用于获取待构建基因组系谱的育种群体及所述育种群体中每个个体的SNP数据;
[0021]推断模块,用于在所述育种群体中,基于每个目标子代样本与候选亲本的SNP数据,使用亲子鉴定方法,确定每个目标子代样本的目标亲本,从而推断出所述育种群体的基因组系谱。
[0022]第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现根据第一方面所述基于SNP位点数据的系谱推断方法的步骤。
[0023]第四方面,本专利技术提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现根据第一方面所述基于SNP位点数据的系谱推断方法的步骤。
[0024]由上面技术方案可知,本专利技术提供的基于SNP位点数据的系谱推断方法、装置、电子设备及存储介质通过使用SNP数据进行亲子鉴定,能够推断出育种群体的基因组系谱,从而得到育种群体的高质量的系谱记录。
附图说明
[0025]图1是根据本专利技术实施例的基于SNP位点数据的系谱推断方法的流程图;
[0026]图2是根据本专利技术实施例的基于SNP位点数据的系谱推断方法的亲子鉴定方法的示意图;
[0027]图3是根据本专利技术实施例的基于SNP位点数据的系谱推断方法的另一亲子鉴定方法的示意图;
[0028]图4是根据本专利技术实施例的基于SNP位点数据的系谱推断装置的结构示意图;
[0029]图5是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0030]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]伴随着基因组学的发展,群体水平遗传标记的获取也更加简单快捷,在众多种类的遗传标记中,单核苷酸多态性(Single nucleotide polymorphisms,SNP)有数量众多,分
布广泛,遗传稳定性好等特点,已经成为最主流的遗传标记。商业化SNP芯片因其标准化程度高,准确性好,操作简便而成为早期全基因组分型的主流方法,通过商业化芯片可以获得几万至几十万个SNP遗传标记;通过高通量二代测序的方法则可以获得成百上千万的SNP标记。借用丰富的遗传标记信息矫正系谱已经成为可能,此外由于基因组选择在育种群体内的广泛应用,基因组系谱的构建可以作为副产品推广应用,无需额外的成本负担。
[0032]针对育种现场的应用需求,本专利技术的目的在于提供一种基于SNP遗传标记推断亲缘关系并构建基因组系谱矫正人工系谱的方法。
[0033]图1是根据本专利技术实施例的基于SNP位点数据的系谱推断方法的流程图,参考图1,本专利技术实施例提供的基于SNP位点数据的系谱推断方法包括如下步骤:
[0034]步骤110,获取待构建基因组系谱的育种群体及所述育种群体中每个个体的SNP数据;
[0035]步骤120,在所述育种群体中,基于每个目标子代样本与候选亲本的SNP数据,使用亲子鉴定方法,确定每个目标子代样本的目标亲本,从而推断出所述育种群体的基因组系谱。
[0036]在本专利技术实施例中,需要说明的是,所述每个目标子代样本与候选亲本的SNP数据包括:从所述SNP数据的所有SNP位点中随机选择的预设数目的SNP位点,所述预设数目使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于SNP位点数据的系谱推断方法,其特征在于,包括:获取待构建基因组系谱的育种群体及所述育种群体中每个个体的SNP数据;在所述育种群体中,基于每个目标子代样本与候选亲本的SNP数据,使用亲子鉴定方法,确定每个目标子代样本的目标亲本,从而推断出所述育种群体的基因组系谱。2.根据权利要求1所述的基于SNP位点数据的系谱推断方法,其特征在于,所述每个目标子代样本与候选亲本的SNP数据包括:从所述SNP数据的所有SNP位点中随机选择的预设数目的SNP位点,所述预设数目使得所述基于SNP位点数据的系谱推断方法达到准确性要求。3.根据权利要求2所述的基于SNP位点数据的系谱推断方法,其特征在于,所述使用亲子鉴定方法,确定每个目标子代样本的目标亲本包括:比较目标子代样本和第一类候选亲本的预设数目的SNP位点,基于比较结果计算孟德尔错误得分,选取得分最低并且得分小于预设阈值的第一候选亲本作为第一目标亲本。4.根据权利要求3所述的基于SNP位点数据的系谱推断方法,其特征在于,所述使用亲子鉴定方法,确定每个目标子代样本的目标亲本进一步包括:比较所述目标子代样本、所述第一目标亲本和第二类候选亲本的预设数目的SNP位点,基于比较结果计算孟德尔错误得分,选取得分最低并且得分小于预设阈值的第二候选亲本作为第二目标亲本。5.根据权利要求4所述的基于SNP位点数据的系谱推断方法,其特征在于,所述第一类候选亲本的数目比所述第二类...

【专利技术属性】
技术研发人员:王宇哲朱迪胡晓湘吴寒宇
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1