The present invention relates to the field of biotechnology, in particular discloses a biological information for breeding system and its algorithm based on the integration of genomic selection in individual linkage disequilibrium and linkage analysis of the relationship between information, more comprehensive and effective use of genomic data of individual information and channel pedigree information, can better play the genomic selection in agriculture breeding field advantage, prediction of whole genome breeding groups of individual value and accurate candidate indicators predictive value as a whole genome breeding and calculated the correlation coefficient between the individual and the true breeding value of simulation data, can accurately predict the specificity in addition to achieve efficient breeding method provided by the invention also helps to detect and determine with some specific traits related genes function, help to achieve specific breeding.
【技术实现步骤摘要】
基于生物信息的选育良种系统及其算法
本专利技术涉及生物
,具体涉及了一种基于生物信息的选育良种系统及其算法。
技术介绍
在农业生物(作物、畜禽和水产生物)的产业链中,良种选育占有至关重要的地位。传统的育种方法大多基于遗传统计原理并结合生产实际,利用候选个体本身和(或)亲属的性状记录估计得到其育种值,并利用育种值为指标通过进行多世代的人工选育以实现品种培育和性状改良。然而这种方法往往存在着育种周期长,人力物力消耗大等缺点。如法国的“大约克”种猪就花了三十多年时间才选育成功。在乳牛育种领域通过传统后裔测定方式验证一头候选种公牛需要5-6年时间,大约投入5万美元。基于候选个体的遗传性状由其所携带的基因来决定的原理,通过利用候选个体的基因信息在基因层面来直接评估而非仅仅利用系谱信息和记录性状的表型数据来考量候选个体的遗传性状的优劣,将能够大大缩短育种时间及成本投入。利用候选个体的基因信息的育种方法主要包括两种。第一种方法称为标记辅助选择(MarkerAssistedSelection,MAS)方法,其试图通过部分基因组信息,即确定控制表型性状的基因信息来实现对目标性状的选择。该方法被有效利用的前提条件是与控制表型性状的基因相关的数量性状位点(QTL)能够确定并被精确定位。然而在实际育种应用中,决定某一经济性状的往往有很多基因,而每个基因的效应都不明显,从而造成QTL检测和定位的困难。即便存在有对经济性状贡献较大的主效基因,在构成表型性状的所有遗传变异中应用于MAS的遗传标记只能捕获主效基因所带来的那部分变异,而小效应累加起来所带来的变异却被忽视了。所以MAS ...
【技术保护点】
一种基于生物信息的选育良种系统,其特征在于,具体实施步骤如下:一、采用全基因组选择方法,首先获取参考群体和候选群体个体的基因组数据,其中,采用SNP遗传标记来获取基因型数据;二、获取系谱文件并进行预处理,向上追溯父母系谱信息至少5代及以上,系谱文件需要包含个体编号、父亲编号和母亲编号至少三段信息,在系谱文件中筛选具有基因型数据的基因分型个体,向上追溯父母系谱信息至少5代及以上以获得GA系谱;通过基因分型个体的基因型数据信息对系谱文件中父母及后代亲缘关系进行亲子鉴定以核查GA系谱文件,当根据基因型数据获得的亲子鉴定结果与原始GA系谱文件所显示的亲子关系不一致时,应以基因型数据获得的亲子鉴定结果为基准重新编排原始GA系谱文件;三、在完成基因型数据的预处理并得到了GA系谱文件后,通过LDMIP方法来完成,具体的LDMIP方法,如下:A、GA系谱中未基因分型的祖先个体,推知其基因型数据;B、根据基因型数据和GA系谱信息,计算个体等位基因从父母处遗传的遗传几率;C、通过LDMIP程序的计算结果可以建立起GA系谱中参考群体和候选群体之间的LDLA关系矩阵,这一关系矩阵既包括参考群体和候选群体之间基 ...
【技术特征摘要】
1.一种基于生物信息的选育良种系统,其特征在于,具体实施步骤如下:一、采用全基因组选择方法,首先获取参考群体和候选群体个体的基因组数据,其中,采用SNP遗传标记来获取基因型数据;二、获取系谱文件并进行预处理,向上追溯父母系谱信息至少5代及以上,系谱文件需要包含个体编号、父亲编号和母亲编号至少三段信息,在系谱文件中筛选具有基因型数据的基因分型个体,向上追溯父母系谱信息至少5代及以上以获得GA系谱;通过基因分型个体的基因型数据信息对系谱文件中父母及后代亲缘关系进行亲子鉴定以核查GA系谱文件,当根据基因型数据获得的亲子鉴定结果与原始GA系谱文件所显示的亲子关系不一致时,应以基因型数据获得的亲子鉴定结果为基准重新编排原始GA系谱文件;三、在完成基因型数据的预处理并得到了GA系谱文件后,通过LDMIP方法来完成,具体的LDMIP方法,如下:A、GA系谱中未基因分型的祖先个体,推知其基因型数据;B、根据基因型数据和GA系谱信息,计算个体等位基因从父母处遗传的遗传几率;C、通过LDMIP程序的计算结果可以建立起GA系谱中参考群体和候选群体之间的LDLA关系矩阵,这一关系矩阵既包括参考群体和候选群体之间基于基因型信息的个体亲缘关系,又包括参考群体和候选群体之间基于系谱信息的血缘关系,得到LDLA关系矩阵之后,对其求逆,然后通过混合模型方程组求解候选群体个体的全基因组育种值;D、同时利用个体等位基因从父母处遗传的遗传几率计算可以示踪等位基因在系谱中世代传递信息,如可以用于检测和确定与疾病相关的功能基因,有助于选育抗病能力强的个体。2.根据权利要求1所述的一种基于生物信息的选育良种系统,其特征在于,采用SNP遗传标记来获取基因型数据具体方式如下:通过SNP芯片获取参考群体和候选群体的基因型数据并进行预处理,首先基因分型个体的基因型数据如有缺失,对所缺失的基因型予以填充;然后通过SNP标记检出率、最小等位基因频率、Hardy-Weinberg平衡检验、个体检出率等参数优化数据质量。3.权利要求1所述的一种基于生物信息的选育良种系统的算法,其特征在于,对于基因型数据的每个S...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。