用于在植物育种中实施资源的方法和系统技术方案

技术编号:30349551 阅读:34 留言:0更新日期:2021-10-16 16:47
公开了用于在育种流水线中将资源分配给多个种源的示例性系统和方法。一种示例性方法包括访问包括代表多个种源的数据的数据结构,其中所述数据包括针对所述多个种源中的每一个的性状表现表达或基因型组分信息。所述示例性方法进一步包括基于与所述种源的所述性状表现表达和/或所述基因型组分相关联的概率确定资源分配,所述资源分配在所述多个种源之间分配n个资源,并且然后基于所确定的资源分配在所述育种流水线中为所述多个种源分配所述n个资源。个资源。个资源。

【技术实现步骤摘要】
【国外来华专利技术】用于在植物育种中实施资源的方法和系统
[0001]相关申请的交叉引用
[0002]本申请要求2019年3月28日提交的美国临时申请号62/825,513的权益和优先权。以上申请的全部公开内容通过引用并入本文。


[0003]本公开总体上涉及用于在植物育种中实施资源的方法和系统,并且具体地涉及用于在植物育种背景中分配资源的方法和系统,其中所述分配基于种源的表现和/或遗传分布。

技术介绍

[0004]本部分提供了与本公开相关的背景信息,其不一定是现有技术。
[0005]在植物发育中,经常通过选择性育种或遗传操作在植物中进行修饰。基于特定的选择或操作,将所得的植物材料引入育种流水线中,然后在育种流水线中产生、生长和测试植株。当植株的表现,例如对于给定表型,处于或高于预期阈值时,或处于最高表现时,或例如,在基因型的频率处于或高于特定阈值时等,可认为所述植株是要推进到进一步开发和/或商业实施的靶标植株。
附图说明
[0006]本文描述的附图仅用于所选实施方案的说明目的,而不是所有可能的实施方式,并且不旨在限制本公开的范围。
[0007]图1是适于至少部分地基于表型和/或基因型信息在植物育种流水线内分配资源的本公开的示例性系统;
[0008]图2是多个种源对的性状表现概率分布的示例性图示,所述性状表现概率分布形成图1的系统中的资源分配的基础;
[0009]图3是可以在图1的系统中使用的示例性计算设备的框图;以及
[0010]图4是适用于图1的系统的示例性方法,用于至少部分地基于表型和/或基因型信息在植物育种流水线内分配资源。
[0011]在整个附图的几个视图中,对应的附图标记指示对应的部件。
具体实施方式
[0012]现将参考附图更全面地描述示例性实施方案。本文包括的描述和具体实例仅旨在用于说明的目的,而不旨在限制本公开的范围。
[0013]在农业工业中通常采用各种育种技术来生产所需植株。对于每一种技术,以及与这些技术相关联的每一个过程,都会使用资源,无论是在产生植物材料、生长植物材料还是测试植物材料中。包括在植物育种流水线中的一些这样的资源包括但不限于土地如田地行和田地块、温室空间、基因分型实验室单位和双单倍体单位(DHU)。例如,当选择一定数量的
种源进行双单倍体(DH)过程时,该过程的能力(由运行该过程所需的任何田地、实验室、人力、金钱等或其他资源决定)可分成单个单元(在这种情况下为DHU),然后在所选种源之间均匀分布。例如,在选择200个种源并且1,000个DHU可用的情况下,如果DHU资源在它们之间划分,则每个种源被分配5个DHU。然而,这种均匀分布没有考虑不同种源的潜在值或不同种源内潜在遗传/表型变异的任何变化。
[0014]独特地,本文的方法和系统基于种源的一个或多个表型和/或基因型特征在育种流水线内分配资源。具体地,决策引擎采用算法,所述算法考虑了种源的性状表现的概率(例如,表达为二项式分布等),以及与所选种源的队列相关联的风险和/或基因型组分和/或多样性。还可以通过模拟遗传/表型变异来预测给定种源的潜在值的变化。通过此算法,用于育种过程的可用资源在种源之间分配,更多的资源专用于以下种源:这些种源具有更高的产生表现高于一个或多个阈值的后代的可能性和/或更高的产生以认为适合和/或期望用于育种流水线的比率表达某些遗传组分的后代的可能性。以这种方式,通过更有效地分配资源来改进育种流水线(作为本文的方法和系统的实际应用),以产生高表现和/或遗传上更适合的后代。
[0015]因此,后代通常是来自相同物种(即种源)的一个或多个亲本生物体之间杂交的生物体。后代可指例如,来自特定育种程序的所有可能后代的集合、特定于一个或多个种源的所有可能后代的子集、来自给定世代中一个种源的所有后代、来自一种源的某些后代等。此外,如本文所用,术语“种源”是指后代的亲本的集合,并且因此在适用时解释为单数或复数。表型数据、性状分布、原种、遗传序列、商业成功和关于后代的附加信息是已知的或可被模拟并可存储在本文所述的存储器中。
[0016]如本文所用,“表型数据”包括但不限于关于给定后代(例如一株植株等)或后代群体(例如一组植株等)的表型的信息。表型数据可以包括后代的大小和/或饱满度(heartiness)(例如,植株高度、茎围、茎强度等)、产量、成熟时间、对生物胁迫的抗性(例如,疾病或害虫抗性等)、对非生物胁迫的抗性(例如,干旱或盐度抗性等)、生长气候或任何另外的表型和/或其组合。
[0017]应当理解,本文的方法和系统通常涉及与一个或多个种源、后代等相关联的表型数据和相关的表型方差。也就是说,应当理解,在一个或多个示例性实施方式中,可以使用基因型数据以代替、结合或组合本文所述的表型数据(或以其他方式)(例如,以进一步补充表型数据和/或进一步通知本文的模型、算法和/或预测等),以帮助选择后代组和/或鉴定符合本文描述的后代集合。这可以采取使用算法的形式,例如,以从与给定杂交相关联的已知或模拟基因型数据预测所述杂交的表型值和/或方差。
[0018]图1示出了用于至少部分地基于已知或模拟的表型和/或基因型信息在植物育种流水线内分配资源的示例性系统100,并且在所述系统中可以实施本公开的一个或多个方面。尽管在所描述的实施方案中,系统100的各部分以一种布置呈现,但其他实施方案可包括以其他方式布置的相同或不同部分,这取决于(例如)用于分配给后代的可用资源、种源的数量、种源的特定类型、后代的特定类型、感兴趣的基因型和/或感兴趣的表型等。
[0019]如图1所示,系统100通常包括育种流水线102,其被提供来推进种源、后代等通过测试和选择,至进一步开发和/或商业用途。通常,育种流水线102限定金字塔形进程,其中输入大量潜在种源,然后将其连续减少(例如,向下选择等)至优选或期望数量的种源、后代
或植株。虽然育种流水线102被配置来在其中分配资源,如本文提供的,但是育种流水线102可以被配置来采用一种或多种其他技术,这些技术可以包括本领域已知的多种方法来在育种流水线102内产生、选择或推进种源或后代,这通常取决于为其提供育种流水线102的特定植物和/或生物体。
[0020]在某些育种流水线实施方案(例如,大型工业育种流水线等)中,测试、选择和/或推进决策可以针对在多个阶段中和在若干年中的若干位置处的成百上千或更多的种源、后代等,以得到一组减少的种源、后代等,然后将其选择用于商业产品开发。简而言之,所说明的育种流水线102通过包括在其中的测试、选择等被配置来将大量的种源、后代等减少到相对少量的表现优异的商业产品。
[0021]在此示例性实施方案中,育种流水线102可以参考玉米或玉蜀黍及其性状和/或特征进行描述并大体针对玉米或玉蜀黍及其性状和/或特征。然而,应当理解的是,文中公开的系统和方法不限于玉米并且可以用于与其他植物相关的植物育种流水线/程序中,例如以改良任何水果、蔬菜、草、树或观赏作物,包括但不限于玉蜀黍(Zea 本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在育种流水线中将资源分配到多个种源的计算机实现的方法,所述方法包括:对于多个种源,访问包括代表所述多个种源的数据的数据结构,所述数据包括针对所述多个种源中的每一个的性状表现表达和/或基因型组分;由至少一个计算设备基于与所述种源的所述性状表现表达和/或基因型组分相关联的概率确定资源分配,所述资源分配在所述多个种源之间分配n个资源,定义如下:其中n是可用资源的整数数量;η是育种值的靶标阈值;θ
i
是特定种源的育种值的变量或其向量;P
i
是发现特定种源的育种值或其向量大于某个阈值的概率;U
i
是特定种源的遗传学习的置信水平;ξ是育种目标的靶标组合;并且x
i
是分配给所述特定种源的资源的整数决策变量;以及基于所确定的资源分配,在育种流水线中为所述多个种源物理地分配所述n个资源。2.如权利要求1所述的方法,其中在所述资源分配中将所述n个资源中的至少一个分配给所述多个种源中的每一个;并且其中在所述资源分配中将所述n个资源中的每一个分配给所述多个种源中的一个。3.如权利要求1所述的方法,其中针对雄性和雌性杂种优势库保持分开的杂交作物确定所述资源分配包括确定所述资源分配,进一步满足以下条件:M
T
y≥mα
M
,F
T
y≥mα
F
,以及α
M

F
≤1;其中M是雄性关联向量;α
M
是被指定专用于雄性杂交的m个种源的最小分数;F是雌性关联向量;并且α
F
是被指定专用于雌性杂交的m个种源的最小分数;由此,所述n个资源能够被适当地分配给每个杂种优势库,而不会超过最大m个种源。4.如权利要求1所述的方法,其中在所述资源分配中将所述n个资源中的至少一个分配给所述多个种源中的每一个;并且其中在所述资源分配中将所述n个资源中的每一个分配给所述多个种源中的一个。5.如权利要求4所述的方法,其中针对雄性和雌性杂种优势库保持分开的杂交作物确定所述资源分配包括确定所述资源分配,进一步满足以下条件:M
T
y≥mα
M
,F
T
y≥mα
F
,以及α
M

F
≤1;其中M是雄性关联向量;α
M
是被指定专用于雄性杂交的m个种源的最小分数;F是雌性关联向量;并且α
F
是被指定专用于雌性杂交的m个种源的最小分数;由此,所述n个资源能够被适当地分配给每个杂种优势库,而不会超过最大m个种源。
6.如权利要求1所述的方法,其中确定所述资源分配包括基于预定义的靶标组合确定所述资源分配,由此基于所述资源分配与所述预定义的靶标组合的偏差来减小每个潜在资源分配的相对值。7.如权利要求1所述的方法,其中确定所述资源分配进一步包括基于所述多个种源中的每一个的所述性状表现表达和/或基因型组分的置信度来确定所述资源分配。8.如权利要求1所述的方法,其中在所述育种流水线中物理地分配所述n个资源包括基于所述多个种源中的至少一个和来自所述多个种源的至少一个后代来在符合所确定的资源分配的生长空间中种植至少一种植物产品。9.一种用于在育种流水线中分配资源的系统,所述系统包括:包括代表多个所选种源的数据的数据结构,所述数据包括针对所述多个所选种源中的每一个的性状表现表达和/或基因型组分;以及计算设备,其与所述数据结构通信耦合并且被配置来:访问所述数据结构中针对所述多个所选种源中的每一个的数据;以及基于与所述种源的所述性状表现表达和/或所述基因型组分相关联的概率确定资源分配,所述资源分配在所述多个所选种源之间分配n个资源,其中n是整数。10.如权利要求9所述的系统,其中在所述资源分配中将所述n个资源中的至少一个分配给所述多个种源中的每一个;并且其中在所述资源分配中将所述n个资源中的每一个分配给所述多个种源中的一个。11.如权利要求9所述的系统,其中所述计算设备被配置来基于每个潜在分配的所述值的减少和/或最小化来确定所述资源分配,其中每个潜在分配的所述值被定义为:其中n是可用资源的整数数量;η是育种值的靶标阈值;θ
i
是特定种源的育种值的变量或其向量;P
i
是发现特定种源的育种值或其向量大于某个阈值的概率;U
i
是特定种源的遗传学习的置信水平;ξ是育种目标的靶标组合;并且x
i
是分配给所述特定种源的资源的整数决策变量。12.如权利要求9所述的系统,其中所述计算设备被配置来确定进一步符合以下条件的所述资源分配:1
T
x=n;1
T
y=m;M
T
y≥mα
M
;F
T
y≥mα
F
;I
P
y≤mα
p

【专利技术属性】
技术研发人员:S
申请(专利权)人:孟山都技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1