用于识别供植物育种使用的子代的方法和系统技术方案

技术编号:25052857 阅读:47 留言:0更新日期:2020-07-29 05:40
公开了用于识别供植物育种使用的子代的示例性方法。一种示例性的由计算机实现的方法包括访问包括代表子代池的数据的数据结构;以及基于所述数据结构中包括的所述数据确定所述子代池的至少一部分的预测得分。所述预测得分指示基于历史数据选择子代的概率。所述方法还包括基于所述预测得分从所述子代池中选择子代群;基于所述子代群的预期表现和与子代集合、所述子代池和/或所述子代群相关联的至少一个因素中的至少一者,从所述子代群中识别所述子代集合,以及使所述子代集合进入育种流水线的验证阶段。

【技术实现步骤摘要】
【国外来华专利技术】用于识别供植物育种使用的子代的方法和系统相关申请的交叉引用本申请要求2017年12月10日提交的美国临时申请No.62/596,905的权益和优先权。上述申请的完整公开内容以引用方式并入本文。
本公开总体上涉及用于供在植物育种中使用的方法和系统,并且具体地涉及用于基于预测框架和/或优化框架从潜在子代池中识别子代集合,并用所识别的子代集合填充育种流水线的方法和系统。
技术介绍
本部分提供与本公开相关的背景信息,该背景信息不一定是现有技术。在植物发育中,通过选择育种或遗传操纵对植物进行修饰。当实现理想的改进时,通过种植来自植物中选定植物的种子并收获若干代中所产生的种子来开发商业量。在整个该过程中,许多决定是基于正在进行育种的植物的特性和/或性状,并且类似地基于子代的特性和/或性状做出的,所述特性和/或性状不能保证继承或表现出子代的亲本和/或祖先的期望性状。传统上,作为选择特定植物以用于进一步发育的一部分,从植物和/或它们产生的种子中取得样本并进行测试,从而使具有所需特性和/或性状的植物得到推进。与此相关,植物发育涉及大量可能的杂交,从而产生大量潜在的子代,必须从所述大量潜在的子代中做出最终育种决策和/或选择商业产品。附图说明本文所述的附图仅出于说明选定实施方案,而非所有可能实施方式的目的,并且并非旨在限制本公开的范围。图1示出了本公开的示例性系统,该示例性系统适合于从潜在子代池中识别出子代集合以实现育种流水线中的推进;图2是可以在图1的示例性系统中使用的计算设备的框图;图3是适合与图1的系统一起使用以从潜在子代池中识别子代集合的示例性方法;图4是被组合以提供一系列子代的示例性起源集合的图形表示,从该一系列子代中可以通过图3的方法选择某些子代;图5是预测得分、表型性状和将植物产品推进至进一步育种的历史决策之间的相互信息的图形表示;并且图6示出了与包括在例如结合图3的方法所指示或识别的杂种群中的杂种的多个性状相关联的示例性风险曲线。在附图的若干视图中,对应的附图标记表示对应的部分。具体实施方式现在将参考附图更全面地描述示例性实施方案。本文所包括的描述和具体示例仅旨在用于说明目的,而不旨在限制本公开的范围。各种育种技术通常用于农业中以产生所需的子代。通常,育种程序实施此类技术以获得具有所需特性或特性和/或性状(例如,产量、茎秆强度、抗病性等)的组合的子代。然而,当从此类程序中选择子代集合时,很难准确地确定最佳子代,特别是当有大量选项可用时。例如,如果育种者给出N个数目的起源,并从每个起源创建n个数目的子代,则子代的总数目变成N×n,其中目标可以是选择r个数目的子代以用于育种流水线。因此,假设和/或考虑到与子代有关的某些表型数据,例如产量、高度、稳定性或与其他植物有关的其他数据(诸如遗传数据),可以评估子代中的每个子代,从而可以存在多达个不同的子代集合,这些不同的子代集合可以折减为个。在潜在现实世界示例的情况下,其中N=100,n=10并且r=100,复杂度被量化为10100。如从该示例可以看出的,子代的选择会导致相当大的复杂度,尤其是在需要和/或希望考虑性状分布和/或遗传多样性时。独特地,本文的方法和系统允许从子代池中识别子代集合,以将该子代集合包括在育种流水线中。具体地,最初例如基于子代中的每个子代的预测得分将子代池折减为子代群,该预测得分表示基于子代的以往选择(例如,基于表型数据等)和/或与子代相关的可用相关数据的子代的成功。然后,对于子代群(如经最初折减的),采用选择算法来识别要在育种管道中推进的子代集合。因此,以比常规已知技术更有效和更全面的方式解决了与要在育种流水线中推进的子代的识别相关的复杂度。因此,可以识别出最佳的子代集合,从而最终的最佳集合平衡了子代的预期性能和子代之间的遗传多样性。子代通常是源自相同物种的一种或多种亲本生物的生物。子代可指例如来自特定育种程序的各种所有可能子代、所有可能子代的子集,或表现出一种或多种不同表型的植物的后代等。子代还可包括来自给定代中的某一品系和/或某一杂交的所有后代、来自某一杂交的某些后代,或单独植物等。如本文所用,术语“起源”是指子代的一个或多个亲本,并且因此在适用时被解释为单数或复数。起源的表型数据、性状分布、祖先、遗传序列、商业成功和附加信息通常是已知的,并且可以存储在本文所述的存储器中。遗传的遗传学表明了要传代给子代的亲本的性状。并且突变、基因重组和/或定向遗传修饰可能相对于起源改变子代的基因型和所产生的表型。如本文所使用的“表型数据”包括但不限于关于给定子代(例如,植物等)或子代群体(例如,植物群等)的表型的信息。表型数据可包括子代的大小和/或活力(heartiness)(例如,株高、茎杆周长、茎杆强度等)、产量、成熟时间、对生物胁迫的抗性(例如,抗病性或抗虫性等)、对非生物胁迫的抗性(例如,耐干旱性或耐盐碱性等)、生长气候或任何附加表型,和/或它们的组合。应当理解的是,本文的方法和系统通常涉及与一个或多个子代、杂交、品系等相关的表型数据。这就是说,应当理解的是,在一个或多个示例性实施方式中,基因型数据可以与本文所述的表型数据结合或组合(或以其他方式)使用(例如,以进一步补充表型数据和/或进一步通知本文的模型、算法和/或预测等),以帮助选择子代群和/或识别与本文描述一致的子代集合。图1示出了用于选择子代的示例性系统100,在所述示例性系统100可以实现本公开的一个或多个方面。尽管在所描述的实施方案中,系统100的各部分以一种布置呈现,但是其他实施方案可包括例如取决于子代的特定特性和/或感兴趣的性状、子代的特定遗传多样性、植物的特定类型和/或感兴趣的子代等以其他方式布置的相同或不同部分。如图1所示,系统100通常包括育种流水线102,提供该育种流水线102以从子代池中选择子代集合来朝向商业产品开发推进。育种流水线102通常限定锥体级数,由此其以大量潜在子代开始,并随后成功地将潜在子代的数目缩小(例如,折减)至优选的和/或期望的子代。虽然育种流水线102被配置为采用本文提供的选择,但是育种流水线102可被配置为采用一种或多种其他技术,该一种或多种其他技术通常包括本领域已知的多种方法,这往往取决于提供育种流水线102所针对的特定植物和/或生物。在某些育种流水线实施方案(例如,大型工业育种流水线等)中,可以在几年中在多个阶段和几个地点针对数百个、数千个或更多的起源、子代等进行测试、选择和/或推进,以得出折减的起源集合、子代等,然后选择所述折减的起源集合、子代进行商业产品开发。简而言之,育种流水线102被配置为通过包括在其中的测试、选择等来将大量的起源、子代等折减成相对较少数目的表现优异的商业产品。在该示例性实施方案中,参考并且通常针对玉米或玉蜀黍及其性状和/或特性来描述育种流水线102。然而,应当理解的是,本文公开的系统和方法不限于玉米,并且可以用于与其他植物有关的植物育种流水线/程序中,例如以改善任本文档来自技高网...

【技术保护点】
1.一种用于识别供植物育种流水线使用的子代的方法,所述方法包括:/n访问包括代表子代池的数据的数据结构;/n由至少一个计算设备基于所述数据结构中包括的所述数据确定所述子代池的至少一部分的预测得分,所述预测得分指示基于历史数据选择子代的概率;/n由所述至少一个计算设备基于所述预测得分从所述子代池中选择子代群;/n由所述至少一个计算设备基于以下中的至少一者从所述子代群中识别出子代集合:所述子代集合的预期表现和与所述子代集合、所述子代池和/或所述子代群相关联的至少一个因素;以及/n使所述子代集合进入育种流水线的测试和培养阶段和/或进入所述育种流水线的验证阶段。/n

【技术特征摘要】
【国外来华专利技术】20171210 US 62/596,9051.一种用于识别供植物育种流水线使用的子代的方法,所述方法包括:
访问包括代表子代池的数据的数据结构;
由至少一个计算设备基于所述数据结构中包括的所述数据确定所述子代池的至少一部分的预测得分,所述预测得分指示基于历史数据选择子代的概率;
由所述至少一个计算设备基于所述预测得分从所述子代池中选择子代群;
由所述至少一个计算设备基于以下中的至少一者从所述子代群中识别出子代集合:所述子代集合的预期表现和与所述子代集合、所述子代池和/或所述子代群相关联的至少一个因素;以及
使所述子代集合进入育种流水线的测试和培养阶段和/或进入所述育种流水线的验证阶段。


2.如权利要求1所述的方法,所述方法还包括由所述至少一个计算设备基于所述数据结构中包括的历史表型数据生成预测模型,所述历史表型数据与同所述子代池的植物类型一致的类型的植物材料相关联;并且
其中确定所述预测得分包括基于所述预测模型确定所述预测得分。


3.如权利要求1所述的方法,其中所述至少一个因素包括以下中的一者或多者:所述子代集合的风险、遗传多样性、一种或多种性状、基础起源的成功概率、基础谱系的成功概率、杂种优势群的成功概率、一种或多种性状型态、市场分割、生产成本和性状整合。


4.如权利要求1所述的方法,其中所述数据包括代表所述子代池的表型数据;并且
其中选择所述子代群包括当选定的子代的预测得分满足一个或多个阈值时从所述池中选择一个或多个子代。


5.如权利要求1所述的方法,其中识别所述子代集合是基于以下集合识别算法:





6.如权利要求5所述的方法,其中所述集合识别算法受于以下算法中的至少一者约束:




和/或





7.如权利要求6所述的方法,其中所述集合识别算法受以下算法中的至少一者约束:




和/或





8.如权利要求1所述的方法,其中使所述子代集合进入育种流水线的测试和培养阶段包括在所述育种流水线的生长空间中包括一株或多株植物,所述一株或多株植物来源于所述识别的子代集合。


9.一种用于识别供植物育种使用的子代的系统,所述系统包括:
数据结构,所述数据结构包括与子代池有关的表型数据,所述子代中的每个子代基于一个或多个起源;以及
计算设备,所述计算设备与所述数据结构通信耦合并且被配置为:
访问所述数据结构中与所述子代池有关的所述表型数据;
基于所述访问的表型数据确定所述子代池中的所述子代中的每个子代的预测得分,所述预测得分指示基于与所述子代池相关联的历史数据选择所述子代的概率;
基于所述子代池中的所述子代中的每个子代的所述预测得分,从所述子代池中选择子代群;
基于以下中的至少两者,从所述子代群中识别子代集合:所述子代的预期表现、与所述子代集合相关联的风险,以及所述子代集合相对于至少一种期望型态的偏差;以及
使所述子代集合进入种植和/或测试的验证阶段和/或进入育种流水线的验证阶段以实现商业化。


10.如权利要求9所述的系统,其中所述计算设备还被配置为基于以下算法识别所述子代集合:





11.如权利要求9所述的系统,所述系统还包括所述育种流水线,所述育种流水线与所述计算设备通信耦合,所述育种流水线包括所述培养和测试阶段和所述验证阶段;
其中所述计算设备被配置为收集包括在所...

【专利技术属性】
技术研发人员:S·P·K·查瓦利S·达斯古普塔M·加达里哈A·P·科瓦克斯N·波拉瓦拉普王梓
申请(专利权)人:孟山都技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1