用于感官特性预测的机器学习模型制造技术

技术编号:38664300 阅读:7 留言:0更新日期:2023-09-02 22:45
公开了一种用于预测分子是否将是良好的驱蚊剂的计算机实现的方法。该方法包括获得通过转移学习获得的机器学习预测模型。该模型已使用用于气味预测任务的第一更大的训练数据集训练并且用第二更小的训练数据集训练来预测分子是否将作为驱蚊剂起作用。该方法还包括:获得描述所选分子的化学结构的输入数据,提供描述所选分子的化学结构的输入数据作为机器学习预测模型的输入,接收描述所选分子是否将是良好的驱蚊剂的预测数据作为机器学习感官预测模型的输出,以及提供预测数据作为输出。出。出。

【技术实现步骤摘要】
【国外来华专利技术】用于感官特性预测的机器学习模型
[0001]相关申请
[0002]本申请要求2020年11月13日提交的美国临时专利申请号63/113,256的优先权和权益。美国临时专利申请号63/113,256据此全文以引用方式并入本文。


[0003]本公开总体上涉及用于感官特性预测的机器学习模型。更具体地,本公开涉及首先针对第一感官预测任务进行训练并用来针对第二感官预测任务进行预测的机器学习模型。

技术介绍

[0004]分子的结构与其嗅觉感知特性(例如,分子的感知气味)之间的关系是复杂的,并且迄今为止,关于此类关系通常知之甚少。例如,香料和芳香剂工业通常依赖于试错法、启发法和/或开采天然产品来提供具有期望感官特性(例如,嗅觉特性)的商业上有用的产品。通常缺乏用于组织嗅觉环境的有意义的原理,尽管已知分子结构与气味之间的映射可以是非常非线性的,使得分子的小变化可导致嗅觉质量的大变化。另外,相反的情况也可能如此,其中不同的分子家族可表现出类似的嗅觉特征。

技术实现思路

[0005]本公开的实施方案的方面和优点将在以下描述中部分地阐述,或者可从描述获知,或者可通过实践实施方案来获知。
[0006]本公开的一个示例性方面涉及一种用于训练感官预测模型的计算机实现的方法,该感官预测模型用于针对具有用于第二感官预测任务的有限可用训练数据的预测任务预测感官特性。该方法可包括通过包括一个或多个计算装置的计算系统获得包括与第一感官预测任务相关联的第一训练数据的第一感官预测任务训练数据集,第一训练数据包括用与第一感官预测任务相关联的第一感官特性标记的分子结构数据。该方法可包括通过计算系统至少部分地基于第一感官预测任务训练数据集来训练机器学习感官预测模型,以预测与第一感官预测任务相关联的第一感官特性。该方法可包括通过计算系统获得包括与第二感官预测任务相关联的第二训练数据的第二感官预测任务训练数据集,第二训练数据包括用与第二感官预测任务相关联的第二感官特性标记的分子结构数据,其中第一感官预测任务训练数据集的数据项数量大于第二感官预测任务训练数据集的数据项数量。该方法可包括通过计算系统至少部分地基于第二感官预测任务训练数据集来训练机器学习感官预测模型,以预测与第二感官预测任务相关联的第二感官特性。
[0007]本公开的另一个示例性方面涉及一种用于针对具有有限可用训练数据的预测任务预测感官特性的计算机实现的方法。该方法可包括通过一个或多个计算装置获得被训练成至少部分地基于与分子相关联的化学结构数据来预测分子的感官特性的机器学习感官预测模型,其中使用用于第一感官预测任务的第一感官预测任务训练数据集来训练机器学
习感官预测模型。该方法可包括通过一个或多个计算装置获得描述所选分子的化学结构的输入数据。该方法可包括通过一个或多个计算装置将描述所选分子的化学结构的输入数据作为输入提供给机器学习感官预测模型。该方法可包括通过一个或多个计算装置接收描述所选分子的与第二感官预测任务相关联的一个或多个第二感官特性的预测数据作为机器学习感官预测模型的输出。该方法可包括通过一个或多个计算装置提供描述所选分子的一个或多个第二感官特性的预测数据作为输出。
[0008]本公开的另一个示例性方面涉及一种或多种非暂时性计算机可读介质,其包括感官嵌入,该感官嵌入被生成作为来自机器学习嵌入模型的输出,其中使用用于第一感官预测任务的第一感官预测任务训练数据集和用于第二感官预测任务的第二感官预测任务训练数据集来训练机器学习嵌入模型,其中第一感官预测任务训练数据集的数据项数量大于第二感官预测任务训练数据集的数据项数量。
[0009]本公开的另一个示例性方面涉及一种具有至少部分地基于感官嵌入而设计以表现出一个或多个期望感官特性的分子结构的物质组合物,该感官嵌入响应于接收到描述分子结构的输入数据而被生成作为机器学习嵌入模型的输出,其中机器学习嵌入模型使用用于第一感官预测任务的第一感官预测任务训练数据集来训练并且该嵌入用于第二感官预测任务。
[0010]本公开的其他方面涉及各种系统、设备、非暂时性计算机可读介质、用户界面和电子装置。
[0011]参考以下描述和所附权利要求,将更好地理解本公开的各种实施方案的这些及其他特征、方面和优点。结合在本说明书中并构成本说明书一部分的附图示出了本公开的示例性实施方案,并与描述一起用于解释相关原理。
附图说明
[0012]在参考附图的具体实施方式中阐述了针对本领域普通技术人员的实施方案的详细讨论,在附图中:
[0013]图1A描绘了根据本公开的示例性实施方案的示例性计算系统的框图。
[0014]图1B描绘了根据本公开的示例性实施方案的示例性计算装置的框图。
[0015]图1C描绘了根据本公开的示例性实施方案的示例性计算装置的框图。
[0016]图2描绘了根据本公开的示例性实施方案的示例性预测模型的框图。
[0017]图3描绘了根据本公开的示例性实施方案的示例性预测模型的框图。
[0018]图4描绘了根据本公开的示例性实施方案的用于针对具有有限可用训练数据的预测任务预测感官特性的示例性方法的流程图。
[0019]图5描绘了根据本公开的示例性实施方案的用于训练针对具有有限可用训练数据的预测任务预测感官特性的感官预测模型的示例性方法的流程图。
[0020]图6描绘了根据本公开的示例性实施方案的用于可视化与所预测感官特性(例如,嗅觉特性)相关联的结构贡献的示例性图示。
[0021]图7示出了根据本公开的示例性实施方案的示例性模型示意图和数据流。
[0022]图8A示出了根据本公开的示例性实施方案的示例性学习的嵌入空间的全局结构。
[0023]图8B示出了根据本公开的示例性实施方案的示例性学习的嵌入空间的全局结构。
[0024]在多个附图中重复的附图标号旨在标识各种具体实施方式中的相同特性。
具体实施方式
[0025]本公开的示例性方面涉及包括或以其他方式利用机器学习模型(例如,图形神经网络)结合分子化学结构数据来预测分子的一个或多个感官和/或感知(例如,嗅觉、味觉、触觉等)特性的系统和方法。具体地,本公开的系统和方法可包括基于分子的化学结构针对第一感官预测任务进行训练的模型(例如,嵌入模型)。该模型的至少一部分可随后用于不同于第一感官预测任务的第二感官预测任务。在一些实施方式中,第二感官预测任务可与第一感官预测任务显著不同,如例如诸涉及与第一感官预测任务不同物种、不同感觉、不同应用等的感官预测任务。例如,第一感官任务可以是比第二感官任务有更大量可用训练数据的感官任务。例如,第一感官任务可以是与人类感知(例如,人类嗅觉)相关的感官任务,并且第二感官任务可以是与非人类物种的感知相关的感官任务。例如,人类感觉比其他物种的感觉可获得更大量训练数据。然而,出乎意料的是,许多感官预测任务表现出与看上去无关或不同的感官预测任务的很大的可转移性。
[0026]更具体地,分子的结构与其嗅觉和/或其他感官(例如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练感官预测模型的计算机实现的方法,所述感官预测模型用于针对具有用于第二感官预测任务的有限可用训练数据的预测任务预测感官特性,所述计算机实现的方法包括:通过包括一个或多个计算装置的计算系统获得包括与第一感官预测任务相关联的第一训练数据的第一感官预测任务训练数据集,所述第一训练数据包括用与所述第一感官预测任务相关联的第一感官特性标记的分子结构数据;通过所述计算系统至少部分地基于所述第一感官预测任务训练数据集来训练机器学习感官预测模型,以预测与所述第一感官预测任务相关联的所述第一感官特性;通过所述计算系统获得包括与第二感官预测任务相关联的第二训练数据的第二感官预测任务训练数据集,所述第二训练数据包括用与所述第二感官预测任务相关联的第二感官特性标记的分子结构数据,其中所述第一感官预测任务训练数据集的数据项数量大于所述第二感官预测任务训练数据集的数据项数量;以及通过所述计算系统至少部分地基于所述第二感官预测任务训练数据集来训练所述机器学习感官预测模型,以预测与所述第二感官预测任务相关联的所述第二感官特性。2.如权利要求1所述的方法,其中所述机器学习感官预测模型包括感官嵌入模型,其中至少部分地基于所述第一感官预测任务训练数据集来训练所述机器学习感官预测模型包括至少部分地基于所述第一感官预测任务训练数据集用第一预测任务模型来训练所述感官嵌入模型,并且其中至少部分地基于所述第二感官预测任务训练数据集来训练所述机器学习感官预测模型包括至少部分地基于所述第二感官预测任务训练数据集用第二预测任务模型来训练所述感官嵌入模型。3.如权利要求2所述的方法,其中所述感官嵌入模型被配置为产生感官嵌入,并且其中所述第一感官预测任务模型和所述第二感官预测任务模型被配置为接收所述感官嵌入作为输入。4.如任一前述权利要求所述的方法,其中所述第一训练数据或所述第二训练数据中的至少一者包括多个示例性化学结构,每个示例性化学结构用描述所述示例性化学结构的感官特性的一个或多个感官特性标签来标记。5.如任一前述权利要求所述的方法,其中所述第一预测任务与第一物种相关联,并且其中所述第二预测任务与第二物种相关联,所述第二物种不同于所述第一物种。6.如任一前述权利要求所述的方法,其中所述第一感官预测任务训练数据集包括人类感知数据,并且所述第二感官预测任务训练数据集包括非人类感知数据。7.一种用于针对具有有限可用训练数据的预测任务预测感官特性的计算机实现的方法,所述计算机实现的方法包括:通过一个或多个计算装置获得被训练成至少部分地基于与分子相关联的化学结构数据来预测所述分子的感官特性的机器学习感官预测模型,其中使用用于第一感官预测任务的第一感官预测任务训练数据集来训练所述机器学习感官预测模型;通过所述一个或多个计算装置获得描述所选分子的化学结构的输入数据;通过所述一个或多个计算装置将描述所述所选分子的所述化学结构的所述输入数据作为输入提供给所述机器学习感官预测模型;通过所述一个或多个计算装置接收描述所述所选分子的与第二感官预测任务相关联
的一个或多个第二感官特性的预测数据作为所述机器学习感官预测模型的输出;以及通过所述一个或多个计算装置提供描述所述所选分子的所述一个或多个第二感官特性的所述预测数据作为输出。8.如权利要求7所述的计算机实现的方法,其中使用用于所述第二感官预测任务的第二感官预测任务训练数据集来进一步训练所述感官预测模型,其中所述第一感官预测任务训练数据集的数据项数量大于所述第二感官预测任务训练数据集的数据项数量。9.如权利要求7或8所述的计算机实现的方法,其中与所述第二感官预测任务相关联的所述一个或多个第二感官特性包括以下各项中的一者或多者:所述所选分子的光学特性;所述所选分子的味觉特...

【专利技术属性】
技术研发人员:A
申请(专利权)人:奥思妙实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1