识别用于机器学习任务的迁移模型制造技术

技术编号:22659422 阅读:17 留言:0更新日期:2019-11-28 03:39
本申请涉及识别用于机器学习任务的迁移模型。提供了关于自主地促进选择一个或多个迁移模型以增强一个或多个机器学习任务的性能的技术。例如,这里描述的一个或多个实施例可以包括一种系统,该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器,该处理器操作性地耦接到存储器,并且可以执行存储在存储器中的计算机可执行组件。该计算机可执行组件可以包括评估组件,该评估组件可以评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算机可执行组件还可以包括识别组件,识别组件可以基于相似性度量识别与源数据集相关联的预训练的神经网络模型,以执行目标机器学习任务。

Identify migration models for machine learning tasks

The present application relates to the identification of a migration model for machine learning tasks. Provides techniques for autonomously facilitating the selection of one or more migration models to enhance the performance of one or more machine learning tasks. For example, one or more embodiments described herein may include a system that may include a memory that can store computer executable components. The system may also include a processor operatively coupled to the memory and may execute computer executable components stored in the memory. The computer executable component can include an evaluation component, which can evaluate the similarity measurement between the source data set and the sample data set from the target machine learning task. The computer executable component can also include the recognition component, which can recognize the pre trained neural network model associated with the source data set based on the similarity measure to perform the target machine learning task.

【技术实现步骤摘要】
识别用于机器学习任务的迁移模型
本公开涉及用于机器学习任务的迁移模型的识别,并且更具体地,涉及自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络,以增强一个或多个机器学习任务的性能。
技术介绍
各种人工智能(“AI”)技术利用深度学习神经网络模型来执行一个或多个机器学习任务。模型的准确性取决于用于训练该模型的数据量和/或数据类型。例如,用于训练主题(subject)模型的唯一数据(例如,非重复数据)越多,主题模型可以变得越准确。然而,许多机器学习任务具有可用于训练模型的有限量的数据。另外,在其中大量数据可用的情况下,训练模型可能是耗时的。传统方法试图通过迁移学习来解决这些问题,其中利用预先存在的预训练的模型来分析新数据集并执行一个或多个期望的机器学习任务。然而,对于给定的新数据集,识别选择哪个预训练的模型用于迁移学习可以直接影响一个或多个期望的机器学习任务的性能。
技术实现思路
以下呈现
技术实现思路
以提供对本专利技术的一个或多个实施例的基本理解。本
技术实现思路
不旨在识别关键或重要元素,或描绘特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化形式来呈现概念,以作为稍后呈现的更详细描述的序言。在这里描述的一个或多个实施例中,描述了可以自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络以增强一个或多个机器学习任务的性能的系统、计算机实现的方法、装置和/或计算机程序产品。根据一个实施例,提供了一种系统。该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器,该处理器可操作地耦接到存储器,并且可以执行存储在存储器中的计算机可执行组件。计算机可执行组件可以包括评估组件,该评估组件可以评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。计算机可执行组件还可以包括识别组件,该识别组件可以基于相似性度量识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。根据一个实施例,提供了一种计算机实现的方法。该计算机实现的方法可以包括由可操作地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。而且,计算机实现的方法可以包括由系统基于相似性度量来识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。根据一个实施例,提供了一种计算机程序产品,该计算机程序产品可以促进使用预训练的神经网络模型来增强目标机器学习任务的性能。该计算机程序产品可以包括具有随其而体现的程序指令的计算机可读存储介质。该计算机指令可以由处理器执行以使处理器由可操作地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量。而且,该程序指令还可以使处理器由系统基于相似性度量识别与源数据集相关联的预训练的神经网络模型以执行目标机器学习任务。附图说明该专利或申请文件包含至少一幅彩色图。在请求和支付必要费用后,专利局将提供具有彩色图的本专利或专利申请公开的副本。图1示出了根据这里描述的一个或多个实施例的示例的非限制性系统的框图,该系统可以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图2示出了根据这里描述的一个或多个实施例的示例的非限制性系统的框图,该系统可以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图3示出了根据这里描述的一个或多个实施例的示例的非限制性神经结构的示意图,该神经结构可以由系统利用以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图4A示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以描绘迁移模型的选择可以如何影响机器学习任务的性能。图4B示出了根据这里描述的一个或多个实施例的示例的非限制性图形的图,该图形可以描绘关于机器学习任务的性能增强的一个或多个预测,其中该一个或多个预测可以由系统生成,这可以促进选择用于关于机器学习任务的迁移学习的一个或多个预训练的神经网络模型。图5示出了根据这里描述的一个或多个实施例的示例的非限制性图表的示意图,该图表可以描绘可以由系统生成的一个或多个相似性度量,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图6示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以表示可以由系统生成的可视化,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图7A示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以描绘可以由系统生成的迁移学习性能预测,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,以增强一个或多个机器学习任务的性能。图7B示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以描绘可以由系统生成的迁移学习性能预测,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,以增强一个或多个机器学习任务的性能。图7C示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以描绘可以由系统生成的迁移学习性能预测,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,以增强一个或多个机器学习任务的性能。图8示出了根据这里描述的一个或多个实施例的示例的非限制性图形的示意图,该图形可以描绘可以由系统生成的迁移学习性能预测,以促进选择用于迁移学习的一个或多个预训练的神经网络模型,以增强一个或多个机器学习任务的性能。图9示出了根据这里描述的一个或多个实施例的可以描绘视觉定制学习工作负载的分布的示例的非限制性饼图的示意图。图10示出了根据这里描述的一个或多个实施例的示例的非限制性方法的流程图,该方法可以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图11示出了根据这里描述的一个或多个实施例的示例的非限制性方法的流程图,该方法可以促进选择用于迁移学习的一个或多个预训练的神经网络模型,该一个或多个预训练的神经网络模型可以增强一个或多个机器学习任务的性能。图12描绘了根据这里描述的一个或多个实施例的云计算环境。图13描绘了根据这里描述的一个或多个实施例的抽象模型层。图14示出了在其中可以促进这里描述的一个或多个实施例的示例的非限制性操作环境的框图。具体实施方式以下详细描述仅是说明性的,并不旨在限制实施例和/或实施例的应用或使用。此外,不旨在受前述
技术介绍

技术实现思路
部分或具体实施方式部分中呈现的任何明示或暗示的信息的约束。现在参考附图描述一个或多个实施例,其中相似的附图标记本文档来自技高网
...

【技术保护点】
1.一种计算机实现的方法,包括:/n由操作性地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量;以及/n由所述系统基于所述相似性度量识别与所述源数据集相关联的预训练的神经网络模型,以执行所述目标机器学习任务。/n

【技术特征摘要】
20180517 US 15/982,6221.一种计算机实现的方法,包括:
由操作性地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量;以及
由所述系统基于所述相似性度量识别与所述源数据集相关联的预训练的神经网络模型,以执行所述目标机器学习任务。


2.如权利要求1所述的计算机实现的方法,其中所述评估还包括:
由所述系统使用特征提取器和统计聚合技术来创建所述源数据集的第一向量表示和所述样本数据集的第二向量表示;以及
由所述系统使用所述关于所述第一向量表示和所述第二向量表示的距离计算技术来评估所述相似性度量。


3.如权利要求2所述的计算机实现的方法,其中,所述距离计算技术选自包括以下各项的组:Kullback-Leibler散度、欧几里德距离、余弦相似性,曼哈顿距离、明可夫斯基距离、简森香农距离、卡方距离和杰卡德相似性。


4.如权利要求1所述的计算机实现的方法,还包括由所述系统使用来自所述目标机器学习任务的目标数据集在所述预训练的神经网络模型上执行训练步骤。


5.如权利要求1所述的计算机实现的方法,其中,所述识别包括由所述系统从预先存在的模型库中识别所述预训练的神经网络模型。


6.如权利要求1所述的...

【专利技术属性】
技术研发人员:P·沃特森B·博哈塔查尔杰N·C·考德拉B·M·贝尔高德瑞P·都贝M·R·格拉斯J·R·肯德尔霍思宇M·L·赫尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1