The present application relates to the identification of a migration model for machine learning tasks. Provides techniques for autonomously facilitating the selection of one or more migration models to enhance the performance of one or more machine learning tasks. For example, one or more embodiments described herein may include a system that may include a memory that can store computer executable components. The system may also include a processor operatively coupled to the memory and may execute computer executable components stored in the memory. The computer executable component can include an evaluation component, which can evaluate the similarity measurement between the source data set and the sample data set from the target machine learning task. The computer executable component can also include the recognition component, which can recognize the pre trained neural network model associated with the source data set based on the similarity measure to perform the target machine learning task.
【技术实现步骤摘要】
识别用于机器学习任务的迁移模型
本公开涉及用于机器学习任务的迁移模型的识别,并且更具体地,涉及自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络,以增强一个或多个机器学习任务的性能。
技术介绍
各种人工智能(“AI”)技术利用深度学习神经网络模型来执行一个或多个机器学习任务。模型的准确性取决于用于训练该模型的数据量和/或数据类型。例如,用于训练主题(subject)模型的唯一数据(例如,非重复数据)越多,主题模型可以变得越准确。然而,许多机器学习任务具有可用于训练模型的有限量的数据。另外,在其中大量数据可用的情况下,训练模型可能是耗时的。传统方法试图通过迁移学习来解决这些问题,其中利用预先存在的预训练的模型来分析新数据集并执行一个或多个期望的机器学习任务。然而,对于给定的新数据集,识别选择哪个预训练的模型用于迁移学习可以直接影响一个或多个期望的机器学习任务的性能。
技术实现思路
以下呈现
技术实现思路
以提供对本专利技术的一个或多个实施例的基本理解。本
技术实现思路
不旨在识别关键或重要元素,或描绘特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化形式来呈现概念,以作为稍后呈现的更详细描述的序言。在这里描述的一个或多个实施例中,描述了可以自主地识别要被选择用于迁移学习的一个或多个预训练的神经网络以增强一个或多个机器学习任务的性能的系统、计算机实现的方法、装置和/或计算机程序产品。根据一个实施例,提供了一种系统。该系统可以包括可以存储计算机可执行组件的存储器。该系统还可以包括处理器 ...
【技术保护点】
1.一种计算机实现的方法,包括:/n由操作性地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量;以及/n由所述系统基于所述相似性度量识别与所述源数据集相关联的预训练的神经网络模型,以执行所述目标机器学习任务。/n
【技术特征摘要】
20180517 US 15/982,6221.一种计算机实现的方法,包括:
由操作性地耦接到处理器的系统评估源数据集和来自目标机器学习任务的样本数据集之间的相似性度量;以及
由所述系统基于所述相似性度量识别与所述源数据集相关联的预训练的神经网络模型,以执行所述目标机器学习任务。
2.如权利要求1所述的计算机实现的方法,其中所述评估还包括:
由所述系统使用特征提取器和统计聚合技术来创建所述源数据集的第一向量表示和所述样本数据集的第二向量表示;以及
由所述系统使用所述关于所述第一向量表示和所述第二向量表示的距离计算技术来评估所述相似性度量。
3.如权利要求2所述的计算机实现的方法,其中,所述距离计算技术选自包括以下各项的组:Kullback-Leibler散度、欧几里德距离、余弦相似性,曼哈顿距离、明可夫斯基距离、简森香农距离、卡方距离和杰卡德相似性。
4.如权利要求1所述的计算机实现的方法,还包括由所述系统使用来自所述目标机器学习任务的目标数据集在所述预训练的神经网络模型上执行训练步骤。
5.如权利要求1所述的计算机实现的方法,其中,所述识别包括由所述系统从预先存在的模型库中识别所述预训练的神经网络模型。
6.如权利要求1所述的...
【专利技术属性】
技术研发人员:P·沃特森,B·博哈塔查尔杰,N·C·考德拉,B·M·贝尔高德瑞,P·都贝,M·R·格拉斯,J·R·肯德尔,霍思宇,M·L·赫尔,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。