利用部分标记的训练数据训练多类别对象分类模型的系统和方法技术方案

技术编号：37396018 阅读：14 留言：0更新日期：2023-04-27 07:33

本公开的系统和方法涉及一种用于利用部分标记的训练数据来训练机器学习的多类别对象分类模型的计算机实现的方法。该方法能够包括获得描绘对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该方法能够包括利用机器学习的多类别对象分类模型来处理该图像数据以获得对象分类数据。该方法能够包括评估损失函数，该损失函数评估多类别分类损失，以及基于该损失函数调整多类别对象分类模型的一个或多个参数。型的一个或多个参数。型的一个或多个参数。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】利用部分标记的训练数据训练多类别对象分类模型的系统和方法

[0001]本公开总体上涉及训练机器学习的对象分类模型。更特别地，本公开涉及使用部分标记的训练数据来训练机器学习的多类别对象分类模型，以检测和识别图像数据中描绘的对象的多个类别。

技术介绍

[0002]训练机器学习的多类别对象分类模型来检测和识别多个对象的类别通常利用图像训练数据，该图像训练数据利用多个类别中的一个或多个的基本事实标记的边界框来标记。该训练数据通常没有被完全标记。也就是说，不是每个类别都有显式标签。相反，一些标签可能是隐式推断的。例如，不被包括在标记的边界框中的图像数据区域(例如，未标记)通常被假定不包括属于这些类别的任何对象。
[0003]然而，这些未标记的区域通常包括对应于模型被训练来检测的对象类别的其他对象。作为示例，可以训练模型来识别猫，并且训练图像可以包括未标记区域中的猫。如果隐式地推断出该未标记区域的标签(例如，猫不存在于该区域中)，则该模型能够被不正确地训练(例如，被训练为不识别猫的存在)。
[0004]因而，为对象分类模型产生训练数据通常需要对训练数据集的图像中描绘的所有类别进行详尽的注释。然而，分类训练数据集的这种注释能够非常昂贵和/或耗时。此外，使用具有部分标记的类别(例如，仅标记三个类别中的两个等)的图像数据来训练模型的现时尝试通常导致模型质量显著下降。

技术实现思路

[0005]本公开的实施例的方面和优点将在以下描述中部分地阐述，或者能够从描述中学习，或者能够通过实施例的实践学习。
>[0006]本公开的一个示例方面涉及一种利用部分标记的训练数据来训练多类别对象分类模型的计算系统。计算系统能够包括一个或多个处理器。计算系统能够包括被配置成对多个对象类别进行分类的机器学习的多类别对象分类模型。计算系统能够包括存储计算机可读指令的一个或多个有形非暂时性计算机可读介质，这些指令在由一个或多个处理器执行时使得该一个或多个处理器执行操作。该操作能够包括获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该操作能够包括利用机器学习的多类别对象分类模型来处理该图像数据以获得对象分类数据。该操作能够包括评估损失函数，该损失函数评估包括对象分类数据与对象类别注释的子集之间的差异的多类别分类损失，其中损失函数包括分别与多个对象类别相关联的多个加权损失信号，其中加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的对象类别包括在对象类别的子集内。操作能够包括至少部分地基于损失函数来调整该机器学习的多类别对象分类模型的一个或多个参数。
[0007]本公开的另一示例方面涉及一种用于利用部分标记的训练数据来训练机器学习的多类别对象分类模型的计算机实现的方法。该方法能够包括由包括一个或多个计算设备的计算系统获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该方法能够包括由计算系统利用该机器学习的多类别对象分类模型来处理图像数据以获得对象分类数据。该方法能够包括由计算系统评估损失函数，该损失函数评估包括对象分类数据与对象类别注释的子集之间的差异的多类别分类损失，其中该损失函数包括分别与多个对象类别相关联的多个加权损失信号，其中加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的对象类别包括在对象类别的子集内。该方法能够包括由计算系统至少部分地基于该损失函数来调整该机器学习的多类别对象分类模型的一个或多个参数。
[0008]本公开的另一示例方面涉及存储计算机可读指令的一个或多个有形非暂时性计算机可读介质，这些指令在由一个或多个处理器执行时使得该一个或多个处理器执行操作。该操作能够包括获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。操作能够包括利用机器学习的多类别对象分类模型来处理图像数据以获得对象分类数据，其中机器学习的多类别对象分类模型被配置成将一个或多个对象中的每一个分类为属于多个对象类别中的对象类别。操作能够包括修改损失函数以获得修改的损失函数，其中该损失函数包括分别与多个对象类别相关联的多个损失信号，其中该修改的损失函数包括分别与对象类别的子集相关联的多个损失信号的子集。操作能够包括评估该修改的损失函数，其中该修改的损失函数评估包括对象分类数据与对象类别注释的子集之间的差异的多类别分类损失。操作能够包括至少部分地基于损失函数来调整该机器学习的多类别对象分类模型的一个或多个参数。
[0009]本公开的其他方面涉及各种系统、装置、非暂时性计算机可读介质、用户接口和电子设备。
[0010]参考以下描述和所附权利要求，将更好地理解本公开的各种实施例的这些和其他特征、方面和优点。并入本说明书并构成其一部分的附图示出了本公开的示例实施例，并与描述一起用于解释相关原理。
附图说明
[0011]涉及本领域普通技术人员的实施例的详细讨论在参考附图的说明书中阐述，其中：
[0012]图1A描绘了根据本公开的示例实施例的执行机器学习的多类别对象分类的示例计算系统的框图。
[0013]图1B描绘了根据本公开的示例实施例的执行机器学习的多类别对象分类模型的训练的示例计算设备的框图。
[0014]图1C描绘了根据本公开的示例实施例的执行机器学习的多类别对象分类的示例计算设备的框图。
[0015]图2描绘了根据本公开的示例实施例的示例机器学习的多类别对象分类模型的框图。
[0016]图3描绘了根据本公开的示例实施例的示例机器学习的图像分析模型的框图。
[0017]图4描绘了根据本公开的示例实施例的用于使用部分标记的训练数据来训练机器学习的多类别对象分类模型的方法的数据流程图。
[0018]图5描绘了执行利用部分标记的训练数据来训练机器学习的多类别对象分类模型的示例方法500的流程图。
[0019]在多个附图中重复的附图标记旨在标识各种实施方式中的相同特征。
具体实施方式
[0020]概述
[0021]总体上，本公开涉及使用部分标记的训练数据来训练机器学习的多类别对象分类模型。更特别地，本公开涉及使用部分标记的训练数据来训练机器学习的多类别对象分类模型，以识别图像数据中描绘的多个类别对象。作为示例，机器学习的多类别对象分类模型能够被配置成将图像数据中描绘的对象分类为属于多个类别(例如，熊类别、狮子类别、老虎类别、袋鼠类别等)。描绘一个或多个对象的图像数据能够与基本事实数据一起获得，该基本事实数据包括与多个对象类别的子集(例如，总共四个类别中的两个等)相关联的对象类别注释(例如，基本事实类别标签)的子集。能够利用机器学习的多类别对象分类模型来处理图像数据，以获得对图像数据中描绘的(多个)对象进行分类的对象分类数据。
[0022]能够评估损失函数，该损失函数评估多类别分类损失，该多类别分类损失包括对象分类数据与对象类别本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于利用部分标记的训练数据来训练多类别对象分类模型的计算系统，包括：一个或多个处理器；机器学习的多类别对象分类模型，所述机器学习的多类别对象分类模型被配置成对多个对象类别进行分类；以及存储计算机可读指令的一个或多个有形非暂时性计算机可读介质，所述指令在由所述一个或多个处理器执行时使得所述一个或多个处理器执行操作，所述操作包括：获得描绘一个或多个对象的图像数据以及包括分别与所述多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据；利用所述机器学习的多类别对象分类模型来处理所述图像数据以获得对象分类数据；评估损失函数，所述损失函数评估包括所述对象分类数据与所述对象类别注释的子集之间的差异的多类别分类损失，其中所述损失函数包括分别与所述多个对象类别相关联的多个加权损失信号，其中所述加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的所述对象类别包括在所述对象类别的子集内；以及至少部分地基于所述损失函数来调整所述机器学习的多类别对象分类模型的一个或多个参数。2.根据权利要求1所述的计算系统，其中：所述加权损失信号中的每一个的所述权重是归一化值；所述多个加权损失信号中的第一加权损失信号与被包括在所述对象类别的子集内的第一对象类别相关联；所述多个加权损失信号中的第二加权损失信号与从所述对象类别的子集排除的第二对象类别相关联；以及所述第一加权损失信号的所述权重大于所述第二加权损失信号的所述权重。3.根据权利要求2所述的计算系统，其中：所述第一加权损失信号的所述权重是一；以及所述第二加权损失信号的所述权重是零。4.根据权利要求2或权利要求3所述的计算系统，其中，调整所述机器学习的多类别对象分类模型的所述一个或多个参数包括至少部分地基于权重大于零的所述多个加权损失信号中的每一个来调整所述机器学习的多类别对象分类模型的所述一个或多个参数。5.根据任一前述权利要求所述的计算系统，其中，所述机器学习的多类别对象分类模型的所述一个或多个参数与所述损失函数的所述加权损失信号中的每一个的所述权重成比例地调整。6.根据任一前述权利要求所述的计算系统，其中：所述对象类别注释的子集的第一注释包括所述图像数据中描绘的第一对象类别的对应对象的边界框和标签；以及所述对象类别注释的子集的第二注释包括指示第二对象类别的对象在所述图像数据中没有描绘的标签。7.根据任一前述权利要求所述的计算系统，其中，所述对象分类数据包括预测将在所述图像数据中描绘的一个或多个对象的一个或多个预测的对象类别注释。8.根据任一前述权利要求所述的计算系统，其中，评估所述损失函数包括评估分别与
所述对象类别的子集相关联的所述损失函数的加权损失信号的子集。9.根据任一前述权利要求所述的计算系统，其中，所述操作进一步包括：获得描绘一个或多个附加对象的附加图像数据；以及利用所述机器学习的多类别分类模型来处理所述附加图像数据以获得图像分类输出，所述图像分类输出包括描述所述附加图像数据的一个或多个标签。10.一种用于利用部分标记的训练数据来训练机器学习的多类别对象分类模型的计算机实现的方法，包括：由包括一个或多个计算设备的计算系统获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据；由所述计算系统利用所述机器学习的多类别对象分类模型来处理所述图像数据以获得对象分类数据；由所述计算系统评估损失函数，所述损失函数评估包括所述对象分类数据与所述对象类别注释的子集之间的差异的多类别分类损失，其中所述损失函数包括分别与所述多个对象类别相关联的多个加权损失信号，其中所述加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的所述对...

【专利技术属性】
技术研发人员：陈惠中，鲁志超，乔纳森，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人