一种图像分类模型的训练方法及图像分类方法技术

技术编号：38771458 阅读：17 留言：0更新日期：2023-09-10 10:44

本发明专利技术提供一种图像分类模型的训练方法及基于此的图像分类方法，其中，图像分类模型的训练方法包括：S1、获取封闭域训练数据，其包括多个封闭域样本图像和指示封闭域样本图像所属已知类别的标签；S2、利用步骤S1获得的封闭域训练数据将模型训练至收敛，训练时，获取总损失，其包括封闭域分类损失和AUROC目标损失，所述AUROC目标损失被配置为用于指导模型训练以期望在相应封闭域样本图像的特征输入分类器后被正确分类的情况下，被正确分类的封闭域样本图像的特征在超未知类上的置信度小于开放域样本特征在超未知类上的置信度。本发明专利技术可约束图像分类模型的性能满足开放域识别任务中的图像分类子任务的优化目标。任务中的图像分类子任务的优化目标。任务中的图像分类子任务的优化目标。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类模型的训练方法及图像分类方法

[0001]本专利技术涉及机器学习领域，具体来说，涉及机器学习中的计算机视觉领域，更具体地说，涉及一种图像分类模型的训练方法及基于此的图像分类方法。

技术介绍

[0002]传统机器学习通常是基于封闭域(Close
‑
set)假设(即训练阶段与测试阶段共享同一标签空间)进行学习。然而，对于大量真实应用场景(例如自动驾驶、物种识别、风险内容监测等)，在测试阶段用到的样本中不可避免地存在一些不属于任何训练阶段用到的已知类别的样本。在此情况下，基于封闭域假设的模型将会将所有未知类样本分类至某些已知类，不仅会造成模型性能的严重下降，还会误导应用该模型的系统的决策结果，严重威胁用户生命健康安全。鉴于此，开放域识别问题(Open
‑
set Recognition)在近些年受到广泛重视。例如参考文献[1]‑
[14]对开放域识别问题进行了相关研究，其中，在处理开放域识别问题时，模型不仅需要将封闭域样本分类至正确的已知类别，还需要正确判别样本是否属于已知类。在此复杂设定下，如何准确评估模型性能成为一项挑战性问题。针对该挑战，已有工作提出的评估指标可以被归为可以被归为以下两类：第一类指标是将传统分类指标拓展至开放域场景；第二类指标是将开放域识别视为具有多个已知类的新类检测任务(Novelty Detection)，例如参考文献[18]、[19]中采用的策略。
[0003]针对第一类指标，首先需要增加一个判断输入样本是否属于开放域的阈值，从而将封...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型的训练方法，所述模型包括特征提取器和分类器，其特征在于，所述方法包括如下步骤：S1、获取封闭域训练数据，其包括多个封闭域样本图像和指示封闭域样本图像所属已知类别的标签；S2、利用步骤S1获得的封闭域训练数据将模型训练至收敛，训练时，包括以下步骤：S21、采用特征提取器对输入其的各封闭域样本图像分别进行特征提取，得到多个封闭域样本特征；S22、伪造一个或者多个开放域样本特征，其中每个开放域样本特征是根据至少两个属于不同已知类别的封闭域样本图像对应的封闭域样本特征组合得到的；S23、采用分类器对输入其的样本特征进行图像分类，以获得对应样本特征分别在多个已知类别上和一个超未知类上的置信度，所述样本特征为封闭域样本图像的特征或者开放域样本特征；S24、获取总损失，其包括封闭域分类损失和AUROC目标损失，所述AUROC目标损失被配置为用于指导模型训练以期望在相应封闭域样本图像的特征输入分类器后被正确分类的情况下，被正确分类的封闭域样本图像的特征在超未知类上的置信度小于开放域样本特征在超未知类上的置信度。2.根据权利要求1所述的方法，其特征在于，所述AUROC目标损失按照以下方式确定：获取每个开放域样本特征在超未知类上的置信度和一个封闭域样本图像的特征在超未知类上的置信度进行组合所能形成的所有置信度组合；确定每个置信度组合对应的置信度差值，所述置信度差值为该置信度组合中的两个置信度的差值；确定每个置信度组合的有效系数，其中，该置信度组合相关的封闭域样本图像的特征被正确分类时，有效系数为正数，否则为0；根据所有置信度组合的置信度差值和有效系数，确定所述AUROC目标损失。3.根据权利要求2所述的方法，其特征在于，所述AUROC目标损失与每个置信度组合对应的置信度差值输入满足费希尔一致性的损失函数后得到的值和有效系数的乘积相关。4.根据权利要求3所述的方法，其特征在于，所述AUROC目标损失按照以下方式确定：其中，N
k
表示封闭域训练数据中的封闭域样本图像数量，N
u
表示开放域样本特征的数量，λ表示超参数，λ∈(0,1]，l(
·
)表示满足费希尔一致性的损失函数，r(x
j
)表示第j个开放域样本特征在超未知类别上的置信度，r(x
i
)表示第i个封闭域样本图像的特征在超未知类别上的置信度，表示有效系数，表示单个置信...

【专利技术属性】
技术研发人员：许倩倩，王子泰，杨智勇，操晓春，黄庆明，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人