图像分类模型训练方法、图像分类方法、装置及设备制造方法及图纸

技术编号：34344098 阅读：51 留言：0更新日期：2022-07-31 04:28

本公开提供了图像分类模型训练方法、图像分类方法、装置及设备，涉及人工智能领域，尤其涉及自动驾驶、智能交通、计算机视觉等技术领域。具体实现方案为：将多个样本图像输入图像分类模型，获取图像分类模型输出的每一样本图像的特征向量和每一样本图像的预测类别；计算多个样本图像中两两图像之间的特征相似度；基于每一样本图像的标注类别和两两图像之间的特征相似度，计算第一损失函数值；基于每一样本图像的预测类别和每一样本图像的标注类别，计算第二损失函数值；根据第一损失函数值和第二损失函数值训练图像分类模型，得到训练完成的图像分类模型。可以在不增加复杂度和耗时的情况下，提高细粒度分类准确度。提高细粒度分类准确度。提高细粒度分类准确度。

全部详细技术资料下载

【技术实现步骤摘要】
图像分类模型训练方法、图像分类方法、装置及设备

[0001]本公开涉及人工智能
，尤其涉及自动驾驶、智能交通、计算机视觉等

技术介绍

[0002]图像分类是计算机视觉的基本任务之一，目前可以通过基于深度学习的图像分类模型对图像进行分类。

技术实现思路

[0003]本公开提供了一种图像分类模型训练方法、图像分类方法、装置及设备。
[0004]根据本公开的第一方面，提供了一种图像分类模型训练方法，包括：
[0005]获取多个样本图像和每一样本图像的标注类别；
[0006]将所述多个样本图像输入图像分类模型，获取所述图像分类模型的全连接层输出的每一样本图像的特征向量，并获取所述图像分类模型的分类器输出的每一样本图像的预测类别；
[0007]基于每一样本图像的特征向量，计算所述多个样本图像中两两图像之间的特征相似度；
[0008]基于每一样本图像的标注类别和所述两两图像之间的特征相似度，计算第一损失函数值；
[0009]基于每一样本图像的预测类别和所述每一样本图像的标注类别，计算第二损失函数值；
[0010]根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型，得到训练完成的图像分类模型。
[0011]根据本公开的第二方面，提供了一种图像分类方法，包括：
[0012]获取多个待分类图像；
[0013]将所述多个待分类图像输入图像分类模型中，得到每一待分类图像的预测类别，所述图像分类模型为根据上述第一方面任...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型训练方法，包括：获取多个样本图像和每一样本图像的标注类别；将所述多个样本图像输入图像分类模型，获取所述图像分类模型的全连接层输出的每一样本图像的特征向量，并获取所述图像分类模型的分类器输出的每一样本图像的预测类别；基于每一样本图像的特征向量，计算所述多个样本图像中两两图像之间的特征相似度；基于每一样本图像的标注类别和所述两两图像之间的特征相似度，计算第一损失函数值；基于每一样本图像的预测类别和所述每一样本图像的标注类别，计算第二损失函数值；根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型，得到训练完成的图像分类模型。2.根据权利要求1所述的方法，其中，所述基于每一样本图像的特征向量，计算所述多个样本图像中两两图像之间的特征相似度，包括：将每一样本图像的特征向量进行归一化处理，得到包含所述多个样本图像的归一化特征向量的特征矩阵；对所述特征矩阵进行维度变换，得到所述特征矩阵的转置矩阵；基于所述特征矩阵和所述转置矩阵，计算得到所述多个样本图像中两两图像之间的特征相似度。3.根据权利要求1或2所述的方法，其中，所述基于每一样本图像的标注类别和所述两两图像之间的特征相似度，计算第一损失函数值，包括：针对所述多个样本图像中每两个样本图像，根据所述两个样本图像的类别值和所述两个样本图像之间的特征相似度，计算所述两个样本图像之间的相同类别损失值和不同类别损失值；所述类别值用于表示所述两个样本图像的标注类别是否为相同类别；基于所述多个样本图像中每两个样本图像之间的相同类别损失值和不同类别损失值，计算所述第一损失函数值。4.根据权利要求3所述的方法，其中，用于计算所述第一损失函数值的第一损失函数为：其中，mask
i,j
为类别值，取值为1或0，当第i张样本图像和第j张样本图像的标注类别相同时，mask
i,j
值为1，当第i张样本图像和第j张样本图像的标注类别不相同时，mask
i,j
值为0；pred
i,j
表示第i张样本图像和第j张样本的图像的特征相似度。5.根据权利要求1
‑
4任一项所述的方法，其中，所述根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型，得到训练完成的图像分类模型，包括：根据所述第一损失函数值和所述第二损失函数值，调整所述图像分类模型参数，直至所述图像分类模型收敛，得到训练完成的图像分类模型；或者，
根据所述第一损失函数值和所述第二损失函数值，调整所述图像分类模型参数，直到所述图像分类模型收敛，将得到的图像分类模型作为候选图像分类模型；基于多个样本图像对所述候选图像分类模型进行迭代训练，得到多个候选图像分类模型；从所述多个候选图像分类模型中选择一个候选图像分类模型作为训练完成的图像分类模型。6.根据权利要求5所述的方法，其中，所述从所述多个候选图像分类模型中选择一个候选图像分类模型作为训练完成的图像分类模型，包括：将多个测试图像分别输入每个候选图像分类模型，获取每个候选图像分类模型对所述多个测试图像的分类结果；基于所述多个测试图像的标注类别以及每个候选图像分类模型对所述多个测试图像的分类结果，确定每个候选图像分类模型的分类准确率；将分类准确率最高的候选图像分类模型作为训练完成的图像分类模型。7.一种图像分类方法，包括：获取多个待分类图像；将所述多个待分类图像输入图像分类模型中，得到每一待分类图像的预测类别，所述图像分类模型为根据权利要求1
‑
6任一项所述方法训练得到的训练完成的图像分类模型。8.一种图像分类模型训练装置，包括：获取模块，用于获取多个样本图像和每一样本图像的标注类别；输入模块，用于将所述多个样本图像输入图像分类模型，获取所述图像分类模型的全连接层输出的每一样本图像的特征向量，并获取所述图像分类模型的分类器...

【专利技术属性】
技术研发人员：夏春龙，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人