图像分类模型训练方法、图像分类方法、装置及设备制造方法及图纸

技术编号:34344098 阅读:44 留言:0更新日期:2022-07-31 04:28
本公开提供了图像分类模型训练方法、图像分类方法、装置及设备,涉及人工智能领域,尤其涉及自动驾驶、智能交通、计算机视觉等技术领域。具体实现方案为:将多个样本图像输入图像分类模型,获取图像分类模型输出的每一样本图像的特征向量和每一样本图像的预测类别;计算多个样本图像中两两图像之间的特征相似度;基于每一样本图像的标注类别和两两图像之间的特征相似度,计算第一损失函数值;基于每一样本图像的预测类别和每一样本图像的标注类别,计算第二损失函数值;根据第一损失函数值和第二损失函数值训练图像分类模型,得到训练完成的图像分类模型。可以在不增加复杂度和耗时的情况下,提高细粒度分类准确度。提高细粒度分类准确度。提高细粒度分类准确度。

【技术实现步骤摘要】
图像分类模型训练方法、图像分类方法、装置及设备


[0001]本公开涉及人工智能
,尤其涉及自动驾驶、智能交通、计算机视觉等


技术介绍

[0002]图像分类是计算机视觉的基本任务之一,目前可以通过基于深度学习的图像分类模型对图像进行分类。

技术实现思路

[0003]本公开提供了一种图像分类模型训练方法、图像分类方法、装置及设备。
[0004]根据本公开的第一方面,提供了一种图像分类模型训练方法,包括:
[0005]获取多个样本图像和每一样本图像的标注类别;
[0006]将所述多个样本图像输入图像分类模型,获取所述图像分类模型的全连接层输出的每一样本图像的特征向量,并获取所述图像分类模型的分类器输出的每一样本图像的预测类别;
[0007]基于每一样本图像的特征向量,计算所述多个样本图像中两两图像之间的特征相似度;
[0008]基于每一样本图像的标注类别和所述两两图像之间的特征相似度,计算第一损失函数值;
[0009]基于每一样本图像的预测类别和所述每一样本图像的标注类别,计算第二损失函数值;
[0010]根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型,得到训练完成的图像分类模型。
[0011]根据本公开的第二方面,提供了一种图像分类方法,包括:
[0012]获取多个待分类图像;
[0013]将所述多个待分类图像输入图像分类模型中,得到每一待分类图像的预测类别,所述图像分类模型为根据上述第一方面任一项所述方法训练得到的训练完成的图像分类模型。
[0014]根据本公开的第三方面,提供了一种图像分类模型训练装置,包括:
[0015]获取模块,用于获取多个样本图像和每一样本图像的标注类别;
[0016]输入模块,用于将所述多个样本图像输入图像分类模型,获取所述图像分类模型的全连接层输出的每一样本图像的特征向量,并获取所述图像分类模型的分类器输出的每一样本图像的预测类别;
[0017]计算模块,用于基于每一样本图像的特征向量,计算所述多个样本图像中两两图像之间的特征相似度;
[0018]所述计算模块,还用于基于每一样本图像的标注类别和所述两两图像之间的特征
相似度,计算第一损失函数值;
[0019]所述计算模块,还用于基于每一样本图像的预测类别和所述每一样本图像的标注类别,计算第二损失函数值;
[0020]训练模块,用于根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型,得到训练完成的图像分类模型。
[0021]根据本公开的第四方面,提供了一种图像分类装置,包括:
[0022]获取模块,用于获取多个待分类图像;
[0023]分类模块,用于将所述多个待分类图像输入图像分类模型中,得到每一待分类图像的预测类别,所述图像分类模型为根据上述第三方面所述的装置训练得到训练完成的图像分类模型。
[0024]根据本公开的第五方面,提供了一种电子设备,包括:
[0025]至少一个处理器;以及
[0026]与所述至少一个处理器通信连接的存储器;其中,
[0027]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面或第二方面任一所述的方法。
[0028]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面或第二方面任一所述的方法。
[0029]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面或第二方面任一所述的方法。
[0030]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0031]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0032]图1是本公开实施例提供的一种图像分类模型训练方法的流程示意图;
[0033]图2是本公开实施例提供的另一种图像分类模型训练方法的流程示意图;
[0034]图3是本公开实施例提供的又一种图像分类模型训练方法的流程示意图;
[0035]图4是本公开实施例提供的一种图像分类模型训练方法的示例性流程示意图;
[0036]图5是本公开实施例提供的一种训练阶段的图像分类模型的结构示意图;
[0037]图6是本公开实施例提供的一种训练完成的图像分类模型的结构示意图;
[0038]图7是本公开实施例提供的一种图像分类方法的流程示意图;
[0039]图8为是本公开实施例提供的一种图像分类模型训练方法应用于自动驾驶、智能交通等领域的示例性流程示意图;
[0040]图9是本公开实施例提供的一种图像分类模型训练装置的结构示意图;
[0041]图10是本公开实施例提供的一种图像分类装置的结构示意图;
[0042]图11是本公开实施例提供的一种电子设备的框图。
具体实施方式
[0043]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0044]相关技术中,通过图像分类模型只能对图像进行粗粒度分类,而粗粒度的分类往往无法满足实际业务需求,这就需要对图像进行细粒度的分类。例如,在智能交通领域中,现有的粗粒度的图像分类模型可以对包含行人的图像和包含机动车的图像进行分类,而无法准确地对更相似的图像进行分类,比如目前对于包含摩托车的图像和包含电动车的图像无法准确地进行分类。
[0045]目前,为了实现对图像进行细粒度分类,主要有两种方案,一种是通过图像检测或图像分割的方法对待分类图像进行预处理,将待分类图像中的前景部分提取出来,图像分类模型可以根据提取得到图像前景部分获得更精确的待分类图像的特征,进而,根据精确的待分类图像的特征对待分类图像进行细粒度分类。另一种是对样本图像进行像素级的标注,然后选择一个能够对图像进行像素级分类的图像分类模型,基于样本图像和像素级的标注对该图像分类模型进行训练,使得训练得到的图像分类模型可以对图像进行细粒度的分类。
[0046]但是上述第一种方案需要预先对图像进行检测或者分割,提取前景部分,增加了处理过程,导致复杂度和耗时增加。第二种方案需要采用能够进行像素级分类的模型,模型结构更加复杂,且标注过程更加复杂,导致分类复杂度和分类耗时增加。目前难以在不提高分类复杂度和耗时的前提下,准确地进行细粒度的分类。
[0047]为了解决上述技术问题,本公开实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型训练方法,包括:获取多个样本图像和每一样本图像的标注类别;将所述多个样本图像输入图像分类模型,获取所述图像分类模型的全连接层输出的每一样本图像的特征向量,并获取所述图像分类模型的分类器输出的每一样本图像的预测类别;基于每一样本图像的特征向量,计算所述多个样本图像中两两图像之间的特征相似度;基于每一样本图像的标注类别和所述两两图像之间的特征相似度,计算第一损失函数值;基于每一样本图像的预测类别和所述每一样本图像的标注类别,计算第二损失函数值;根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型,得到训练完成的图像分类模型。2.根据权利要求1所述的方法,其中,所述基于每一样本图像的特征向量,计算所述多个样本图像中两两图像之间的特征相似度,包括:将每一样本图像的特征向量进行归一化处理,得到包含所述多个样本图像的归一化特征向量的特征矩阵;对所述特征矩阵进行维度变换,得到所述特征矩阵的转置矩阵;基于所述特征矩阵和所述转置矩阵,计算得到所述多个样本图像中两两图像之间的特征相似度。3.根据权利要求1或2所述的方法,其中,所述基于每一样本图像的标注类别和所述两两图像之间的特征相似度,计算第一损失函数值,包括:针对所述多个样本图像中每两个样本图像,根据所述两个样本图像的类别值和所述两个样本图像之间的特征相似度,计算所述两个样本图像之间的相同类别损失值和不同类别损失值;所述类别值用于表示所述两个样本图像的标注类别是否为相同类别;基于所述多个样本图像中每两个样本图像之间的相同类别损失值和不同类别损失值,计算所述第一损失函数值。4.根据权利要求3所述的方法,其中,用于计算所述第一损失函数值的第一损失函数为:其中,mask
i,j
为类别值,取值为1或0,当第i张样本图像和第j张样本图像的标注类别相同时,mask
i,j
值为1,当第i张样本图像和第j张样本图像的标注类别不相同时,mask
i,j
值为0;pred
i,j
表示第i张样本图像和第j张样本的图像的特征相似度。5.根据权利要求1

4任一项所述的方法,其中,所述根据所述第一损失函数值和所述第二损失函数值训练所述图像分类模型,得到训练完成的图像分类模型,包括:根据所述第一损失函数值和所述第二损失函数值,调整所述图像分类模型参数,直至所述图像分类模型收敛,得到训练完成的图像分类模型;或者,
根据所述第一损失函数值和所述第二损失函数值,调整所述图像分类模型参数,直到所述图像分类模型收敛,将得到的图像分类模型作为候选图像分类模型;基于多个样本图像对所述候选图像分类模型进行迭代训练,得到多个候选图像分类模型;从所述多个候选图像分类模型中选择一个候选图像分类模型作为训练完成的图像分类模型。6.根据权利要求5所述的方法,其中,所述从所述多个候选图像分类模型中选择一个候选图像分类模型作为训练完成的图像分类模型,包括:将多个测试图像分别输入每个候选图像分类模型,获取每个候选图像分类模型对所述多个测试图像的分类结果;基于所述多个测试图像的标注类别以及每个候选图像分类模型对所述多个测试图像的分类结果,确定每个候选图像分类模型的分类准确率;将分类准确率最高的候选图像分类模型作为训练完成的图像分类模型。7.一种图像分类方法,包括:获取多个待分类图像;将所述多个待分类图像输入图像分类模型中,得到每一待分类图像的预测类别,所述图像分类模型为根据权利要求1

6任一项所述方法训练得到的训练完成的图像分类模型。8.一种图像分类模型训练装置,包括:获取模块,用于获取多个样本图像和每一样本图像的标注类别;输入模块,用于将所述多个样本图像输入图像分类模型,获取所述图像分类模型的全连接层输出的每一样本图像的特征向量,并获取所述图像分类模型的分类器...

【专利技术属性】
技术研发人员:夏春龙
申请(专利权)人:阿波罗智联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1