【技术实现步骤摘要】
生成图像分类网络与图像分类方法、装置、设备及介质
[0001]本公开涉及计算机视觉
,具体而言,涉及一种生成图像分类网络的方法、图像分类方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,各类深度学习模型逐渐开始在各个领域得到应用。其中,图像分类被认为是计算机视觉中最基本的任务,通常基于图像分类的结果进行各种下游任务,比如物体检测、视频分析或者语义分割等。因此,如何提高图像分类精度显得尤为重要。
技术实现思路
[0003]本公开实施例至少提供一种生成图像分类网络的方法、图像分类方法、装置、电子设备及存储介质。
[0004]本公开实施例提供了一种生成图像分类网络的方法,包括:
[0005]在每一轮训练中,获取本轮训练的图像样本集合;所述图像样本集合包括至少两张样本图像,每张所述样本图像标注有所述每张样本图像的真实类别标签;
[0006]将所述图像样本集合分别输入第一图像分类网络以及第二图像分类网络,得到本轮训练所述第一图像分类网络输出的第一输出结果以及所述第二图像分类网络输出的第二输出结果,所述第二图像分类网络基于已完成的至少一轮训练中获得的调整参数后的所述第一图像分类网络得到;
[0007]基于本轮训练得到的第一输出结果以及所述每张样本图像对应的真实类别标签,确定预设的第一损失函数的第一损失;
[0008]基于本轮训练的第一输出结果以及历史第二输出结果,确定预设的第二损失函数的第二损失,所述第二损失函数表征第一输出结果与历史第二输 ...
【技术保护点】
【技术特征摘要】
1.一种生成图像分类网络的方法,其特征在于,包括:在每一轮训练中,获取本轮训练的图像样本集合;所述图像样本集合包括至少两张样本图像,每张所述样本图像标注有所述每张样本图像的真实类别标签;将所述图像样本集合分别输入第一图像分类网络以及第二图像分类网络,得到本轮训练所述第一图像分类网络输出的第一输出结果以及所述第二图像分类网络输出的第二输出结果,所述第二图像分类网络基于已完成的至少一轮训练中获得的调整参数后的所述第一图像分类网络得到;基于本轮训练得到的第一输出结果以及所述每张样本图像对应的真实类别标签,确定预设的第一损失函数的第一损失;基于本轮训练的第一输出结果以及历史第二输出结果,确定预设的第二损失函数的第二损失,所述第二损失函数表征第一输出结果与历史第二输出结果中相似度大于预设阈值的样本图像之间的距离;所述历史第二输出结果包括本轮训练之前的至少一轮历史训练中获得的所述第二输出结果;基于所述第一损失及所述第二损失对所述第一图像分类网络进行参数调整;重复多轮所述训练,获得训练完成的第一图像分类网络。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一损失及所述第二损失对所述第一图像分类网络进行参数调整之前,所述方法还包括:基于本轮训练的第二输出结果以及所述历史第二输出结果,生成本轮训练中所述图像样本集合的虚拟类别标签;基于本轮训练的第一输出结果和所述虚拟类别标签之间的差异,确定预设的第三损失函数的第三损失;所述基于所述第一损失及所述第二损失对所述第一图像分类网络进行参数调整,包括:基于所述第一损失、所述第二损失以及所述第三损失的加权和对所述第一图像分类网络进行参数调整。3.根据权利要求1或2所述的方法,其特征在于,所述第二图像分类网络通过对所述已完成的至少一轮训练中获得的调整参数后的第一图像分类网络进行滑动平均得到。4.根据权利要求1所述的方法,其特征在于,所述本轮训练的第一输出结果包括本轮训练的每张样本图像的第一特征以及本轮训练的所述每张样本图像的第一预测概率分布,所述第一预测概率分布表征所述每张样本图像属于预设的多个类别中的每个类别的概率的分布;所述基于本轮训练的第一输出结果以及所述每张样本图像对应的真实类别标签,确定预设的第一损失函数的第一损失,包括:基于所述本轮训练的每张样本图像的第一预测概率分布以及所述本轮训练的每张样本图像对应的真实类别标签,确定所述第一损失函数的第一损失。5.根据权利要求4所述的方法,其特征在于,所述历史第二输出结果包括历史至少一轮训练中获取的每张样本图像的第二特征;所述基于所述本轮训练的第一输出结果以及历史第二输出结果,确定预设的第二损失函数的第二损失,包括:
基于所述本轮训练的每张样本图像的第一特征以及所述历史至少一轮训练中获取的每张样本图像的第二特征,确定所述第二损失函数的第二损失。6.根据权利要求2所述的方法,其特征在于,所述本轮训练的第一输出结果包括本轮训练的每张图片的第一预测概率分布,所述本轮训练的第二输出结果包括本轮训练的每张样本图像的第二特征,所述历史第二输出结果包括历史至少一轮训练中第二图像分类网络输出的每张样本图像的第二特征以及每张样本图像的第二预测概率分布,所述第二预测概率分布表征所述每张样本图像属于预设的多个类别中的每个类别的概率的分布;所述基于本轮训练的第二输出结果以及所述历史第二输出结果,生成本轮训练中所述图像样本集合的虚拟类别标签,包括:针对本轮训练的每张样本图像,确定所述本轮训练的图像样本的第二特征相对于所述历史第二输出结果中的每张样本图像的第二特...
【专利技术属性】
技术研发人员:郑明凯,游山,王飞,钱晨,
申请(专利权)人:上海商汤临港智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。