一种图像识别方法、装置、存储介质及设备制造方法及图纸

技术编号:30766544 阅读:21 留言:0更新日期:2021-11-10 12:27
本申请公开了一种图像识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标图像,然后再将其输入至预先构建的图像识别模型,识别得到目标图像的特征向量;其中,图像识别模型是根据神经元的算力进行自适应剪枝,并利用对抗训练和知识蒸馏的方式训练得到的神经网络模型;接着,可以根据该特征向量,对目标图像进行识别,得到目标图像的识别结果。可见,由于本申请预先构建的图像识别模型是利用神经元的算力进行自适应剪枝,从而提高了剪枝效率,并且通过对抗训练和知识蒸馏的训练方式还能够使得该模型有效继承当前主流神经网络模型所包含的知识,并保证其维持着最大化的识别性能效果,进而能够在此情况下,有效提高图像的识别效率。图像的识别效率。图像的识别效率。

【技术实现步骤摘要】
一种图像识别方法、装置、存储介质及设备


[0001]本申请涉及图像处理
,尤其涉及一种图像识别方法、装置、存储介质及设备。

技术介绍

[0002]随着人工智能技术的不断突破和各种智能终端设备的日益普及,需要处理的图像数量呈现几何级别的增长。在图像处理领域中,最为常见的一个任务便是图像识别任务。在如ImageNet等图像识别数据集中,包括了如飞机、汽车、鸟、猫、鹿等1000多个图像类别,共计1500万张图像。图像识别任务在本质上就是一个分类任务,通常需要求解出一个有效的分类器,来准确地将一张图像分类到它所属的真实类别中。
[0003]传统的图像识别方法通常是采用当前主流的神经网络进行识别,如卷积神经网络(Convolution Neural Network,CNN)等,但这些主流的神经网络通常是以其复杂的结构及超大的参数量为基础,才能取得优异的识别效果,而复杂的结构及超大的参数量要求相应的硬件必须具备超强的运算能力。面对日益增多的多功能智能终端的任务需求,超强的算力要求严重限制了这些主流神经网络算法在终端设备的部署。由此,为了能够在取得准确的识别结果的情况下,降低大网络参数量及运算量,需要通过网络剪枝的方式,移除大网络中的冗余参数,以有效降低网络前向推理的计算成本,最终成功实现端上设备的网络部署。目前的网络剪枝方法是采用L1正则化对代表神经元的重要程度的比例因子进行优化,以将比例因子低于一定阈值的神经元直接移除,从而实现神经网络的结构化剪枝,但这种剪枝方式,是利用L1正则化无差别的将所有比例因子向0推进,导致比例因子大量的集中在0附近,难以选择出合理的分割阈值,导致网络识别精度严重下降,同时剪枝过程的不稳定还会造成剪枝后网络性能下降,而且还需要对剪枝后的网络进行进一步微调,也会造成算力资源浪费。
[0004]因此,如何对图像识别网络进行更高效的剪枝,使得在取得准确的识别结果的情况下,能够降低网络参数量,提高图像的识别效率是目前亟待解决的技术问题。

技术实现思路

[0005]本申请实施例的主要目的在于提供一种图像识别方法、装置、存储介质及设备,能够对图像识别网络进行更高效的剪枝,以实现在保持优异的识别效果的情况下,有效提高图像的识别效率。
[0006]本申请实施例提供了一种图像识别方法,包括:
[0007]获取待识别的目标图像;
[0008]将所述目标图像输入至预先构建的图像识别模型,识别得到所述目标图像的特征向量;所述图像识别模型是根据神经元的算力进行自适应剪枝,并利用对抗训练和知识蒸馏的方式训练得到的神经网络模型;
[0009]根据所述目标图像的特征向量,对所述目标图像进行识别,得到所述目标图像的
识别结果。
[0010]一种可能的实现方式中,所述图像识别模型的构建方式如下:
[0011]获取样本图像和教师图像识别模型;所述教师图像识别模型是基于样本图像训练得到的神经网络模型;
[0012]将所述样本图像输入所述教师图像识别模型,得到第一样本特征向量及其所属的第一分类概率;将所述样本图像输入初始学生图像识别模型,得到第二样本特征向量及其所属的第二分类概率;所述初始学生图像识别模型为由所述教师图像识别模型中的神经元与初始比例因子相乘后得到的神经神经网络模型;
[0013]根据所述第一样本特征向量及其所属的第一分类概率、所述第二样本特征向量及其所属的第二分类概率、以及预设的判别器,利用对抗训练和知识蒸馏的方式,对所述初始学生图像识别模型进行训练,生成学生图像识别模型;
[0014]根据所述学生图像识别模型的比例因子分布,对所述学生图像识别模型进行剪枝,并将剪枝后的图像识别模型作为最终的图像识别模型。
[0015]一种可能的实现方式中,所述根据所述第一样本特征向量及其所属的第一分类概率、所述第二样本特征向量及其所属的第二分类概率、以及预设的判别器,利用对抗训练和知识蒸馏的方式,对所述初始学生图像识别模型进行训练,生成学生图像识别模型,包括:
[0016]利用所述初始学生图像识别模型中神经元的算力,计算所述初始学生图像识别模型对应的剪枝损失,作为第一目标函数;所述第一目标函数用于优化所述初始学生图像识别模型中神经元对应的比例因子;
[0017]计算所述第一分类概率和第二分类概率之间的KL散度损失,作为第二目标函数;所述第二目标函数用于提升所述初始学生图像识别模型的输出结果与所述教师图像识别模型的输出结果之间的相似度;
[0018]计算所述第二分类概率和所述样本图像对应的真实分类结果之间的交叉熵损失,作为第三目标函数;所述第三目标函数用于提升所述初始学生图像识别模型的输出结果与所述样本图像对应的真实分类结果之间的相似度;
[0019]将所述第一样本特征向量和所述第二样本特征向量输入预设的判别器进行对抗训练,得到二者的对抗损失,作为第四目标函数;所述第四目标函数用于实现所述第一样本特征向量与所述第二样本特征向量的最大化相似;
[0020]根据所述第一目标函数、第二目标函数、第三目标函数以及第四目标函数对所述初始学生图像识别模型进行训练,生成学生图像识别模型。
[0021]一种可能的实现方式中,所述根据所述第一目标函数、第二目标函数、第三目标函数以及第四目标函数对初始学生图像识别模型进行训练,生成学生图像识别模型,包括:
[0022]将所述第一目标函数、第二目标函数、第三目标函数以及第四目标函数进行加权求和,并根据所述和值,对所述初始学生图像识别模型进行训练,生成学生图像识别模型。
[0023]一种可能的实现方式中,所述根据所述学生图像识别模型的比例因子分布,对所述学生图像识别模型进行剪枝,并将剪枝后的学生图像识别模型作为最终的图像识别模型,包括:
[0024]根据所述学生图像识别模型的比例因子分布,确定低于预设阈值的比例因子;
[0025]将低于预设阈值的比例因子所对应的神经元从所述学生图像识别模型中移除,得
到剪枝后的学生图像识别模型,并将其作为最终的图像识别模型。
[0026]一种可能的实现方式中,所述根据所述学生图像识别模型的比例因子分布,对所述学生图像识别模型进行剪枝,并将剪枝后的学生图像识别模型作为最终的图像识别模型,包括:
[0027]根据所述学生图像识别模型的比例因子分布,确定比例因子的移除阈值;
[0028]将低于所述移除阈值的比例因子所对应的神经元从所述学生图像识别模型中移除,得到剪枝后的学生图像识别模型,并将其作为最终的图像识别模型。
[0029]一种可能的实现方式中,在所述根据所述学生图像识别模型的比例因子分布,对所述学生图像识别模型进行剪枝,并将剪枝后的学生图像识别模型作为最终的图像识别模型之后,所述方法还包括:
[0030]判断所述图像识别模型的参数量和理论计算量是否满足预设的硬件需求,若是,则利用所述预设的判别器对所述图像识别模型参数进行微调,并将调整后的图像识别模型作为最终的图像识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别的目标图像;将所述目标图像输入至预先构建的图像识别模型,识别得到所述目标图像的特征向量;所述图像识别模型是根据神经元的算力进行自适应剪枝,并利用对抗训练和知识蒸馏的方式训练得到的神经网络模型;根据所述目标图像的特征向量,对所述目标图像进行识别,得到所述目标图像的识别结果。2.根据权利要求1所述的方法,其特征在于,所述图像识别模型的构建方式如下:获取样本图像和教师图像识别模型;所述教师图像识别模型是基于样本图像训练得到的神经网络模型;将所述样本图像输入所述教师图像识别模型,得到第一样本特征向量及其所属的第一分类概率;将所述样本图像输入初始学生图像识别模型,得到第二样本特征向量及其所属的第二分类概率;所述初始学生图像识别模型为由所述教师图像识别模型中的神经元与初始比例因子相乘后得到的神经神经网络模型;根据所述第一样本特征向量及其所属的第一分类概率、所述第二样本特征向量及其所属的第二分类概率、以及预设的判别器,利用对抗训练和知识蒸馏的方式,对所述初始学生图像识别模型进行训练,生成学生图像识别模型;根据所述学生图像识别模型的比例因子分布,对所述学生图像识别模型进行剪枝,并将剪枝后的图像识别模型作为最终的图像识别模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一样本特征向量及其所属的第一分类概率、所述第二样本特征向量及其所属的第二分类概率、以及预设的判别器,利用对抗训练和知识蒸馏的方式,对所述初始学生图像识别模型进行训练,生成学生图像识别模型,包括:利用所述初始学生图像识别模型中神经元的算力,计算所述初始学生图像识别模型对应的剪枝损失,作为第一目标函数;所述第一目标函数用于优化所述初始学生图像识别模型中神经元对应的比例因子;计算所述第一分类概率和第二分类概率之间的KL散度损失,作为第二目标函数;所述第二目标函数用于提升所述初始学生图像识别模型的输出结果与所述教师图像识别模型的输出结果之间的相似度;计算所述第二分类概率和所述样本图像对应的真实分类结果之间的交叉熵损失,作为第三目标函数;所述第三目标函数用于提升所述初始学生图像识别模型的输出结果与所述样本图像对应的真实分类结果之间的相似度;将所述第一样本特征向量和所述第二样本特征向量输入预设的判别器进行对抗训练,得到二者的对抗损失,作为第四目标函数;所述第四目标函数用于实现所述第一样本特征向量与所述第二样本特征向量的最大化相似;根据所述第一目标函数、第二目标函数、第三目标函数以及第四目标函数对所述初始学生图像识别模型进行训练,生成学生图像识别模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一目标函数、第二目标函数、第三目标函数以及第四目标函数对初始学生图像识别模型进行训练,生成学生图像识
别模型,包括:将所述第一...

【专利技术属性】
技术研发人员:张圆
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1