图像识别模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33777936 阅读:75 留言:0更新日期:2022-06-12 14:31
本申请提供了一种图像识别模型的训练方法、装置、电子设备及存储介质,该方法包括:获取样本图像对应的第一图像特征向量;根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量;将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量;根据所有类别的平均图像特征向量和样本图像对应的分数向量,确定样本图像对应的第二图像特征向量;将样本图像的图像特征向量减去与样本图像对应的第二图像特征向量,计算样本图像的第三图像特征向量;根据所有样本图像的第三图像特征向量及其类别,对最新更新的图像识别模型进行模型更新。本申请能够消除干扰识别结果的图像特征,即上下文偏移现象。象。象。

【技术实现步骤摘要】
图像识别模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及图像识别
,具体而言,涉及一种图像识别模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着深度网络模型的发展,在图像识别任务中也开始使用深度网络模型,但是由于现有的用于图像识别的深度网络模型都是数据驱动的,依赖于数据概率统计,因此会发生上下文偏移现象。上下文偏移现象是指当数据集中的某物体经常出现在一个地点时,深度网络模型会因为图像中出现了该地点,而直接判断该物体的存在。
[0003]近年来消除上下文偏移现象的方法是根据具体的识别任务,通过无上下文偏移的数据集对模型进行训练,但是这种模型所用的数据集对于其他任务来说,依然存在着上下文偏移,因此,这种训练模型无法应用到其他的识别任务中。

技术实现思路

[0004]有鉴于此,本申请的目的在于提供一种图像识别模型的训练方法、装置、电子设备及存储介质,能够通过计算每个类别的平均图像特征向量和分数向量,得到第二图像特征,再用样本图像的第一图像特征向量减去第二图像特征向量,得到第三图像特征向量,第三图像特征也就是无上下文偏移的图像特征,然后再通过无上下文偏移的图像特征向量对模型进行训练,这样得到的图像识别模型在执行图像识别任务时,就会消除上下文偏移现象。
[0005]第一方面,本申请实施例提供了一种图像识别模型的训练方法,该方法包括:
[0006]获取样本图像对应的第一图像特征向量;根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量;
[0007]将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量;分数向量中包含每个类别的预测分数;
[0008]针对每一张样本图像,根据所有类别的平均图像特征向量和样本图像对应的分数向量,确定样本图像对应的第二图像特征向量;
[0009]将样本图像的图像特征向量减去与样本图像对应的第二图像特征向量,计算样本图像的第三图像特征向量;
[0010]根据所有样本图像的第三图像特征向量及其类别,对最新更新的图像识别模型进行模型更新。
[0011]在一种可能的实施方式中,在根据所有样本图像的第三图像特征向量及其类别,对图像识别模型进行模型更新之后,该方法还包括:
[0012]确定最新更新的图像识别模型的准确率;
[0013]若最新更新的图像识别模型的准确率大于上一轮更新的图像识别模型的准确率,则跳转到将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量的步骤;
[0014]若最新更新的图像识别模型的准确率小于等于上一轮更新的图像识别模型的准确率,将最新更新的图像识别模型确定为最终的图像识别模型。
[0015]在一种可能的实施方式中,获取样本图像对应的第一图像特征向量,包括:
[0016]将样本图像输入到最新更新的图像识别模型中,获取样本图像对应的第一图像特征向量。
[0017]在一种可能的实施方式中,根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量,包括:
[0018]针对每个类别,计算所有样本图像对应的类别中与类别相同的数量,得到类别的第一数值;
[0019]将所有属于类别的样本图像的第一图像特征向量进行相加,计算类别的图像特征向量的和,得到第二数值;
[0020]将类别对应的第二数值除以与其对应的第一数值,计算类别的平均图像特征向量。
[0021]在一种可能的实施方式中,根据所有类别的平均图像特征向量和样本图像对应的分数向量,确定样本图像对应的第二图像特征向量,包括:
[0022]将样本图像对应的分数向量进行非负处理,得到非负的分数向量;
[0023]将非负的分数向量进行归一化处理,得到样本图像对应的概率权重向量;概率权重向量中包含每个类别的预测概率;
[0024]将样本图像对应的概率权重向量和根据所有类别的平均图像特征向量组成的矩阵相乘,计算样本图像对应的第二图像特征向量。
[0025]第二方面,本申请实施例还提供了一种图像识别模型的训练装置,该装置包括:
[0026]获取模块,用于获取样本图像对应的第一图像特征向量;
[0027]计算模块,用于根据所有样本图像对应的类别和图像特征向量,计算每个类别的平均图像特征向量;
[0028]输入模块,用于将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量;分数向量中包含每个类别的预测分数;
[0029]确定模块,用于针对每一张样本图像,根据所有类别的平均图像特征向量和样本图像对应的分数向量,确定样本图像对应的第二图像特征向量;
[0030]计算模块,还用于将样本图像的图像特征向量减去与样本图像对应的第二图像特征向量,计算样本图像的第三图像特征向量;
[0031]更新模块,用于根据所有样本图像的第三图像特征向量及其类别,对最新更新的图像识别模型进行模型更新。
[0032]在一种可能的实施方式中,该装置还包括:跳转模块;
[0033]确定模块,还用于确定最新更新的图像识别模型的准确率;
[0034]跳转模块,用于若最新更新的图像识别模型的准确率大于上一轮更新的图像识别模型的准确率,则跳转到将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量的步骤;
[0035]确定模块,还用于若最新更新的图像识别模型的准确率小于等于上一轮更新的图像识别模型的准确率,将最新更新的图像识别模型确定为最终的图像识别模型。
[0036]在一种可能的实施方式中,获取模块,具体用于将样本图像输入到最新更新的图像识别模型中,获取样本图像对应的第一图像特征向量。
[0037]在一种可能的实施方式中,计算模块,具体用于针对每个类别,计算所有样本图像对应的类别中与类别相同的数量,得到类别的第一数值;将所有属于类别的样本图像的图像特征向量进行相加,计算类别的图像特征向量的和,得到第二数值;将类别对应的第二数值除以与其对应的第一数值,计算类别的平均图像特征向量。
[0038]在一种可能的实施方式中,确定模块,具体用于将样本图像对应的分数向量进行非负处理,得到非负的分数向量;将非负的分数向量进行归一化处理,得到样本图像对应的概率权重向量;概率权重向量中包含每个类别的预测概率;将样本图像对应的概率权重向量和根据所有类别的平均图像特征向量组成的矩阵相乘,计算样本图像对应的第二图像特征向量。
[0039]第三方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行如第一方面任一项图像识别模型的训练方法的步骤。
[0040]第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,所述方法包括:获取样本图像对应的第一图像特征向量;根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量;将所述样本图像输入到最新更新的图像识别模型中,得到所述样本图像对应的分数向量;所述分数向量中包含每个类别的预测分数;针对每一张样本图像,根据所有类别的平均图像特征向量和所述样本图像对应的分数向量,确定所述样本图像对应的第二图像特征向量;将所述样本图像的图像特征向量减去与所述样本图像对应的第二图像特征向量,计算所述样本图像的第三图像特征向量;根据所有样本图像的第三图像特征向量及其类别,对最新更新的图像识别模型进行模型更新。2.根据权利要求1所述的图像识别模型的训练方法,其特征在于,在根据所有样本图像的第三图像特征向量及其类别,对所述图像识别模型进行模型更新之后,所述方法还包括:确定所述最新更新的图像识别模型的准确率;若最新更新的图像识别模型的准确率大于上一轮更新的图像识别模型的准确率,则跳转到将所述样本图像输入到最新更新的图像识别模型中,得到所述样本图像对应的分数向量的步骤;若最新更新的图像识别模型的准确率小于等于上一轮更新的图像识别模型的准确率,将所述最新更新的图像识别模型确定为最终的图像识别模型。3.根据权利要求1所述的图像识别模型的训练方法,其特征在于,所述获取样本图像对应的第一图像特征向量,包括:将样本图像输入到最新更新的图像识别模型中,获取样本图像对应的第一图像特征向量。4.根据权利要求1所述的图像识别模型的训练方法,其特征在于,所述根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量,包括:针对每个类别,计算所有样本图像对应的类别中与所述类别相同的数量,得到所述类别的第一数值;将所有属于所述类别的样本图像对应的第一图像特征向量进行相加,计算所述类别的图像特征向量的和,得到第二数值;将所述类别对应的第二数值除以与其对应的第一数值,计算所述类别的平均图像特征向量。5.根据权利要求1所述的图像识别模型的训练方法,其特征在于,所述根据所有类别的平均图像特征向量和所述样本图像对应的分数向量,确定所述样本图像对应的第二图像特征向量,包括:将所述样本图像对应的分数向量进行非负处理,得到非负的分数向量;将所述非负的分数向量进行归一化处理,得到所述样本图...

【专利技术属性】
技术研发人员:李革柳儒扬李宏高伟
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1