一种基于稀疏矩阵算法的图像模型优化方法及装置制造方法及图纸

技术编号:39050728 阅读:14 留言:0更新日期:2023-10-12 19:43
本公开提供一种基于稀疏矩阵算法的图像模型优化方法及装置,通过将预先获取的图像训练集输入当前待优化图像模型进行训练,并获取当前待优化图像模型对应的待处理扰动参数,获取当前稀疏掩码,基于当前稀疏掩码以及待处理扰动参数,计算当前扰动参数,并基于当前扰动参数,采用梯度下降随机梯度下降的方法,得到更新模型参数,在更新模型参数对应的图像模型未收敛的情况下,将更新模型参数对应的图像模型作为当前待优化图像模型,并返回将预先获取的图像训练集输入当前待优化图像模型进行训练的步骤,直至当前待优化图像模型收敛,得到已优化图像模型。这样,能够进一步提高已优化图像模型的泛化能力,并提高已优化图像模型进行图像识别的准确率。行图像识别的准确率。行图像识别的准确率。

【技术实现步骤摘要】
一种基于稀疏矩阵算法的图像模型优化方法及装置


[0001]本公开涉及人工智能
,尤其涉及一种基于稀疏矩阵算法的图像模型优化方法及装置。

技术介绍

[0002]深度学习的发展得益于庞大的数据量。针对图像领域来说,基于庞大的图像数据量所训练的图像模型容易收敛到优化空间更为尖锐的局部最优解,这使得图像模型泛化能力变弱。
[0003]在图像模型泛化能力变弱的情况下,会导致图像模型对图像进行识别的准确率下降,例如,在对图像模型的训练集中不包括的图像数据进行识别的情况下,也就是在图像模型对未识别过的图像数据进行识别的情况下,泛化能力越弱,会导致对于图像数据识别的准确率越低。又例如,在图像模型对分辨率较低的图像数据进行识别的情况下,泛化能力越弱,会导致对于图像数据的识别的准确率越低。
[0004]因此,亟需一种能够提高图像模型的泛化能力,从而提高图像识别的准确率的方法。

技术实现思路

[0005]本公开提供一种基于稀疏矩阵算法的图像模型优化方法及装置,用以解决现有技术中图像模型的泛化能力差的缺陷,实现进一步提高图像模型的泛化能力。
[0006]本公开提供一种基于稀疏矩阵算法的图像模型优化方法,包括:
[0007]将预先获取的图像训练集输入当前待优化图像模型进行训练,并获取所述当前待优化图像模型对应的待处理扰动参数,其中,所述待处理扰动参数为基于所述当前待优化图像模型的参数获得的参数;
[0008]获取当前稀疏掩码,其中,所述当前稀疏掩码为表征所述当前待优化图像模型的当前优化状态的稀疏掩码;
[0009]基于所述当前稀疏掩码以及所述待处理扰动参数,计算当前扰动参数,并基于所述当前扰动参数,采用随机梯度下降的方法,得到更新模型参数;
[0010]在所述更新模型参数对应的图像模型未收敛的情况下,将所述更新模型参数对应的图像模型作为当前待优化图像模型,并返回所述将预先获取的图像训练集输入当前待优化图像模型进行训练的步骤,直至所述当前待优化图像模型收敛,得到已优化图像模型,其中,所述已优化图像模型用于对待处理图像进行图像识别。
[0011]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,在所述获取当前稀疏掩码的步骤之前,所述方法还包括:
[0012]判断待确定稀疏掩码是否需要更新,其中,所述待确定稀疏掩码为表征所述当前待优化图像模型的上一优化状态的稀疏掩码;
[0013]在确定所述待确定稀疏掩码需要更新的情况下,基于稀疏度获取更新稀疏掩码,
并将所述更新稀疏掩码作为当前稀疏掩码,其中,所述稀疏度为所述待确定稀疏掩码的稀疏度;
[0014]在确定所述待确定稀疏掩码不需要更新的情况下,将所述待确定稀疏掩码作为当前稀疏掩码。
[0015]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述获取所述当前待优化图像模型对应的待处理扰动参数的步骤,包括:
[0016]从所述图像训练集中抽取预设数量个图像训练样本,作为待处理图像样本;
[0017]计算所述待处理图像样本对应的第一损失函数;
[0018]将所述第一损失函数对所述当前待优化图像模型的参数的梯度,作为第一梯度参数;
[0019]基于所述第一梯度参数以及预先获取的扰动参数的幅度,确定待处理扰动参数。
[0020]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述基于稀疏度获取更新稀疏掩码的步骤,包括:
[0021]针对每个所述待处理图像样本,获取该待处理图像样本的费希尔信息量;
[0022]基于所述稀疏度,确定调整数量;
[0023]在多个所述待处理图像样本中,确定满足第二预设条件的费希尔信息量对应的待处理图像样本,并根据所述调整数量选取对应数量的待处理图像样本,作为目标图像样本,并将所述目标图像样本的掩码置1;
[0024]将其余待处理图像样本对应的掩码置0,得到更新稀疏掩码。
[0025]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述基于稀疏度获取更新稀疏掩码的步骤,包括:
[0026]基于预设剪枝率以及所述稀疏度,获取遗弃扰动数量以及复原扰动数量,其中,所述遗弃扰动数量与所述复原扰动数量相等;
[0027]基于所述遗弃扰动数量以及所述复原扰动数量,将所述待确定稀疏掩码中满足第一预设条件的掩码置1,将所述待确定稀疏掩码中不满足第一预设条件的掩码置0,得到更新稀疏掩码。
[0028]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述基于所述遗弃扰动数量以及所述复原扰动数量,将所述待确定稀疏掩码中满足第一预设条件的掩码置1的步骤,包括:
[0029]基于所述第一梯度参数,从所述待确定稀疏掩码中掩码值为1的掩码中,删除所述遗弃扰动数量个掩码;
[0030]将所述待确定稀疏掩码中剩余的掩码值为1的掩码,确定为满足第一预设条件的掩码,且保持掩码值为1;
[0031]从所述待确定稀疏掩码中掩码值为0的掩码中,随机选取复原扰动数量个掩码,将随机选取的掩码确定为满足第一预设条件的掩码并置1。
[0032]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述基于所述当前稀疏掩码以及所述待处理扰动参数,计算当前扰动参数的步骤,包括:
[0033]计算所述当前稀疏掩码和所述待处理扰动参数的哈达姆积,得到当前扰动参数。
[0034]根据本公开提供的一种基于稀疏矩阵算法的图像模型优化方法,所述基于所述当
前扰动参数,采用随机梯度下降的方法,得到更新模型参数的步骤,包括:
[0035]将当前扰动参数以及所述当前待优化图像模型的参数的和,作为待处理参数;
[0036]计算待处理参数对应的第二损失函数,并将所述第二损失函数对所述当前待优化图像模型的参数的梯度,作为第二梯度参数;
[0037]将预先获取的学习率和所述第二梯度参数的乘积,作为第三梯度参数;
[0038]将所述当前待优化图像模型的参数以及所述第三梯度参数的差值,作为更新模型参数。
[0039]本公开还提供一种基于稀疏矩阵算法的图像模型优化装置,装置包括:
[0040]第一获取模块,用于将预先获取的图像训练集输入当前待优化图像模型进行训练,并获取所述当前待优化图像模型对应的待处理扰动参数,其中,所述待处理扰动参数为基于所述当前待优化图像模型的参数获得的参数;
[0041]第二获取模块,用于获取当前稀疏掩码,其中,所述当前稀疏掩码为表征所述当前待优化图像模型的当前优化状态的稀疏掩码;
[0042]计算模块,用于基于所述当前稀疏掩码以及所述待处理扰动参数,计算当前扰动参数,并基于所述当前扰动参数,采用随机梯度下降的方法,得到更新模型参数;
[0043]训练模块,用于在所述更新模型参数对应的图像模型未收敛的情况下,将所述更新模型参数对应的图像模型作为当前待优化图像模型,并返回所述将预先获取的图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于稀疏矩阵算法的图像模型优化方法,其特征在于,所述方法包括:将预先获取的图像训练集输入当前待优化图像模型进行训练,并获取所述当前待优化图像模型对应的待处理扰动参数,其中,所述待处理扰动参数为基于所述当前待优化图像模型的参数获得的参数;获取当前稀疏掩码,其中,所述当前稀疏掩码为表征所述当前待优化图像模型的当前优化状态的稀疏掩码;基于所述当前稀疏掩码以及所述待处理扰动参数,计算当前扰动参数,并基于所述当前扰动参数,采用随机梯度下降的方法,得到更新模型参数;在所述更新模型参数对应的图像模型未收敛的情况下,将所述更新模型参数对应的图像模型作为当前待优化图像模型,并返回所述将预先获取的图像训练集输入当前待优化图像模型进行训练的步骤,直至所述当前待优化图像模型收敛,得到已优化图像模型,其中,所述已优化图像模型用于对待处理图像进行图像识别。2.根据权利要求1所述的一种基于稀疏矩阵算法的图像模型优化方法,其特征在于,在所述获取当前稀疏掩码的步骤之前,所述方法还包括:判断待确定稀疏掩码是否需要更新,其中,所述待确定稀疏掩码为表征所述当前待优化图像模型的上一优化状态的稀疏掩码;在确定所述待确定稀疏掩码需要更新的情况下,基于稀疏度获取更新稀疏掩码,并将所述更新稀疏掩码作为当前稀疏掩码,其中,所述稀疏度为所述待确定稀疏掩码的稀疏度;在确定所述待确定稀疏掩码不需要更新的情况下,将所述待确定稀疏掩码作为当前稀疏掩码。3.根据权利要求2所述的一种基于稀疏矩阵算法的图像模型优化方法,其特征在于,所述获取所述当前待优化图像模型对应的待处理扰动参数的步骤,包括:从所述图像训练集中抽取预设数量个图像训练样本,作为待处理图像样本;计算所述待处理图像样本对应的第一损失函数;将所述第一损失函数对所述当前待优化图像模型的参数的梯度,作为第一梯度参数;基于所述第一梯度参数以及预先获取的扰动参数的幅度,确定待处理扰动参数。4.根据权利要求3所述的一种基于稀疏矩阵算法的图像模型优化方法,其特征在于,所述基于稀疏度获取更新稀疏掩码的步骤,包括:针对每个所述待处理图像样本,获取该待处理图像样本的费希尔信息量;基于所述稀疏度,确定调整数量;在多个所述待处理图像样本中,确定满足第二预设条件的费希尔信息量对应的待处理图像样本,并根据所述调整数量选取对应数量的待处理图像样本,作为目标图像样本,并将所述目标图像样本的掩码置1;将其余待处理图像样本对应的掩码置0,得到更新稀疏掩码。5.根据权利要求3所述的一种基于稀疏矩阵算法的图像模型优化方法,其特征在于,所述基于稀疏度获取更新稀疏掩码的步骤,包括:基于预设剪枝率以及所述稀疏度,获取遗弃扰动数量以及复原扰动数量,其中,所述遗弃扰动数量与所述复原扰动数量相等;基于所述遗弃扰动数量以及所述复原扰动数量,将所述待确定稀疏掩码中满足第一预
设条件的掩码置1,将所述待确定稀疏掩码中不满足第一预设条件的掩码置0,得到更新稀疏掩码。6.根...

【专利技术属性】
技术研发人员:沈力米芃陶大程
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1