一种图像分类方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:36861774 阅读:61 留言:0更新日期:2023-03-15 18:37
本申请涉及深度神经网络技术领域,公开了一种图像分类方法、装置、设备和计算机可读存储介质,利用预训练神经网络模型对获取的图像数据集进行分析,以得到特征图像和分类预测值;对同类别特征图像进行相关性分析,以确定出同类别特征图像之间的相关系数;依据同类别特征图像各自对应的分类预测值,确定出同类别特征图像之间的分类预测偏差。依据相关系数与分类预测偏差之间的关联关系以及各特征图像对应的标签值和分类预测值,对预训练神经网络模型进行参数调整,以利用训练好的神经网络模型对获取的待分类图像进行分析,确定出待分类图像包含的图像类别。基于不同样本之间的相关性对模型进行微调,提升了图像分类识别的准确性。性。性。

【技术实现步骤摘要】
一种图像分类方法、装置、设备和计算机可读存储介质


[0001]本申请涉及深度神经网络
,特别是涉及一种图像分类方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]深度神经网络因其强大的数据处理和非线性数据拟合能力而被广泛地应用于解决各种复杂问题,无论是图像领域中分类、分割、目标检测问题,还是自然语言处理、语音识别等都表现出强大的性能。但是复杂的神经网络结构除了能获得性能的提升外,还可能会导致过拟合问题。过拟合表示神经网络模型学习过于最小化训练数据集的误差,但测试数据的性能较差。除模型复杂度过高之外,样本数目少、类别数目分布不均衡、分类难易程度不均衡、样本噪声等原因都会加剧模型过拟合问题。
[0003]传统改善模型过拟合问题的方案中,主要是从模型训练配置和模型构造两方面改进,模型训练配置方法的改善效果通常较小,模型构造可以从根本上影响模型训练,因而改善效果更好些,其中模型构造的改进以损失函数的构造为主。
[0004]目前损失函数构造的技术方案可分为两类。一类是改善样本不均衡问题的权重微调,另一类是基于样本特征图像之间距离的正则项构造损失函数。前者侧重样本不均衡问题,后者侧重考虑样本内部相关性。但是这些方案改善效果有限,神经网络模型仍存在过拟合的问题,从而影响图像分类识别的准确性。
[0005]可见,如何提升图像分类识别的准确性,是本领域技术人员需要解决的问题。

技术实现思路

[0006]本申请实施例的目的是提供一种图像分类方法、装置、设备和计算机可读存储介质,可以提升图像分类识别的准确性。
[0007]为解决上述技术问题,本申请实施例提供一种图像分类方法,包括:利用预训练神经网络模型对获取的图像数据集进行分析,以得到特征图像和分类预测值;对同类别特征图像进行相关性分析,以确定出所述同类别特征图像之间的相关系数;依据所述同类别特征图像各自对应的分类预测值,确定出所述同类别特征图像之间的分类预测偏差;依据所述相关系数与所述分类预测偏差之间的关联关系以及各所述特征图像对应的标签值和所述分类预测值,对所述预训练神经网络模型进行参数调整,以得到训练好的神经网络模型;利用所述训练好的神经网络模型对获取的待分类图像进行分析,以确定出所述待分类图像包含的图像类别。
[0008]可选地,所述依据所述相关系数与所述分类预测偏差之间的关联关系以及各所述
特征图像对应的标签值和所述分类预测值,对所述预训练神经网络模型进行参数调整,以得到训练好的神经网络模型包括:利用支持向量机算法,对所述同类别特征图像之间的相关系数以及所述分类预测偏差进行拟合,以构建出用于表征样本间相关性的正则项;基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项;将所述误差损失项与所述正则项作为损失函数;利用所述损失函数对所述预训练神经网络模型进行训练,以得到训练好的神经网络模型。
[0009]可选地,所述利用支持向量机算法,对所述同类别特征图像之间的相关系数以及所述分类预测偏差进行拟合,以构建出用于表征样本间相关性的正则项包括:将每个类别所对应的相关系数以及分类预测偏差作为训练样本;利用所述训练样本对构建的支持向量机回归模型进行训练,以得到所述相关系数与所述分类预测偏差之间的线性关系;基于所述线性关系拟合出的分类预测偏差与所述预训练神经网络模型输出的分类预测值之间的偏差,构建所述正则项。
[0010]可选地,所述基于所述线性关系拟合出的分类预测偏差与所述预训练神经网络模型输出的分类预测值之间的偏差,构建所述正则项包括:利用所述线性关系拟合出同类别下任意两个特征图像对应的分类预测偏差;获取所述预训练神经网络模型输出的所述任意两个特征图像各自对应分类预测值;将所述任意两个特征图像各自对应的分类预测值的差值的平方作为模型预测偏差;将所述分类预测偏差与所述模型预测偏差的差值的平方作为正则项。
[0011]可选地,所述基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项包括:将各所述特征图像对应的标签值和所述分类预测值进行均方差运算,以得到误差损失项。
[0012]可选地,所述基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项包括:将各所述特征图像对应的标签值和所述分类预测值进行交叉熵运算,以得到误差损失项。
[0013]可选地,所述对同类别特征图像进行相关性分析,以确定出所述同类别特征图像之间的相关系数包括:计算目标类别下所有特征图像各自对应的图像均值;其中,所述目标类别为所述预训练神经网络模型包含的所有类别中的任意一个类别;基于所述图像均值以及所述目标类别下任意两个特征图像,构建出所述目标类别下任意两个特征图像之间的相关系数。
[0014]可选地,所述基于所述图像均值以及所述目标类别下任意两个特征图像,构建出所述目标类别下任意两个特征图像之间的相关系数包括:
将所述图像均值以及所述目标类别下任意两个特征图像输入至预先设置的相关系数计算公式,以得到所述目标类别下任意两个特征图像之间的相关系数;所述相关系数计算公式为:;其中,c表示目标类别,i表示目标类别下的第i个样本,j表示目标类别下的第j个样本,k表示通道数,表示目标类别c下第i个样本和第j个样本之间的相关系数,表示第i个样本的特征图像,表示第i个样本的特征图像的图像均值,表示第j个样本的特征图像,表示第j个样本的特征图像的图像均值,m表示特征图像的像素点的行下标,n表示特征图像的像素点的列下标。
[0015]可选地,所述依据所述同类别特征图像各自对应的分类预测值,确定出所述同类别特征图像之间的分类预测偏差包括:将目标类别下任意两个特征图像对应的分类预测值的L2范数的平方作为所述目标类别下任意两个特征图像对应的分类预测偏差;其中,所述目标类别为所述预训练神经网络模型包含的所有类别中的任意一个类别。
[0016]可选地,针对于所述图像数据集的获取过程,所述方法包括:获取初始图像数据集;对所述初始图像数据集进行预处理,以得到所述图像数据集。
[0017]可选地,所述对所述初始图像数据集进行预处理,以得到所述图像数据集包括:对所述初始图像数据集包含的图像进行裁剪、翻转和/或旋转处理,以得到新的图像数据集;按照所述预训练神经网络模型的输入图像尺寸,将所述新的图像数据集以及所述初始图像数据集包含的图像进行尺寸调整,以得到所述图像数据集。
[0018]可选地,在所述按照所述预训练神经网络模型的输入图像尺寸,将所述新的图像数据集以及所述初始图像数据集包含的图像进行尺寸调整之后还包括:计算尺寸调整后的图像对应的亮度均值和方差;基于所述亮度均值和所述方差,对所述尺寸调整后的图像进行规范化处理,以得到最终的图像数据集。
[0019]可选地,在所述对同类别特征图像进行相关性分析,以确定出所述同类别特征图像之间的相关系数之前还包括:依据主成分分析法对所述特征图像进行降维处理,以得到最新的特征图像。
[0020]可选地,所述依据主成分分析法对所述特征图像进行降维处理,以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:利用预训练神经网络模型对获取的图像数据集进行分析,以得到特征图像和分类预测值;对同类别特征图像进行相关性分析,以确定出所述同类别特征图像之间的相关系数;依据所述同类别特征图像各自对应的分类预测值,确定出所述同类别特征图像之间的分类预测偏差;依据所述相关系数与所述分类预测偏差之间的关联关系以及各所述特征图像对应的标签值和所述分类预测值,对所述预训练神经网络模型进行参数调整,以得到训练好的神经网络模型;利用所述训练好的神经网络模型对获取的待分类图像进行分析,以确定出所述待分类图像包含的图像类别。2.根据权利要求1所述的图像分类方法,其特征在于,所述依据所述相关系数与所述分类预测偏差之间的关联关系以及各所述特征图像对应的标签值和所述分类预测值,对所述预训练神经网络模型进行参数调整,以得到训练好的神经网络模型包括:利用支持向量机算法,对所述同类别特征图像之间的相关系数以及所述分类预测偏差进行拟合,以构建出用于表征样本间相关性的正则项;基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项;将所述误差损失项与所述正则项作为损失函数;利用所述损失函数对所述预训练神经网络模型进行训练,以得到训练好的神经网络模型。3.根据权利要求2所述的图像分类方法,其特征在于,所述利用支持向量机算法,对所述同类别特征图像之间的相关系数以及所述分类预测偏差进行拟合,以构建出用于表征样本间相关性的正则项包括:将每个类别所对应的相关系数以及分类预测偏差作为训练样本;利用所述训练样本对构建的支持向量机回归模型进行训练,以得到所述相关系数与所述分类预测偏差之间的线性关系;基于所述线性关系拟合出的分类预测偏差与所述预训练神经网络模型输出的分类预测值之间的偏差,构建所述正则项。4.根据权利要求3所述的图像分类方法,其特征在于,所述基于所述线性关系拟合出的分类预测偏差与所述预训练神经网络模型输出的分类预测值之间的偏差,构建所述正则项包括:利用所述线性关系拟合出同类别下任意两个特征图像对应的分类预测偏差;获取所述预训练神经网络模型输出的所述任意两个特征图像各自对应分类预测值;将所述任意两个特征图像各自对应的分类预测值的差值的平方作为模型预测偏差;将所述分类预测偏差与所述模型预测偏差的差值的平方作为正则项。5.根据权利要求2所述的图像分类方法,其特征在于,所述基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项包括:将各所述特征图像对应的标签值和所述分类预测值进行均方差运算,以得到误差损失项。
6.根据权利要求2所述的图像分类方法,其特征在于,所述基于各所述特征图像对应的标签值和所述分类预测值,构造误差损失项包括:将各所述特征图像对应的标签值和所述分类预测值进行交叉熵运算,以得到误差损失项。7.根据权利要求1所述的图像分类方法,其特征在于,所述对同类别特征图像进行相关性分析,以确定出所述同类别特征图像之间的相关系数包括:计算目标类别下所有特征图像各自对应的图像均值;其中,所述目标类别为所述预训练神经网络模型包含的所有类别中的任意一个类别;基于所述图像均值以及所述目标类别下任意两个特征图像,构建出所述目标类别下任意两个特征图像之间的相关系数。8.根据权利要求7所述的图像分类方法,其特征在于,所述基于所述图像均值以及所述目标类别下任意两个特征图像,构建出所述目标类别下任意两个特征图像之间的相关系数包括:将所述图像均值以及所述目标类别下任意两个特征图像输入至预先设置的相关系数计算公式,以得到所述目标类别下任意两个特征图像之间的相关系数;所述相关系数计算公式为:;其中,c表示目标类别,i表示目标类别下的第i个样本,j表示目标类别下的第j个样本,k表示通道数,表示目标类别c下第i个样本和第j个样本之间的相关系数,表示第i个样本的特征图像,表示第i个样本的特征图像的图像均值,表示第j个样本的特征图像,表示第j个样本的特征图像的图像均值,m表示特征图像的像素点的行下标,n表示特征图像的像素点的列下标。9.根据权利要求1所述的图像分类方法,其特征在于,所述依据所述同类别特征图像各自对应的分类预测值,确定出所述同类别特征图像之间的分类预测偏差包括:将目标类别下任意两个特征图像对应的分类预测值的L2范数的平方作为所述目标类别下任意两个特征图像对...

【专利技术属性】
技术研发人员:沈艳梅宿栋栋刘伟阚宏伟王彦伟李仁刚
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1