一种基于均衡互补熵的长尾图像分类方法及系统技术方案

技术编号：34336819 阅读：61 留言：0更新日期：2022-07-31 03:08

本发明专利技术公开了一种基于均衡互补熵的长尾图像分类方法及系统，其方法包括如下步骤：针对获取的长尾图像训练集，读取图像数据及标签；随机初始化卷积神经网络参数，采用mini

全部详细技术资料下载

【技术实现步骤摘要】
一种基于均衡互补熵的长尾图像分类方法及系统

[0001]本专利技术涉及深度学习图像分类
，具体涉及一种基于均衡互补熵的长尾图像分类方法及系统。

技术介绍

[0002]近年来，基于深度学习的图像分类技术取得巨大的成功，但大多数性能优越的图像分类技术依赖类别平衡的数据集，导致在类别不平衡的数据集中无法发挥较好的分类性能。在现实场景下，类别不平衡的数据集更趋向于长尾分布，其中数量占优势的类别称为头类，不具优势的类别称为尾类。若直接将长尾分布的数据集用于模型训练，由于头类和尾类的样本数量差异较大，传统的图像分类技术模型容易偏向于训练样本较多的头类，忽视样本数量较少的尾类，进而造成分类性能下降。为了解决这一问题，目前较为常用的解决方法有重采样(re
‑
sampling)技术和重加权(re
‑
weighting)技术。最基本的重采样技术通过过采样(over
‑
sampling)随机增加尾类的样本数量，或通过欠采样(under
‑
sampling)随机减少头部类的样本数量，使得长尾数据集的分布变得相对均衡。重加权技术为损失函数设计一个权重因子，以平衡不同类别间的损失值。然而，这两种常用的技术也存在一定的弊端。例如，重采样技术容易造成模型的过拟合或者欠拟合现象，而重加权技术需要精心地设计一个权重因子才能有效地提高模型分类性能。

技术实现思路

[0003]针对上述问题，本专利技术提出一种基于均衡互补熵的长尾图像分类方法及系统，通过新的均衡互补...

【技术保护点】

【技术特征摘要】
1.一种基于均衡互补熵的长尾图像分类方法，其特征在于，包括：步骤1、获取长尾图像训练集，针对长尾图像训练集，读取图像数据及标签；步骤2、随机初始化卷积神经网络参数，采用mini
‑
batch的方式对提取的图像数据进行前向计算，得到全连接层输出，并计算Softmax预测概率；步骤3、设计均衡互补熵损失函数，通过在归一化的互补熵损失函数中引入一个自适应权重系数，得到均衡互补熵损失函数，然后利用Softmax预测概率计算互补类的损失；步骤4、联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练，引导网络模型参数更新，得到图像分类模型。2.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法，其特征在于，所述读取图像数据，包括：读取输入图像的像素矩阵，用于后续的图像视觉特征处理。3.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法，其特征在于，所述得到全连接层输出，并计算Softmax预测概率，包括：采用卷积神经网络模型提取步骤1中输入长尾图像的像素矩阵，进行卷积层、激活函数层和池化层等前向计算处理，得到全连接层输入，根据全连接层输入得到全连接层输出，然后采用Softmax激活函数计算得到图像的Softmax预测概率。4.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法，其特征在于，所述自适应权重系数表达式为：其中，w
j
表示互补类(不正确类)j的权重系数，n
j
表示互补类j的样本数，n
sum
表示全部样本数，α是一个超参数设置。5.根据权利要求1所述的基...

【专利技术属性】
技术研发人员：杨钊，胡陆宇，李嘉壕，罗名凯，曹任龙，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人