当前位置: 首页 > 专利查询>哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院专利>正文

一种面向长尾分布场景下图片分类的模型训练方法技术

技术编号：31848430 阅读：29 留言：0更新日期：2022-01-12 13:30

本发明专利技术提供了一种面向长尾分布场景下图片分类的模型训练方法，包括：构建第一损失函数，用于加入原型归一化以及角域上与类别数量相关的带有边界的交叉熵分类损失；构建第二损失函数，使得各个类别的原型分散的更加均匀的，与类别数量相关最小角度最大化的正则项损失；构建第三损失函数，用于帮助模型有效训练的特征向量模长大小的正则化损失；将第一损失函数、第二损失函数、第三损失函数组合起来得到最终的损失函数Loss。本发明专利技术的有益效果是：本发明专利技术可以避免训练数据不均衡带来的模型先验偏差的问题以及进一步提升模型在测试集上的泛化性，从而在长尾分布场景下提升图片分类准确率。景下提升图片分类准确率。景下提升图片分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向长尾分布场景下图片分类的模型训练方法

[0001]本专利技术涉及图像处理
，尤其涉及一种面向长尾分布场景下图片分类的模型训练方法。

技术介绍

[0002]深度学习在图片分类领域已经取得了巨大的成功，但是现有的技术选择的实验环境过于理想，在训练数据中每一类的数量都是相同的。但是在实际场景下数据中各个类别的数量分布更倾向于趋于长尾分布，长尾分布中部分类别的数据量比较大称为头类，而与之对应的数据量比较小的类称为尾类。而在测试模型时因为要求模型对于每个类别都能学习到好的分类结果而会使用每个类别数量相同的测试集。在这种场景下，传统的分类方法的效果就会大打折扣。因此如何解决长尾分布下的分类问题是将深度学习技术投入到实际场景的至关重要的一步。
[0003]目前普通的使用softmax和交叉熵损失的图片分类方法在长尾场景下的表现会比较差。虽然已有了一种针对长文分布场景下的分类方法，主要包括一些重平衡的方法以及两阶段的方法，但是普通的重平衡的方法会容易过拟合到训练数据集上而导致泛化性较差，而两阶段的方法则会面临训练与测试时决策边界不一致的问题。

技术实现思路

[0004]为了解决现有技术中的问题，本专利技术提供了一种面向长尾分布场景下图片分类的模型训练方法，解决图片数据在长尾分布的场景下尾类的分类效果差的问题。
[0005]本专利技术提供了一种面向长尾分布场景下图片分类的模型训练方法，该模型训练方法表现为一个损失函数在端到端的模型训练下提升图片分类的准确率，该模型训练方法包括如下步骤：第一...

【技术保护点】

【技术特征摘要】
1.一种面向长尾分布场景下图片分类的模型训练方法，其特征在于，该模型训练方法表现为一个损失函数在端到端的模型训练下提升图片分类的准确率，该模型训练方法包括如下步骤：第一损失函数构建步骤：构建第一损失函数，用于加入原型归一化以及角域上与类别数量相关的带有边界的交叉熵分类损失；第二损失函数构建步骤：构建第二损失函数，使得各个类别的原型分散的更加均匀的，与类别数量相关最小角度最大化的正则项损失；第三损失函数构建步骤：构建第三损失函数，用于帮助模型有效训练的特征向量模长大小的正则化损失；最终损失函数构建步骤：将第一损失函数、第二损失函数、第三损失函数组合起来得到最终的损失函数Loss，，其中和为超参数。2.根据权利要求1所述的模型训练方法，其特征在于，每个类别所采用的边界通过计算得到，其中，m表示超参数，m决定了边界的大小，θy代表的是第y类的边界角度的大小，k为4，ny代表的是第y个类别的训练样本的数量。3.根据权利要求1所述的模型训练方法，其特征在于，在所述第一损失函数构建步骤中，计算得到分类损失的公式为：P(y|x)代表的是把图片的特征向量x归为第y类的概率，s是一个超参数，x为提取到的图片的特征向量，c是第c个类别，y是一个类别，θy代表的是第y类的边界角度的大小，θwy,x代表的是提取到的图片的特征向量和第y个类别的原型的向量的夹角大小，θwc,x代表的是提取到的图片的特征向量和第c个类别的原型的向量的夹角大小；N代表的是训练样本的总数量，yi代表的是第i个训练样本的标签...

【专利技术属性】
技术研发人员：高翠芸，高树政，王轩，陈清财，刘川意，廖清，罗文坚，王朝正，
申请(专利权)人：哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人