损失函数动态加权的方法、装置、设备和存储介质制造方法及图纸

技术编号：32454701 阅读：25 留言：0更新日期：2022-02-26 08:30

本发明专利技术公开了一种损失函数动态加权的方法、装置、设备和存储介质，包括：获取样本集内每个类别的先验概率；根据所述先验概率和当次模型训练中所输出的每个类别的预测概率，确定每个类别的难易权值；基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新，得到难易权值更新后的损失函数，实现了动态调整损失函数的权值变量，避免人为划分的难易权值在所选取的损失函数中效果不佳的现象，这样，在利用更新后的损失函数，确定当次模型训练的损失值后，对模型的超参数进行更新，使得越难的类别损失占比越大，越简单的类别损失占比越小，从而提高了模型训练效果。从而提高了模型训练效果。从而提高了模型训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
损失函数动态加权的方法、装置、设备和存储介质

[0001]本专利技术属于机器学习
，具体涉及一种损失函数动态加权的方法、装置、设备和存储介质。

技术介绍

[0002]近年来，随着人工智能浪潮的涌起，人工智能、机器学习在学术界乃至工业界所占分量越来越大。
[0003]传统的模型训练中，通常利用损失函数计算预测分布与真实分布之间的差距作为损失值，并利用损失值对模型进行调整，使得模型收敛。
[0004]在真实的环境中，往往各类别的学习难度不同，有的类别有比较简单固定的模式，较容易训练，而有的类别的样本，模式复杂多变，模型学习难度大。对于难易类别，一种较理想的加权方案是：给难类别加一个较大权值，给简单类别加一个较小权值，这样便可以增加难类别的损失占比。
[0005]但是这种方法需要事先知道类别的难易，而类别难易是一个相对概念，每个训练集中的类别都有相对难易，但是不同类别的难易差距可能不同，因此采用同一种区分方式可能会导致同一个损失函数在某一个类别上取得较好的效果，在另一个类别上却取得很差的效果。因此，训练集中各类别的难易程度，很难在模型训练前准确定量估计，导致模型训练效果较差。

技术实现思路

[0006]本专利技术的主要目的是提供一种损失函数动态加权的方法、装置、设备和存储介质，以解决现有技术中训练集中各类别的难易程度，很难在模型训练前准确定量估计，导致模型训练效果较差的技术问题。
[0007]针对上述问题，本专利技术提供了一种损失函数动态加权的方...

【技术保护点】

【技术特征摘要】
1.一种损失函数动态加权的方法，其特征在于，包括：获取样本集内每个类别的先验概率；根据所述先验概率和当次模型训练中所输出的每个类别的预测概率，确定每个类别的难易权值；基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新，得到难易权值更新后的损失函数，以利用更新后的损失函数，确定当次模型训练的损失值。2.根据权利要求1所述的损失函数动态加权的方法，其特征在于，获取类别集内每个类别的先验概率，包括：利用预设的先验概率计算式，获取样本集内每个类别的先验概率；所述先验概率计算式为：其中，p(c
i
)表示先验概率，c
i
表示第i个类别，n
i
表示c
i
对应的样本数量，K表示样本集中类别的数量，n
k
表示第k个类别对应的样本数量，Y表示类别难易控制参数，Y为常数。3.根据权利要求1所述的损失函数动态加权的方法，其特征在于，根据所述先验概率和当次模型训练中所输出的每个类别的预测概率，确定每个类别的难易权值，包括：将所述先验概率和当次模型训练中所输出的每个类别的预测概率代入预设的难易权值计算式，计算每个类别的难易权值；所述难易权值计算式为：W
d
＝(p(c
i
)
‑
p)2其中，W
d
表示难易权值，p(c
i
)表示先验概率，p表示预测概率。4.根据权利要求1所述的损失函数动态加权的方法，其特征在于，基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新，得到难易权值更新后的损失函数，包括：将所述每个类别的难易权值代入预设的权值变量更新计算式中，得到难易权值更新后的损失函数；所述权值变量更新计算式为：Loss＝
‑
W
d
＊log p其中，Loss表示更新后的损失函数，W
d
表示难易权值，
‑
log p表示预设的损失函数。5.一种损失函数动态加权的装置，其特征在于，包括：获取模块，用于获取样本集内每个类别的先验概率；确定模块，用于根据所述先验...

【专利技术属性】
技术研发人员：周开龙，陈颖辉，王范萍，张玥，
申请(专利权)人：上海小零网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人