System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 噪声标签数据训练的方法、装置、设备和计算机存储介质制造方法及图纸_技高网

噪声标签数据训练的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:40934468 阅读:2 留言:0更新日期:2024-04-18 14:54
本申请提供一种噪声标签数据训练方法噪声标签数据训练的方法、装置、设备和计算机存储介质。噪声标签数据训练方法,通过获取训练数据集(X,Y),其中,X为输入数据,Y为带噪声的标签;利用当前数据集及标签训练M神经网络模型;在每一个一代训练结束后,均做标签修正处理,得到每个样本数据经过修改后的标签;基于经过修改的样本标签,对M神经网络模型继续用交叉熵损失函数训练,得到每个样本数据经过修改后的标签,直到训练结束。通过拟合在训练过程中训练数据集的损失函数分布,计算出样本属于标记正确与标记错误的概率,并据此更新样本的标签进行训练,提高标签数据的准确率。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及噪声标签数据训练的方法、装置、设备和计算机存储介质


技术介绍

1、传统监督学习需要大量的数据以及准确的标注信息。但是在实际应用中,由于成本的问题,许多数据都会由于标注不准确而存在噪声。如果直接只用标签错误的噪声样本进行模型训练的话,由于神经网络模型具有强大的拟合能力,可能会对标签错误的样本进行过拟合,造成模型的识别能力下降。

2、因此,需要一种对深度神经网络模型的噪声标签具有鲁棒性的算法来解决潜在问题。


技术实现思路

1、本申请提供了一种噪声标签数据训练的方法和系统,旨在提高标签数据的准确率。

2、本申请提供一种噪声标签数据训练方法,所述方法包括:

3、获取训练数据集(x,y),其中,x为输入数据,y为带噪声的标签;

4、利用当前数据集及标签训练m神经网络模型;

5、在每一个一代训练结束后,均做标签修正处理,得到每个样本数据经过修改后的标签;

6、基于经过修改的样本标签,对m神经网络模型继续用交叉熵损失函数训练,在每一个一代训练结束后,下一个一代训练开始前,都执行标签修正处理,得到每个样本数据经过修改后的标签,直到训练结束。

7、在本申请实施例提供的噪声标签数据训练方法中,所述标签修正处理,包括:

8、用当前m神经网络模型对所有训练数据进行预测,得到每个样本的预测值h和带噪声标签y的损失函数值;

9、利用双峰高斯混合模型和双峰贝塔混合模型对当前损失函数分布用期望最大化算法进行拟合,拟合结果分别记为m1和m2,拟合结束后分别计算损失函数分布值li和两个模型预测值m(xi)的均方误差mse(m)-∑(m(xi)-li)2,并采用mse值较低的模型;

10、根据选定的模型,均值较少的分量记为gsmall,均值较大的分量记为glarge,基于公式

11、

12、计算得出每个样本loss值li其对应属于标记正确和标记错误的概率:

13、根据计算得出的样本属于标记正确的概率,对样本标签yi作修正处理。

14、在本申请实施例提供的噪声标签数据训练方法中,所述对样本标签yi作修正处理,包括通过下列公式实现:

15、其中yi为样本原始标签,hi为当前模型对样本预测的分数。

16、在本申请实施例提供的噪声标签数据训练方法中,模型预测的分数hi利用以下公式进行计算:

17、

18、其中hij指第i个样本中的类别j的分数,t为一个随一代训练增加而减少的变量。

19、在本申请实施例提供的噪声标签数据训练方法中,t起始值为10,训练到最后一个运动训练时,t取0.001;当t从大变小的过程中,一个样本中不同类别的分数h的分布会从较为均匀逐渐变为集中于其中一类。

20、在本申请实施例提供的噪声标签数据训练方法中,所述获取训练数据集(x,y),其中,x为输入数据,y为带噪声的标签,包括:

21、获取图像分类训练数据集(x,y),其中x为输入数据,y为带噪声的标签,类别数为10,图片数量为100万,其中有20%的标签标记错误。

22、在本申请实施例提供的噪声标签数据训练方法中,所述基于经过修改的样本标签,对m神经网络模型继续用交叉熵损失函数训练,在每一个一代训练结束后,下一个一代训练开始前,都执行标签修正处理,得到每个样本数据经过修改后的标签,直到训练结束,包括:

23、一代训练数量至少为100个,直至模型收敛。

24、本申请还提供一种噪声标签数据训练装置,所述噪声标签数据训练系统包括:

25、数据获取模块,用于获取训练数据集(x,y),其中,x为输入数据,y为带噪声的标签;

26、训练模块,用于利用当前数据集及标签训练m神经网络模型;

27、修正模块,用于在每一个一代训练结束后,均做标签修正处理,得到每个样本数据经过修改后的标签;

28、迭代模块,用于基于经过修改的样本标签,对m神经网络模型继续用交叉熵损失函数训练,在每一个一代训练结束后,下一个一代训练开始前,都执行标签修正处理,得到每个样本数据经过修改后的标签,直到训练结束。

29、本申请还提供一种计算机设备,包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器,非易失性存储介质可存储操作系统和计算机程序,该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行上述任一项所述噪声标签数据训练方法。

30、本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现上述任一项所述噪声标签数据训练方法。

31、本申请提供一种噪声标签数据训练方法,通过获取训练数据集(x,y),其中,x为输入数据,y为带噪声的标签;利用当前数据集及标签训练m神经网络模型;在每一个一代训练结束后,均做标签修正处理,得到每个样本数据经过修改后的标签;基于经过修改的样本标签,对m神经网络模型继续用交叉熵损失函数训练,在每一个一代训练结束后,下一个一代训练开始前,都执行标签修正处理,得到每个样本数据经过修改后的标签,直到训练结束。本专利技术提出,通过拟合在训练过程中训练数据集的损失函数分布,计算出样本属于标记正确与标记错误的概率,并据此更新样本的标签进行训练,能够提高标签数据的准确率。

本文档来自技高网...

【技术保护点】

1.一种噪声标签数据训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的噪声标签数据训练方法,其特征在于,所述标签修正处理,包括:

3.根据权利要求2所述的噪声标签数据训练方法,其特征在于,所述对样本标签yi作修正处理,包括通过下列公式实现:

4.根据权利要求3所述的噪声标签数据训练方法,其特征在于,模型预测的分数hi利用以下公式进行计算:

5.根据权利要求4所述的噪声标签数据训练方法,其特征在于,T起始值为10,训练到最后一个运动训练时,T取0.001;当T从大变小的过程中,一个样本中不同类别的分数h的分布会从较为均匀逐渐变为集中于其中一类。

6.根据权利要求1所述的噪声标签数据训练方法,其特征在于,所述获取训练数据集(X,Y),其中,X为输入数据,Y为带噪声的标签,包括:

7.根据权利要求1所述的噪声标签数据训练方法,其特征在于,所述基于经过修改的样本标签,对M神经网络模型继续用交叉熵损失函数训练,在每一个一代训练结束后,下一个一代训练开始前,都执行标签修正处理,得到每个样本数据经过修改后的标签,直到训练结束,包括:

8.一种噪声标签数据训练装置,其特征在于,所述噪声标签数据训练装置包括:

9.一种计算机设备,其特征在于,包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器,非易失性存储介质可存储操作系统和计算机程序,该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行权利要求1-7任一项所述噪声标签数据训练方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现权利要求1-7提供的任一项所述噪声标签数据训练方法。

...

【技术特征摘要】

1.一种噪声标签数据训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的噪声标签数据训练方法,其特征在于,所述标签修正处理,包括:

3.根据权利要求2所述的噪声标签数据训练方法,其特征在于,所述对样本标签yi作修正处理,包括通过下列公式实现:

4.根据权利要求3所述的噪声标签数据训练方法,其特征在于,模型预测的分数hi利用以下公式进行计算:

5.根据权利要求4所述的噪声标签数据训练方法,其特征在于,t起始值为10,训练到最后一个运动训练时,t取0.001;当t从大变小的过程中,一个样本中不同类别的分数h的分布会从较为均匀逐渐变为集中于其中一类。

6.根据权利要求1所述的噪声标签数据训练方法,其特征在于,所述获取训练数据集(x,y),其中,x为输入数据,y为带噪声的标签,包括:

7.根据权利要求1所述的噪声标签数据...

【专利技术属性】
技术研发人员:陆嘉达
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1