模型训练方法、装置及设备制造方法及图纸

技术编号：38314658 阅读：26 留言：0更新日期：2023-07-29 08:56

本说明书实施例公开了一种模型训练方法、图像分类方法、装置及设备，该方法包括：将多个第一样本分别输入至目标模型中，得到每个第一样本对应的第一预测类别标签，并基于每个第一样本对应的第一预测类别标签得到多个第一样本对应的预测标签集合，第一样本为不存在类别标签的样本；基于多个第一增强样本，确定预测标签集合中不同的第一预测类别标签各自对应的基准特征；基于各第一预测类别标签对应的基准特征和与各第一预测类别标签对应的第一样本对应的特征，对多个第一样本对应的第一损失信息进行校准，得到校准后的第一损失信息；基于校准后的第一损失信息和多个第三样本对应的第二损失信息对目标模型进行训练，得到训练后的目标模型。后的目标模型。后的目标模型。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置及设备

[0001]本申请涉及计算机
，尤其涉及一种模型训练方法、装置及设备。

技术介绍

[0002]半监督学习的目的是通过少量存在标签的样本和大量的不存在标签的样本来提高神经网络的性能。
[0003]目前，通常采用的半监督学习方法为基于伪标签的学习方法。基于伪标签的学习方法是利用训练一定程度后的目标模型对输入样本进行标签分布预测得到预测的标签分布，并根据其中得到的结果，选择置信度较高的样本作为具有伪标签的样本，并以此对相应的模型进行后续训练。然而，由于在上述生成伪标签的过程中不可避免地会存在噪声的干扰，使得基于伪标签的半监督学习方法受到较大影响，从而降低了模型的性能和准确率。

技术实现思路

[0004]本说明书实施例的目的是提供一种提高模型训练的性能和准确率的技术方案。
[0005]为了解决上述技术问题，本专利技术实施例是这样实现的：
[0006]第一方面，本说明书实施例提供了一种模型训练的方法，所述方法包括：
[0007]将多个第一样本分别输入至目标模型中，得到每个所述第一样本对应的第一预测类别标签，并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合，所述第一样本为不存在类别标签的样本；
[0008]基于多个第一增强样本，确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征，其中，所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到；
[000...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：将多个第一样本分别输入至目标模型中，得到每个所述第一样本对应的第一预测类别标签，并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合，所述第一样本为不存在类别标签的样本；基于多个第一增强样本，确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征，其中，所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到；基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征，对所述多个第一样本对应的第一损失信息进行校准，得到校准后的第一损失信息；基于校准后的第一损失信息和所述多个第三样本对应的第二损失信息对所述目标模型进行训练，得到训练后的目标模型。2.根据权利要求1所述的方法，其特征在于，所述基于多个第一增强样本，确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征，包括：针对所述预测标签集合中每一种第一预测类别标签，执行下述处理：获取第一预测类别标签对应的多个第一增强样本，并确定获取的第一增强样本各自对应的特征，以及确定获取的第一增强样本的数量；基于所述获取的第一增强样本各自对应的特征和所述获取的第一增强样本的数量，计算所述获取的第一增强样本各自对应的特征的平均特征，将所述平均特征确定为所述第一预测类别标签对应的基准特征。3.根据权利要求2所述的方法，其特征在于，基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征，对所述多个第一样本对应的第一损失信息进行校准，得到校准后的第一损失信息，包括：针对所述预测标签集合中每一种第一预测类别标签执行下述处理：确定所述第一预测类别标签对应的所有第一样本与所述第一预测类别标签对应的所述基准特征之间的多个第一相似度；基于所述多个第一相似度，确定所述第一预测类别标签对应的所述第一样本的权重；基于所述第一预测类别标签对应的所述第一样本的权重对所述第一损失信息校准，得到校准后的第一损失信息。4.根据权利要求3所述的方法，其特征在于，所述基于所述多个第一相似度，确定所述第一预测类别标签对应的所述第一样本的权重，包括：获取目标超参数，所述目标超参数用于调整所述第一预测类别标签对应的所述第一样本的权重；基于所述目标超参数和所述第一相似度，确定所述第一预测类别标签对应的所述第一样本的权重。5.根据权利要求2所述的方法，其特征在于，所述基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征，对所述多个第一样本对应的第一损失信息进行校准，得到校准后的第一损失信息，包括：针对所述预测标签集合中的每一种第一预测类别标签，执行下述处理：
对第一预测类别标签对应的所有第...

【专利技术属性】
技术研发人员：吕永春，朱徽，周迅溢，曾定衡，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人