模型训练方法、装置及设备制造方法及图纸

技术编号:38314658 阅读:26 留言:0更新日期:2023-07-29 08:56
本说明书实施例公开了一种模型训练方法、图像分类方法、装置及设备,该方法包括:将多个第一样本分别输入至目标模型中,得到每个第一样本对应的第一预测类别标签,并基于每个第一样本对应的第一预测类别标签得到多个第一样本对应的预测标签集合,第一样本为不存在类别标签的样本;基于多个第一增强样本,确定预测标签集合中不同的第一预测类别标签各自对应的基准特征;基于各第一预测类别标签对应的基准特征和与各第一预测类别标签对应的第一样本对应的特征,对多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息;基于校准后的第一损失信息和多个第三样本对应的第二损失信息对目标模型进行训练,得到训练后的目标模型。后的目标模型。后的目标模型。

【技术实现步骤摘要】
模型训练方法、装置及设备


[0001]本申请涉及计算机
,尤其涉及一种模型训练方法、装置及设备。

技术介绍

[0002]半监督学习的目的是通过少量存在标签的样本和大量的不存在标签的样本来提高神经网络的性能。
[0003]目前,通常采用的半监督学习方法为基于伪标签的学习方法。基于伪标签的学习方法是利用训练一定程度后的目标模型对输入样本进行标签分布预测得到预测的标签分布,并根据其中得到的结果,选择置信度较高的样本作为具有伪标签的样本,并以此对相应的模型进行后续训练。然而,由于在上述生成伪标签的过程中不可避免地会存在噪声的干扰,使得基于伪标签的半监督学习方法受到较大影响,从而降低了模型的性能和准确率。

技术实现思路

[0004]本说明书实施例的目的是提供一种提高模型训练的性能和准确率的技术方案。
[0005]为了解决上述技术问题,本专利技术实施例是这样实现的:
[0006]第一方面,本说明书实施例提供了一种模型训练的方法,所述方法包括:
[0007]将多个第一样本分别输入至目标模型中,得到每个所述第一样本对应的第一预测类别标签,并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合,所述第一样本为不存在类别标签的样本;
[0008]基于多个第一增强样本,确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征,其中,所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到;
[0009]基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息;
[0010]基于校准后的第一损失信息和所述多个第三样本对应的第二损失信息对所述目标模型进行训练,得到训练后的目标模型。
[0011]第二方面,本说明书实施例提供了一种图像分类的方法,所述方法包括:
[0012]获取待分类的目标图像;
[0013]将所述目标图像输入到用于图像分类的预先训练的目标模型中,得到所述目标图像对应的分类结果。
[0014]第三方面,本说明书实施例提供的一种模型训练装置,所述装置包括:
[0015]样本输入模块,被配置为将多个第一样本分别输入至目标模型中,得到每个所述第一样本对应的第一预测类别标签,并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合,所述第一样本为不存在类别标签的样本;
[0016]基准特征确定模块,被配置为基于多个第一增强样本,确定所述预测标签集合中
不同的第一预测类别标签各自对应的基准特征,其中,所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到;
[0017]损失信息校准模块,被配置为基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息;
[0018]模型训练模块,被配置为基于校准后的第一损失信息和所述多个第三样本对应的第二损失信息对所述目标模型进行训练,得到训练后的目标模型。
[0019]第四方面,本说明书实施例提供的一种图像分类装置,所述装置包括:
[0020]图像获取模块,被配置为获取待分类的目标图像;
[0021]图像输入模块,被配置为将所述目标图像输入到用于图像分类的预先训练的目标模型中,得到所述目标图像对应的分类结果。
[0022]第五方面,本说明书实施例提供的一种模型训练设备,所述模型训练设备包括:
[0023]处理器;以及
[0024]被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令包括用于执行如第一方面中所述的方法中的步骤。
[0025]第六方面,本说明书实施例提供的一种图像分类设备,所述图像分类设备包括:
[0026]处理器;以及
[0027]被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令包括用于执行如第二方面中所述的方法中的步骤。
[0028]第七方面,本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行如第一方面中所述的方法中的步骤。
[0029]第八方面,本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行如第二方面中所述的方法中的步骤。
[0030]可以看出,在本说明书实施例中,由于在对上述目标模型进行训练的过程中对于训练过程中所采用的多个第一样本,通过基于各第一预测类别标签对应的基准特征和与各第一预测类别标签对应的第一样本对应的特征,对多个第一样本对应的第一损失信息进行校准,这样,在使用校准后的第一损失信息和多个第三样本对应的第二损失信息对目标模型进行训练的方法,有效提高了模型训练的性能和准确率。通过本说明书的实施例,进一步有效避免了在对目标模型训练过程中,由于在利用对第一样本预测的标签分布信息来对上述目标模型进行训练过程中,可能存在所预测标签分布信息不准确,进而导致在基于上述不准确的预测标签分布信息对目标模型进行训练时造成所训练的模型准确率不高的问题。
附图说明
[0031]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0032]图1为本说明书一种模型训练方法实施例;
[0033]图2为本说明书一种模型训练方法的示意图;
[0034]图3为本说明书一种模型训练方法的示意图;
[0035]图4为本说明书又一种模型训练方法实施例;
[0036]图5为本说明书又一种模型训练方法实施例;
[0037]图6为本说明书又一种模型训练方法实施例;
[0038]图7为本说明书一种图像分类方法实施例;
[0039]图8为本说明书又一种图像分类方法实施例;
[0040]图9为本说明书一种模型训练装置实施例;
[0041]图10为本说明书一种图像分类装置实施例;
[0042]图11为本说明书一种模型训练设备实施例。
具体实施方式
[0043]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:将多个第一样本分别输入至目标模型中,得到每个所述第一样本对应的第一预测类别标签,并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合,所述第一样本为不存在类别标签的样本;基于多个第一增强样本,确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征,其中,所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到;基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息;基于校准后的第一损失信息和所述多个第三样本对应的第二损失信息对所述目标模型进行训练,得到训练后的目标模型。2.根据权利要求1所述的方法,其特征在于,所述基于多个第一增强样本,确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征,包括:针对所述预测标签集合中每一种第一预测类别标签,执行下述处理:获取第一预测类别标签对应的多个第一增强样本,并确定获取的第一增强样本各自对应的特征,以及确定获取的第一增强样本的数量;基于所述获取的第一增强样本各自对应的特征和所述获取的第一增强样本的数量,计算所述获取的第一增强样本各自对应的特征的平均特征,将所述平均特征确定为所述第一预测类别标签对应的基准特征。3.根据权利要求2所述的方法,其特征在于,基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息,包括:针对所述预测标签集合中每一种第一预测类别标签执行下述处理:确定所述第一预测类别标签对应的所有第一样本与所述第一预测类别标签对应的所述基准特征之间的多个第一相似度;基于所述多个第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重;基于所述第一预测类别标签对应的所述第一样本的权重对所述第一损失信息校准,得到校准后的第一损失信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重,包括:获取目标超参数,所述目标超参数用于调整所述第一预测类别标签对应的所述第一样本的权重;基于所述目标超参数和所述第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重。5.根据权利要求2所述的方法,其特征在于,所述基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息,包括:针对所述预测标签集合中的每一种第一预测类别标签,执行下述处理:
对第一预测类别标签对应的所有第...

【专利技术属性】
技术研发人员:吕永春朱徽周迅溢曾定衡
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1