多目标模型训练方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38275342 阅读:9 留言:0更新日期:2023-07-27 10:27
本申请提供了一种多目标模型训练方法和装置、电子设备及存储介质。该方法包括:获得样本特征,其中,样本特征包括样本用户特征、样本物料特征、以及样本交叉特征;将样本特征输入多目标模型,以得到样本特征的多个预测分值;基于样本特征的多个预测分值,确定样本特征的多个损失值;根据多个损失值,确定多目标模型的多个推荐目标之间的相关性;根据相关性,对与多个推荐目标对应的权重进行调整和/或对多目标模型的结构进行修改;以及,基于与多个推荐目标对应的权重,使用样本特征对多目标模型进行迭代训练,以得到训练后的多目标模型。通过本申请,能够增强多任务学习的效果。能够增强多任务学习的效果。能够增强多任务学习的效果。

【技术实现步骤摘要】
多目标模型训练方法和装置、电子设备及存储介质


[0001]本申请涉及推荐系统技术,尤其涉及一种多目标模型训练方法和装置、电子设备及存储介质。

技术介绍

[0002]目前,在多任务学习中,可以采用多目标模型来完成对多个目标的同时学习。例如,在视频推荐业务中,可以采用完播率、互动率、观看时长等作为多目标模型的目标。在多目标模型中,共享层可以进行多个目标之间的共享学习,以使得多个目标的学习能够相互促进。
[0003]然而,多目标模型中的多个目标的学习可能是相互促进的,也可能是相互干扰的。那么,在多任务学习中,如何对多目标模型的多个目标的相关性进行调整是亟需解决的问题。

技术实现思路

[0004]本申请提供一种多目标模型训练方法和装置、电子设备及存储介质,能够增强多任务学习的效果。
[0005]本申请的技术方案是这样实现的:
[0006]在第一方面,本申请提供一种多目标模型训练方法。该方法包括:获得样本特征,其中,样本特征包括样本用户特征、样本物料特征、以及样本用户和样本物料之间的样本交叉特征;将样本特征输入多目标模型,以得到样本特征的多个预测分值,其中,多个预测分值与多目标模型的多个推荐目标一一对应;基于样本特征的多个预测分值,确定样本特征的多个损失值,其中,多个损失值与多个推荐目标一一对应;根据多个损失值,确定多目标模型的多个推荐目标之间的相关性;根据相关性,对与多个推荐目标对应的权重进行调整和/或对多目标模型的结构进行修改,其中,权重用于多个损失值的加权融合;以及,基于与多个推荐目标对应的权重,使用样本特征对多目标模型进行迭代训练,直至满足预设收敛条件,以得到训练后的多目标模型。
[0007]在一些可能的实施方式中,根据多个损失值,确定多目标模型的多个推荐目标之间的相关性的操作可以包括:确定与多个推荐目标对应的多个损失值分别相对于多目标模型的共享层的多个参数的梯度;以及,基于与多个推荐目标对应的梯度,确定多个推荐目标之间的相关性。
[0008]在一些可能的实施方式中,确定与多个推荐目标对应的多个损失值分别相对于多目标模型的共享层的多个参数的梯度的操作可以包括:确定多个损失值中的每个损失值相对于共享层中的多个参数的梯度。
[0009]在一些可能的实施方式中,基于与多个推荐目标对应的梯度,确定多个推荐目标之间的相关性的操作可以包括:确定多个推荐目标中的每两个推荐目标分别相对于多个参数中同一参数的梯度之间的余弦相似度;以及,根据余弦相似度,确定每两个推荐目标之间
的相关性。
[0010]在一些可能的实施方式中,根据相关性,对与多个推荐目标对应的权重进行调整的操作可以包括:在多个推荐目标中的第一推荐目标与除第一推荐目标之外的至少一个推荐目标之间的相关性为干扰关系的情况下,减小与第一推荐目标对应的权重。
[0011]在一些可能的实施方式中,根据相关性,对多目标模型的结构进行修改的操作可以包括:在多个推荐目标中的第二推荐目标与除第二推荐目标之外的至少一个推荐目标之间的相关性为干扰关系的情况下,取消第二推荐目标和至少一个推荐目标之间在多目标模型的共享层中的参数共享。
[0012]在一些可能的实施方式中,获得样本特征的操作可以包括:获取样本原始特征;确定样本原始特征的特征标识符;以及,为特征标识符添加标签,以得到样本特征,其中,标签用于指示样本特征参与多个推荐目标中的至少一个推荐目标的训练。
[0013]在一些可能的实施方式中,标签可以包括多个标识位。多个标识位与多个推荐目标一一对应。多个标识位中的每个标识位用于指示样本特征是否参与多个推荐目标中与每个标识位对应的推荐目标的训练。
[0014]在一些可能的实施方式中,确定样本原始特征的特征标识符的操作可以包括:对样本原始特征进行哈希映射,以得到特征数据编码;以及,将特征数据编码和特征槽位编码组合,以得到特征标识符,其中,特征槽位编码用于表征样本原始特征的特征类型。
[0015]在第二方面,本申请提供一种多目标模型训练装置。该装置包括获得模块、预测分值确定模块、损失值确定模块、相关性确定模块、调整模块、以及训练模块。获得模块被配置为获得样本特征。样本特征包括样本用户特征、样本物料特征、以及样本用户和样本物料之间的样本交叉特征。预测分值确定模块被配置为将样本特征输入多目标模型,以得到样本特征的多个预测分值。多个预测分值与多目标模型的多个推荐目标一一对应。损失值确定模块被配置为基于样本特征的多个预测分值,确定样本特征的多个损失值。多个损失值与多个推荐目标一一对应。相关性确定模块被配置为根据多个损失值,确定多目标模型的多个推荐目标之间的相关性。调整模块被配置为根据相关性,对与多个推荐目标对应的权重进行调整或对多目标模型的结构进行修改。权重用于多个损失值的加权融合。训练模块被配置为基于与多个推荐目标对应的权重,使用样本特征对多目标模型进行迭代训练,直至满足预设收敛条件,以得到训练后的多目标模型。
[0016]在一些可能的实施方式中,相关性确定模块可以被配置为:确定与多个推荐目标对应的多个损失值分别相对于多目标模型的共享层的多个参数的梯度;以及,基于与多个推荐目标对应的梯度,确定多个推荐目标之间的相关性。
[0017]在一些可能的实施方式中,相关性确定模块可以被配置为:确定多个损失值中的每个损失值相对于共享层中的多个参数的梯度。
[0018]在一些可能的实施方式中,相关性确定模块可以被配置为:确定多个推荐目标中的每两个推荐目标分别相对于多个参数中同一参数的梯度之间的余弦相似度;以及,根据余弦相似度,确定每两个推荐目标之间的相关性。
[0019]在一些可能的实施方式中,调整模块可以被配置为:在多个推荐目标中的第一推荐目标与除第一推荐目标之外的至少一个推荐目标之间的相关性为干扰关系的情况下,减小与第一推荐目标对应的权重。
[0020]在一些可能的实施方式中,调整模块可以被配置为:在多个推荐目标中的第二推荐目标与除第二推荐目标之外的至少一个推荐目标之间的相关性为干扰关系的情况下,取消第二推荐目标和至少一个推荐目标在在多目标模型的共享层中的参数共享。
[0021]在一些可能的实施方式中,获得模块可以被配置为:获取样本原始特征;确定样本原始特征的特征标识符;以及,为特征标识符添加标签,以得到样本特征,其中,标签用于指示样本特征参与多个推荐目标中的至少一个推荐目标的训练。
[0022]在一些可能的实施方式中,标签可以包括多个标识位。多个标识位与多个推荐目标一一对应。多个标识位中的每个标识位用于指示样本特征是否参与多个推荐目标中与每个标识位对应的推荐目标的训练。
[0023]在一些可能的实施方式中,获得模块可以被配置为:对样本原始特征进行哈希映射,以得到特征数据编码;以及,将特征数据编码和特征槽位编码组合,以得到特征标识符,其中,特征槽位编码用于表征样本原始特征的特征类型。
[0024]在第三方面,本申请提供一种电子设备。该电子设备包括存储器和处理器。存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多目标模型训练方法,其特征在于,所述方法包括:获得样本特征,其中,所述样本特征包括样本用户特征、样本物料特征、以及样本用户和样本物料之间的样本交叉特征;将所述样本特征输入多目标模型,以得到所述样本特征的多个预测分值,其中,所述多个预测分值与所述多目标模型的多个推荐目标一一对应;基于所述样本特征的所述多个预测分值,确定所述样本特征的多个损失值,其中,所述多个损失值与所述多个推荐目标一一对应;根据所述多个损失值,确定所述多目标模型的所述多个推荐目标之间的相关性;根据所述相关性,对与所述多个推荐目标对应的权重进行调整和/或对所述多目标模型的结构进行修改,其中,所述权重用于所述多个损失值的加权融合;以及基于与所述多个推荐目标对应的权重,使用所述样本特征对所述多目标模型进行迭代训练,直至满足预设收敛条件,以得到训练后的多目标模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个损失值,确定所述多目标模型的所述多个推荐目标之间的相关性,包括:确定与所述多个推荐目标对应的所述多个损失值分别相对于所述多目标模型的共享层中的多个参数的梯度;以及基于与所述多个推荐目标对应的所述梯度,确定所述多个推荐目标之间的相关性。3.根据权利要求2所述的方法,其特征在于,所述确定与所述多个推荐目标对应的所述多个损失值分别相对于所述多目标模型的共享层中的多个参数的梯度,包括:确定所述多个损失值中的每个损失值相对于所述共享层中的所述多个参数的梯度。4.根据权利要求2或3所述的方法,其特征在于,所述基于与所述多个推荐目标对应的所述梯度,确定所述多个推荐目标之间的相关性,包括:确定所述多个推荐目标中的每两个推荐目标分别相对于所述多个参数中同一参数的梯度之间的余弦相似度;以及根据所述余弦相似度,确定每两个推荐目标之间的相关性。5.根据权利要求1所述的方法,其特征在于,所述根据所述相关性,对与所述多个推荐目标对应的权重进行调整,包括:在所述多个推荐目标中的第一推荐目标与除所述第一推荐目标之外的至少一个推荐目标之间的所述相关性为干扰关系的情况下,减小与所述第一推荐目标对应的权重。6.根据权利要求1所述的方法,其特征在于,所述根据所述相关性,对所述多目标模型的结构进行修改,包括:在所述多个推荐目标中的第二推荐目标与除所述第二推荐目标之外的至少一个推荐目标之间的相关性为干扰关系的情况下,取消所述第二推荐目...

【专利技术属性】
技术研发人员:富辰瑶蒋江林李亚辉
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1