一种推荐模型训练、推荐方法、装置、介质和设备制造方法及图纸

技术编号:32516561 阅读:15 留言:0更新日期:2022-03-02 11:12
本公开涉及一种推荐模型训练、推荐方法、装置、介质和设备。根据本公开实施例提供的方案,可以根据待推荐对象的标签和目标用户的历史对象的标签,从目标用户的历史对象中确定历史对象序列,进而可以根据获取的目标用户的第一特征向量、历史对象序列和待推荐对象的标识,获得待推荐对象的预测分值,从而可以根据预测分值,从待推荐对象中确定针对目标用户的目标推荐对象。本公开实施例提供的方案,可以根据标签,从目标用户对应的长期序列中准确地获取有效的序列信息,充分利用长期序列,减少长期序列的序列信息损失,提升推荐效果。提升推荐效果。提升推荐效果。

【技术实现步骤摘要】
一种推荐模型训练、推荐方法、装置、介质和设备


[0001]本公开涉及互联网
,特别涉及一种推荐模型训练、推荐方法、装置、介质和设备。

技术介绍

[0002]基于用户行为对应的对象序列的推荐模型越来越多地被应用于生产生活中。基于用户行为对应的对象序列的推荐模型旨在引入用户的历史行为,从而挖掘用户的偏好,进而根据这些偏好推荐更多用户感兴趣的对象。
[0003]用户行为对应的对象序列按照对应用户行为的时间长度,一般可以分为短期序列,中期序列和长期序列。其中,短期序列和中期序列数据量较小,被业界广泛使用。而长期序列由于数据量庞大,应用上难度较大。但也正是因为长期序列数据量庞大,其中蕴藏的有价值的信息也会更多,如果能够善加利用,则会显著提高推荐系统的推荐效果。
[0004]目前,在利用长期序列进行用户感兴趣的对象推荐时,为了训练方便和保证线上性能,需要对长期序列进行截取或采样,但这样显然会损失一定的序列信息,无法保证推荐系统的推荐效果。

技术实现思路

[0005]本公开实施例提供一种推荐模型训练、推荐方法、装置、介质和设备,用于解决基于长期序列的推荐模型存在序列信息损失,推荐效果较差的问题。
[0006]第一方面,本公开提供了一种推荐方法,所述方法包括:
[0007]获取目标用户的第一特征向量;根据待推荐对象的标签和目标用户的历史对象的标签,确定历史对象序列;将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后,输出所述待推荐对象的预测分值;根据所述预测分值,从所述待推荐对象中确定目标推荐对象。
[0008]第二方面,本公开还提供了一种推荐模型训练方法,所述方法包括,根据预先建立的推荐模型,针对预先获取的样本集中的每一样本数据执行如下操作:根据该样本数据获取目标用户的第一特征向量;根据从该样本数据中获取的待推荐样本对象的标签和目标用户的历史样本对象的标签,确定历史样本对象序列;将所述第一特征向量、历史样本对象序列和待推荐样本对象标识输入推荐模型后,输出所述待推荐样本对象的预测分值;根据所述预测分值、待推荐样本对象的真实推荐标签以及预先设置的推荐模型损失函数,用优化器进行反向传播,进行所述推荐模型参数的迭代优化,直到所述推荐模型收敛或者针对预先获取的样本集中的每一样本数据均执行完毕如上操作,得到训练出的推荐模型。
[0009]第三方面,本公开还提供了一种推荐装置,所述装置包括:
[0010]获取模块,用于获取目标用户的第一特征向量;确定模块,用于根据待推荐对象的标签和目标用户的历史对象的标签,确定历史对象序列;输出模块,用于将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后,输出所述待推荐对象的预测分值;推
荐模块,用于根据所述预测分值,从所述待推荐对象中确定目标推荐对象。
[0011]第四方面,本公开还提供了一种推荐模型训练装置,所述装置包括输入输出模块和迭代优化模块:所述输入输出模块,用于根据预先建立的推荐模型,针对预先获取的样本集中的每一样本数据执行如下操作:根据该样本数据获取目标用户的第一特征向量;根据从该样本数据中获取的待推荐样本对象的标签和目标用户的历史样本对象的标签,确定历史样本对象序列;将所述第一特征向量、历史样本对象序列和待推荐样本对象标识输入推荐模型后,输出所述待推荐样本对象的预测分值;所述迭代优化模块,用于针对预先获取的样本集中的每一样本数据,根据所述预测分值、待推荐样本对象的真实推荐标签以及预先设置的推荐模型损失函数,用优化器进行反向传播,进行所述推荐模型参数的迭代优化,直到所述推荐模型收敛或者针对预先获取的样本集中的每一样本数据均执行完毕如上操作,得到训练出的推荐模型。
[0012]第五方面,本公开还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。
[0013]第六方面,本公开还提供了一种推荐设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
[0014]所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存储的程序时,实现如上所述的推荐方法步骤。
[0015]第七方面,本公开还提供了一种推荐模型的训练设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存储的程序时,实现如上所述的推荐模型训练方法步骤。
[0016]根据本公开实施例提供的方案,可以根据待推荐对象的标签和目标用户的历史对象的标签,从目标用户的历史对象中确定历史对象序列,进而可以根据获取的目标用户的第一特征向量、历史对象序列和待推荐对象的标识,获得待推荐对象的预测分值,从而可以根据预测分值,从待推荐对象中确定针对目标用户的目标推荐对象。本公开实施例提供的方案,可以根据标签,从目标用户对应的长期序列中准确地获取有效的序列信息,充分利用长期序列,减少长期序列的序列信息损失,提升推荐效果。
[0017]本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0018]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本公开实施例提供的推荐方法的流程示意图;
[0020]图2为本公开实施例提供的推荐模型训练方法的流程示意图;
[0021]图3为本公开实施例提供的推荐装置的结构示意图;
[0022]图4为本公开实施例提供的推荐模型训练装置的结构示意图;
[0023]图5为本公开实施例提供的推荐模型训练和推荐方法的流程示意图;
[0024]图6为本公开实施例提供的对风格语种标签进行聚类得到的二级标签的示意图;
[0025]图7为本公开实施例提供的样本数据获取步骤示意图;
[0026]图8为本公开实施例提供的推荐模型主网络结构的示意图;
[0027]图9为本公开实施例提供的生成用户序列表达向量的网络结构示意图;
[0028]图10为本公开实施例提供的检索得到历史样本对象序列的示意图;
[0029]图11为本公开实施例提供的推荐设备/推荐模型训练设备的结构示意图。
具体实施方式
[0030]为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开的一部分实施例,而不是全部的实施例。基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐方法,其特征在于,所述方法包括:获取目标用户的第一特征向量;根据待推荐对象的标签和目标用户的历史对象的标签,确定历史对象序列;将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后,输出所述待推荐对象的预测分值;根据所述预测分值,从所述待推荐对象中确定目标推荐对象。2.如权利要求1所述的方法,其特征在于,根据待推荐对象的标签和目标用户的历史对象的标签,确定对象序列之前包括:获取目标用户的历史对象的一级标签;将一级标签相同的历史对象归为一簇;通过聚类算法,得到所述历史对象的二级标签。3.如权利要求2所述的方法,其特征在于,根据待推荐对象的标签和目标用户的历史对象的标签,确定历史对象序列,包括:当所述待推荐对象的标签包括二级标签时,从所述历史对象的二级标签中确定与所述待推荐对象的二级标签的相同或相似度达到阈值的目标历史对象;根据所述目标历史对象确定历史对象序列。4.如权利要求1所述的方法,其特征在于,所述第一特征向量包括:目标用户特征向量;将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后,输出所述待推荐对象的预测分值,包括:将所述历史对象序列、待推荐对象标识经过嵌入层处理得到对应的历史对象序列向量和待推荐对象的第二特征向量;将所述历史对象序列向量和第二特征向量经激活层加权求和处理后得到用户序列表达向量;将所述目标用户特征向量和用户序列表达向量进行拼接后,再经过全连接层和sigmoid函数后输出所述待推荐对象的预测分值。5.如权利要求4所述的方法,其特征在于,所述第一特征向量还包括:上下文特征向量;所述方法还包括:获取待推荐对象的第三特征向量;计算所述目标用户特征向量和第三特征向量的交叉特征向量;所述将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后,输出所述待推荐对象的预测分值,还包括:将所述目标用户特征向量、第三特征向量、上下文特征向量、交叉特征向量和用户序列表达向量进行拼接后,再经过全连接层和sigmoid函数后输出所述待推荐对象的预测分值。6.如权利要求2所述的方法,其特征在于,通过聚类算法,得到所述历史对象的二级标签,包括:将每个历史对象对应的离线预训练出的矩阵和第二编码相乘,得到每个历史对象对应的离线向量,其中,所述第二编码通过将获得的第一编码进行一位有效编码表示得到,所述第一编码通过将历史对象标识进行编码映射得到;根据确定出的每个历史对象对应的离线向量,通过聚类算法,得到所述历史对象的二级标签。
7.如权利要求6所述的方法,其特征在于,根据确定出的每个历史对象对应的离线向量,通过聚类算法,得到所述历史对象的二级标签,包括:将一级标签相同的历史对象所对应簇作为分裂簇,根据确定出的每个历史对象对应的离线向量,确定分裂簇的中心点和簇代价函数;根据确定出的分裂簇的中心点和簇代价函数,确定分裂簇对应的二分簇,选择代价函数最小的...

【专利技术属性】
技术研发人员:李伟生王诗佳赵逸龙彭正超肖强李勇
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1