一种推荐模型训练、推荐方法、装置、介质和设备制造方法及图纸

技术编号：32516561 阅读：15 留言：0更新日期：2022-03-02 11:12

本公开涉及一种推荐模型训练、推荐方法、装置、介质和设备。根据本公开实施例提供的方案，可以根据待推荐对象的标签和目标用户的历史对象的标签，从目标用户的历史对象中确定历史对象序列，进而可以根据获取的目标用户的第一特征向量、历史对象序列和待推荐对象的标识，获得待推荐对象的预测分值，从而可以根据预测分值，从待推荐对象中确定针对目标用户的目标推荐对象。本公开实施例提供的方案，可以根据标签，从目标用户对应的长期序列中准确地获取有效的序列信息，充分利用长期序列，减少长期序列的序列信息损失，提升推荐效果。提升推荐效果。提升推荐效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种推荐模型训练、推荐方法、装置、介质和设备

[0001]本公开涉及互联网
，特别涉及一种推荐模型训练、推荐方法、装置、介质和设备。

技术介绍

[0002]基于用户行为对应的对象序列的推荐模型越来越多地被应用于生产生活中。基于用户行为对应的对象序列的推荐模型旨在引入用户的历史行为，从而挖掘用户的偏好，进而根据这些偏好推荐更多用户感兴趣的对象。
[0003]用户行为对应的对象序列按照对应用户行为的时间长度，一般可以分为短期序列，中期序列和长期序列。其中，短期序列和中期序列数据量较小，被业界广泛使用。而长期序列由于数据量庞大，应用上难度较大。但也正是因为长期序列数据量庞大，其中蕴藏的有价值的信息也会更多，如果能够善加利用，则会显著提高推荐系统的推荐效果。
[0004]目前，在利用长期序列进行用户感兴趣的对象推荐时，为了训练方便和保证线上性能，需要对长期序列进行截取或采样，但这样显然会损失一定的序列信息，无法保证推荐系统的推荐效果。

技术实现思路

[0005]本公开实施例提供一种推荐模型训练、推荐方法、装置、介质和设备，用于解决基于长期序列的推荐模型存在序列信息损失，推荐效果较差的问题。
[0006]第一方面，本公开提供了一种推荐方法，所述方法包括：
[0007]获取目标用户的第一特征向量；根据待推荐对象的标签和目标用户的历史对象的标签，确定历史对象序列；将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后，输出所述待推荐对象的预测分值；根据所述预测分值，从所...

【技术保护点】

【技术特征摘要】
1.一种推荐方法，其特征在于，所述方法包括：获取目标用户的第一特征向量；根据待推荐对象的标签和目标用户的历史对象的标签，确定历史对象序列；将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后，输出所述待推荐对象的预测分值；根据所述预测分值，从所述待推荐对象中确定目标推荐对象。2.如权利要求1所述的方法，其特征在于，根据待推荐对象的标签和目标用户的历史对象的标签，确定对象序列之前包括：获取目标用户的历史对象的一级标签；将一级标签相同的历史对象归为一簇；通过聚类算法，得到所述历史对象的二级标签。3.如权利要求2所述的方法，其特征在于，根据待推荐对象的标签和目标用户的历史对象的标签，确定历史对象序列，包括：当所述待推荐对象的标签包括二级标签时，从所述历史对象的二级标签中确定与所述待推荐对象的二级标签的相同或相似度达到阈值的目标历史对象；根据所述目标历史对象确定历史对象序列。4.如权利要求1所述的方法，其特征在于，所述第一特征向量包括：目标用户特征向量；将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后，输出所述待推荐对象的预测分值，包括：将所述历史对象序列、待推荐对象标识经过嵌入层处理得到对应的历史对象序列向量和待推荐对象的第二特征向量；将所述历史对象序列向量和第二特征向量经激活层加权求和处理后得到用户序列表达向量；将所述目标用户特征向量和用户序列表达向量进行拼接后，再经过全连接层和sigmoid函数后输出所述待推荐对象的预测分值。5.如权利要求4所述的方法，其特征在于，所述第一特征向量还包括：上下文特征向量；所述方法还包括：获取待推荐对象的第三特征向量；计算所述目标用户特征向量和第三特征向量的交叉特征向量；所述将所述第一特征向量、历史对象序列和待推荐对象标识输入推荐模型后，输出所述待推荐对象的预测分值，还包括：将所述目标用户特征向量、第三特征向量、上下文特征向量、交叉特征向量和用户序列表达向量进行拼接后，再经过全连接层和sigmoid函数后输出所述待推荐对象的预测分值。6.如权利要求2所述的方法，其特征在于，通过聚类算法，得到所述历史对象的二级标签，包括：将每个历史对象对应的离线预训练出的矩阵和第二编码相乘，得到每个历史对象对应的离线向量，其中，所述第二编码通过将获得的第一编码进行一位有效编码表示得到，所述第一编码通过将历史对象标识进行编码映射得到；根据确定出的每个历史对象对应的离线向量，通过聚类算法，得到所述历史对象的二级标签。
7.如权利要求6所述的方法，其特征在于，根据确定出的每个历史对象对应的离线向量，通过聚类算法，得到所述历史对象的二级标签，包括：将一级标签相同的历史对象所对应簇作为分裂簇，根据确定出的每个历史对象对应的离线向量，确定分裂簇的中心点和簇代价函数；根据确定出的分裂簇的中心点和簇代价函数，确定分裂簇对应的二分簇，选择代价函数最小的...

【专利技术属性】
技术研发人员：李伟生，王诗佳，赵逸龙，彭正超，肖强，李勇，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人