一种处理数据的方法和装置制造方法及图纸

技术编号:31225330 阅读:16 留言:0更新日期:2021-12-08 09:29
本发明专利技术公开了一种处理数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征,生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量;将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量;将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中,从而输出所述目标用户对所述目标物品的行为概率。该实施方式能够解决无法精准和高效地挖掘用户与物品之间的隐含的向量表式,无法区分用户长期、中期和近期的兴趣变化的技术问题。中期和近期的兴趣变化的技术问题。中期和近期的兴趣变化的技术问题。

【技术实现步骤摘要】
一种处理数据的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种处理数据的方法和装置。

技术介绍

[0002]个性化排序是依据用户个性化特性,利用机器学习和深度学习算法,在不同应用场景给用户呈现个性化推送结果的技术。该技术最重要的目的是从海量的候选集中给用户呈现极少数用户心中优先级最高的物品。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]无法精准和高效地挖掘用户与物品之间的隐含的向量表式,无法区分用户长期、中期和近期的兴趣变化,导致计算结果不准确。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种处理数据的方法和装置,以解决无法精准和高效地挖掘用户与物品之间的隐含的向量表式,无法区分用户长期、中期和近期的兴趣变化的技术问题。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种处理数据的方法,包括:
[0007]根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征,生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量;
[0008]将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量;
[0009]将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中,从而输出所述目标用户对所述目标物品的行为概率;
[0010]其中,所述计算模型采用如下方法训练得到:
[0011]根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征,生成各个所述用户的组合嵌入向量;
[0012]采用各个所述用户的组合嵌入向量训练全连接神经网络,从而得到计算模型。
[0013]可选地,根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征,生成各个所述用户的组合嵌入向量,包括:
[0014]采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征,转换成各个所述用户的嵌入向量;
[0015]采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征,转换成各个所述物品的嵌入向量;
[0016]采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的行为嵌入向量;
[0017]采用记忆网络模型将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的兴趣演化嵌入向量;
[0018]将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。
[0019]可选地,所述第一图嵌入模型为Node2vec模型,所述第二图嵌入模型为Node2vec模型,所述记忆网络模型为分层周期记忆网络模型。
[0020]可选地,所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。
[0021]可选地,还包括:
[0022]若所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述物品的嵌入向量中缺少任一维度的特征,则采用不参与计算的标记符对该维度的特征进行补齐。
[0023]可选地,根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征,生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量,包括:
[0024]采用所述第一图嵌入模型将目标用户的近期行为特征和基础特征,转换成所述目标用户的嵌入向量;
[0025]采用所述第二图嵌入模型目标物品的近期行为特征和基础特征,转换成所述目标物品的嵌入向量;
[0026]采用所述注意力神经网络将所述目标用户的不同时期的行为特征,转换成所述目标用户的行为嵌入向量;
[0027]采用所述记忆网络模型将所述目标用户的不同时期的行为特征,转换成所述目标用户的兴趣演化嵌入向量。
[0028]可选地,输出所述目标用户对所述目标物品的行为概率之后,还包括:
[0029]将所述目标用户对各个所述目标物品的行为概率进行降序排列;
[0030]筛选出行为概率靠前的N个目标物品,N为大于零的整数;
[0031]将所述N个目标物品加入到所述目标用户对应的待推荐物品集合中。
[0032]另外,根据本专利技术实施例的另一个方面,提供了一种处理数据的装置,包括:
[0033]特征模块,用于根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征,生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量;
[0034]组合模块,用于将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量;
[0035]计算模块,用于将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中,从而输出所述目标用户对所述目标物品的行为概率;
[0036]训练模块,用于根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征,生成各个所述用户的组合嵌入向量;采用各个所述用户的组合嵌入向量训练全连接神经网络,从而得到计算模型。
[0037]可选地,所述训练模块还用于:
[0038]采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征,转换成
各个所述用户的嵌入向量;
[0039]采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征,转换成各个所述物品的嵌入向量;
[0040]采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的行为嵌入向量;
[0041]采用记忆网络模型将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的兴趣演化嵌入向量;
[0042]将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。
[0043]可选地,所述第一图嵌入模型为Node2vec模型,所述第二图嵌入模型为Node2vec模型,所述记忆网络模型为分层周期记忆网络模型。
[0044]可选地,所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。
[0045]可选地,所述训练模块还用于:
[0046]若所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述物品的嵌入向量中缺少任一维度的特征,则采用不参与计算的标记符对该维度的特征进行补齐。
[0047]可选地,所述特征模块还用于:
[0048]采用所述第一图嵌入模型将目标用户的近期行为特征和基础特征,转换成所述目标用户的嵌入向量;
[0049]采用所述第二图嵌入模型目标物品的近期行为特征和基础特征,转换成所述目标物品的嵌入向量;
[0050]采用所述注意力神经网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种处理数据的方法,其特征在于,包括:根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征,生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量;将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量;将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中,从而输出所述目标用户对所述目标物品的行为概率;其中,所述计算模型采用如下方法训练得到:根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征,生成各个所述用户的组合嵌入向量;采用各个所述用户的组合嵌入向量训练全连接神经网络,从而得到计算模型。2.根据权利要求1所述的方法,其特征在于,根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征,生成各个所述用户的组合嵌入向量,包括:采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征,转换成各个所述用户的嵌入向量;采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征,转换成各个所述物品的嵌入向量;采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的行为嵌入向量;采用记忆网络模型将训练样本中各个所述用户的不同时期的行为特征,转换成各个所述用户的兴趣演化嵌入向量;将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。3.根据权利要求2所述的方法,其特征在于,所述第一图嵌入模型为Node2vec模型,所述第二图嵌入模型为Node2vec模型,所述记忆网络模型为分层周期记忆网络模型。4.根据权利要求2所述的方法,其特征在于,所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。5.根据权利要求2所述的方法,其特征在于,还包括:若所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述物品的嵌入向量中缺少任一维度的特征,则采用不参与计算的标记符对该维度的特征进行补齐。6.根据权利要求2所述...

【专利技术属性】
技术研发人员:蒋权陈希李鑫
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1