一种融合关键词生成的推荐算法制造技术

技术编号:29489759 阅读:96 留言:0更新日期:2021-07-30 19:01
本发明专利技术提供了一种融合关键词生成的推荐算法,首先获取用户的历史点击行为序列和对应产品标题的关键词序列,然后将所述用户历史点击行为序列输入到用户偏好模型中,学习用户的特征表示向量;接着将产品标题关键词序列数据输入到seq2seq模型中,得到标题关键词序列的上下文向量;最后根据用户最终特征向量计算用户购买各种产品的概率,根据用户购买产品的概率对用户进行产品推荐。

【技术实现步骤摘要】
一种融合关键词生成的推荐算法
本专利技术涉及智能推荐
,主要涉及一种融合关键词生成的推荐算法。
技术介绍
推荐系统作为解决“信息过载”问题的有效方法,近年来已经成为学术界和工业界的关注热点,同时各种各样的推荐系统亦随之在电子商务、社交网站、电子旅游和互联网广告等大量领域得到了广泛应用,并展示出优越的效果与前景。个性化推荐系统通过对用户行为数据进行分析、建模,预测用户的购物意向,为用户推荐可能感兴趣的产品。常用的推荐方法主要包含基于内容推荐、协同过滤推荐、基于关联规则推荐以及混合推荐等。然而,现有的推荐方法通常根据用户的点击序列捕获用户的购买意图,由于电商网站中包含大规模的产品,这些方法会造成与用户购买意图相关的其他产品被忽略。也就是说,存在着具有不同ID标识的相似商品,这些商品能够满足用户相同需求。我们认为,用户点击序列中的文本信息(例如,商品标题中包含的关键词)可以看作额外的监督信号,来学习相似商品中包含的共同意图。通过在多任务学习方法将产品推荐与商品关键字生成任务相结合,可以缓解训练过程中的上述问题。
技术实现思路
专利技术目的:为了解决上述
技术介绍
中存在的问题,本专利技术提供了一种融合关键词生成的推荐算法,本专利技术采用的技术方案如下:步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列;将用户购买的产品vp作为预测目标产品,获取用户历史点击行为序列V=[(v1,t1),(v2,t2),…,(vn,tn)],其中ti对应于产品vi点击的时间戳;从用户历史点击行为对应的产品标题中,获取关键词序列;按照词频,选取前N个关键词组成的关键词序列W=[w1,w2,…,wN];步骤S2、将所述用户历史点击行为序列V=[(v1,t1),(v2,t2),…,(vn,tn)]输入到用户偏好模型中,学习用户的特征表示向量sn;步骤S3、将产品标题关键词序列数据W=[w1,w2,…,wN]输入到seq2seq模型中,得到标题关键词序列的上下文向量ct;步骤S4、整合并计算步骤S2得到的用户的特征表示向量sn和步骤S3得到的标题关键词序列在步骤t=0时的上下文向量c0,得到用户的最终特征表示向量cu如下:cu=Wu[sn,c0]其中Wu为可学习参数;步骤S5、根据所述用户最终特征向量计算用户购买各种产品的概率,根据用户购买产品的概率对用户进行产品推荐。进一步地,所述步骤S2中学习用户的特征表示向量sn具体步骤如下:步骤S2.1、创建一个可学习的产品嵌入矩阵Ep,为每一个产品vi分配一个嵌入向量vi;步骤S2.2、采用时间感知自注意力机制,学习用户行为中不同产品之间的相似度,并采用加权求和得到产品的表示向量;将点击2个产品之间的时间间隔rij=|ti-tj|作为指数获取时间间隔嵌入向量rij如下:Base(rij,2k)=sin(rij/100002k/d)Base(rij,2k+1)=cos(rij/100002k/d)rij=fLinear(Base(rij))其中fLinear(·)代表线性函数;加权求和得到产品的表示向量bi如下:其中bi表示产品i在用户短期行为中的表示向量,vj为根据所述步骤S2.1得到的产品vj的嵌入向量,rij表示时间间隔嵌入向量,αij为产品vi和vj之间的相似度,WV表示可学习的参数;产品vi和vj之间的相似度αij计算如下:其中WQ和WK为可学习的参数,vi和vj为根据所述步骤S2.1得到的产品vi和vj的嵌入向量,d表示产品嵌入向量的维度,使用归一化指数函数计算相似度;步骤S2.3、使用最大池化层,获得用户的特征表示向量如下:其中sn为用户的特征表示向量,snj为sn在维度j上的值。进一步地,步骤S3中获取标题关键词序列的上下文向量ct具体步骤如下:步骤S3.1、由步骤S1所得标题关键词序列W=[w1,w2,…,wN],进过ID嵌入层后,通过双向长短期记忆网络获得隐式状态[h1,h2,....,hN];步骤S3.2、获取标题关键词序列上下文向量;通过步骤S3.1所述隐式状态hN,得到解码器的初始状态d0如下:d0=ReLU(WdhN)其中Wd为可学习的参数,ReLU为线性整流函数,且ReLU(x)=max(0,x);通过注意力机制,计算t时刻的关键词序列中单词的注意力分布;解码器根据单词的注意力分布查找生成下一个单词,具体计算公式如下:eti=vTtanh(W[dt,hi,sn]+b)βt=softmax(et)其中βt为关键词序列中单词的注意力分布,W和b是可学习参数;softmax为归一化指数函数;dt为t时刻的解码器状态,计算如下:dt=f(dt-1,yt-1,ct-1)其中f代表长短期记忆网络;yt-1为t-1时刻解码器的输入向量。ct-1为t-1时刻的标题关键词序列上下文向量;标题关键词序列上下文向量ct由编码器的隐式状态加权得到,计算如下:ct=∑iβtihi。进一步地,所述步骤S5中计算用户购买产品概率,根据用户购买产品的概率对用户进行产品推荐步骤如下:步骤S5.1、获得用户的最终偏好表示向量之后,通过用户最终特征表示向量cu与产品最终特征表示向量cv,计算用户购买产品的概率如下:其中,产品最终特征表示向量cv是产品嵌入向量vi经过多层感知机获得,为可学习的参数矩阵;将交叉熵作为模型训练的目标函数,并使用Adam算法训练产品推荐模型,定义目标函数如下:其中,zuv为用户购买产品的真实概率,为模型计算出来的概率,I为产品的个数;步骤S5.2、利用指针生成模型生成关键词序列;利用生成网络,计算时刻t生成单词w的概率Pvocab(w):Pvocab(w)=softmax(Wh[dt,ct]+oh)其中,Wh和oh为可学习的参数,dt为t时刻的解码器状态,ct为关键词序列的上下文向量。利用指针网络,计算时刻t从关键词序列中复制单词w的概率:根据t时刻的解码器状态dt,t-1时刻解码器的输入向量yt-1,关键词序列的上下文向量ct,计算从生成网络中生成单词的权重:Pgen=sigmoid(Wt[dt,yt-1,ct]+bt)其中sigmoid(·)为激活函数,利用权重向量,融合生成网络和指针网络生成和复制单词的结果,计算公式如下:p(w)=PgenPvocab(w)+(1-Pgen)Pcopy(w)将交叉熵作为模型训练的目标函数,并使用Adam算法训练关键词生成模型,定义的目标函数如下所示:步骤S5.3、联合训练产品推荐任务和关键词生成任务;联合产品推荐任务和关键词生成模型的损失模型,并使用Adam算法同时训练两本文档来自技高网...

【技术保护点】
1.一种融合关键词生成的推荐算法,其特征在于,包括以下步骤:/n步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列;/n将用户购买的产品v

【技术特征摘要】
1.一种融合关键词生成的推荐算法,其特征在于,包括以下步骤:
步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列;
将用户购买的产品vp作为预测目标产品,获取用户历史点击行为序列V=[(v1,t1),(v2,t2),…,(vn,tn)],其中ti对应于产品vi点击的时间戳;从用户历史点击行为对应的产品标题中,获取关键词序列;按照词频,选取前N个关键词组成的关键词序列W=[w1,w2,…,wN];
步骤S2、将所述用户历史点击行为序列V=[(v1,t1),(v2,t2),…,(vn,tn)]输入到用户偏好模型中,学习用户的特征表示向量sn;
步骤S3、将产品标题关键词序列数据W=[w1,w2,…,wN]输入到seq2seq模型中,得到标题关键词序列的上下文向量ct;
步骤S4、整合并计算步骤S2得到的用户的特征表示向量sn和步骤S3得到的标题关键词序列在步骤t=0时的上下文向量c0,得到用户的最终特征表示向量cu如下:
cu=Wu[sn,c0]
其中Wu为可学习参数;
步骤S5、根据所述用户最终特征向量计算用户购买各种产品的概率,根据用户购买产品的概率对用户进行产品推荐。


2.根据权利要求1所述的一种融合关键词生成的推荐算法,其特征在于,所述步骤S2中学习用户的特征表示向量sn具体步骤如下:
步骤S2.1、创建一个可学习的产品嵌入矩阵Ep,为每一个产品vi分配一个嵌入向量vi;
步骤S2.2、采用时间感知自注意力机制,学习用户行为中不同产品之间的相似度,并采用加权求和得到产品的表示向量;将点击2个产品之间的时间间隔rij=|ti-tj|作为指数获取时间间隔嵌入向量rij如下:
Base(rij,2k)=sin(rij/100002k/d)
Base(rij,2k+1)=cos(rij/100002k/d)
rij=fLinear(Base(rij))
其中fLinear(·)代表线性函数;
加权求和得到产品的表示向量bi如下:



其中bi表示产品i在用户短期行为中的表示向量,vj为根据所述步骤S2.1得到的产品vj的嵌入向量,rij表示时间间隔嵌入向量,αij为产品vi和vj之间的相似度,WV表示可学习的参数;
产品vi和vj之间的相似度αij计算如下:






其中WQ和WK为可学习的参数,vi和vj为根据所述步骤S2.1得到的产品vi和vj的嵌入向量,d表示产品嵌入向量的维度,使用归一化指数函数计算相似度;
步骤S2.3、使用最大池化层,获得用户的特征表示向量如下:



其中sn为用户的特征表示向量,snj为sn在维度j上的值。


3.根据权利要求1所述的一种融合关键词生成的推荐算法,其特征在于,步骤S3中获取标题关键词序列的上下文向量ct具体步骤如下:
步骤S3.1、由步骤S1所得标题关键词序列W=[w1,w2,…,wN],进过ID嵌入层后,通过双向长短期记忆网...

【专利技术属性】
技术研发人员:曹杰陈蕾申冬琴蒋聚王煜尧
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1