一种融合关键词生成的推荐算法制造技术

技术编号：29489759 阅读：96 留言：0更新日期：2021-07-30 19:01

本发明专利技术提供了一种融合关键词生成的推荐算法，首先获取用户的历史点击行为序列和对应产品标题的关键词序列，然后将所述用户历史点击行为序列输入到用户偏好模型中，学习用户的特征表示向量；接着将产品标题关键词序列数据输入到seq2seq模型中，得到标题关键词序列的上下文向量；最后根据用户最终特征向量计算用户购买各种产品的概率，根据用户购买产品的概率对用户进行产品推荐。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合关键词生成的推荐算法
本专利技术涉及智能推荐
，主要涉及一种融合关键词生成的推荐算法。
技术介绍
推荐系统作为解决“信息过载”问题的有效方法，近年来已经成为学术界和工业界的关注热点，同时各种各样的推荐系统亦随之在电子商务、社交网站、电子旅游和互联网广告等大量领域得到了广泛应用，并展示出优越的效果与前景。个性化推荐系统通过对用户行为数据进行分析、建模，预测用户的购物意向，为用户推荐可能感兴趣的产品。常用的推荐方法主要包含基于内容推荐、协同过滤推荐、基于关联规则推荐以及混合推荐等。然而，现有的推荐方法通常根据用户的点击序列捕获用户的购买意图，由于电商网站中包含大规模的产品，这些方法会造成与用户购买意图相关的其他产品被忽略。也就是说，存在着具有不同ID标识的相似商品，这些商品能够满足用户相同需求。我们认为，用户点击序列中的文本信息(例如，商品标题中包含的关键词)可以看作额外的监督信号，来学习相似商品中包含的共同意图。通过在多任务学习方法将产品推荐与商品关键字生成任务相结合，可以缓解训练过程中的上述问题。
技术实现思路
专利技术目的：为了解决上述
技术介绍
中存在的问题，本专利技术提供了一种融合关键词生成的推荐算法，本专利技术采用的技术方案如下：步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列；将用户购买的产品vp作为预测目标产品，获取用户历史点击行为序列V＝[(v1,t1),(v2,t2),…,(vn,tn)]，其中ti对应于产品vi点击的时间戳；从用户历...

【技术保护点】
1.一种融合关键词生成的推荐算法，其特征在于，包括以下步骤：/n步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列；/n将用户购买的产品v

【技术特征摘要】
1.一种融合关键词生成的推荐算法，其特征在于，包括以下步骤：
步骤S1、获取用户的历史点击行为序列和对应产品标题的关键词序列；
将用户购买的产品vp作为预测目标产品，获取用户历史点击行为序列V＝[(v1，t1)，(v2，t2)，…，(vn，tn)]，其中ti对应于产品vi点击的时间戳；从用户历史点击行为对应的产品标题中，获取关键词序列；按照词频，选取前N个关键词组成的关键词序列W＝[w1，w2，…，wN]；
步骤S2、将所述用户历史点击行为序列V＝[(v1，t1)，(v2，t2)，…，(vn，tn)]输入到用户偏好模型中，学习用户的特征表示向量sn；
步骤S3、将产品标题关键词序列数据W＝[w1，w2，…，wN]输入到seq2seq模型中，得到标题关键词序列的上下文向量ct；
步骤S4、整合并计算步骤S2得到的用户的特征表示向量sn和步骤S3得到的标题关键词序列在步骤t＝0时的上下文向量c0，得到用户的最终特征表示向量cu如下：
cu＝Wu[sn，c0]
其中Wu为可学习参数；
步骤S5、根据所述用户最终特征向量计算用户购买各种产品的概率，根据用户购买产品的概率对用户进行产品推荐。

2.根据权利要求1所述的一种融合关键词生成的推荐算法，其特征在于，所述步骤S2中学习用户的特征表示向量sn具体步骤如下：
步骤S2.1、创建一个可学习的产品嵌入矩阵Ep，为每一个产品vi分配一个嵌入向量vi；
步骤S2.2、采用时间感知自注意力机制，学习用户行为中不同产品之间的相似度，并采用加权求和得到产品的表示向量；将点击2个产品之间的时间间隔rij＝|ti-tj|作为指数获取时间间隔嵌入向量rij如下：
Base(rij，2k)＝sin(rij/100002k/d)
Base(rij，2k+1)＝cos(rij/100002k/d)
rij＝fLinear(Base(rij))
其中fLinear(·)代表线性函数；
加权求和得到产品的表示向量bi如下：

其中bi表示产品i在用户短期行为中的表示向量，vj为根据所述步骤S2.1得到的产品vj的嵌入向量，rij表示时间间隔嵌入向量，αij为产品vi和vj之间的相似度，WV表示可学习的参数；
产品vi和vj之间的相似度αij计算如下：

其中WQ和WK为可学习的参数，vi和vj为根据所述步骤S2.1得到的产品vi和vj的嵌入向量，d表示产品嵌入向量的维度，使用归一化指数函数计算相似度；
步骤S2.3、使用最大池化层，获得用户的特征表示向量如下：

其中sn为用户的特征表示向量，snj为sn在维度j上的值。

3.根据权利要求1所述的一种融合关键词生成的推荐算法，其特征在于，步骤S3中获取标题关键词序列的上下文向量ct具体步骤如下：
步骤S3.1、由步骤S1所得标题关键词序列W＝[w1，w2，…，wN]，进过ID嵌入层后，通过双向长短期记忆网...

【专利技术属性】
技术研发人员：曹杰，陈蕾，申冬琴，蒋聚，王煜尧，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人