基于评论信息的个性化推荐方法技术

技术编号:37597913 阅读:10 留言:0更新日期:2023-05-18 11:46
本发明专利技术涉及一种基于评论信息的个性化推荐方法,属于计算机领域。本发明专利技术利用word2vec初始化词向量矩阵,再利用CNNs将评论映射到特征。然后借助注意力机制并且利用评论和评分来初始化用户和项目的特征表示。最后,结合用户和项目的交互图来捕获它们之间的高阶交互关系,从而学习用户/项目的潜在特征表示。通过在真实数据集上的实验,证明了本发明专利技术模型能利用评分和评论提升模型的性能。评分和评论提升模型的性能。评分和评论提升模型的性能。

【技术实现步骤摘要】
基于评论信息的个性化推荐方法


[0001]本专利技术属于计算机领域,涉及基于评论信息的个性化推荐方法。

技术介绍

[0002]随着互联网服务产品的涌现,人们的生活也积极地向数字化方式转变,推荐系统在帮助消费者找到好的产品和服务方面发挥着关键的作用。传统的推荐系统利用协同过滤技术借助历史交互数据(评分、浏览、购买、点击等行为)为用户兴趣偏好建模,但是利用稀疏的交互数据挖掘用户的偏好会存在局限性,辅助信息的引入是一种有效的解决思路。对于不同的应用场景,推荐系统能获取到的辅助信息是非常有限的,通常不能获得非常全面的辅助信息。针对不同的信息,要设计相应的处理策略。本文在第三章中利用了用户的统计学信息、社交关系、项目属性等等,接下来,本专利技术继续探索评论信息如何帮助推荐系统更好地为用户服务。
[0003]如今,人们更愿意在网络中发表自己的意见、感受,表达自己的感情。例如,人们在淘宝网站上购物后,会发表一些评论来解释为什么喜欢或不喜欢特定的产品或服务等,可以给出其他用户可参考的意见。这种有价值的信息能够从多方面反映出用户的偏好模式,因此可以了解到用户对哪些方面有较高的要求,例如质量、价格、设计等等,这些丰富的语义信息可以帮助推荐系统多层面的了解用户评价的关键因素。并且从评论中也可以提取到许多有关项目的信息,有利于项目特征的抽取。这不仅可以缓解推荐系统的数据稀疏性还可以有效捕获用户潜在的兴趣模式。
[0004]目前,深度学习技术已被广泛应用于从评论文本中学习用户和项目的特征表示,如DeepCoNN、D

Attn、HRDR、TransNets等模型,他们都是利用CNNs从用户的评论中学习用户和项目的隐因子。虽然这些方法已被证明提供了良好的预测性能,但仅为每个用户/项目学习低维的隐因子特征表示还远远不够,因为它无法准确地建模来自评论中的用户

项目高阶的协同信号。然而,在个性化推荐系统的研究中,大多数基于评论的方法忽视了这一点。虽然有图神经网络(GNNs)方法在用户

项目图上建立高阶节点关系,但他们忽略了评论中所携带的边缘语义。综上,本专利技术利用图卷积网络分析评论信息以便更好地给用户进行推荐。但是目前仍然存在一些挑战,首先,评论中包含着复杂的语义和上下文信息,反映了用户各个方面的偏好,而且文本不能直接输入到图卷积网络中,本专利技术需要将评论文本映射到词向量空间,并用于学习用户/项目的特征表示。其次,本专利技术要将评论内容整合到图中来获取用户

项目之间的高阶交互信息也十分具有挑战。
[0005]基于上述问题,本专利技术提出了一个联合评分和评论的图卷积网络(Rating and Reviewwith Graph Convolutional Networks,RRGCN)。首先利用CNNs将评论文本映射到词向量空间,得到评论文本的特征表示,然后结合注意力机制利用评论的特征表示来初始化用户/项目节点。其次,利用图卷积网络的卷积和聚合操作来捕获用户和项目之间的高阶协同信息来完善特征表示。最后,本专利技术在三个真实的公开数据集上进行实验并与其他基准方法进行比较,证明了本专利技术提出的方法的有效性。

技术实现思路

[0006]有鉴于此,本专利技术的目的在于提供一种基于评论信息的个性化推荐方法。
[0007]为达到上述目的,本专利技术提供如下技术方案:
[0008]基于评论信息的个性化推荐方法,该方法包括以下步骤:
[0009]S1:给定一组用户U和一组项目V,以及用户的评论信息和评论文本,每条用户和项目的交互表示成一个四元组(u,v,r
ij
,d
ij
),其中r
ij
表示用户i对项目j的评分数值,是对该项目的一个整体评价,d
ij
是对应的评论文本;D
i
表示用户i发表的所有评论的合集,D
j
表示所有对项目j发的评论的合集;根据四元组,预测用户u对从未没有接触的项目v的评分r;
[0010](u,v,rij,dij)代表用户

项目交互记录;rij代表用户i对项目j的评分;dij代表用户i对项目j的评论;eij代表用户i对项目j的评论的特征表示;αij代表用户i对项目j的评论的特征的权重;Hi代表用户i的初始特征表示;Zu代表最终的用户的特征表示;
[0011]S2:融合评分与评论的图卷积模型RRGCN;
[0012]模型RRGCN包括特征表示层、图卷积层和评分预测层;
[0013]所述特征表示层为:
[0014]利用词嵌入技术将用户评论中的单词映射到向量空间中;用户i发布的关于项目j的评论表示为包含n个单词的序列,即d
ij
=[w1,w2,

,w
n
];词嵌入利用全局共享的嵌入矩阵f:V

R
d
执行查找操作,将词汇表V中的每个单词映射到其对应的d维向量空间中;使用word2vec中预先训练过的词向量来初始化嵌入矩阵;将评论文本d
ij
转化为词嵌入矩阵W∈R
n
×
d
,d为每个单词嵌入向量的维度;借助CNNs计算评论的特征表示,捕获句子中的语义信息和上下文信息,学习用户和项目的特征表示;在CNNs中,设有k个不同的卷积核,F={f1,f2,

,f
k
},其中每个卷积核为f
l
∈R
d
×
s
,s为卷积核窗口大小,嵌入矩阵W被第l个卷积核采样后,再经过最大池化层后得到的特征标量表示为:
[0015][0016]其中,*表示卷积运算,b
l
表示偏置;连接经过K个卷积核产生的特征向量,即评论d
ij
的特征表示:e
ij
=[c1,c2,

,c
k
]∈R
K

[0017]所述图卷积层为:
[0018]初始化用户和项目节点的特征;借助评论文本和评分,捕获上下文信息和语义信息来初始化用户和项目的特征表示;利用注意力机制为不同方面的特征分配不同的权重,去除与用户偏好无关的特征信息,学习用户和项目节点的特征表示;对于用户建模,注意力权重的计算方式如下:
[0019]α

ij
=W
p
[w
e
e
ij
|w
r
r
ij
]ꢀꢀꢀꢀꢀ
(2)
[0020][0021]其中,W
p
,W
e
,W
r
是待学习的参数,r
ij
是用one

hot编码评分信息后的向量,|表示向量之间的连接操作,N表示用户i的邻节点数量;用户节点的特征表示为:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于评论信息的个性化推荐方法,其特征在于:该方法包括以下步骤:S1:给定一组用户U和一组项目V,以及用户的评论信息和评论文本,每条用户和项目的交互表示成一个四元组(u,v,r
ij
,d
ij
),其中r
ij
表示用户i对项目j的评分数值,是对该项目的一个整体评价,d
ij
是对应的评论文本;D
i
表示用户i发表的所有评论的合集,D
j
表示所有对项目j发的评论的合集;根据四元组,预测用户u对从未没有接触的项目v的评分r;(u,v,rij,dij)代表用户

项目交互记录;rij代表用户i对项目j的评分;dij代表用户i对项目j的评论;eij代表用户i对项目j的评论的特征表示;αij代表用户i对项目j的评论的特征的权重;Hi代表用户i的初始特征表示;Zu代表最终的用户的特征表示;S2:融合评分与评论的图卷积模型RRGCN;模型RRGCN包括特征表示层、图卷积层和评分预测层;所述特征表示层为:利用词嵌入技术将用户评论中的单词映射到向量空间中;用户i发布的关于项目j的评论表示为包含n个单词的序列,即d
ij
=[w1,w2,

,w
n
];词嵌入利用全局共享的嵌入矩阵f:V

R
d
执行查找操作,将词汇表V中的每个单词映射到其对应的d维向量空间中;使用word2vec中预先训练过的词向量来初始化嵌入矩阵;将评论文本d
ij
转化为词嵌入矩阵W∈R
n
×
d
,d为每个单词嵌入向量的维度;借助CNNs计算评论的特征表示,捕获句子中的语义信息和上下文信息,学习用户和项目的特征表示;在CNNs中,设有k个不同的卷积核,F={f1,f2,

,f
k
},其中每个卷积核为f
l
∈R
d
×
s
,s为卷积核窗口大小,嵌入矩阵W被第l个卷积核采样后,再经过最大池化层后得到的特征标量表示为:其中,*表示卷积运算,b
l
表示偏置;连接经过K个卷积核产生的特征向量,即评论d
ij
的特征表示:e
ij
=[c1,c2,

,c
k
]∈R
K
;所述图卷积层为:初始化用户和项目节点的特征;借助评论文本和评分,捕获上下文信息和语义信息来初始化用户和项目的特征表示;利用注意力机制为不同方面的特征分配不同的权重,去除与用户偏好无关的特征信息,学习用...

【专利技术属性】
技术研发人员:苏畅彭劭闻谢显中陈敏
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1