一种基于联合评分预测和理由生成的可解释推荐方法技术

技术编号:37507075 阅读:15 留言:0更新日期:2023-05-07 09:44
本发明专利技术属于推荐系统领域,具体涉及一种基于联合评分预测和理由生成的可解释推荐方法,包括:构建联合评分预测和理由生成的可解释推荐模型,评分预测模块包含用户项目历史交互中得到用户物品的自由嵌入,通过基于注意力的方面提取模块分别从用户和项目的评论集合中提取方面词并嵌入到相同的空间,分别输入到多层感知机中,在预测层结合两部分进行评分预测并进行推荐和生成推荐解释;本发明专利技术同时考虑用户历史交互中的评分数据和评论数据,并将其映射到同一空间更好的进行评分预测,提高了推荐的准确性,同时在解释生成的过程中考虑生成式和模板式的优点,解释的生成过程由模板进行指导,使得模板适应于所给定的特征,提高了解释的质量。的质量。的质量。

【技术实现步骤摘要】
一种基于联合评分预测和理由生成的可解释推荐方法


[0001]本专利技术属于推荐系统领域,具体涉及一种基于联合评分预测和理由生成的可解释推荐方法。

技术介绍

[0002]随着近年来互联网技术的高速发展,信息过载的问题也日益严重,推荐系统通过从大量产品集合中找到用户可能感兴趣的项目来解决信息过载问题,它通过分析用户历史行为帮助用户完成信息的筛选,它可以发现用户的潜在兴趣偏好。
[0003]如今推荐系统已经应用到我们生活中的各个方面,并且催生了很多新的推荐技术,推荐算法的准确度也得到了改进,极大地完善了推荐效果。传统的推荐系统往往缺乏对推荐结果的解释,而可解释推荐指的是在给用户推荐商品的同时,给出推荐该商品的解释。通过给出推荐的解释,可以增加系统的透明度和用户的信任度以及使用体验,帮助用户更快速更准确地做出选择。
[0004]目前关于基于评论的推荐的研究可以分为两类:面向准确性的建模和可解释性建模。基于嵌入的推荐模型在精度建模方面表现出了最先进的性能,第一类的研究主要利用用户和商品评论中的内容嵌入,并将内容嵌入与协同过滤相融合,增强用户和商品的嵌入表示能力。第二类考虑在推荐商品时为用户提供说明文字,这样更容易说服用户。这类模型借鉴了基于编码器

解码器的语言生成技术的成功,仍然存在几个问题:(1)多数推荐模型倾向于推荐的准确性,而忽略推荐结果的有效性和说服性;(2)目前生成推荐的方法要么局限于预定义的句子模板,限制了句子的表达能力,要么选择自由风格的句子生成,使得句子质量难以控制。
>
技术实现思路

[0005]为解决上述技术问题,本专利技术提出一种基于联合评分预测和理由生成的可解释推荐方法,包括以下步骤:
[0006]S1:获取用户项目交互历史数据,对获取的用户项目交互历史数据进行数据集划分,生成训练数据集和测试数据集,并对训练数据集中的用户项目交互历史数据进行预处理,生成解释词汇表;
[0007]所述用户项目交互历史数据,包括:用户对项目的评分数据、评论数据;
[0008]S2:建立联合评分预测和解释产生模型;
[0009]所述联合评分预测和解释产生模型,包括:偏好评分预测模块和解释生产模块;
[0010]所述偏好评分预测模块,包括:矩阵分解层、基于注意力机制的方面提取层、预测层;
[0011]所述解释生产模块,包括:编码器、解码器;
[0012]S3:将训练数据集输入联合评分预测和解释产生模型进行模型的训练,通过损失函数计算联合评分预测和解释产生模型的损失直至收敛,得到训练好的联合评分预测和解
释产生模型;
[0013]S4:将测试数据集输入训练好的联合评分预测和解释产生模型,得到目标用户项目的评分预测,选择评分最高的项目对用户进行推荐,并生成相应的推荐解释;
[0014]S41:将测试数据集输入偏好评分预测模块,测试数据集中的用户对项目的评分数据通过矩阵分解层,得到用户和项目的自由嵌入表征,用户和项目的自由嵌入表征通过MLP得到潜在特征空间的编码向量;
[0015]S42:将测试数据集输入偏好评分预测模块,测试数据集中的用户项目的评论数据通过基于注意力机制的方面提取层进行提取评论句子的方面表征,再通过平均池化操作分别得到用户、项目的表征,并通过MLP得到方面特征空间的编码向量;
[0016]S43:将潜在特征空间的编码向量和方面特征空间的编码向量通过预测层进行评分预测,得到用户对项目的评分,选择评分最高的项目对用户进行推荐;
[0017]S44:将用户对项目的评分作为解释语句的情感判断,同用户项目对输入到解释产生模块中通过编码器中,解码器通过MLP多层感知机进行初始化信息得到的初始化向量,解码器采用门控单元的组合两个GRU生成最终的隐藏状态,根据初始化向量和最终的隐藏状态生成解释词在词汇表中的概率,并将概率最大的词汇作为生成的推荐解释。
[0018]本专利技术的有益效果:本专利技术同时考虑用户历史交互中的评分数据和评论数据,并将其映射到同一空间更好的进行评分预测,提高了推荐的准确性,同时在解释生成的过程中考虑生成式和模板式的优点,解释的生成过程由模板进行指导,使得模板适应于所给定的特征,提高了解释的质量。
附图说明
[0019]图1为本专利技术的整体流程图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]一种基于联合评分预测和理由生成的可解释推荐方法,如图1所示,包括:
[0022]S1:获取用户项目交互历史数据,对获取的用户项目交互历史数据进行数据集划分,生成训练数据集和测试数据集,并对训练数据集中的用户项目交互历史数据进行预处理,生成解释词汇表;
[0023]所述用户项目交互历史数据,包括:用户对项目的评分数据、评论数据;
[0024]S2:建立联合评分预测和解释产生模型;
[0025]所述联合评分预测和解释产生模型,包括:偏好评分预测模块和解释生产模块;
[0026]所述偏好评分预测模块,包括:矩阵分解层、基于注意力机制的方面提取层、预测层;
[0027]所述解释生产模块,包括:编码器、解码器;
[0028]S3:将训练数据集输入联合评分预测和解释产生模型进行模型的训练,通过损失
函数计算联合评分预测和解释产生模型的损失直至收敛,得到训练好的联合评分预测和解释产生模型;
[0029]S4:将测试数据集输入训练好的联合评分预测和解释产生模型,得到目标用户项目的评分预测,选择评分最高的项目对用户进行推荐,并生成相应的推荐解释;
[0030]S41:将测试数据集输入偏好评分预测模块,测试数据集中的用户对项目的评分数据通过矩阵分解层,得到用户和项目的自由嵌入表征,用户和项目的自由嵌入表征通过MLP得到潜在特征空间的编码向量;
[0031]S42:将测试数据集输入偏好评分预测模块,测试数据集中的用户项目的评论数据通过基于注意力机制的方面提取层进行提取评论句子的方面表征,再通过平均池化操作分别得到用户、项目的表征,并通过MLP得到方面特征空间的编码向量;
[0032]S43:将潜在特征空间的编码向量和方面特征空间的编码向量通过预测层进行评分预测,得到用户对项目的评分,选择评分最高的项目对用户进行推荐;
[0033]S44:将用户对项目的评分作为解释语句的情感判断,同用户项目对输入到解释产生模块中通过编码器中,解码器通过MLP多层感知机进行初始化信息得到的初始化向量,解码器采用门控单元的组合两个GRU生成最终的隐藏状态,根据初始化向量和最终的隐藏状态生成解释词在词汇表中的概率,并将概率最大的词汇作为生成的推荐解释。
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于联合评分预测和理由生成的可解释推荐方法,其特征在于,包括:S1:获取用户项目交互历史数据,对获取的用户项目交互历史数据进行数据集划分,生成训练数据集和测试数据集,并对训练数据集中的用户项目交互历史数据进行预处理,生成解释词汇表;所述用户项目交互历史数据,包括:用户对项目的评分数据、评论数据;S2:建立联合评分预测和解释产生模型;所述联合评分预测和解释产生模型,包括:偏好评分预测模块和解释生产模块;所述偏好评分预测模块,包括:矩阵分解层、基于注意力机制的方面提取层、预测层;所述解释生产模块,包括:编码器、解码器;S3:将训练数据集输入联合评分预测和解释产生模型进行模型的训练,通过损失函数计算联合评分预测和解释产生模型的损失直至收敛,得到训练好的联合评分预测和解释产生模型;S4:将测试数据集输入训练好的联合评分预测和解释产生模型,得到目标用户项目的评分预测,选择评分最高的项目对用户进行推荐,并生成相应的推荐解释;S41:将测试数据集输入偏好评分预测模块,测试数据集中的用户对项目的评分数据通过矩阵分解层,得到用户和项目的自由嵌入表征,用户和项目的自由嵌入表征通过MLP得到潜在特征空间的编码向量;S42:将测试数据集输入偏好评分预测模块,测试数据集中的用户项目的评论数据通过基于注意力机制的方面提取层进行提取评论句子的方面表征,再通过平均池化操作分别得到用户、项目的表征,并通过MLP得到方面特征空间的编码向量;S43:将潜在特征空间的编码向量和方面特征空间的编码向量通过预测层进行评分预测,得到用户对项目的评分,选择评分最高的项目对用户进行推荐;S44:将用户对项目的评分作为解释语句的情感判断,同用户项目对输入到解释产生模块中通过编码器中,解码器通过MLP多层感知机进行初始化信息得到的初始化向量,解码器采用门控单元的组合两个GRU生成最终的隐藏状态,根据初始化向量和最终的隐藏状态生成解释词在词汇表中的概率,并将概率最大的词汇作为生成的推荐解释。2.根据权利要求1所述的一种基于联合评分预测和理由生成的可解释推荐方法,其特征在于,对训练数据集中的用户项目交互历史数据进行预处理,包括:S11:删除训练数据集中的用户对项目的评分数据的所有的停顿词和标点符号;S12:对处理后的用户对项目的评分数据采用gensim工具包中的Word2vec模型生成解释词汇表。3.根据权利要求1所述的一种基于联合评分预测和理由生成的可解释推荐方法,其特征在于,通过损失函数计算联合评分预测和解释产生模型的损失直至收敛,得到训练好的联合评分预测和解释产生模型,包括:其中,表示联合评分预测和解释产生模型的损失函数,表示基于注意力机制的方面提取层的损失系数,表示基于注意力机制的方面提取层的损失函数
表示重构句子嵌入的损失函数的损失系数,表示重构句子嵌入的损失函数,r
w
表示利用方面矩阵重构的句子嵌入向量,z
w
表示基于注意力机制句子嵌入向量,z

w
表示基于方面矩阵重构的句子嵌入向量,表示归一正则化损失系数,表示基于注意力机制的方面提取层的归一正则化损失函数,表示偏好评分预测模块的损失系数,表示偏好评分预测模块的损失函数,损失函数,表示训练集中的用户

项目对,r
u,i
表示在训练数据集中用户u对项目I的实际评分,表示预测数据集中用户u对项目i的预测评分,表示解释生成模块的损失系数,表示解释生成模块的损失函数,a表示用户

项目对,表示用户u和项目i在解释词汇表的事实解释,p(y
t
)表示对单词y
t
预测的概率,表示全局参数的权重,||Θ||表示全局参数。4.根据权利要求1所述的一种基于联合评分预测和理由生成的可解释推荐方法,其特征在于,用户和项目的自由嵌入表征通过MLP中处理得到潜在特征空间的编码向量,包括:其中,MLP表示多层感知机,Relu(.)表示激活函数,分别表示用户u和项目i的自由嵌入表征,W
l
、b
l
分别表示在潜在特征空间中MLP第l层的...

【专利技术属性】
技术研发人员:唐宏张静杨浩澜金哲正刘斌
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1