当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于知识图谱的可解释推荐模型的构建方法技术

技术编号:29873197 阅读:19 留言:0更新日期:2021-08-31 23:48
本发明专利技术公开了一种基于知识图谱的可解释推荐模型的构建方法,S1、将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将嵌入矢量通过拼接形成一个句子矩阵;S2、将句子矩阵通过卷积核,得到不同的特征映射;S3、不同的特征映射通过池化层,将不同的路径序列经过池化后归整定长的特征表示;S4、将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示;S5、基于加权池化函数预测用户与候选项目的交互概率,并计算不同路径的得分贡献,选择得分最大的一条路径作为推荐;S6、采用Hit@K和NDCG@K对推荐的路径进行评价。

【技术实现步骤摘要】
一种基于知识图谱的可解释推荐模型的构建方法
本专利技术属于推荐系统的
,具体涉及一种基于知识图谱的可解释推荐模型的构建方法。
技术介绍
人工智能发展开始进入后深度学习时代,尤其是在能源、医疗和金融等高风险、高价值产业中,若没有可解释的推理过程,则会潜藏着巨大的风险。在人工智能领域,一个重要分支是推荐系统,若解决了推荐可解释任务,则后续可为开发和研究新的可解释机器学习算法和理论提供合适的背景。当前推荐系统欠缺一种与之配套且有效的解释机制,解释机制的缺乏使得用户在应用推荐服务时,存在一种模糊感,不明白作为“黑箱”系统最后给出的结果是否真的适合自己。向用户解释系统会给出这个推荐结果的缘由与推荐系统的准确性同等重要,可解释的推荐会增进系统的透明度、说服力和信任度。目前对于推荐的解释有基于协同的解释,基于模板的解释,基于评论的解释。基于协同的推荐解释,能根据用户社交关系或项目特征生成“您的朋友也在看”或“您购买的A和B相似,为您推荐B”等解释,但在数据稀疏时,推荐的解释会过于牵强;基于模板的解释,其通过对预先定义好的模板进行关键词填充来形成解释,然而模板化的解释并不能满足用户的个性化需求;基于评论的解释,可对评论库中的文本进行提取,以生成推荐解释,但因评论中存在噪声文本,并不是所有的评论句子都能为用户决策过程提供解释。研究界将上述解释统称为post-hoc解释,即后处理方法解释,这种方法的优点是简单通用易实现,解释的内容不易受推荐系统的影响。但缺点一是这种解释产生的依据是一个“黑盒子”,无法进行合理显式地推断;二是推荐理由千篇一律,不满足用户个性化解释需求。当用户发现系统推荐的结果并不是自己的真正需要时,会降低用户对系统的信任度,最后流失用户,导致企业盈利下降。
技术实现思路
本专利技术的目的在于针对现有技术中的上述不足,提供一种基于知识图谱的可解释推荐模型的构建方法,以解决或改善上述的问题。为达到上述目的,本专利技术采取的技术方案是:一种基于知识图谱的可解释推荐模型的构建方法,其包括以下步骤:S1、将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将所述嵌入矢量通过拼接形成一个句子矩阵;S2、将所述句子矩阵通过卷积核,得到不同的特征映射;S3、不同的特征映射通过池化层,将不同的路径序列经过池化后归整定长的特征表示;S4、将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示;S5、基于加权池化函数预测用户与候选项目的交互概率,并计算不同路径的得分贡献,选择得分最大的一条路径作为推荐;S6、采用Hit@K和NDCG@K对推荐的路径进行评价。进一步地,S1中将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将所述嵌入矢量通过拼接形成一个句子矩阵:其中,L为句子最大长度,为级联算子,对应于句子中第i个词的k维词向量,x1:L为从第1个到第L个词构成的句子,ei为第i个实体向量,e′为第i个实体类型向量,ri为关系向量。进一步地,S2中将所述句子矩阵通过卷积核,得到不同的特征映射,包括:将句子矩阵通过卷积核h的一维卷积,每个卷积核的窗口大小为h*k,得到(L-h+1)维的特征集合即特征映射ci:ci=f(w·xi:i+h-1+b)其中,为滤波器,为偏置项,f为激活函数,xi:i+h-1为第i个词在卷积窗口的向量;并采取不同大小的卷积核对句子{x1:h,x2:h+1,…,xL-h+1:L}进行卷积:c=[c1,c2,…,cL-h+1]其中,进一步地,S4中将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示,包括:S4.1、采用门控循环单元GRU作为RNN模型,为RNN的输入向量,输出隐态向量为hl为:rl=σ(Wirxl+bir+Whrhl-1+bhr)zl=σ(Wizxl+biz+Whzhl-1+bhz)nl=tanh(Winxl+bin+rl*(Whnhl-1+bhn))hl=(1-zl)*nl+zl*hl-1其中,xl为第l步的输入向量,hl-1为第l-1步输出的隐态或第0步初始化的隐态;rl,zl,nl分别是重置门控,更新门控和新门控;σ为sigmoid函数,*为哈达玛积;Wir,Wiz,Win为第l步中,输入层-隐藏层之间可学习的权重;bir,biz,bin为输入层-隐藏层之间可学习偏置;Whr,Whz,Whn为隐藏层-隐藏层之间可学习的权重;bhr,bhz,bhn为隐藏层-隐藏层之间可学习的偏置;S4.2、将通过RNN捕捉到的每条路径的最终隐态作为整条路径pt的最终表示,并通过将路径表示输入全连接层以得到用户与项目的交互分数:其中,ρ=(u,interact,i)的路径合理性,st(ρ|pt)为,为,L为句子最大长度,U(W1Tpt)为。进一步地,步骤S5基于加权池化函数预测用户与候选项目的交互概率,并计算不同路径的得分贡献,选择得分最大的一条路径作为推荐,包括:S5.1、采用加权池化函数,将用户与项目的L条路径p(u,i)={p1,p2,…,pT}计算的得分S={s1,s2,…,sT}通过加权池化进行整合,获得用户与项目交互的最终预测得分;加权池化函数为:其中,st为第t条路径的得分,γ为一个控制权重的超参数;S5.2、通过非线性激活函数得到用户与项目的交互概率其中,σ为log_softmax函数,sK为第K条路径的得分。进一步地,步骤S6中采用Hit@K对推荐的路径进行评价,包括:其中,I(x)是一个指示函数,当x>0时,函数值为1,否则为0;为用户u的最终推荐列表,为推荐列表中排在第k个位置得分项目,Tu为测试集中的用户-项目交互项,N是测试集中的用户总数;计算得到的Hit@K的值若大于预设值,则为用户推荐的路径对应的项目合理。进一步地,步骤S6中采用NDCG@K对推荐的路径进行评价,包括:其中,Z为归一化常数,是DCG@K的最大可能值;计算得到的DCG@K值的值若大于预设值,则衡量推荐算法给出的列表中被推荐项目的相对位置靠前,则为用户推荐的路径对应的项目合理。本专利技术提供的基于知识图谱的可解释推荐模型的构建方法,具有以下有益效果:本专利技术模型首先在嵌入层,通过在知识图谱中发现用户与候选项目之间的路径,并按最大长度进行截断,每条路径均由实体与关系构成的序列;然后利用TextCNN的方法提取路径中的关键信息,输入路径序列L,输出k维的路径向量表示;再基于卷积核捕捉路径的局部语义相关性,增强特征表示;接着将提取的特征表示送入RNN中获得最终隐向量作为路径表示;最后通过权重池化操作预测用户与候选项目的交互概率,计算不同路径得分贡献,选择输出得分最大的一条路径作为对给出推荐最合理的解释。本专利技术本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的可解释推荐模型的构建方法,其特征在于,包括以下步骤:/nS1、将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将所述嵌入矢量通过拼接形成一个句子矩阵;/nS2、将所述句子矩阵通过卷积核,得到不同的特征映射;/nS3、不同的特征映射通过池化层,将不同的路径序列经过池化后归整定长的特征表示;/nS4、将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示;/nS5、基于加权池化函数预测用户与候选项目的交互概率,并计算不同路径的得分贡献,选择得分最大的一条路径作为推荐;/nS6、采用Hit@K和NDCG@K对推荐的路径进行评价。/n

【技术特征摘要】
1.一种基于知识图谱的可解释推荐模型的构建方法,其特征在于,包括以下步骤:
S1、将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将所述嵌入矢量通过拼接形成一个句子矩阵;
S2、将所述句子矩阵通过卷积核,得到不同的特征映射;
S3、不同的特征映射通过池化层,将不同的路径序列经过池化后归整定长的特征表示;
S4、将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示;
S5、基于加权池化函数预测用户与候选项目的交互概率,并计算不同路径的得分贡献,选择得分最大的一条路径作为推荐;
S6、采用Hit@K和NDCG@K对推荐的路径进行评价。


2.根据权利要求1所述的基于知识图谱的可解释推荐模型的构建方法,其特征在于:所述S1中将知识图谱中的实体和关系类别数据通过Word2Vec转换为嵌入矢量,并将所述嵌入矢量通过拼接形成一个句子矩阵:






其中,L为句子最大长度,为级联算子,对应于句子中第i个词的k维词向量,x1:L为从第1个到第L个词构成的句子,ei为第i个实体向量,e′为第i个实体类型向量,ri为关系向量。


3.根据权利要求1所述的基于知识图谱的可解释推荐模型的构建方法,其特征在于:所述S2中将所述句子矩阵通过卷积核,得到不同的特征映射,包括:
将句子矩阵通过卷积核h的一维卷积,每个卷积核的窗口大小为h*k,得到(L-h+1)维的特征集合即特征映射ci:
ci=f(w·xi:i+h-1+b)
其中,为滤波器,为偏置项,f为激活函数,xi:i+h-1为第i个词在卷积窗口的向量;
并采取不同大小的卷积核对句子{x1:h,x2:h+1,…,xL-h+1:L}进行卷积:
c=[c1,c2,…,cL-h+1]
其中,


4.根据权利要求1所述的基于知识图谱的可解释推荐模型的构建方法,其特征在于:所述S4中将池化层输出的特征输入RNN网络中,输出隐态向量作为路径表示,包括:
S4.1、采用门控循环单元GRU作为RNN模型,为RNN的输入向量,输出隐态向量为hl为:
rl=σ(Wirxl+bir+Whrhl-1+bhr)
zl=σ(Wizxl+biz+Whzhl-1+bhz)
nl=tanh(Winxl+bin+rl*(Whnhl-1+bhn))
hl=(1-zl)*nl+zl*hl-1
其中,xl为第l步的...

【专利技术属性】
技术研发人员:徐兵彭舰黄飞虎弋沛玉
申请(专利权)人:四川大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1