当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于知识图谱的新颖性增强推荐方法技术

技术编号:36804964 阅读:14 留言:0更新日期:2023-03-09 00:09
本发明专利技术公开了一种基于知识图谱的新颖性增强推荐方法,包括:对原始数据集中的用户物品交互数据以及知识图谱数据进行预处理,并将处理后的用户物品交互数据集划分为训练集、验证集和测试集;构建基于知识图谱的新颖性增强推荐网络模型,将用户物品交互数据集的训练集样本、验证集样本及处理后的知识图谱数据批量随机地送入新颖性增强推荐网络模型中,开始迭代模型训练过程,迭代结束后保存验证集上最优的新颖性增强推荐网络模型;加载保存的最优新颖性增强推荐网络模型,将测试样本批量送入该新颖性增强推荐网络模型中,得到新颖性推荐结果。本发明专利技术同时将用户兴趣偏好与用户新颖性偏好融合,极大地提升了推荐的准确性和新颖性。极大地提升了推荐的准确性和新颖性。极大地提升了推荐的准确性和新颖性。

【技术实现步骤摘要】
一种基于知识图谱的新颖性增强推荐方法


[0001]本专利技术属于推荐系统的
,具体涉及一种基于知识图谱的新颖性增强推荐方法。

技术介绍

[0002]随着互联网的不断发展,网络信息爆炸增长,用户可以接触到海量的数据。然而,繁杂的数据使用户很难快速寻找到自己需要的内容。大量浏览无关内容和长时间低效寻找严重降低了使用者的使用体验,从而导致系统的用户量不断减少。因此,个性化推荐系统由此产生,致力于为用户提供定制化的推荐结果。一个好的推荐系统可以提高企业利润,并给予用户更好的体验感。
[0003]推荐系统中存在长尾分布现象,即小部分的热门或头部商品占据了总销量的绝大部分,而大部分长尾物品的销量仅占据总销量的微小部分。常规基于准确率的推荐系统会偏向于推荐热门商品,导致了推荐结果的重复冗余,降低了用户的使用体验也损害了商家的利益。现今,新颖性推荐越来越受到学术界和工业界的关注,已有研究者针对新颖性推荐进行了不错的尝试。然而,在没有引入额外信息的前提下,现有方法只能在头部物品与长尾物品之间做取舍。同时,现有基于用户新颖性偏好的工作思路在于为新颖偏好高的用户推荐新颖程度高的物品,而新颖性推荐的真正目标在于为用户推荐感兴趣的新颖物品,它们忽略了新颖物品是否在用户的兴趣范围内。由于以上原因,现有的新颖性推荐在提高新颖性的同时牺牲了太多的准确率。
[0004]基于知识图谱的推荐系统是推荐系统中的一个重要分支。知识图谱将现实中的知识转化为包含实体与关系的知识三元组并形成图的结构,其带有图的结构连通信息以及实体语义信息。现有基于知识图谱的工作大多利用知识图谱解决稀疏性问题和可解释性问题,它们几乎没有区分头部物品和长尾物品,忽视了头部物品与长尾物品对于知识图谱的依赖程度,没有做到将知识图谱与新颖性推荐结合起来。因此,需要开发一种能够利用知识图谱作为辅助信息增强推荐的新颖性推荐方法。

技术实现思路

[0005]本专利技术的目的在于针对现有技术的不足之处,提供一种基于知识图谱的新颖性增强推荐方法,该方法考虑到了头部物品与长尾物品的区别,并使用知识图谱作为辅助信息,同时将用户兴趣偏好与用户新颖性偏好融合,极大地提升了推荐的准确性和新颖性。
[0006]为解决上述技术问题,本专利技术采用如下技术方案:
[0007]一种基于知识图谱的新颖性增强推荐方法,包括如下步骤:
[0008]步骤1:对原始数据集中的用户物品交互数据以及知识图谱数据进行预处理,并将处理后的用户物品交互数据集划分为训练集、验证集和测试集;
[0009]步骤2:构建基于知识图谱的新颖性增强推荐网络模型,将用户物品交互数据集的训练集样本、验证集样本及处理后的知识图谱数据批量随机地送入新颖性增强推荐网络模
型中,开始迭代模型训练过程,计算新颖性增强推荐网络模型在训练集与验证集上的推荐效果,当验证集上的推荐效果不再上升或者迭代达到一定次数后停止,保存验证集上最优的新颖性增强推荐网络模型;
[0010]步骤3:加载保存的最优新颖性增强推荐网络模型,将测试样本批量送入该新颖性增强推荐网络模型中,得到新颖性推荐结果。
[0011]进一步地,对于数据的预处理包括赋予物品、用户以及知识图谱中实体、关系独热编码,并将用户的历史交互物品处理为固定格式。
[0012]进一步地,新颖性增强推荐网络模型包括知识图谱嵌入学习模块、协同过滤分支预测模块、知识图谱分支预测模块、双分支交互模块、双分支联合预测模块以及损失权重函数模块;其中,
[0013]知识图谱嵌入学习模块通过嵌入学习方法学习知识图谱中实体、关系的嵌入表示;
[0014]协同过滤分支预测模块以目标用户以及目标物品的独热编码为输入,训练和学习目标用户以及目标物品的协同过滤表示,得到协同过滤分支模块下的预测分数;
[0015]知识图谱分支预测模块以用户的历史交互物品为输入,经过知识图谱嵌入学习模块后得到图谱特征表示,再经过编码器编码得到用户的兴趣偏好表示,并与候选物品的图谱表示进行计算得到知识图谱分支模块下的预测得分;
[0016]双分支交互模块,将头部物品的协同过滤特征表示为监督信号指导知识图谱中头部物品的图谱表示学习,并使长尾物品随着图谱嵌入表示学习,从而获得准确的图谱表示;
[0017]双分支联合预测模块,通过定义物品新颖性度量以结合协同过滤分支模块以及知识图谱分支模块的预测得分进行联合预测;
[0018]损失权重函数模块通过知识图谱分支得到用户的兴趣偏好表示,通过定义用户新颖性偏好度量计算用户的新颖性偏好,通过定义权重函数融入用户的新颖性偏好和兴趣偏好,将计算得到的权重作为样例的损失权重函数,通过损失权重函数调整新颖性增强推荐网络模型的预测损失函数,并对模型参数进行优化。
[0019]进一步地,知识图谱嵌入学习模块学习知识图谱中实体、关系的嵌入表示的方法为:
[0020]采用TransR作为谱嵌入学习方法,对于步骤1得到的知识三元组(h,r,t),通过嵌入表示层后得到稠密的向量表示e
h
,r
r
,e
t
,真实三元组的置信度得分为:
[0021][0022]其中,是关系r下的投影矩阵,g(h,r,t)函数得到的分数用以评估该三元组是否是真实的三元组的可能性;
[0023]构建TransR的损失函数如下:
[0024][0025]其中,为构建的知识图谱,(h,r,t)为知识图谱真实的正例知识三元组,(h,r,t

)为通过随机采样得到的不存在于知识图谱中
的负例知识三元组,σ(
·
)为激活函数;
[0026]使用TransR作为正则器对知识图谱进行训练,得到具有隐含语义的实体、关系的嵌入向量表示。
[0027]进一步地,协同过滤分支预测模块预测分数的方法为:
[0028]协同过滤分支预测模块以目标用户i以及目标物品j的独热编码作为输入,经过嵌入层后得到用户i的协同特征与物品j协同特征通过点积得到协同过滤分支下用户i对物品j的预测分数,公式如下:
[0029][0030]式中,σ(
·
)表示Sigmoid激活函数。
[0031]进一步地,知识图谱分支预测模块计算知识图谱分支下的预测得分的方法为:
[0032]在步骤1中得到用户u的历史物品输入序列S
u
,将S
u
经过知识图谱嵌入层后得到交互物品集合的图谱嵌入表示:
[0033][0034]式中,表示第n个物品的图谱嵌入表示;
[0035]将输入到编码器中,其中,编码器为以注意力为基础的Transformer模型,Transformer模块分为多头自注意力模块和前馈神经网络模块,其中,多头注意力定义为:
[0036]MultiHead(S
l
)=Concat(head1,...head
h
)W
o
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的新颖性增强推荐方法,其特征在于,包括如下步骤:步骤1:对原始数据集中的用户物品交互数据以及知识图谱数据进行预处理,并将处理后的用户物品交互数据集划分为训练集、验证集和测试集;步骤2:构建基于知识图谱的新颖性增强推荐网络模型,将用户物品交互数据集的训练集样本、验证集样本及处理后的知识图谱数据批量随机地送入新颖性增强推荐网络模型中,开始迭代模型训练过程,计算新颖性增强推荐网络模型在训练集与验证集上的推荐效果,当验证集上的推荐效果不再上升或者迭代达到目标次数后停止,保存验证集上推荐效果最优的新颖性增强推荐网络模型;步骤3:加载保存的最优新颖性增强推荐网络模型,将测试样本批量送入该新颖性增强推荐网络模型中,得到新颖性推荐结果。2.根据权利要求1所述的基于知识图谱的新颖性增强推荐方法,其特征在于,对于数据的预处理包括赋予物品、用户以及知识图谱中实体、关系独热编码,并将用户的历史交互物品处理为固定格式。3.根据权利要求1所述的基于知识图谱的新颖性增强推荐方法,其特征在于,新颖性增强推荐网络模型包括知识图谱嵌入学习模块、协同过滤分支预测模块、知识图谱分支预测模块、双分支交互模块、双分支联合预测模块以及损失权重函数模块;其中,知识图谱嵌入学习模块通过嵌入学习方法学习知识图谱中实体、关系的嵌入表示;协同过滤分支预测模块以目标用户以及目标物品的独热编码为输入,训练和学习目标用户以及目标物品的协同过滤表示,得到协同过滤分支模块下的预测分数;知识图谱分支预测模块以用户的历史交互物品为输入,经过知识图谱嵌入学习模块后得到图谱特征表示,再经过编码器编码得到用户的兴趣偏好表示,并与候选物品的图谱表示进行计算得到知识图谱分支模块下的预测得分;双分支交互模块,将头部物品的协同过滤特征表示为监督信号指导知识图谱中头部物品的图谱表示学习,并使长尾物品随着图谱嵌入表示学习,从而获得准确的图谱表示;双分支联合预测模块,通过定义物品新颖性度量以结合协同过滤分支模块以及知识图谱分支模块的预测得分进行联合预测;损失权重函数模块通过知识图谱分支得到用户的兴趣偏好表示,通过定义用户新颖性偏好度量计算用户的新颖性偏好,通过定义权重函数融入用户的新颖性偏好和兴趣偏好,将计算得到的权重作为样例的损失权重函数,通过损失权重函数调整新颖性增强推荐网络模型的预测损失函数,并对模型参数进行优化。4.根据权利要求3所述的基于知识图谱的新颖性增强推荐方法,其特征在于,知识图谱嵌入学习模块学习知识图谱中实体、关系的嵌入表示的方法为:采用TransR作为谱嵌入学习方法,对于步骤1得到的知识三元组(h,r,t),通过嵌入表示层后得到稠密的向量表示e
h
,r
r
,e
t
,真实三元组的置信度得分为:其中,是关系r下的投影矩阵,g(h,r,t)函数得到的分数用以评估该三元组是否是真实的三元组的可能性;构建TransR的损失函数如下:
其中,其中,为构建的知识图谱,(h,r,t)为知识图谱真实的正例知识三元组,(h,r,t

)为通过随机采样得到的不存在于知识图谱中的负例知识三元组,σ(
·
)为Sigmoid激活函数;使用TransR作为正则器对知识图谱进行训练,得到具有隐含语义的实体、关系的嵌入向量表示。5.根据权利要求3所述的基于知识图谱的新颖性增强推荐方法,其特征在于,协同过滤分支预测模块预测分数的方法为:协同过滤分支预测模块以目标用户i以及目标物品j的独热编码作为输入,经过嵌入层后得到用户i的协同特征与物品j协同特征通过点积得到协同过滤分支下用户i对物品j的预测分数,公式如下:式中,σ(
·
)表示Sigmoid激活函数。6.根据权利要求3所述的基于知识图谱的新颖性增强推荐方法,其特征在于,知识图谱分支预测模块计算知识图谱分支下的预测得分的方法为:在步骤1中得到用户u的历史物品输入序列S
u
,将S
u
经过知识图谱嵌入层后得到交互物品集合的图谱嵌入表示:式中,表示第n个物品的图谱嵌入表示;将输入到编码器中,其中,编码器为以注意力为基础的Transformer模型,Transformer模块分为多头自注意力模块和前馈神经网络模块,其中,多头注意力定义为:MultiHead(S
l
)=Concat(head
l
,...,head
h
)W
O
其中S
l
为Transformer第l层的输入,投影矩阵为Transformer第l层的输入...

【专利技术属性】
技术研发人员:赵裴云航钱铁云孙柯戈步荣陈旭
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1