当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于知识图谱的长尾推荐计算方法技术

技术编号:26766017 阅读:49 留言:0更新日期:2020-12-18 23:42
本发明专利技术公开了一种基于知识图谱的长尾推荐计算方法,包括:首先从商品知识图谱中通过图谱表示学习方法学习待推荐商品的嵌入表示;接着依据用户和商品交互数量的多少将用户划分为头部用户以及长尾用户;然后对头部用户使用传统协同过滤方法学习其嵌入表示,并通过聚类方法学习用户群体中的原型用户的嵌入表示;最终依据长尾用户和头部用户的相似程度,找出待预测长尾用户最相近的原型用户,使用原型用户的嵌入表示作为待预测长尾用户的嵌入表示进行预测。本发明专利技术利用知识图谱中的信息以及对相似用户群体的捕捉,实现了对长尾(低资源)用户喜好的预测,解决了传统协同过滤推荐系统中固有的长尾(低资源)推荐问题。

【技术实现步骤摘要】
一种基于知识图谱的长尾推荐计算方法
本专利技术属于知识图谱与推荐系统领域,具体涉及一种基于知识图谱的长尾推荐计算方法。
技术介绍
随着电子商务平台的发展,商品数量和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品的过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,推荐系统应运而生。推荐系统根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。推荐系统中存在明显的长尾效应,即少量的用户拥有很多的购买记录,而大部分的用户仅拥有为数不多的购买记录。我们通常将拥有较多购买记录的用户称为头部用户,将拥有较少购买记录的用户称为长尾用户。从总体上看,长尾用户数量交易总量远多于头部用户,因此提高长尾用户的推荐效果对于提升整体的推荐效益是十分重要的。推荐系统作为电商平台的核心技术工具,一直是电商行业内的研究热点。目前主流的推荐系统算法,比如MF(矩阵分解)、DeepMF(基于深度学习模型的矩阵分解)等主要针对头部用户,由于头部用户的购买交互记录数量多,推荐系统对于这些用户的学习效果也会更好,因此目前的主流推荐系统算法对于头部用户的推荐效果较好,而对于长尾用户的针对性不强,导致长尾推荐的效果弱于头部推荐效果。如申请公布号为CN109903117A的专利申请公开的一种用于商品推荐的知识图谱处理方法及装置,申请公布号为CN111507796A的专利申请公开的一种基于知识图谱的网上商城商品推荐方法,这两种方法没有区分长尾用户和头部用户,因此混合推荐效果不佳。
技术实现思路
鉴于上述,本专利技术的目的是提供一种基于知识图谱的长尾推荐计算方法,利用知识图谱存储的领域内知识增强决策和推理过程,提升长尾推荐的效果。本专利技术的技术方案为:一种基于知识图谱的长尾推荐计算方法,包括以下步骤:(1)采集一批包含用户、商品以及商品评分的商品购买记录,获取包含商品属性名和商品属性值的商品属性;(2)根据商品属性构建商品知识图谱,以商品作为头实体,以商品属性作为关系,以商品属性值作为尾实体,构建商品知识图谱,并基于商品知识图谱学习商品的嵌入表示;(3)根据商品购买记录和长尾比例t划分为头部用户和长尾用户;(4)初始化头部用户的初始向量表示,并根据购买记录,基于初始向量表示学习头部用户在推荐空间的嵌入表示;(5)根据购买记录计算得到头部用户和长尾用户在喜好空间的嵌入表示;(6)以头部用户在推荐空间的嵌入表示作为数据基础,对头部用户进行聚类,将具有相似喜好的头部用户组成喜好群组,并将聚类中心对应的嵌入表示作为喜好群组的原型用户向量表示;(7)针对待推荐长尾用户,根据喜好空间的嵌入表示计算长尾用户最接近的头部用户,并将该头部用户所在喜好群组的原型用户向量表示作为待推荐长尾用户在推荐空间的嵌入表示,并以待推荐长尾用户在推荐空间的嵌入表示与商品嵌入表示的内积作为商品的推荐指标。与现有技术相比,本专利技术具有的有益效果至少包括:本专利技术提供的基于知识图谱的长尾推荐计算方法,通过头部用户在喜好空间的嵌入表示找到长尾用户在推荐空间的嵌入表示,然后再根据长尾用户在推荐空间的嵌入表示与商品嵌入表示的内积计算商品的推荐指标以实现商品推荐,利用知识图谱存储的领域内知识增强决策和推理过程,提升了长尾用户推荐的的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。图1是本专利技术提供的基于知识图谱的长尾推荐计算方法的流程图;图2是本专利技术提供的长尾用户匹配最相近的头部用户的过程示意图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。传统的商品推荐系统对头部用户的推荐效果较好,而对于长尾用户的针对性不强,导致长尾推荐的效果弱于头部推荐效果。为了提升长尾用户的商品推荐效果,实施例提供了一种基于知识图谱的长尾推荐计算方法,如图1所示,该基于知识图谱的长尾推荐计算方法包括以下步骤:步骤1,采集一批包含用户、商品以及商品评分的商品购买记录,获取包含商品属性名和商品属性值的商品属性。电商用户从自家电商平台获取商品购买记录和商品属性,该些商品购买记录和商品属性被处理后,作为样本集用于训练学习头部用户在推荐空间的嵌入表示。其中,可以假设一批商品购买记录中共包含n个用户、m个商品以及k个购买记录,用户和商品的购买记录H形式为{用户i,商品j,评分r}其中,i∈[1,n],j∈[1,m],r∈[1,k],n,m,k均为大于1的自然数。假设共有m个商品,p个属性名,q个属性值,商品的属性P形式如下{商品j,属性名s,属性值l},其中,j∈[1,m],s∈[1,p],l∈[1,q],s,l均为大于1的自然数。步骤2,根据商品属性构建商品知识图谱,以商品作为头实体,以商品属性作为关系,以商品属性值作为尾实体,构建商品知识图谱,并基于商品知识图谱学习商品的嵌入表示。在商品知识图谱中,商品为头实体,商品属性为关系,商品属性值为尾实体,由(商品、商品属性、商品属性值)组成一个三元组,商品与商品属性值之间通过商品属性连接,当两个商品属于同一个商品属性值时,这样商品之间通过商品属性值进行连接,形成一个网状的知识图谱。构建的商品知识图谱用作学习用户和商品的嵌入表示。实施例中,通过知识图谱表示学习的方法,为构建好的商品知识图谱中的每个商品实体学习一个嵌入表示。具体可以采用transE对商品知识图谱进行学习获得商品的嵌入表示,该商品的嵌入表示可以用来学习用户在推荐空间和爱好空间的嵌入表示。步骤3,根据商品购买记录和长尾比例t划分为头部用户和长尾用户。实施例中,根据商品购买记录,统计每个用户的购买记录数量,并对购买记录数量进行降序排列,根据预设的长尾比例t,将排序序列中最后n*t个用户被认为是长尾用户,其他用户为头部用户,n为商品购买记录中获取用户总个数,t取值为[0,1]。步骤4,初始化头部用户的初始向量表示,并根据购买记录H,基于初始向量表示学习头部用户在推荐空间的嵌入表示。在获得头部用户和长尾用户后,初始化头部用户的初始向量表示,该初始向量表示作为学习的基础数据,然后基于始化头部用户的初始向量表示,结合商品的嵌入表示、商品评分矩阵构建损失函数,利用损失函数来学习更新头部用户的在推荐空间的嵌入表示。具体地,在样本集上根据以下损失函数学习头部用户在推荐空间的嵌入表示:其中,为训练头部用户时的损失函数,Uhead为头部用户在推荐空间的嵌入表示,本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的长尾推荐计算方法,其特征在于,包括以下步骤:/n(1)采集一批包含用户、商品以及商品评分的商品购买记录,获取包含商品属性名和商品属性值的商品属性;/n(2)根据商品属性构建商品知识图谱,以商品作为头实体,以商品属性作为关系,以商品属性值作为尾实体,构建商品知识图谱,并基于商品知识图谱学习商品的嵌入表示;/n(3)根据商品购买记录和长尾比例t划分为头部用户和长尾用户;/n(4)初始化头部用户的初始向量表示,并根据购买记录,基于初始向量表示学习头部用户在推荐空间的嵌入表示;/n(5)根据购买记录计算得到头部用户和长尾用户在喜好空间的嵌入表示;/n(6)以头部用户在推荐空间的嵌入表示作为数据基础,对头部用户进行聚类,将具有相似喜好的头部用户组成喜好群组,并将聚类中心对应的嵌入表示作为喜好群组的原型用户向量表示;/n(7)针对待推荐长尾用户,根据喜好空间的嵌入表示计算长尾用户最接近的头部用户,并将该头部用户所在喜好群组的原型用户向量表示作为待推荐长尾用户在推荐空间的嵌入表示,并以待推荐长尾用户在推荐空间的嵌入表示与商品嵌入表示的内积作为商品的推荐指标。/n

【技术特征摘要】
1.一种基于知识图谱的长尾推荐计算方法,其特征在于,包括以下步骤:
(1)采集一批包含用户、商品以及商品评分的商品购买记录,获取包含商品属性名和商品属性值的商品属性;
(2)根据商品属性构建商品知识图谱,以商品作为头实体,以商品属性作为关系,以商品属性值作为尾实体,构建商品知识图谱,并基于商品知识图谱学习商品的嵌入表示;
(3)根据商品购买记录和长尾比例t划分为头部用户和长尾用户;
(4)初始化头部用户的初始向量表示,并根据购买记录,基于初始向量表示学习头部用户在推荐空间的嵌入表示;
(5)根据购买记录计算得到头部用户和长尾用户在喜好空间的嵌入表示;
(6)以头部用户在推荐空间的嵌入表示作为数据基础,对头部用户进行聚类,将具有相似喜好的头部用户组成喜好群组,并将聚类中心对应的嵌入表示作为喜好群组的原型用户向量表示;
(7)针对待推荐长尾用户,根据喜好空间的嵌入表示计算长尾用户最接近的头部用户,并将该头部用户所在喜好群组的原型用户向量表示作为待推荐长尾用户在推荐空间的嵌入表示,并以待推荐长尾用户在推荐空间的嵌入表示与商品嵌入表示的内积作为商品的推荐指标。


2.如权利要求1所述的基于知识图谱的长尾推荐计算方法,其特征在于,采用transE对商品知识图谱进行学习获得商品的嵌入表示。


3.如权利要求1所述的基于知识图谱的长尾推荐计算方法,其特征在于,步骤(3)中,根据商品购买记录,统计每个用户的购买记录数量,并对购买记录数量进行降序排列,根据预设的长尾比例t,将排序序...

【专利技术属性】
技术研发人员:陈华钧文博邓淑敏
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1