一种基于知识图谱的网上商城商品推荐方法技术

技术编号:25187692 阅读:40 留言:0更新日期:2020-08-07 21:14
本发明专利技术公开了一种基于知识图谱的网上商城商品推荐方法,利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号,根据所述评分信息将商品划分为正例和负例;根据商品及其属性数据,构建实体关系三元组,并得到商品知识图谱,获取设定路径数,进行相似度计算,得到相关性概率;将商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量,基于邻居信息,结合对应的实体的特征信息,得到实体表示向量,将所述用户表示向量和所述实体表示向量进行内积运算后,将得到的购买概率按照降序排列,基于设定阈值进行选取,得到对应的推荐列表,能够准确的给用户推荐商品。

【技术实现步骤摘要】
一种基于知识图谱的网上商城商品推荐方法
本专利技术涉及知识图谱
,尤其涉及一种基于知识图谱的网上商城商品推荐方法。
技术介绍
随着电子商务的飞速发展,网上商城出现爆炸式的增长,如何从海量的商品中给用户推荐可能感兴趣的商品对于网上商城经营者来说至关重要。因此,如何根据用户的历史购买记录来构建用户的偏好特征,是个性化商品推荐系统的关键。传统的用户偏好建模方法,大多数都是根据用户历史购买的商品,通过生成商品的特征向量来刻画用户的偏好特征,进而给用户生成个性化的推荐。然而,用户历史购买的商品仅包含有限的特征信息,根据商品的特征生成的用户偏好过于单一,无法全面地表征用户的兴趣,不能很好地满足用户个性化的要求,同时也没有考虑用户-商品交互数据的稀疏性和冷启动问题,不能准确地根据用户偏好给用户推荐可能感兴趣的商品。目前有通过采集用户的消费习惯数据和消费记录数据然后分别建立数据库,商家运用数据分析工具判断用户是否具备消费意愿,如果具备消费意愿则直接进行广告推送;如果不具备意愿,则通过向用户推荐相关联的商品或向与用户相关联的其他用户推送商品广告来挖掘其他的消费意愿。但没有考虑用户历史购买商品对用户兴趣的不同影响,也忽略了商品本身的特征信息,很难准确地给用户推荐商品。
技术实现思路
本专利技术的目的在于提供一种基于知识图谱的网上商城商品推荐方法,能够准确的给用户推荐商品。为实现上述目的,本专利技术提供了一种基于知识图谱的网上商城商品推荐方法,包括:利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号;根据所述评分信息将商品划分为正例和负例;根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱;将获取的商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量;基于邻居信息,结合对应的实体的特征信息,得到对应的实体表示向量;将所述用户表示向量和所述实体表示向量进行内积运算后,根据得到的购买概率得到推荐列表。其中,所述利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号,包括:利用网络爬虫技术获取设定时间内用户购买商品的评分信息和多种属性数据,同时对所述评分信息和多种所述属性数据进行清洗后,获取设定的唯一ID值,分别对用户、商品和对应的属性数据进行编号。其中,根据所述评分信息将商品划分为正例和负例,包括:根据所述评分信息,将所述评分信息大于或等于设定值的商品作为正例,并标记标签为1;将所述评分信息小于所述设定值的商品作为负例,并标记标签为0。其中,根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱,包括:将用户、商品和标签对应的转换为由头实体、关系和尾实体构建的三元组,并将所述头实体和所述尾实体进行链接,得到对应的商品知识图谱后,获取设定路径数,得到对应实体集。其中,根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱,还包括:基于对应实体集,得到三元组集合后,将获取的商品特征向量,与所述三元组中的所述头实体进行相似度计算,得到相关性概率。其中,将获取的商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量,包括:将获取的商品购买信息输入用户偏好建模模块后,将所述相关性概率与所述尾实体进行计算,得到不同路径数下的所述尾实体特征向量,并利用所述商品特征向量生成所述尾实体特征向量的权重后,进行加权求和,得到对应的用户表示向量。其中,所述基于邻居信息,结合对应的实体的特征信息,得到对应的实体表示向量,包括:将用户与对应的所述三元组中的所述关系内积运算后进行归一化处理,并结合基于商品知识图谱卷积网络得到的邻居信息,利用聚合函数根据设定的路径数进行迭代,得到对应的实体表示向量。其中,将所述用户表示向量和所述实体表示向量进行内积运算后,根据得到的购买概率得到推荐列表,包括:将所述用户表示向量和所述实体表示向量进行内积运算后,得到对应的购买概率,并将所述购买概率按照降序排列,基于设定阈值进行选取,得到对应的推荐列表。本专利技术的一种基于知识图谱的网上商城商品推荐方法,利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号,根据所述评分信息将商品划分为正例和负例,并分别进行标记;根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱,获取设定路径数后,进行相似度计算,得到相关性概率;将获取的商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量,基于邻居信息,结合对应的实体的特征信息,得到对应的实体表示向量,将所述用户表示向量和所述实体表示向量进行内积运算后,将得到的购买概率按照降序排列,基于设定阈值进行选取,得到对应的推荐列表,能够准确的给用户推荐商品。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术提供的一种基于知识图谱的网上商城商品推荐方法的步骤示意图。图2是本专利技术提供的模型框架图。图3是本专利技术提供的用户偏好建模模块框架图。图4是本专利技术提供的基于知识图谱的网上商城商品推荐方法的流程示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。请参阅图1,本专利技术提供一种基于知识图谱的网上商城商品推荐方法,包括:S101、利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号。具体的,利用网络爬虫技术在唯品会、1号店、苏宁易购等网上商城上获取设定时间内或者一年内用户购买商品的评分信息和多种属性数据即商品序列,所述属性数据包括:商品价格、商品产地、商品类型、生产日期等。由于爬取的原始数据存在缺失、杂乱等问题无法直接用于后续的计算,需要对没有价值的数据进行清洗,例如,对用户历史购买的商品序列,只保留购买的商品数量大于等于5的序列;例如,对用户对商品的评分,去除那些用户已购买但是未评分的商品。对所述评分信息和多种所述属性数据进行清洗后,原始数据不能直接作为模型的输入,为了便于后续计算,获取设定的唯一ID值,分别对用户、商品和对应的属性数据进行编号,用该ID来表示唯一的一个对象。例如,用户“100000”的ID值设为0,用户“100001”的ID值设为1,商品“伊利纯牛奶”的ID值设为10,类似上述编码将所有的用户、商品和商品属性都分配一个ID值,由此本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的网上商城商品推荐方法,其特征在于,包括:/n利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号;/n根据所述评分信息将商品划分为正例和负例;/n根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱;/n将获取的商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量;/n基于邻居信息,结合对应的实体的特征信息,得到对应的实体表示向量;/n将所述用户表示向量和所述实体表示向量进行内积运算后,根据得到的购买概率得到推荐列表。/n

【技术特征摘要】
1.一种基于知识图谱的网上商城商品推荐方法,其特征在于,包括:
利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号;
根据所述评分信息将商品划分为正例和负例;
根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱;
将获取的商品购买信息输入用户偏好建模模块中,并在所述商品知识图谱中传播,得到用户表示向量;
基于邻居信息,结合对应的实体的特征信息,得到对应的实体表示向量;
将所述用户表示向量和所述实体表示向量进行内积运算后,根据得到的购买概率得到推荐列表。


2.如权利要求1所述的一种基于知识图谱的网上商城商品推荐方法,其特征在于,所述利用网络爬虫技术获取用户对商品的评分信息和属性数据,对所述属性数据进行预处理后进行编号,包括:
利用网络爬虫技术获取设定时间内用户购买商品的评分信息和多种属性数据,同时对所述评分信息和多种所述属性数据进行清洗后,获取设定的唯一ID值,分别对用户、商品和对应的属性数据进行编号。


3.如权利要求2所述的一种基于知识图谱的网上商城商品推荐方法,其特征在于,根据所述评分信息将商品划分为正例和负例,包括:
根据所述评分信息,将所述评分信息大于或等于设定值的商品作为正例,并标记标签为1;将所述评分信息小于所述设定值的商品作为负例,并标记标签为0。


4.如权利要求3所述的一种基于知识图谱的网上商城商品推荐方法,其特征在于,根据商品及其所述属性数据,构建实体关系三元组,并得到商品知识图谱,包括:
将用户、商品和标签对应的转换为由头实体、关系和尾实体构建的三元组,并将所述头实体...

【专利技术属性】
技术研发人员:古天龙田冰冰李龙常亮
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1