当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于全局有向图的商品会话序列推荐方法技术

技术编号:32924245 阅读:11 留言:0更新日期:2022-04-07 12:15
本发明专利技术公开了一种基于全局有向图的商品会话序列推荐方法,包括:步骤一、提取原始数据集中的商品项目,生成图数据库节点集;根据原始数据集中的项目之间的点击关系,并且将点击关系出现的次数作为节点关系的属性值,生成节点关系集;步骤二、生成会话序列的全局有向图G=(V,E);其中,V为图数据库节点集,E为节点关系集;步骤三、对于待推荐会话中的每个项目建立初始值为0的m元评分数组,评分数组中的每个元素对应一个待推荐项目的评分值,通过项目的偏好传播更新每个评分数组中的对应的元素;其中,m为原始数据集中项目的数量;步骤四、得到待推荐会话的所有待推荐项目的总评分值,筛选出多个总评分值高的项目作为待推荐会话的最终推荐结果。终推荐结果。终推荐结果。

【技术实现步骤摘要】
一种基于全局有向图的商品会话序列推荐方法


[0001]本专利技术属于商品会话序列推荐
,特别涉及一种基于全局有向图的商品会话序列推荐方法。

技术介绍

[0002]在推荐系统中,商品的会话序列是一种特殊的数据形式,它指在一段时间内某用户点击商品的次序,具有数据量大、随机性强、用户匿名情况多的特点。基于会话序列的商品推荐旨在通过已有的会话预测当前用户下一个可能感兴趣的商品实体。传统的推荐系统往往只关注于会话序列最后一个商品项目实体(简称项目)或者某几个会话中的项目转换,局部偏好过强导致推荐效果不理想,甚至容易引起用户的反感。随着会话序列数据量以及用户的不断增加,传统方法做出推荐的计算代价也在增加。在推荐领域,协同过滤一直经久不衰,以实现简单且推荐准确被亚马逊等众多电商网站使用。
[0003]协同过滤中最常见的可分为基于用户的算法和基于项目的算法两类。基于用户的协同过滤的核心是计算用户与邻居用户之间的相似性,根据邻居用户的点击情况,预测当前用户的可能的点击情况,需要用户的明确偏好和历史交互。在实际推荐系统中,需要维护一个巨大的用户商品交互矩阵,有严重的矩阵稀疏性问题,新增加用户或商品也将导致重新计算用户相似度,可伸缩性差。
[0004]在用户匿名情况较多时,基于用户的协同过滤也无法满足需求。与基于用户的协同过滤算法不同,在会话序列推荐中基于项目的协同过滤是除了深度学习的方法以外的最优选择,它推荐准确度较好,算法复杂度低,但由于需要计算所有商品项目的相似度信息,也有一定的计算代价。马尔科夫链方法是一种基于当前用户最后一次点击项目的最近点击情况预测下一个项目的方法。它不能够捕捉会话整体特征以及全局项目点击信息,而且只关注了最后一次的点击项目。基于马尔科夫链的推荐的准确度也差于基于项目的协同过滤。总之,传统的推荐方法在用户匿名以及大规模数据量情况下,受到了严重的挑战。因此能够满足在匿名情况下使用且实现简便,推荐效率高的算法成为当前研究的热门问题。

技术实现思路

[0005]本专利技术针对现有的商品会话序列推荐算法的缺陷,提供了一种基于全局有向图的商品会话序列推荐方法,本专利技术的一个目的是采用全局偏好传播的策略得到当前会话序列每一个项目的全局影响,获得当前会话的待推荐项目的评分信息,能够实现快速有效的项目推荐。
[0006]本专利技术还有一个目的是在获取评分的过程中通过提高会话序列中靠后项目对应的参数以考虑点击的时间因素对推荐的重要影响,从而能够进一步提高项目推荐的准确率。
[0007]本专利技术提供的技术方案为:
[0008]一种基于全局有向图的商品会话序列推荐方法,包括如下步骤:
[0009]步骤一、提取原始数据集中的商品项目,生成图数据库节点集;根据原始数据集中的会话序列中的项目之间的点击关系,并且将点击关系出现的次数作为节点关系的属性值,生成节点关系集;
[0010]步骤二、根据所述图数据库节点集和所述生成节点关系集得到所述会话序列的全局有向图G=(V,E);
[0011]其中,V为图数据库节点集,E为节点关系集;
[0012]步骤三、对于待推荐会话中的每个项目建立初始值为0的m元评分数组,所述评分数组中的每个元素对应一个待推荐项目的评分值;并且通过所述待推荐会话中项目的偏好传播更新评分数组中的对应的元素;
[0013]其中,m为所述原始数据集中项目的数量;
[0014]步骤四、根据步骤三中得到的评分数组得到所述待推荐会话的每个待推荐项目的总评分值,筛选出多个总评分值高的项目作为所述待推荐会话的推荐项目。
[0015]优选的是,在所述步骤三中,得到项目的评分值,包括:
[0016]对于会话S{v1,v2...v
n
}的项目v
i
,在图数据库中搜索项目v
i
的1

hop,2

hop
……
N

hop集合,并根据全局偏好传播策略更新对应的评分值到项目v
i
对应的评分数组s
i
中;
[0017]其中,v
i
的N

hop集合中第j个项目的评分为:
[0018][0019]式中,是与节点关系的权重,节点关系的权重,s
(N

1)
是的评分值。
[0020]优选的是,在所述步骤四中,根据会话S{v1,v2...v
n
}每个项目的评分数组s
i
,得到会话S的全局评分数组:
[0021][0022]式中,k
i
表示项目v
i
的参数权重;
[0023]其中,全局评分数组s中的每个元素对应一个项目v
i
的总评分值。
[0024]优选的是,k
i
的设置规则为k
n
>k
n
‑1>

k1。
[0025]优选的是,在所述步骤三中,采用使用cypher语句在图数据库中搜索项目v
i
的1

hop,2

hop
……
N

hop集合。
[0026]优选的是,在所述步骤二中,通过Neo4j的neo4j

import api将所述的图数据库节点集以及所述的节点关系集导入数据库后,得到所述会话序列的全局有向图。
[0027]优选的是,将所述全局评分数组s中的元素按照总评分值从高到低的顺序排列,并且筛选出全局评分数组s中前t个元素对应的项目作为所述会话的推荐项目。
[0028]优选的是,t=20。
[0029]本专利技术所述的有益效果是:
[0030]本专利技术通过构建全局有向图的方法对数据集所有会话序列进行建模,对于当前会话使用偏好传播策略并考虑时间因素获得会话中项目的全局影响,从而生成所有待推荐项目的评分,从中评分高的项目做出推荐;在两个标准数据集上的大量实验证明在与传统的
基于项目的协同过滤以及马尔科夫链等方法相比在P@20评价指标还是MRR@20评价指标下都有较好的表现。
附图说明
[0031]图1为本专利技术所述的数据库节点连接示例示意图。
[0032]图2为本专利技术所述的节点偏好传播“波纹”的示意图。
[0033]图3为本专利技术所述的节点偏好传播示例的示意图。
[0034]图4为本专利技术所述的Diginetica数据集会话序列长度分布图。
[0035]图5为本专利技术所述的Yoochoose数据集会话序列长度分布图。
[0036]图6为本专利技术所述的Diginetica各组参数的推荐结果比较示意图。
[0037]图7为本专利技术所述的Yoochoose各组参数的推荐结果比较示意图。
具体实施方式
[0038]下面结合附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于全局有向图的商品会话序列推荐方法,其特征在于,包括如下步骤:步骤一、提取原始数据集中的商品项目,生成图数据库节点集;根据原始数据集中的会话序列中的项目之间的点击关系,并且将点击关系出现的次数作为节点关系的属性值,生成节点关系集;步骤二、根据所述图数据库节点集和所述生成节点关系集得到所述会话序列的全局有向图G=(V,E);其中,V为图数据库节点集,E为节点关系集;步骤三、对于待推荐会话中的每个项目建立初始值为0的m元评分数组,所述评分数组中的每个元素对应一个待推荐项目的评分值;并且通过所述待推荐会话中项目的偏好传播更新评分数组中的对应的元素;其中,m为所述原始数据集中项目的数量;步骤四、根据步骤三中得到的评分数组得到所述待推荐会话的每个待推荐项目的总评分值,筛选出多个总评分值高的项目作为所述待推荐会话的推荐项目。2.根据权利要求1所述的基于全局有向图的商品会话序列推荐方法,其特征在于,在所述步骤三中,得到项目的评分值,包括:对于会话S{v1,v2...v
n
}的项目v
i
,在图数据库中搜索项目v
i
的1

hop,2

hop
……
N

hop集合,并根据全局偏好传播策略更新对应的评分值到项目v
i
对应的评分数组s
i
中;其中,v
i
的N

hop集合中第j个项目的评分为:式中,是与节点关系的权重,节点关系的权重,是的评分值。3.根据权利要求2所述的基于全局有向图的商品...

【专利技术属性】
技术研发人员:白洪涛何丽莉苗启鹏姜宇
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1