一种基于层次化物品协同过滤推荐方法技术

技术编号:23099407 阅读:24 留言:0更新日期:2020-01-14 20:39
本发明专利技术公开了一种基于层次化物品协同过滤推荐方法,包括以下步骤:收集用户对物品的行为数据以及物品的元数据;对收集的行为数据和物品的元数据进行建模和物品相似度计算;基于层次化物品协同过滤的推荐。本发明专利技术主要是利用多种数据,包括用户对物品的行为数据和物品的元数据信息,以此计算物品之间的相似度并实施基于层次化物品协同过滤的推荐,缓解数据稀疏和冷启动问题的影响,进而改进推荐结果的准确率和多样性。

A collaborative filtering and recommendation method based on hierarchical items

【技术实现步骤摘要】
一种基于层次化物品协同过滤推荐方法
本专利技术属于数据挖掘及推荐
,具体涉及一种基于层次化物品协同过滤推荐方法。
技术介绍
推荐系统能够帮助用户从海量在线内容中找到相关项目来降低搜索成本,而准确计算物品的相似度是实现个性化推荐系统的核心之一。然而,传统方法通常遭受诸如推荐精度低、推荐效果类似等问题,无法满足用户的需求。协同过滤推荐算法能够利用用户和物品之间的行为数据实施推荐,在一定程度上提高了推荐的准确率和用户的满意率。然而,现有协同过滤方法无法充分利用内容数据,且面临冷启动和数据稀疏等问题。因此,如何充分包括用户的细粒度行为数据和物品的内容数据在内的丰富信息,是改进推荐系统的准确性、推荐结果多样性以及用户满意度的关键之一。
技术实现思路
针对现有技术所存在的上述技术问题,本专利技术提供了一种基于层次化物品协同过滤推荐方法,能够改善推荐的效果和性能。本专利技术包括如下内容:1、一种基于层次化物品协同过滤推荐方法,包括如下步骤:10.收集用户对物品的行为数据以及物品的元数据;20.对收集的行为数据和物品元数据进行建模并计算物品之间的相似度;30.基于层次化物品协同过滤的推荐。其中步骤10包括:101.收集所有用户的行为数据U={u1,u2,...,u|U|}为所有用户的集合,用户u∈U的历史行为数据为Hu={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合。102.收集I中所有物品的元数据M,包括但不限于类别、属性、标签等信息。其中步骤20包括:201.将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话。以用户u∈U为例,其历史行为数据可以根据时间划分为用户u的第n个会话定义为202.根据上述数据分别构建物品-用户索引表、物品-会话索引表和物品-元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系。203.根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)其中,i,j∈I,α、β和γ是对应相似度的权重;是物品在用户层的相似度,Ui和Uj是分别与物品i和j的有交互行为的用户集合,根据物品-用户索引表获得,|U|是集合U的大小;是物品在用户层的相似度,Si和Sj是分别包含物品i和j的会话集合,根据物品-会话索引表获得;是物品在用户层的相似度,Mi和Mj是分别是物品i和j的元数据集合,根据物品-元数据索引表获得;其中步骤30包括:301.根据用户的行为数据以及物品的相似度,计算目标用户u对物品i的兴趣,其计算公式如下:其中,u是目标用户;Ii,k是和i最相似的k个物品的集合;Iu是用户u交互过的物品集合。302.利用上述公式对所有物品进行排序,把前n个物品推荐给目标用户u。本专利技术的有益效果是:1)充分利用用户对物品的交互行为数据和物品的元数据,缓解数据稀疏和冷启动问题;2)设计了基于层次化物品协同过滤推荐算法,能够提升推荐结果的准确率和多样性,进而提升用户的满意度。附图说明图1为本专利技术推荐方法的系统架构示意图。具体实施方式为了更为具体地描述本专利技术,下面结合附图及具体实施方式对本专利技术的技术方案进行详细说明。本专利技术基于层次化物品协同过滤推荐方法包括以下步骤:(1).收集所有用户的行为数据U={u1,u2,...,u|U|}为所有用户的集合,用户u∈U的历史行为数据为Hu={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合。收集I中所有物品的元数据M,包括但不限于类别、属性、标签等信息。(2).将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话。以用户u∈U为例,其历史行为数据可以根据时间划分为用户u的第n个会话定义为(3).根据上述数据分别构建物品-用户索引表、物品-会话索引表和物品-元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系。(4).根据用户的行为数据以及物品的元数据,计算物品之间的相似度,其计算公式为:sim(i,j)=α·simu(i,j)+β·sims(i,j)+γ·simm(i,j)其中,i,j∈I,α、β和γ是对应相似度的权重;是物品在用户层的相似度,Ui和Uj是分别与物品i和j的有交互行为的用户集合,根据物品-用户索引表获得,|U|是集合U的大小;是物品在用户层的相似度,Si和Sj是分别包含物品i和j的会话集合,根据物品-会话索引表获得;是物品在用户层的相似度,Mi和Mj是分别是物品i和j的元数据集合,根据物品-元数据索引表获得。(5).根据用户的行为数据以及物品的相似度,计算目标用户u对物品i的兴趣,其计算公式如下:其中,u是目标用户;Ii,k是和i最相似的k个物品的集合;Iu是用户u交互过的物品集合。(6).利用上述公式对所有物品进行排序,把前n个物品推荐给目标用户u。图1给出了本实施方式基于层次化物品协同过滤推荐方法的架构。该推荐系统分为两个主要模块:预处理模块和预测模块。预处理模块中,首先获取所有用户的行为数据和物品的元数据,并构建物品-用户索引表、物品-会话索引表和物品-元数据索引表,分别表示用户和物品的交互关系、物品和会话的归属关系以及物品和元数据的包含关系,基于三张表计算物品之间的相似度,得到物品相似度数据库。在预测模块中,提取目标用户的物品交互记录,结合物品相似度数据库计算目标用户对候选物品的潜在兴趣并排序,最后将排名靠前的物品推荐给用户。表1给出了本专利技术推荐方法中根据用户的行为数据构建会话的示例。表1用户u1的前4条交互行为记录的时间较为接近,最后3条交互行为记录的时间较为接近,且二者之间的时间间隔较大,因此分别被划分到两个会话和中。上述的对实施例的描述是为便于本
的普通技术人员能理解和应用本专利技术。熟悉本领域技术的人员显然可以容易地对上述实施做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本专利技术不限于上述实施例,本领域技术人员根据本专利技术的揭示,对于本专利技术做出的改进和修改都应该在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种基于层次化物品协同过滤推荐方法,其特征在于包括如下步骤:/n10.收集用户和物品的行为数据以及物品的元数据;/n20.对收集的行为数据和元数据进行建模并计算物品相似度;/n30.基于层次化物品协同过滤的推荐。/n

【技术特征摘要】
1.一种基于层次化物品协同过滤推荐方法,其特征在于包括如下步骤:
10.收集用户和物品的行为数据以及物品的元数据;
20.对收集的行为数据和元数据进行建模并计算物品相似度;
30.基于层次化物品协同过滤的推荐。


2.根据权利要求1所述的基于层次化物品协同过滤推荐方法,其特征在于,步骤10包括:
101.收集所有用户的行为数据U={u1,u2,...,u|U|}为所有用户的集合,用户u∈U的历史行为数据为Hu={(i1,t1),(i2,t2),…,(im,tm)},I={i1,i2,...,i|M|}为所有物品的集合;
102.收集集合I中所有物品的元数据M,包括类别、属性和标签。


3.根据权利要求1所述的基于层次化物品协同过滤推荐方法,其特征在于,步骤20包括:
201.将每个用户的行为数据按照时间分别划分为不同的会话,时间接近的行为数据被划分为一个会话;以用户u∈U为例,其历史行为数据根据时间划分为用户u的第n个会话定义为
202.根据上述数据分别构建物品-用户索引表、物品-会话索引表和物品-元数据索引表,分别表示用户和物品的交互关系...

【专利技术属性】
技术研发人员:张新王东京俞东进
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1