本发明专利技术公开了一种基于加权二部图的混合推荐算法,步骤为:从电影观看平台中得到用户的历史数据信息,根据用户的历史数据构建加权二部图;在加权二部图中使用个性化随机游走方法度量项目对于用户的重要度,生成候选推荐集合;利用协同过滤推荐框架对候选推荐集合中项目进行评分预测;通过参数调整待推荐集合中项目的重要度与预测评分对推荐产生的影响,生成推荐结果。本发明专利技术的基于加权二部图的混合推荐算法针对不同用户有不同的推荐方案,实现个性化推荐,通过个性化随机游走方法,进一步挖掘了用户的兴趣,增强了推荐的长尾能力,利用候选集合中项目的重要度和预测评分进行综合推荐,提高了推荐的多样性、新颖性。新颖性。新颖性。
【技术实现步骤摘要】
一种基于加权二部图的混合推荐算法
[0001]本专利技术属于系统推荐的
,尤其涉及一种基于加权二部图的混合推荐算法。
技术介绍
[0002]随着时代的发展,信息过载问题变得越来越严重,信息消费者越来越难于从海量信息中寻找到感兴趣的信息,信息生产者也难于确保生产的信息能够受到广大用户关注。推荐系统应运而生,它是解决信息过载问题非常有潜力的方法。
[0003]目前学者们提出很多推荐算法,运用最广泛的是基于预测评分的推荐算法,如协同过滤。这类算法主要利用用户对物品的评分信息预测用户未评分物品的评分值,进而对预测评分值降序排列,组成Top
‑
N列表推荐给用户。因此这类算法都致力于提高预测准确性。
[0004]但是,准确性并不是衡量用户对推荐物品满意度的唯一标准,多样性也很重要。基于用户的协同过滤在依靠邻近用户为目标用户进行推荐时,如果目标用户的邻近用户集中存在喜欢热门物品的用户,这些热门物品大概率会被推荐给目标用户,而那些长尾物品由于大多数用户不了解,预测评分值小,难以出现在推荐列表中。这就导致推荐的物品过度集中在热门物品中,而潜在的长尾物品往往被忽略,大幅降低了推荐的多样性和新颖性。因此挖掘长尾物品、提升推荐多样性和新颖性,已成为推荐系统中重要的研究话题。
技术实现思路
[0005]针对现有技术中的不足,本专利技术所要解决的技术问题在于提供一种基于加权二部图的混合推荐算法,能够解决传统的协同过滤推荐算法推荐结果过度集中于热门项目,导致多样性和新颖性较低、覆盖率较小的问题,能够增强推荐的多样性和新颖性及覆盖率。
[0006]为了解决上述技术问题,本专利技术通过以下技术方案来实现:
[0007]本专利技术提供一种基于加权二部图的混合推荐算法,包括以下步骤:
[0008]步骤1:从电影观看平台中得到用户的历史数据信息,根据用户的历史数据构建加权二部图;
[0009]步骤2:在加权二部图中使用个性化随机游走方法度量项目对于用户的重要度,生成候选推荐集合;
[0010]步骤3:利用协同过滤推荐框架对候选推荐集合中项目进行评分预测;
[0011]步骤4:通过参数调整待推荐集合中项目的重要度与预测评分对推荐产生的影响,生成推荐结果。
[0012]优选的,步骤2中的个性化随机游走方法包括:
[0013]根据新的随机游走策略,新的随机游走概率Q
uo
为:
[0014][0015]其中,F
uo
为用户u对项目o的评分,D
o
为项目o的度;
[0016]归一化后的游走概率gQ
uo
为:
[0017][0018]其中,Q
uos
为用户u游走到每个已评分项目的概率总和;
[0019]初始赋予PR(u1)=1,其余节点PR值均为0,即对用户u1而言,自身重要度为满分,每次都是从PR值不为0的节点开始游走,每次走一步,继续游走的概率是α,停留在当前节点的概率是1
‑
α;
[0020]多次迭代,最终每个节点的PR值会趋于稳定,这个PR值就是其与目标节点的重要度:
[0021][0022]其中,v
i
节点为v
j
节点的入边,即从v
i
节点游走至v
j
节点,α为继续游走的概率,1
‑
α为停留在当前节点的概率,为游走概率,v
j
≠v
u
表示继续游走,v
j
=v
u
表示停留在当前节点。
[0023]进一步的,在步骤3中,为目标用户未选择的项目进行预测评分,已知目标用户u和未选择的项目o,用户u对项目o的预测评分为:
[0024][0025]其中,v表示对项目o已评分过的用户,R
v,o
表示用户v对项目o的评分,分别表示用户u、v所有评分的平均评分,n表示用户u的n位邻近用户;sim(u,v)为用户u、v之间的相似度,对sim(u,v)排序生成近邻用户集合,sim(u,v)计算步骤如下:
[0026][0027]其中,d(v)表示加权二部图中用户v的度,d(o)表示加权二部图中项目o的度;
[0028][0029]其中,o∈out(u)表示在加权二部图中项目o与用户u存在连边。
[0030]优选的,在步骤4中,引入参数λ来整合评分与PR值对推荐产生的影响,假设PR值对推荐产生的影响与预测评分是一致的,将PR值映射到[0,5]区间,即
[0031][0032]其中,PR
uo
表示候选推荐集合中项目o的PR值,PR
max
表示候选推荐集合中项目PR值的最大值;
[0033]得到综合的项目推荐值为
[0034]T
uo
=λPR
′
uo
+(1
‑
λ)P
uo
[0035]其中,λ为可调节的参数(λ∈[0,1]),当λ=0时,T
uo
变为单独的预测评分推荐值,当λ=1时,T
uo
变为单独的PR推荐值。
[0036]由上,本专利技术的基于加权二部图的混合推荐算法至少具有如下有益效果:
[0037]1.针对不同用户有不同的推荐方案,实现个性化推荐。
[0038]2.通过个性化随机游走方法,进一步挖掘了用户的兴趣,增强了推荐的长尾能力。
[0039]3.利用候选集合中项目的重要度和预测评分进行综合推荐,提高了推荐的多样性、新颖性。
[0040]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
[0041]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例的附图作简单地介绍。
[0042]图1是加权二部图示意图;
[0043]图2是本专利技术的基于加权二部图的混合推荐算法的流程图。
具体实施方式
[0044]下面结合附图详细说明本专利技术的具体实施方式,其作为本说明书的一部分,通过实施例来说明本专利技术的原理,本专利技术的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
[0045]如图1和图2所示,本专利技术的基于加权二部图的混合推荐算法,包括以下步骤:
[0046]步骤1:从电影观看平台中得到用户的历史数据信息,根据用户的历史数据构建加权二部图。
[0047]步骤2:在加权二部图中使用个性化随机游走方法度量项目对于用户的重要度,生成候选推荐集合。
[0048]步骤3:利用协同过滤推荐框架对候选推荐集合中项目进行评分预测。
...
【技术保护点】
【技术特征摘要】
1.一种基于加权二部图的混合推荐算法,其特征在于,包括以下步骤:步骤1:从电影观看平台中得到用户的历史数据信息,根据用户的历史数据构建加权二部图;步骤2:在加权二部图中使用个性化随机游走方法度量项目对于用户的重要度,生成候选推荐集合;步骤3:利用协同过滤推荐框架对候选推荐集合中项目进行评分预测;步骤4:通过参数调整待推荐集合中项目的重要度与预测评分对推荐产生的影响,生成推荐结果。2.如权利要求1所述的基于加权二部图的混合推荐算法,其特征在于,步骤2中的个性化随机游走方法包括:根据新的随机游走策略,新的随机游走概率Q
uo
为:其中,F
uo
为用户u对项目o的评分,D
o
为项目o的度;归一化后的游走概率gQ
uo
为:其中,Q
uos
为用户u游走到每个已评分项目的概率总和;初始赋予PR(u1)=1,其余节点PR值均为0,即对用户u1而言,自身重要度为满分,每次都是从PR值不为0的节点开始游走,每次走一步,继续游走的概率是α,停留在当前节点的概率是1
‑
α;多次迭代,最终每个节点的PR值会趋于稳定,这个PR值就是其与目标节点的重要度:其中,v
i
节点为v
j
节点的入边,即从v
i
节点游走至v
j
节点,α为继续游走的概率,1
‑
α为停留在当前节点的概率,为游走概率,v
j
≠v
u
表示继...
【专利技术属性】
技术研发人员:张俊东,
申请(专利权)人:辽宁工程技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。