当前位置: 首页 > 专利查询>天津大学专利>正文

用户相似度改进的协同过滤推荐系统及方法技术方案

技术编号:27357869 阅读:34 留言:0更新日期:2021-02-19 13:38
本发明专利技术涉及推荐系统技术领域,为提出一种用户相似度改进的协同过滤推荐算法,使得推荐结果更加精准,并缓解用户冷启动问题。本发明专利技术,用户相似度改进的协同过滤推荐系统及方法,包括服务器和客户端,用户通过客户端向服务器提出服务请求,服务器端执行如下程序:构建用户

【技术实现步骤摘要】
用户相似度改进的协同过滤推荐系统及方法


[0001]本专利技术涉及推荐系统
,具体涉及一种用户相似度改进的协同过滤推荐系统及方法。

技术介绍

[0002]随着互联网的蓬勃发展,海量的信息资源造成了“信息过载”问题,生产者难以将对消费者有用的信息呈现给消费者,而消费者难以找到自己感兴趣的信息。为了解决这一问题,推荐系统技术应运而生。其通过分析用户的历史行为等,推测出用户的兴趣,建立用户兴趣模型,从海量信息中找到符合用户兴趣的信息推荐给用户。作为和搜索引擎一样帮助用户筛选信息的工具,推荐系统主动为用户推荐其感兴趣的信息或物品,从而克服了搜索引擎中需要用户明确的需求和一定的搜索技术的问题。
[0003]推荐系统中最核心的是推荐算法的设计。协同过滤算法是较为经典和广泛运用的一种推荐算法。协同过滤算法又可分为基于用户的协同过滤算法、基于物品的协同过滤算法、矩阵分解算法等。基于用户的协同过滤算法的思想是用户可能会喜欢兴趣相似的其他用户喜欢的物品。该算法首先计算各用户之间的兴趣相似度,然后对于目标用户,选取与其具有最高相似度的一些用户,称为近邻用户,通过近邻用户对物品的评分计算出目标用户对其未有过行为的物品的预测评分,最后根据预测评分生成对目标用户的推荐列表。由于是将其他用户作为中介,因此称为基于用户的协同过滤算法。基于用户的协同过滤算法可以通过用户的行为精准地挖掘出用户的偏好,但也存在着数据稀疏、冷启动等问题。
[0004]在基于用户的协同过滤算法中,传统的用户相似度计算方法如杰卡德相似度、余弦相似度、皮尔逊相似度等,存在着用户相似度区分度不够、忽略用户评分尺度、忽略用户评分规模、用户相似度不够准确等问题,导致推荐结果不够准确。
[0005]对基于用户的协同过滤算法中存在的上述问题,提出一种改进的用户相似度计算方法,从用户评分数值、用户评分尺度、用户共同评分规模、用户属性几方面改进用户相似度计算公式,从而提高用户相似度的准确度,使得推荐结果更加精准,并缓解用户冷启动问题。

技术实现思路

[0006]为克服现有技术的不足,针对现有的基于用户的协同过滤算法中存在的问题,本专利技术旨在提出一种用户相似度改进的协同过滤推荐算法,该方法能够提高用户相似度计算的准确性,使得推荐结果更加精准,并缓解用户冷启动问题。为此,本专利技术采取的技术方案是,用户相似度改进的协同过滤推荐系统,包括服务器和客户端,用户通过客户端向服务器提出服务请求,服务器端执行如下程序:
[0007]步骤一:收集用户对电影的评分数据,构建用户-电影评分矩阵;
[0008]步骤二:计算用户评分数值相似度、用户兴趣相似度和用户共同评分权重,结合权重得到用户评分相似度;
[0009]用户评分数值相似度按照如下公式计算:
[0010][0011]其中,sim1(u,v,i)为用户u和用户v对于物品i的评分数值相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分;
[0012]用户兴趣相似度按照如下公式计算:
[0013][0014]其中,sim2(u,v,i)为用户u和用户v对于物品i的兴趣相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分,r
u,avg
和r
v,avg
分别为用户u和用户v的评分平均值;
[0015]用户共同评分权重按照如下公式计算:
[0016][0017]其中,sim3(u,v)为用户u和用户v的共同评分权重,I
u
和I
v
分别为用户u和用户v评分过的物品集合;
[0018]用户评分相似度为用户所给评分的相似度,对上述三部分结合得到用户评分相似度:
[0019][0020]其中,sim
rate
(u,v)为用户u和用户v的评分相似度,C
uv
为用户u和用户v共同评分过的物品集合;
[0021]步骤三:根据用户属性计算用户属性相似度;
[0022]用户属性相似度为用户个人属性的相似度,按照如下公式计算用户属性相似度:
[0023]sim
attr
(u,v)=∑
i∈attr w
i
·
sim4(u,v,i)
[0024]其中,sim
attr
(u,v)为用户u和用户v的用户属性相似度,attr为已知的用户属性集合,sim4(u,v,i)为用户u和用户v在属性i上的相似度;
[0025]步骤四:将用户评分相似度和用户属性相似度结合得到最终的用户相似度;
[0026]按照如下公式计算最终的用户相似度:
[0027]sim(u,v)=α
·
sim
attr
(u,v)+β
·
sim
rate
(u,v)
[0028]其中,sim(u,v)为用户u和用户v最终的用户相似度,α和β为两部分相似度的权重,按照如下公式计算:
[0029]其中I
u
为用户u评分过的物品集合;
[0030][0031]β=1-α
[0032]步骤五:根据用户相似度找出与目标用户相似度最大的K个用户,作为目标用户的
近邻用户;
[0033]步骤六:计算目标用户对未评分过物品的预测评分;
[0034]按照如下公式计算目标用户对未评分过物品的预测评分:
[0035][0036]其中,r
ui
为计算的用户u对物品i的预测评分,N
K
为用户的K个近邻用户,sim
uv
为用户u和用户v的用户相似度,r
vi
为用户v对物品i的评分;
[0037]步骤七:将目标用户所有未评分过的物品按照预测评分排序,选取预测评分最高的N个物品推荐给目标用户。
[0038]用户相似度改进的协同过滤推荐方法,步骤如下:
[0039]步骤一:收集用户对电影的评分数据,构建用户-电影评分矩阵;
[0040]步骤二:计算用户评分数值相似度、用户兴趣相似度和用户共同评分权重,结合权重得到用户评分相似度;
[0041]用户评分数值相似度按照如下公式计算:
[0042][0043]其中,sim1(u,v,i)为用户u和用户v对于物品i的评分数值相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分;
[0044]用户兴趣相似度按照如下公式计算:
[0045][0046]其中,sim2(u,v,i)为用户u和用户v对于物品i的兴趣相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分,r
u,avg
和r
v,avg
分别为用户u和用户v的评分平均值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户相似度改进的协同过滤推荐系统,其特征是,包括服务器和客户端,用户通过客户端向服务器提出服务请求,服务器端执行如下程序:步骤一:收集用户对电影的评分数据,构建用户-电影评分矩阵;步骤二:计算用户评分数值相似度、用户兴趣相似度和用户共同评分权重,结合权重得到用户评分相似度;用户评分数值相似度按照如下公式计算:其中,sim1(u,v,i)为用户u和用户v对于物品i的评分数值相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分;用户兴趣相似度按照如下公式计算:其中,sim2(u,v,i)为用户u和用户v对于物品i的兴趣相似度,r
ui
和r
vi
分别为用户u和用户v对物品i的评分,r
u,avg
和r
v,avg
分别为用户u和用户v的评分平均值;用户共同评分权重按照如下公式计算:其中,sim3(u,v)为用户u和用户v的共同评分权重,I
u
和I
v
分别为用户u和用户v评分过的物品集合;用户评分相似度为用户所给评分的相似度,对上述三部分结合得到用户评分相似度:其中,sim
rate
(u,v)为用户u和用户v的评分相似度,C
uv
为用户u和用户v共同评分过的物品集合;步骤三:根据用户属性计算用户属性相似度;sim
attr
(u,v)=∑
i∈attr
w
i
·
sim4(u,v,i)用户属性相似度为用户个人属性的相似度,按照如下公式计算用户属性相似度:其中,sim
attr
(u,v)为用户u和用户v的用户属性相似度,attr为已知的用户属性集合,sim4(u,v,i)为用户u和用户v在属性i上的相似度;步骤四:将用户评分相似度和用户属性相似度结合得到最终的用户相似度;sim(u,v)=α
·
sim
attr
(u,v)+β
·
sim
rate
(u,v)按照如下公式计算最终的用户相似度:其中,sim(u,v)为用户u和用户v最终的用户相似度,α和β为两部分相似度的权重,按照如下公式计算:
β=1-α其中I
u
为用户u评分过的物品集合;步骤五:根据用户相似度找出与目标用户相似度最大的K个用户,作为目标用户的近邻用户;步骤六:计算目标用户对未评分过物品的预测评分;按照如下公式计算目标用户对未评分过物品的预测评分:其中,r
ui
为计算的用户u对物品i的预测评分,N
K
为用户的K个近邻用户,sim
uv
为用户u和用户v的用户相似度,r
vi
为用户v对物品i的评分;步骤七:将目标用户所有未评分过的物品按照预测评分排序,选取预测评分最...

【专利技术属性】
技术研发人员:张蕾唐凯辰伊丽萍
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1