引入空间衰减函数的兴趣点推荐算法制造技术

技术编号:13331368 阅读:86 留言:0更新日期:2016-07-11 23:01
本发明专利技术公开了引入空间衰减函数的兴趣点推荐算法。现有兴趣点推荐算法没有考虑兴趣点相似度存在空间上的衰减现象。本发明专利技术的步骤:首先给出适合特定签到数据集的空间衰减函数类型,然后对空间衰减函数预设参数,并将含有预设参数的空间衰减函数作为权值参与兴趣点相似度的计算当中;在进行推荐算法推荐性能实验时,通过给定不同的空间衰减函数预设参数值来得到不同的召回率、精确度和F指标,根据这些指标选取适合本数据集的空间衰减函数预设参数值,此时,即可确定适合本数据集的空间衰减函数。本发明专利技术通过引入空间衰减函数可以提高兴趣点推荐算法的推荐性能。

【技术实现步骤摘要】

本专利技术属于计算机
,具体涉及一种引入空间衰减函数的兴趣点推荐算法
技术介绍
随着智能手机的普及和定位技术的发展,人们更容易获得自己位置的实时信息,从而促使了基于位置的社交网络的出现,例如大众点评,Foursquare,Jiepang等。由于这些网站收集了大量的用户签到信息,利用这些签到信息可以对用户没有访问过的兴趣点进行推荐。现实社会有大量景点,用户往往对目的地难以抉择,服务提供商可以根据系统内其他用户的签到记录以及用户自身的特征对用户推荐合适的兴趣点。常用的推荐算法有基于内容的推荐,基于协同过滤的推荐,基于模型的推荐,以及混合推荐等。在兴趣点推荐中,由于用户的数目巨大并且在不断变化,而兴趣点相对固定,因此基于兴趣点相似度的协同过滤推荐算法常常被用在兴趣点推荐服务上,这种算法首先要建立“用户-兴趣点”评价矩阵进行数据分析,矩阵中每个元素是用户对兴趣点的访问次数或者评分数据。基于位置的社交网络中包含了用户访问兴趣点的地理位置等信息,这就为我们在推荐算法中考虑空间衰减性提供了方便。由于兴趣点包含地理信息,一些研究者在基于位置的社交网络中发现了人们的移动行为存在空间聚类现象,个人的访问地点趋向于聚集在一起,利用这种现象来帮助兴趣点推荐,例如,通过任意一对访问地点之间距离的幂律分布来描述,或对兴趣点分布直接执行密度估计。这些算法仅仅考虑空间聚类现象对兴趣点推荐的影响,而没有考虑兴趣点相似度存在空间上的衰减现象。在兴趣点推荐中空间衰减性是重要的因素,能对推荐结果产生重大影响。相隔的距离越近,用户感兴趣地点的相似度越高,与间隔很远的兴趣点相比在推荐算法中具有更大的权重。
技术实现思路
本专利技术针对现有兴趣点推荐算法仅仅考虑空间聚类现象对兴趣点推荐的影响,而没有考虑兴趣点相似度存在空间上的衰减现象,提出了一种引入空间衰减函数的兴趣点推荐算法,该算法利用兴趣点之间相似度受到空间距离的影响,在求解兴趣点之间相似度时用距离作为参数的函数对兴趣点相似度进行加权。实际数据集上测试结果表明,该改进算法在精准度、召回率和F指标等方面比传统基于兴趣点的协同过滤推荐算法有更好的表现。本专利技术的具体步骤是:步骤1、收集签到网站中用户签到数据。表1签到网站中用户签到数据集表1中:u代表用户的编号,1≤u≤m,m为收集的用户总数;v代表兴趣点的编号,1≤v≤n,n为兴趣点总数;ruv代表用户u对兴趣点v的评分,Av代表兴趣点v的纬度,Ov代表兴趣点v的经度。步骤2、建立包含兴趣点位置信息的“用户-兴趣点”评分矩阵R(m×n),评分矩阵含m个用户和n个兴趣点,兴趣点的位置信息用兴趣点的经纬度来表示,如表2所示。随机选取1/8的签到兴趣点作为测试集,剩余7/8的兴趣点作为训练集。表2包含兴趣点位置信息的“用户-兴趣点”评分矩阵步骤3、使用传统兴趣点相似度求解公式求解兴趣点i,j之间的相似度w(i,j),1≤i≤n,1≤j≤n;传统兴趣点相似度求解公式有:余弦相似度求解公式、修正余弦相似度求解公式和皮尔逊相关系数相似度求解公式。相关参数设置:rui和ruj分别表示用户u对兴趣点i和兴趣点j的评分,用户没有对兴趣点评分被设置为0,和分别表示m个用户对兴趣点i和兴趣点j的平均评分,表示用户u对兴趣点的平均评分,U(i)和U(j)分别表示对兴趣点i和兴趣点j评分的用户集合,U(i,j)表示同时对兴趣点i,j评分的用户集合。3.1余弦相似度求解公式。在余弦相似度求解公式中,通过兴趣点评分向量之间的夹角余弦来度量它们之间的相似度。兴趣点i,j的余弦相似度如下: w ( i , j ) = Σ u = 1 m r u i r u j Σ u = 1 m ( r u i ) 2 Σ u = 1 m ( r u j ) 2 - - - ( 1 ) ]]>3.2修正余弦相似度求解公式。它在余弦相似度基础上进行了改进,通过减去用户对兴趣点的平均评分解决了余弦相似度没有考虑用户评分等级差异的问题。兴趣点i,j的修正余弦相似度如下本文档来自技高网
...

【技术保护点】
引入空间衰减函数的兴趣点推荐算法,其特征在于:该方法的具体步骤如下:步骤1、收集签到网站中用户签到数据;表1 签到网站中用户签到数据集表1中:u代表用户的编号,1≤u≤m,m为收集的用户总数;v代表兴趣点的编号,1≤v≤n,n为兴趣点总数;ruv代表用户u对兴趣点v的评分,Av代表兴趣点v的纬度,Ov代表兴趣点v的经度;步骤2、建立包含兴趣点位置信息的“用户‑兴趣点”评分矩阵R(m×n),评分矩阵含m个用户和n个兴趣点,兴趣点的位置信息用兴趣点的经纬度来表示,如表2所示;随机选取1/8的签到兴趣点作为测试集,剩余7/8的兴趣点作为训练集;表2 包含兴趣点位置信息的“用户‑兴趣点”评分矩阵步骤3、使用传统兴趣点相似度求解公式求解兴趣点i,j之间的相似度w(i,j),1≤i≤n,1≤j≤n;传统兴趣点相似度求解公式有:余弦相似度求解公式、修正余弦相似度求解公式和皮尔逊相关系数相似度求解公式;相关参数设置:rui和ruj分别表示用户u对兴趣点i和兴趣点j的评分,用户没有对兴趣点评分被设置为0,和分别表示m个用户对兴趣点i和兴趣点j的平均评分,表示用户u对兴趣点的平均评分,U(i)和U(j)分别表示对兴趣点i和兴趣点j评分的用户集合,U(i,j)表示同时对兴趣点i,j评分的用户集合;3.1余弦相似度求解公式;在余弦相似度求解公式中,通过兴趣点评分向量之间的夹角余弦来度量它们之间的相似度;兴趣点i,j的余弦相似度如下:w(i,j)=Σu=1mruirujΣu=1m(rui)2Σu=1m(ruj)2---(1)]]>3.2修正余弦相似度求解公式;它在余弦相似度基础上进行了改进,通过减去用户对兴趣点的平均评分解决了余弦相似度没有考虑用户评分等级差异的问题;兴趣点i,j的修正余弦相似度如下:w(i,j)=Σu∈U(i,j)(rui-ru‾)(ruj-ru‾)Σu∈U(i)(rui-ru‾)2Σu∈U(j)(ruj-ru‾)2---(2)]]>3.3皮尔逊相关系数相似度求解公式;与修正余弦相似度一样,它也解决了用户评分等级差异的问题;兴趣点i,j的皮尔逊相关系数相似度如下:w(i,j)=Σu∈U(i,j)(rui-ri‾)(ruj-rj‾)Σu∈U(i,j)(rui-ri‾)2Σu∈U(i,j)(ruj-rj‾)2---(3)]]>步骤4、三种兴趣点相似度求解公式分别代入兴趣点的预测评分公式形成三种传统兴趣点推荐算法,分别预测出用户u对测试集内各个兴趣点的预测评分;用户u对兴趣点i的预测评分公式如下:r^ui=ri‾+Σj∈S(i,K)∩N(u)w(i,j)(ruj-rj‾)Σj∈S(i,K)∩N(u)|w(i,j)|---(4)]]>式中,S(i,K)表示和兴趣点i最相似的K个兴趣点的集合,N(u)表示用户u访问兴趣点的集合;步骤5、每种传统兴趣点推荐算法都推荐出预测评分值最大的N个兴趣点;步骤6、通过召回率、精准度和F指标评价传统兴趣点推荐算法的推荐性能;R(u)表示用户u推荐的N个兴趣点的集合,T(u)表示用户u实际感兴趣的兴趣点集合,则召回率P1、精准度P2和F指标F,分别由下式求得:P1=Σu=1m|R(u)∩T(u)|Σu=1m|T(u)|---(5)]]>P2=Σu=1m|R(u)∩T(u)|Σu=1m|R(u)|---(6)]]>F=2P1P2P1+P2---(7)]]>召回率描述的是在用户实际感兴趣的兴趣点当中被推荐的比例,精准度描述的是推荐列表当中用户实际感兴趣的兴趣点所占的比例,但这2个指标经常出现相互矛盾的情况,往往1个指标增大的同时另1个指标随之减小,为了综合考虑召回率和精准度,还用到了综合评价指标F指标;步骤7、在推荐性能最好的传统兴趣点推荐算法基础上引入空间衰减函数,得到引入空间衰减函数的兴趣点推荐算法,具体如下:7.1找到推荐性能最好的传统兴趣点推荐算法;由推荐列表长度N的不同值,根据三种传统兴趣点推荐算法中召回率、精准度和F指标选取最好的传统兴趣点推荐算法;7.2引入空间衰减函数f(d(i,j)),其中d(i,j)是兴趣点i和兴趣点j之间的大圆距离,大圆距离指的是从球面的一点出发沿球面到达球面上另一点所经过的最短路径的长...

【技术特征摘要】
1.引入空间衰减函数的兴趣点推荐算法,其特征在于:该方法的具
体步骤如下:
步骤1、收集签到网站中用户签到数据;
表1签到网站中用户签到数据集
表1中:u代表用户的编号,1≤u≤m,m为收集的用户总数;v代表
兴趣点的编号,1≤v≤n,n为兴趣点总数;ruv代表用户u对兴趣点v的
评分,Av代表兴趣点v的纬度,Ov代表兴趣点v的经度;
步骤2、建立包含兴趣点位置信息的“用户-兴趣点”评分矩阵R(m
×n),评分矩阵含m个用户和n个兴趣点,兴趣点的位置信息用兴趣点
的经纬度来表示,如表2所示;随机选取1/8的签到兴趣点作为测试集,
剩余7/8的兴趣点作为训练集;
表2包含兴趣点位置信息的“用户-兴趣点”评分矩阵
步骤3、使用传统兴趣点相似度求解公式求解兴趣点i,j之间的相似
度w(i,j),1≤i≤n,1≤j≤n;传统兴趣点相似度求解公式有:余弦相似度
求解公式、修正余弦相似度求解公式和皮尔逊相关系数相似度求解公式;
相关参数设置:rui和ruj分别表示用户u对兴趣点i和兴趣点j的评分,
用户没有对兴趣点评分被设置为0,和分别表示m个用户对兴趣点i
和兴趣点j的平均评分,表示用户u对兴趣点的平均评分,U(i)和U(j)
分别表示对兴趣点i和兴趣点j评分的用户集合,U(i,j)表示同时对兴趣点
i,j评分的用户集合;
3.1余弦相似度求解公式;在余弦相似度求解公式中,通过兴趣点评
分向量之间的夹角余弦来度量它们之间的相似度;兴趣点i,j的余弦相
似度如下:
w ( i , j ) = Σ u = 1 m r u i r u j Σ u = 1 m ( r u i ) 2 Σ u = 1 m ( r u j ) 2 - - - ( 1 ) ]]>3.2修正余弦相似度求解公式;它在余弦相似度基础上进行了改进,
通过减去用户对兴趣点的平均评分解决了余弦相似度没有考虑用户评分
等级差异的问题;兴趣点i,j的修正余弦相似度如下:
w ( i , j ) = Σ u ∈ U ( i , j ) ( r u i - r u ‾ ) ( r u j - r u ‾ ) Σ u ∈ U ( i ) ( r u i - r u ‾ ) 2 Σ u ∈ U ( j ) ( r u j - r u ‾ ) 2 - - - ( 2 ) ]]>3.3皮尔逊相关系数相似度求解公式;与修正余弦相似度一样,它也
解决了用户评分等级差异的问题;兴趣点i,j的皮尔逊相关系数相似度
如下:
w ( i , j ) = Σ u ∈ U ( i , j ) ( r u i - r i ‾ ) ( r u j - r j ‾ ) Σ u ∈ U ( i , j ) ( r u i - r i ‾ ) 2 Σ ...

【专利技术属性】
技术研发人员:余正生常晓雨
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1