The present invention provides a model building method for extending the long tail interest point, which calculates the relevant interest point set JV of the visitor set UV={u'1, u'2,..., u't} of the interest point v, and then calculates the likelihood probability p (u | RV) under the model of each user u; the algorithm calculates the likelihood probability p (u | RV) based on the profile of the interest point v through the relevant model Rv. Likelihood probability can be calculated by the set of interest points Jv. This method extends the long tail interest points, thus alleviating the problem of data sparsity and solving the limitations of the current model.
【技术实现步骤摘要】
一种对长尾兴趣点进行扩展的模型构建方法
本专利技术涉及信息推送领域,更具体地,涉及一种对长尾兴趣点进行扩展的模型构建方法。
技术介绍
在基于位置服务的社交网络中,有大量的兴趣点(pointofinterest,POI,或位置点)存在,如餐馆、酒店、景点等,用户经常需要面对数以万计的兴趣点来做出选择。如何帮助用户过滤掉无用的信息,找出用户可能最关心或喜欢的兴趣点,并推荐给用户,这是兴趣点推荐系统所要完成的工作。在兴趣点推荐方面,主要面对的是,如何解决数据稀疏所带来的推荐效果并不好的问题。以及面临多源的异构数据,如地理信息和文本信息,如何将他们融入到现有的兴趣点推荐系统中,达到提高推荐效果是非常有必要的。目前相关领域主要采用的技术是协同过滤,包括基于内存的协同过滤,和基于模型的协同过滤。基于内存的协同过滤方法,是根据用户与用户之间的相似性,向用户推荐相似用户也可能喜欢的兴趣点。但是在学习的数据集-用户的签到数据中,数据是十分稀疏的,数据稀疏度在0.01%左右,这会造成很多用户之间没有共同的签到数据,以致于计算出的用户相似性并不准确,从而导致推荐效果并不好。基于模型的协同过滤方法,如矩阵分解方法,将原有的用户对兴趣点的签到矩阵转化为评分矩阵,然后分解出用户特征隐向量和兴趣点特征隐向量,接着根据学习到的特征向量相乘来预测用户对兴趣点的喜好值,并将喜好值最高的K个兴趣点推荐给用户。在兴趣点推荐中,一个重要的现象是数据稀疏问题。它对推荐质量起到关键性影响。当前的这些相关工作已经提出多样的模型来缓解数据稀疏问题,并且大部分工作都是从用户角度来解决该问题。而就目前所了解的 ...
【技术保护点】
1.一种对长尾兴趣点进行扩展的模型构建方法,其特征在于,包括以下步骤:S1:计算兴趣点v的访问者集合UV={u1',u'2,···,ut'}的相关兴趣点集JV;S2;计算每个用户u的模型下的似然概率p(u|RV)。
【技术特征摘要】
1.一种对长尾兴趣点进行扩展的模型构建方法,其特征在于,包括以下步骤:S1:计算兴趣点v的访问者集合UV={u1',u'2,···,ut'}的相关兴趣点集JV;S2;计算每个用户u的模型下的似然概率p(u|RV)。2.根据权利要求1所述的对长尾兴趣点进行扩展的模型构建方法,其特征在于,所述步骤S1的具体过程是:S11:计算兴趣点间的一般相似度;S12:计算兴趣点间的空间相似度;S13:将以上两种相似度进行融合。3.根据权利要求2所述的对长尾兴趣点进行扩展的模型构建方法,其特征在于,所述步骤S11的过程是:相似兴趣点是真实相关兴趣点的近似,把兴趣点v的相似兴趣点称作相关模型Rv的伪相关兴趣点,采用余弦相似度,兴趣点vi和vj之间的相似度如下:其中,U表示所有用户的集合,V表示所有兴趣点的集合,V′表示长尾兴趣点的集合,其中C代表“用户-兴趣点”矩阵,它表示每个用户和兴趣点之间的关系,cu,v代表用户u在兴趣点v的签到活动,当cu,v=1,表示用户u在过去访问过兴趣点v,否则表示用户u没有去过兴趣点v,每个兴趣点都有若干历史访问者,用Uv={u′1,u′2,…u′t}表示兴趣点v的访问者集合,它看作为兴趣点的简况。4.根据权利要求3所述的对长尾兴趣点进行扩展的模型构建方法,其特征在于,所述步骤S12的过程是:两个兴趣点之间距离可用来衡量兴趣点间的空间相似度,空间相似度与距离之间并不是线性关系,为了从距离信息中获取兴趣点间的空间相似度,并能够反映它们的非线性...
【专利技术属性】
技术研发人员:刘威,杨伟伟,王志杰,印鉴,高静,
申请(专利权)人:中山大学,广东恒电信息科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。