一种用户关系预测方法及装置制造方法及图纸

技术编号:15187050 阅读:69 留言:0更新日期:2017-04-19 04:13
本发明专利技术公开了一种用户关系预测方法,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。另外,本发明专利技术还公开了一种用户关系预测装置。采用本发明专利技术实施例,能够提高用户关系预测的精确度。

【技术实现步骤摘要】

本专利技术涉及移动通信
,尤其涉及一种用户关系预测方法及装置。
技术介绍
随着移动应用的发展,以QQ和微信为代表的基于社交网络和位置融合的移动应用已经成为用户在现实世界活动的镜像。用户通过相互通信形成了一种复杂的社会网络,该网络在一定程度上体现了用户的交友偏好、用户之间的关系和用户的行为模式。因此,越来越多的商家开始关注信息如何在复杂的社会网络进行有效扩散,以便商家或者运营商实现个性化的位置、好友和广告推荐。用户关系的预测起源于“六度理论”,即任意两个陌生人之间只需要6个中间人即可产生联系,随着互联网和移动通信的发展、交通方式的进步,人们的社交圈也会越来越广泛,当今社会网络两个人认识的中间人甚至更少,例如Facebook社交网站的统计己经将这一数字变为了4.7。Lambiotte提出,移动用户双方的社交关系紧密程度和他们之间的距离的平方成反比,用户会优先选择与他距离较小的人交朋友。Newman用用户间的相似度证明了用户共同好友的个数与他们在将来会成为好友的可能性存在正相关的关系。Adamic和Adar通过统计共同好友的好友情况来分析用户关系,在考虑社交关系的基础上,通过Adamic-Adar系数来衡量用户之间社交关系。Lu考虑到用户关系的差异性,将用户间的关系赋予不同的权值,提出一种结合用户关系权重的用户关系分析方法。然而上述的方法仅仅从社交网络或者地理位置单一的角度来挖掘用户之间的关系,没有综合他们现实世界和虚拟世界两方面的特性来考虑问题而导致挖掘出来的用户关系精确度不高。
技术实现思路
本专利技术实施例提出一种用户关系预测方法及装置,能够提高用户关系预测的精确度。本专利技术实施例提供一种用户关系预测方法,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。进一步地,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。进一步地,所述区域分布算法如下:其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;所述位置相似度算法如下:其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。进一步地,所述关系预测模型如下:MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。进一步地,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;去除所述实际重合度小于预设阈值的移动用户;所述重合度算法如下:其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。相应地,本专利技术实施例还提供一种用户关系预测装置,包括:数据提取模块,用于分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;位置相似度计算模块,用于根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;社交相似度计算模块,用于分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;以及,预测模块,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。进一步地,所述位置相似度计算模块具体包括:区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;以及,位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。进一步地,所述区域分布算法如下:其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;所述位置相似度算法如下:其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。进一步地,所述关系预测模型如下:MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。进一步地,所述用户关系预测装置还包括:数据划分模块,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;第一重合度计算模块,用于根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;第二重合度计算模块,用于根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;实际重合度计算模块,用于将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,过滤模块,用于去除所述实际重合度小于预设阈值的移动用户;所述重合度算法如下:其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。实施本专利技术实施例,具有如本文档来自技高网...
一种用户关系预测方法及装置

【技术保护点】
一种用户关系预测方法,其特征在于,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。

【技术特征摘要】
1.一种用户关系预测方法,其特征在于,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。2.如权利要求1所述的用户关系预测方法,其特征在于,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。3.如权利要求2所述的用户关系预测方法,其特征在于,所述区域分布算法如下:GP(u,r)=Σi=1nδ(r,li(u))n(u);]]>其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;所述位置相似度算法如下:SCoS(u,v)=Σr∈LocGP(u,r)×GP(v,r)||GP(u,r)||×||GP(v,r)||;]]>其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。4.如权利要求3所述的用户关系预测方法,其特征在于,所述关系预测模型如下:MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。5.如权利要求1至4任一项所述的用户关系预测方法,其特征在于,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;去除所述实际重合度小于预设阈值的移动用户;所述重合度算法如下:CoL(u,v)=Σi=1n(u)Σj=1n(v)θ(ΔT-|Ti(u)-Tj(v)|)(δ(li(u),li(v))Σi=1n(u)Σj=1n(v)θ(ΔT-|Ti(u)-Tj(v)|);]]>其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。6.一种用户关系预测装置,其特征在于,包括:数据提取模块,用...

【专利技术属性】
技术研发人员:杜翠凤
申请(专利权)人:广州杰赛科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1