一种社交网络中用户属性的预测方法及系统技术方案

技术编号:9967684 阅读:187 留言:0更新日期:2014-04-25 08:45
本发明专利技术提供一种社交网络中用户属性的预测方法及系统,所述方法包括:统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;以及根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。在地理位置社交网络数据集上的实验数据表明,本发明专利技术提供的社交网络中用户属性的预测方法及系统可提高用户属性预测的准确性。

【技术实现步骤摘要】
一种社交网络中用户属性的预测方法及系统
本专利技术涉及预测社交网络中用户属性的技术,尤其涉及一种社交网络中用户地理位置的预测方法及系统。
技术介绍
社交网络,又称社交网络服务(SocialNetworkingService,简称SNS),其主要作用是为一群拥有相同兴趣与活动的人创建在线社区。这类服务往往是基于互联网,为用户提供各种联系和交流的交互通路,如电子邮件、实时消息服务等。多数社交网络会提供多种让用户交互起来的方式,包括聊天、寄信、影音、文件分享、博客、讨论组群等,社交网络为信息的交流与分享提供了新的途径。社交网络的网站一般拥有数百万的登记用户,使用社交网络服务已成为用户每天生活不可或缺的一部分。在社交网络(例如Twitter,Facebook和Gollwala等)中预测用户的属性,在近年来受到很大关注。这是因为预测用户的属性很有意义,以用户的地理位置为例,预测用户的地理位置对基于地理位置的推送服务很有帮助,如疾病预防和控制、个人账户安全,以及人口统计分析等等。目前,如果每个用户公开他们的属性,通常可以基于用户好友的影响力以及好友的属性来预测该用户在未来某个时间的属性。本文中,属性指那些在外界因素的影响下可动态变化的属性,如用户位置、兴趣、情感、观点和行为(如在线购物,投票)等。对于地理位置属性,现有技术通常是基于用户在移动行为上的相似性来定义用户影响力的,但其均没有考虑到好友影响力会随时间发生变化,这导致最终预测的用户位置准确性较低。
技术实现思路
为解决现有预测技术中存在的问题,根据本专利技术的一个实施例,提供一种社交网络中用户属性的预测方法,所述方法包括:步骤1)、统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。在一个实施例中,步骤1)包括:步骤11)、对于一段时间内的每个时刻,通过计算好友对所述用户在所述属性的一个或多个方面的影响力,得到该好友对所述用户在该时刻的影响力;步骤12)、选择每个时刻对用户影响力最大的N个好友。在进一步的实施例中,在步骤11)中,利用下式得到好友v对所述用户u在ti时刻的影响力:其中,表示好友v对所述用户u在ti时刻的影响力;m为针对所述属性考虑的方面个数;表示在ti时刻,好友v对所述用户u在所述属性的第j个方面的影响力;wj表示所述属性的第j个方面的权重。在进一步的实施例中,根据以下步骤获得所述属性的第j个方面的权重wj:步骤A)、初始化权重向量w为任意的m元组,其中m是针对所述属性考虑的方面个数;步骤B)、计算ti时刻好友对所述用户的影响力;步骤C)、根据ti时刻好友对所述用户的影响力计算随机游走转移概率矩阵其中,α为重新启动概率,其使得随机游走具有α概率跳回用户v并在ti时刻重启动;步骤D)、计算重启动的随机游走在ti时刻的固定分布其满足:步骤E)、根据下式更新权重向量w:其中,λ是可选步长;且其中,g(p)=1/(1+e-p),h(x)=max{x,0}2,是ti时刻用户u的非好友集,是ti时刻用户u的好友集合,δld为和的差值。步骤F)、如果更新后的w与更新前的w的差值小于预定阈值,则得到最终的权重向量,否则返回步骤B)。在一个实施例中,在步骤2)中,根据下式得到在将来时刻所述用户的属性:其中,x1:T是在将来一段时间1至T内每个时刻所预测的所述用户的属性的随机变量序列,y1:T是在一段时间1至T内每个时刻观测到的所述用户影响力最大的N个好友的属性的随机变量。在一个实施例中,所述属性为地理位置,且在步骤11)中,好友对所述用户在所述属性的一个或多个方面的影响力包括下列的一个或多个:好友对所述用户的动态影响力,该动态影响力是由所述用户距离自己家的距离和所述用户距离好友家的距离确定的;好友对所述用户的空间影响力,该空间影响力是由所述用户与好友的签到位置轨迹的相似性确定的;以及好友对所述用户的时间影响力,该时间影响力是由所述用户和好友的签到行为的相似性确定的。在一个实施例中,在步骤11)中,利用下式计算在ti时刻好友v对所述用户u的动态影响力其中,β(Pu(ti),Hu)表示平滑参数β与Pu(ti)和Hu之间的几何乘积;Pu(ti)表示用户u在ti时刻的位置;Hu表示用户家的位置;E(Pu(ti),Hv)表示在ti时刻,用户u的位置与好友家的位置Hv的距离。在一个实施例中,在步骤11)中,计算在ti时刻好友v对所述用户u的空间影响力包括:步骤a)、计算在ti时刻前所述用户签到位置的中心集合Cu,以及好友签到位置的中心集合Cv;步骤b)、根据中心集合Cu和Cv,分别定义签到位置的分布为多中心的所述用户u和好友v的高斯分布函数;步骤c)、利用下式计算在ti时刻好友v对所述用户u的空间影响力其中DKL(Nu||Nv)是用户u和好友v的高斯分布函数的Kullback-Leibler距离。在进一步的实施例中,在步骤a)中,计算在ti时刻前所述用户签到位置的中心集合Cu包括:根据访问频率对ti时刻前所述用户u的签到位置集合中所有签到位置进行排序,选取访问次数最多的位置;将访问次数最多的签到位置与其他签到位置进行对比,若两者之间的距离不小于预定阈值d,则将进行对比的签到位置记录下来;在所记录的签到位置中,将签到次数与所述用户u签到总数的比例大于阈值θ的签到位置放入Cu中。在一个实施例中,在步骤11)中,计算在ti时刻好友v对所述用户u的时间影响力包括:步骤i)、统计所述用户u和好友v在ti时刻之前的所有签到位置和签到时刻;步骤ii)、两两计算在ti时刻之前所述用户u的每次签到位置和好友v的每次签到位置之间的距离并且两两计算在ti时刻之前所述用户u的每次签到时刻与好友v的每次签到时刻之间的时间差其中表示所述用户u在ti时刻之前的第j个签到位置,表示所述好友v在ti时刻之前的第k个签到位置;表示所述用户u在ti时刻之前第j个签到的时刻,表示好友v在ti时刻之前第k个签到的时间戳;步骤iii)、利用下式计算在ti时刻好友v对所述用户u的时间影响力其中,Nu是所述用户u在ti时刻之前的签到记录个数,Nv是好友v在ti时刻之前的签到记录个数;ΔT是时间差参数;Θ(x)是HeavisideStep函数;∈是预先定义的阈值,当E(x,y)≤∈时E∈(x,y)为1,否则为0。根据本专利技术的一个实施例,还提供一种社交网络中用户属性的预测系统,其中所述属性是在外界因素影响下动态变化的属性,所述系统包括:统计模块,用于统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;预测模块,用于根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。本专利技术所提供的预测方法及系统考虑到好友影响力会随时间发生变化,选择在过去一段时间每个时刻最具影响力的多个好友,在好友选择方面提高了预测的准确率,然后通过时空演化的贝叶斯模型进行用户属性预测。在地理位置社交网络数据集上的实验数据表明,本专利技术可提高用户属性预测的准确性。附图说明图1是根据一个实施例的社交网络中用户属性的预测方法流程图;图2是根据一个实施例的计算用户位置中心集合的方法流程图;图3是根据一个实施例的本文档来自技高网...
一种社交网络中用户属性的预测方法及系统

【技术保护点】
一种社交网络中用户属性的预测方法,其中所述属性是在外界因素影响下动态变化的属性,所述方法包括:步骤1)、统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。

【技术特征摘要】
1.一种社交网络中用户属性的预测方法,其中所述属性是在外界因素影响下动态变化的属性,所述方法包括:步骤1)、针对在一段时间内的每个时刻,统计对用户影响力最大的N个好友,其中N为正整数;步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。2.根据权利要求1所述的方法,其中,步骤1)包括:步骤11)、对于一段时间内的每个时刻,通过计算好友对所述用户在所述属性的一个或多个方面的影响力,得到该好友对所述用户在该时刻的影响力;步骤12)、选择每个时刻对用户影响力最大的N个好友。3.根据权利要求2所述的方法,在步骤11)中,利用下式得到好友v对所述用户u在ti时刻的影响力:其中,表示好友v对所述用户u在ti时刻的影响力;m为针对所述属性考虑的方面个数;表示在ti时刻,好友v对所述用户u在所述属性的第j个方面的影响力;wj表示所述属性的第j个方面的权重。4.根据权利要求3所述的方法,其中,根据以下步骤获得所述属性的第j个方面的权重wj:步骤A)、初始化权重向量w为任意的m元组,其中m是针对所述属性考虑的方面个数;步骤B)、计算ti时刻好友对所述用户的影响力;步骤C)、根据ti时刻好友对所述用户的影响力计算随机游走转移概率矩阵其中,α为重新启动概率,其使得随机游走具有α概率跳回用户v并在ti时刻重启动;步骤D)、计算重启动的随机游走在ti时刻的固定分布其满足:步骤E)、根据下式更新权重向量w:其中,λ是可选步长;且其中,g(p)=1/(1+e-p),h(x)=max{x,0}2,是ti时刻用户u的非好友集,是ti时刻用户u的好友集合,δld为和的差值;步骤F)、如果更新后的w与更新前的w的差值小于预定阈值,则得到最终的权重向量,否则返回步骤B)。5.根据权利要求1-4中任何一个所述的方法,在步骤2)中,根据下式得到在将来时刻所述用户的属性:其中,x1:T是在将来一段时间1至T内每个时刻所预测的所述用户的属性的随机变量序列,y1:T是在一段时间1至T内每个时刻观测到的所述用户影响力最大的N个好友的属性的随机变量。6.根据权利要求2-4中任何一个所述的方法,其中所述属性为地理位置。7.根据权利要求6所述的方法,在步骤11)中,好友对所述用户在所述属性的一个或多个方面的影响力包括下列的一个或多个:好友对所述用户的动态影响力,该动态影响力是由所述用户距离自己家的距离和所述用户距离好友家的距离确定的;好友对所述用户的空间影响力,该空间影响力是由所述用户与好友的签到位置轨迹的相似性确定的;以及好友对所述用户的时间影响力,该时间影响力是由所述用户和好友的签到行为的相似性确定...

【专利技术属性】
技术研发人员:程学旗贾岩涛王元卓张泽慧冯凯
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1