一种基于多尺度地理信息的社交网络关联挖掘方法技术

技术编号：13903207 阅读：145 留言：0更新日期：2016-10-26 00:17

本发明专利技术涉及一种基于多尺度地理信息的社交网络关联挖掘方法。该方法包括：1)获取用户签到数据，对其进行预处理得到结构化数据；2)设定划分地图的不同方法以及每种方法的尺度标准，根据用户签到数据中的GPS数据计算获得其对应的多个位置ID；3)根据签到人数计算获得不同位置的权重，表征不同位置对社交关系预测的贡献；4)利用位置的权重信息进行特征提取，获得所有用户的位置交互特征；5)利用提取的特征训练分类器，得到关系预测模型；6)利用所得的关系预测模型对目标用户进行预测，获得社交网络关系预测结果。本发明专利技术通过充分利用位置签到信息来训练获得更鲁棒的预测模型，能够获得理想稳定的预测结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息技术、社交网络
，具体涉及一种基于多尺度地理信息的社交网络关联挖掘方法。
技术介绍
在社交网络研究领域，社交网络关联挖掘是一项重要的研究方向，而且是其他很多研究如社团发现和推荐系统等研究的基础。例如，人们倾向于购买亲朋好友推荐的产品，社团也往往是由相互之间熟悉的人组成。因此，社交网络关联挖掘已经成为社交网络研究领域的热门话题，并且吸引了广泛关注。传统意义上，社交网络关联挖掘往往是利用图模型的方法进行预测，即把社交网络关联挖掘网络抽象成图模型，并利用拓扑学方法进行预测。近年来，随着基于地理位置信息社交网络的迅速发展，研究人员开始利用用户的位置信息来预测相互之间的社交网络关联。目前，利用用户的位置信息预测用户之间社交网络关联的研究，主要集中在对于位置特征的提取方面，对于位置属性以及如何充分利用位置属性设计有效关系预测模型的研究较少，主要不足在于：a.对签到信息的稀疏性的处理欠缺。目前采用的地点确认方法是利用固定的网格或者其他方法划分区域，而各个地点的签到人数和签到次数稀疏差异很大，因而使用固定尺寸划分地图形成地点，可能会导致某些地点的签到人数很多，而某些地点的签到人数又太少。这就导致在进行社交网络关联挖掘时，难以保证预测的稳定性。签到人数多的位置，人们更容易被预测为之间存在社交网络关联，签到人数少的位置，由于观测到的人们之间的互动较少因此更容易预测为相互之间没有好友关系。b.对于位置属性挖掘不充分。在对人们之间社交网络关联进行预测时，不同的位置贡献大小不同。如果是在一个用户家里检测到另一位用户的访问信息，很大程度上可以确认两人存在社交...

【技术保护点】
一种基于多尺度地理信息的社交网络关联挖掘方法，其特征在于，包括以下步骤：1)获取用户签到数据，对其进行预处理得到结构化数据；2)设定划分地图的不同方法以及每种方法的尺度标准，根据用户签到数据中的GPS数据计算获得其对应的多个位置ID；3)根据签到人数计算获得不同位置的权重，用以表征不同位置对社交关系预测的贡献；4)利用位置的权重信息进行特征提取，获得所有用户的位置交互特征；5)利用提取的特征训练分类器，得到关系预测模型；6)利用所得的关系预测模型对目标用户进行预测，获得社交网络关系预测结果。

【技术特征摘要】
1.一种基于多尺度地理信息的社交网络关联挖掘方法，其特征在于，包括以下步骤：1)获取用户签到数据，对其进行预处理得到结构化数据；2)设定划分地图的不同方法以及每种方法的尺度标准，根据用户签到数据中的GPS数据计算获得其对应的多个位置ID；3)根据签到人数计算获得不同位置的权重，用以表征不同位置对社交关系预测的贡献；4)利用位置的权重信息进行特征提取，获得所有用户的位置交互特征；5)利用提取的特征训练分类器，得到关系预测模型；6)利用所得的关系预测模型对目标用户进行预测，获得社交网络关系预测结果。2.如权利要求1所述的方法，其特征在于：步骤1)所述结构化数据包括用户的签到时间、签到地点、签到次数，将这些数据以矩阵形式存储。3.如权利要求1所述的方法，其特征在于：步骤3)按照如下公式计算位置权重： D k = 0 , i f Σ i = 1 m d ( i , l k ) ≤ 1 1 l n Σ i = 1 m d ( i , l k ) Σ x = 1 t Σ i = 1 ...

【专利技术属性】
技术研发人员：张凯，张晓宇，云晓春，王树鹏，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人