本发明专利技术实施例公开了一种人际关系推算方法和装置。所述方法包括:通过Map‑Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD;通过Map‑Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD;以及通过判断所述第一RDD与所述第二RDD之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。本发明专利技术实施例提供的人际关系推算方法及装置能够准确的推算人们相互之间的人际关系。
【技术实现步骤摘要】
本专利技术实施例涉及大数据分析
,尤其涉及一种人际关系推算方法及装置。
技术介绍
20世纪60年代后期,哈佛大学成为社会网络研究的重镇。社会心理学家斯坦利·米尔格莱姆(StanleyMilgram)于1969年做过一个非常有意思的实验,为了解人类社会关系网络的结构打开了一扇窗户。这项实验的目的是找出任意两个人之间的“社会距离”。因此实验被定义为:在两个随机选择的个体之间,需要多少个熟人才能将他们联系起来?米尔格莱姆首先选择了两个目标人物,一个是马萨诸塞州某神学院学生的妻子,另一个是波士顿的股票经纪人。然后挑选了堪萨斯州的威奇塔和内布拉斯加州的奥马哈作为实验的起点。这两个起点位于美国中部,两个实验终点则位于美国东北部,这足以象征随机选择的两人之间的距离。米尔格莱姆随机向实验起点的居民发送了信件,信中附上了其中一个目标任务的照片和地址,规定收件人只有亲自见过目标人物且知道对方姓名,才可以直接将信寄给他;否则,将所有文件寄给自己最有可能认识目标人物的熟人。米尔格莱姆总共发出了160封信,收回42封。42封信各自形成了一条从“起点”到“终点”的链条。分析发现,链条最短的一封信只经过了两个中间人,最长的则经过了12个人,平均式5.5个。这与当时人们的直觉明显相悖。这就是著名的“六度分离”。虽然“六度分离”的概念并非由米尔格莱姆提出,但他的实验却是“六度分离”最初的完美印证。在移动互联的概念大行其道的今天,人们越来越多的社会交际活动通过网络完成。正是基于这样的现状,完全可以通过对分布在网络上各个节点上人们的社交活动的数据分析,获得关于人们相互之间的社会关系的数据。然而,现有技术并没有给出这样的可行方案。
技术实现思路
针对上述技术问题,本专利技术实施例提供了一种人际关系推算方法及装置,以准确的推算人们相互之间的人际关系。一方面,本专利技术实施例提供了一种人际关系推算方法,所述方法包括:通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD,其中,所述第一人群与所述第一目标人物之间的关联关系具有第一深度;通过Map-Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD,其中,所述第二人群与所述第二目标人物之间的关联关系具有第二深度;以及通过判断所述第一RDD中存储的所述第一人群与所述第二RDD中存储的所述第二人群之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。另一方面,本专利技术实施例还提供了一种人际关系推算装置,所述装置包括:第一人群获取模块,用于通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD,其中,所述第一人群与所述第一目标人物之间的关联关系具有第一深度;第二人群获取模块,用于通过Map-Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD,其中,所述第二人群与所述第二目标人物之间的关联关系具有第二深度;以及关联判断模块,用于通过判断所述第一RDD中存储的所述第一人群与所述第二RDD中存储的所述第二人群之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。本专利技术实施例提供的人际关系推算方法及装置,通过Map-Reduce计算模型,获取同第一目标人物之间存在第一深度的关联关系的第一人群,通过Map-Reduce计算模型,获取同第二目标人物之间存在第二深度的关联关系的第二人群,以及通过判断所述第一RDD与所述第二RDD之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系,实现了对人们相互之间人际关系的准确推算。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术第一实施例提供的人际关系推算方法的流程图;图2是本专利技术第一实施例提供的人际关系推算方法的执行代码的类引用关系图;图3是本专利技术第二实施例提供的人际关系推算方法的流程图;图4是本专利技术第二实施例提供的人际关系的挖掘结果图;图5是本专利技术第三实施例提供的人际关系推算装置的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。第一实施例本实施例提供了人际关系推算方法的一种技术方案。在该技术方案中,所述人际关系推算方法包括:通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD;通过Map-Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD;以及通过判断所述第一RDD中存储的所述第一人群与所述第二RDD中存储的所述第二人群之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。参见图1,人际关系推算方法包括:S11,通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合(Resilientdistributeddataset,RDD),其中,所述第一人群与所述第一目标人物之间的关联关系具有第一深度。本实施例提供的人际关系推算方法在Spark大数据分析系统上实现。具体的,人际关系推算方法在Spark大数据分析系统上,通过Scala语言编写的程序进行实现。Spark是一个开源的适用于大数据的高可靠、高性能分布式并行计算框架,由AMP实验室出品,该实验室隶属于加州大学伯克利分校。Spark支持在大数据集上进行复杂的查询;能够轻量级的进行快速的处理并且进行结果准确的有效服务;支持多语言编程,易于使用;并且兼容性很好,能够与Yarn、Mesos、Hive、HBase、HDFS等多个框架进行很好的兼容。在使用Scala语言实现本实施例提供的人际关系推算方法的过程中,使用了RDD。RDD是Spark的一个重要的抽象概念,是分布在集群节点上的具有容错机制且进行平行操作的制度记录分区集合,可以将所有数据加载至内存,允许在大型集群上执行基于内存的计算。在本实施例中,对人群数据的收集及存储都采用了RDD。可以理解的是,在判断人群中的社会关系时,需要有两个目标人物作为判断的标的。我们将这两个目标人物分别称为第一目标人物以及第二目标人物。如果收集到的数据显示,两个目标人物之间存在某种关联,则可以判定两个目标人物之间存在社会关系,否则,可以判定两个目标人物之间不存在社会关系。因此,执行本实施例提供的方法时,首先需要获取到同第一目标人物之间存在关联关系的第一人群。所谓关联关系是指两个人物之间的属性数据有部分的重合,例如一个人物曾经关注过另一个人物的微博,或者一个人物是另一个人物在即时通讯(Instantmessaging,IM)软件中的好友,等等。在本实施例中,优选的,两个人物之间存在关联关系是指,其中一个人物与另一个人物之间存在着通话联系。也就是说,一个人物曾经拨打过另一个人物的电话。在原始数据中,上述本文档来自技高网...
【技术保护点】
一种人际关系推算方法,其特征在于,包括:通过Map‑Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD,其中,所述第一人群与所述第一目标人物之间的关联关系具有第一深度;通过Map‑Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD,其中,所述第二人群与所述第二目标人物之间的关联关系具有第二深度;以及通过判断所述第一RDD中存储的所述第一人群与所述第二RDD中存储的所述第二人群之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。
【技术特征摘要】
1.一种人际关系推算方法,其特征在于,包括:通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一弹性分布式数据集合RDD,其中,所述第一人群与所述第一目标人物之间的关联关系具有第一深度;通过Map-Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD,其中,所述第二人群与所述第二目标人物之间的关联关系具有第二深度;以及通过判断所述第一RDD中存储的所述第一人群与所述第二RDD中存储的所述第二人群之间是否存在交集,判断所述第一目标人物与所述第二目标人物之间是否存在关联关系。2.根据权利要求1所述的方法,其特征在于,通过Map-Reduce计算模型,获取存储有表示同第一目标人物之间存在关联关系的第一人群的第一RDD包括:通过人物的特征属性,判断所述人物与所述第一目标人物之间是否存在所述第一深度的关联关系;将与所述第一目标人物之间存在所述第一深度的关联关系的人物,存储至所述第一RDD。3.根据权利要求1所述的方法,其特征在于,通过Map-Reduce计算模型,获取存储有表示同第二目标人物之间存在关联关系的第二人群的第二RDD包括:通过人物的特征属性,判断所述人物与所述第二目标人物之间是否存在所述第二深度的关联关系;将与所述第二目标人物之间存在所述第二深度的关联关系的人物,存储至所述第二RDD。4.根据权利要求2或3所述的方法,其特征在于,所述特征属性包括:联系人电话号码、联系起始时间,以及联系终止时间。5.根据权利要求4所述的方法,其特征在于,还包括:若判断所述第一目标人物与所述第二目标人物之间存在关联关系,保存所述第一目标人物与所述第二目标人物之间的关联路径。6.根据权利要求4所...
【专利技术属性】
技术研发人员:方铸,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。