The embodiment of the invention discloses a method and a device for excavating a network community. The method comprises: acquiring the original network community and the previous mining community network; network community has preliminary communication relationship with members of the members to obtain the original network in the community; to obtain network community; through the difference set to calculate the target network community; and repeat the above operation, until it reaches a predetermined stop condition. The method and the device for digging the network community provided by the embodiment of the invention realize the effective excavation of the network community and the members thereof.
【技术实现步骤摘要】
网络社区的挖掘方法及装置
本专利技术实施例涉及大数据分析
,尤其涉及一种网络社区的挖掘方法及装置。
技术介绍
在移动互联时代,人们的社交行为越来越多的依赖于网络。比如,人们通过网络社区对一个热点事件表达不同的观点,或者通过各种即时通讯软件完成相互之间的联络。可以预见的是,由于人们的很多社交行为通过网络上自发形成的网络社区完成,因此,可以通过对人们网络交互数据的挖掘,得到人们日常的网络交流行为所形成的各种“人际圈子”,也就是网络社区。如果能够通过对网络数据的分析、挖掘,得到人们进行日常交流的网络社区,无疑将对企业的更多决策提供有效的支持。比如,可以通过上述挖掘得知人们在网络上行程的网络社区的关注话题是什么,进而为企业下一步的营销目标及营销战略提供决策支持。然而,对于这种在网络上形成的网络社区的挖掘,目前还没有可行的技术方案。
技术实现思路
针对上述技术问题,本专利技术实施例提供了一种网络社区的挖掘方法及装置,以实现对网络社区及其组成成员的有效挖掘。一方面,本专利技术实施例提供了一种网络社区的挖掘方法,所述方法包括:获取以弹性分布式数据集合RDD形式存储的原始网络社区,以及所有前次挖掘得到的前次挖掘网络社区;获取与所述原始网络社区中的成员存在通联关系的初步网络社区成员,并以RDD形式将所有初步网络社区成员存储为初步网络社区;获取所有一个成员属于所述初步网络社区,另一个成员属于所述初步网络社区,或者所述原始网络社区,或者所述前次挖掘网络社区的目标通联关系,并以RDD形式将所述目标通联关系所涉及的网络社区成员存储为泛化网络社区;获取所述泛化网络社区与所述原始网络 ...
【技术保护点】
一种网络社区的挖掘方法,其特征在于,包括:获取以弹性分布式数据集合RDD形式存储的原始网络社区,以及所有前次挖掘得到的前次挖掘网络社区;获取与所述原始网络社区中的成员存在通联关系的初步网络社区成员,并以RDD形式将所有初步网络社区成员存储为初步网络社区;获取所有一个成员属于所述初步网络社区,另一个成员属于所述初步网络社区,或者所述原始网络社区,或者所述前次挖掘网络社区的目标通联关系,并以RDD形式将所述目标通联关系所涉及的网络社区成员存储为泛化网络社区;获取所述泛化网络社区与所述原始网络社区及所述前次挖掘网络社区之间的差集,并以RDD形式将所述差集中的成员存储为目标网络社区;重复上述挖掘操作,直至所述目标网络社区的规模维持稳定,或者目标网络社区达到预定规模,或者所述挖掘操作的次数达到挖掘次数上限。
【技术特征摘要】
1.一种网络社区的挖掘方法,其特征在于,包括:获取以弹性分布式数据集合RDD形式存储的原始网络社区,以及所有前次挖掘得到的前次挖掘网络社区;获取与所述原始网络社区中的成员存在通联关系的初步网络社区成员,并以RDD形式将所有初步网络社区成员存储为初步网络社区;获取所有一个成员属于所述初步网络社区,另一个成员属于所述初步网络社区,或者所述原始网络社区,或者所述前次挖掘网络社区的目标通联关系,并以RDD形式将所述目标通联关系所涉及的网络社区成员存储为泛化网络社区;获取所述泛化网络社区与所述原始网络社区及所述前次挖掘网络社区之间的差集,并以RDD形式将所述差集中的成员存储为目标网络社区;重复上述挖掘操作,直至所述目标网络社区的规模维持稳定,或者目标网络社区达到预定规模,或者所述挖掘操作的次数达到挖掘次数上限。2.根据权利要求1所述的方法,其特征在于,所述通联关系表示:一个成员与另一个成员之间存在关联。3.根据权利要求2所述的方法,其特征在于,所述关联包括:所述一个成员与所述另一个成员之间存在通讯联系。4.根据权利要求1至3任一所述的方法,其特征在于,还包括:在获取以RDD形式存储的原始网络社区,以及前次挖掘得到的前次挖掘网络社区之前,通过数据挖掘技术,以流式处理框架挖掘成员真实身份数据,以及成员通联关系数据。5.根据权利要求4所述的方法,其特征在于,还包括:在完成所述挖掘操作之后,根据成员之间的通联关系对所述目标网络社区的成员打分,以挖掘所述目标网络社区中的核心成员。6.一种网络社区的挖掘装置,其特征在于,包括:原始获取模块,用于获取...
【专利技术属性】
技术研发人员:李大虎,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。