本发明专利技术公开了一种基于即时通讯工具的社群关系分析方法,包括:根据即时通讯工具获取用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,基于所述社群关系属性信息计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;根据所述基本数据采用中心度算法计算用户的中心值,将中心值高的用户定义为中心点用户,并将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。本发明专利技术还公开了一种基于即时通讯工具的社群关系分析装置。本发明专利技术能够多维度、全方面分析每个人在社交圈中的社交关系和该人员在社交圈中的重要程度。员在社交圈中的重要程度。员在社交圈中的重要程度。
【技术实现步骤摘要】
基于即时通讯工具的社群关系分析方法及装置
[0001]本专利技术涉及即时通讯领域。更具体地说,本专利技术涉及一种基于即时通讯工具的社群关系分析方法及装置。
技术介绍
[0002]即时通讯是当今生活中人们互动、通信的一种必不可少的沟通方式。腾讯发布的2018年财报显示,微信的月活跃量是11亿,QQ的月活跃用户是7亿。2018你年9月27日,Facebook宣布每日有高达3亿的活跃用户。Telegram在2021年1月份宣布,在2021年首月的第一周,就有5亿的活跃用户。那么在些即时通讯软件上,不乏会出现各种各样的社交关系圈,那么如何识别出关系圈,同时找出该关系圈中相对重要的人呢?
[0003]如今大多数的判别方式只是简单的根据是否有共同的好友来判断其社交圈,该方法中每个人的量级都是相同的,不能更好的判断出在该社交圈中相对比较重要的人。这种方法识别度不高,无法从多维度中去分析内容信息。
技术实现思路
[0004]本专利技术的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
[0005]本专利技术还有一个目的是提供一种基于即时通讯工具的社群关系分析方法及装置,其能够多维度、全方面分析每个人在社交圈中的社交关系和该人员在社交圈中的重要程度。
[0006]为了实现根据本专利技术的这些目的和其它优点,提供了一种基于即时通讯工具的社群关系分析方法,包括:
[0007]根据即时通讯工具获取每个用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,汇总各个即时通讯工具的基本数据;
[0008]根据所述基本数据计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;
[0009]根据所述基本数据采用中心度算法计算用户的每个中心值,将中心值高的用户定义为中心点用户,并将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。
[0010]优选的是,用户发送的社群信息进行语义识别预处理,即将识别到关键词的社群信息保留,读取基本数据。
[0011]优选的是,所述社群关系属性信息包括转发、@、回复、分享、引用、收藏、点赞。
[0012]优选的是,计算关系值时,为各项社群关系属性信息赋予权重并加和计算得到。
[0013]优选的是,所述中心度算法包括:
[0014]PR(A)=(1
‑
d)+d((PR(11)/C(11)+
…
+PR(n1)/C(n1)+
…
+(PR(1i)/C(1i)+
…
+PR(ni)/C(ni)))/i;
[0015]d=c/h;
[0016]其中,PR(A)是用户A的中心度值,d为阻尼系数,该数值在0和1之间,c是用户A在各个即时通讯工具发表的数据来源的总量,h为出度的总量,C(ni)是出度,i为即时通讯工具的个数,n当前即时通讯工具的数据来源的总数量。
[0017]基于即时通讯工具的社群关系分析装置,包括:
[0018]确认关系比例模块,其根据即时通讯工具获取用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,汇总各个即时通讯工具的基本数据;
[0019]关系分析模块,其根据所述基本数据计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;
[0020]中心度分析模块,其根据所述基本数据采用中心度算法计算用户的中心值,将中心值高的用户定义为中心点用户;
[0021]数据处理模块,其将分析好的数据转化为待输出的数据格式;
[0022]数据展示模块,其将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。
[0023]电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述的方法。
[0024]存储介质,其上存储有计算机程序,该程序被处理器执行时,实现所述的方法。
[0025]本专利技术至少包括以下有益效果:
[0026]第一、本专利技术的方法和装置具有维度广的优点,不仅仅只是好友关系,还会根据回复、引用、@、转发等维度进行分析,并且可以处理不同来源的数据的同时,还可以将数据根据行动线索算法,筛选出自己想要的数据集,另外,本专利技术的方法和装置具有灵活度高的优点,可以自定义维度进行分析,本专利技术的方法和装置具有速度快的优点,面对海量用户,可以快速识别,本专利技术的方法和装置还具有功能多的优点,还可计算其中心度高的用户。
[0027]本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。
附图说明
[0028]图1为本专利技术的方法的流程示意图;
[0029]图2为本专利技术的语义识别预处理代码示意图;
[0030]图3为本专利技术的中心度算法代码示意图;
[0031]图4为本专利技术的装置的结构示意图;
[0032]图5为本专利技术的一个实例的结果展示图;
[0033]图6为本专利技术的基础数据整理格式举例图。
具体实施方式
[0034]下面结合附图对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
[0035]应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
[0036]需要说明的是,下述实施方案中所述实验方法,如无特殊说明,均为常规方法,所述试剂和材料,如无特殊说明,均可从商业途径获得。
[0037]如图1所示,本专利技术提供一种基于即时通讯工具的社群关系分析方法,包括:
[0038]根据即时通讯工具获取用户发送的社群信息的基本数据,即时通讯工具包括但不局限于微博、微信、Facebook、Telegram,数据获取的方式为数据采集,可以用最常用的方式爬虫。得到基础数据后,可以写一个脚本将数据整理为如图6的json格式的数据,亦可以整理自己需要的格式,社群信息例如发送的动态、群聊中的发言等等,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,发生社群关系指的是对该用户的动态、群聊进行转发、@、回复、分享、引用、收藏、点赞等等,汇总各个即时通讯工具的基本数据;
[0039]根据所述基本数据计算用户与发生社群关系的人员的关系值,关系值的大小可以对是否进行转发、@、回复、分享、引用、收藏、点赞以及发生次数进行数据统计,将关系值高的人员定义为密切人员,设定一个关系值阈值,高于该阈值则相对密切,低于该阈值则忽略该人员的互动;
[0040]根据所述基本数据采用中心度算法计算用户的中心值,计算中新度算法有两个维度,数量维度:即一个人的发言被转发的次数越多,中心度越高;质量维度:即一个人的发言被不同的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于即时通讯工具的社群关系分析方法,其特征在于,包括:根据即时通讯工具获取每个用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,汇总各个即时通讯工具的基本数据;根据所述基本数据计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;根据所述基本数据采用中心度算法计算用户的每个中心值,将中心值高的用户定义为中心点用户,并将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。2.如权利要求1所述的基于即时通讯工具的社群关系分析方法,其特征在于,用户发送的社群信息进行语义识别预处理,即将识别到关键词的社群信息保留,读取基本数据。3.如权利要求1所述的基于即时通讯工具的社群关系分析方法,其特征在于,所述社群关系属性信息包括转发、@、回复、分享、引用、收藏、点赞。4.如权利要求1所述的基于即时通讯工具的社群关系分析方法,其特征在于,计算关系值时,为各项社群关系属性信息赋予权重并加和计算得到。5.如权利要求1所述的基于即时通讯工具的社群关系分析方法,其特征在于,所述中心度算法包括:PR(A)=(1
‑
d)+d((PR(11)/C(11)+
…
+PR(n1)/C(n1)+
…
+(PR(1i)/C(1i)+
…
+PR(ni)/C(ni))...
【专利技术属性】
技术研发人员:张旭,梁汝锋,刘春阳,张翔宇,王宇,刘巨安,王菲,
申请(专利权)人:北京蓝光汇智网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。