当前位置: 首页 > 专利查询>同济大学专利>正文

一种网络社交平台用户分类方法、存储介质及终端技术

技术编号:27513640 阅读:16 留言:0更新日期:2021-03-02 18:45
本发明专利技术涉及一种网络社交平台用户分类方法、存储介质及终端,方法包括以下步骤:S1:获取网络社交平台的用户关注信息,构建无向图;S2:在无向图中选取初始节点,待检测节点集的元素初始化为初始节点,已检测节点集初始化为空集;S3:检测待检测节点集内的节点,得到峰值点集和与峰值点集对应的阶数集;S4:判断峰值点集是否为空集,若是,更新已检测节点集的元素为待检测节点集和已检测节点集或运算后的元素,更新待检测节点集的元素为现有待检测节点集的元素的所有邻节点,执行步骤S3,若否,阶数集中数值最小的元素对应的节点作为种子节点;S5:种子节点扩张形成社区,完成网络社交平台用户分类。与现有技术相比,分类的精确度和稳定性好。稳定性好。稳定性好。

【技术实现步骤摘要】
一种网络社交平台用户分类方法、存储介质及终端


[0001]本专利技术涉及复杂网络分析领域,尤其是涉及一种网络社交平台用户分类方法、存储介质及终端。

技术介绍

[0002]局部社区发现算法是分析复杂网络、挖掘网络信息的有力方法之一。它能够检测复杂网络中的社区结构。复杂网络具有社区结构,是指复杂网络可以被自然地分成一系列节点组,同一组的节点一般更具有相连相关的倾向。局部社区发现算法已经被各大网络社交平台应用于网络社交平台异常用户分类,在防止诈骗、恶意营销、恶意舆论引导等方面起着重要的作用。
[0003]应用局部社区发现算法的网络社交平台用户分类的检测过程包含两个步骤:选择种子节点和以种子节点为起点,以一定的方式扩张形成社区。选择种子节点,是要先找出作为研究对象的节点所处社区中代表性强的节点,再将这样的节点作为算法起点发现社区,种子节点的代表性越强,以它为算法起点扩张社区的准确度越高。目前,选取种子节点主要有三种方法,一种方法是以随机选择的方式确定种子节点,一种方法是以度数较低的节点作为种子节点,这两种方法选取的种子节点代表性差,不能体现所处社区的特征,故计算准确度低,在实际应用中逐渐被淘汰;另一种方法是以局部度数峰值节点作为种子节点,这种选择种子节点的方法明显提高了计算准确度,但此方法局限性大、敏感度低,只能感知到含有极高代表性节点的部分社区,但无法感知其他社区,故发现社区的稳定性差。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的精确度和稳定性差的缺陷而提供一种网络社交平台用户分类方法、存储介质及终端。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种网络社交平台用户分类方法,该方法包括以下步骤:
[0007]S1:获取网络社交平台的用户关注信息,并基于用户关注信息构建无向图;
[0008]S2:在无向图中选取初始节点,待检测节点集的元素初始化为初始节点,已检测节点集初始化为空集;
[0009]S3:检测待检测节点集内的节点,得到峰值点集和与峰值点集对应的阶数集;
[0010]S4:判断峰值点集是否为空集,若是,更新已检测节点集的元素为待检测节点集和已检测节点集或运算后的元素,更新待检测节点集的元素为现有待检测节点集的元素的所有邻节点,执行步骤S3,若否,阶数集中数值最小的元素对应的节点作为种子节点;
[0011]S5:种子节点扩张形成社区,完成网络社交平台用户分类。
[0012]步骤S1的无向图中,用户作为节点,任意两用户之间的关注作为无向边。
[0013]若任意两用户之间为多重关注,只保留单个关注。
[0014]所述步骤S2中初始节点为随机选择的节点。
[0015]所述的步骤S3中,得到峰值点集和与峰值点集对应的阶数集的过程包括:
[0016]S31:检测待检测节点集内的节点u,得到节点u的一次邻节点,并进一步得到节点u的度数D
u
以及一次邻节点的度数;
[0017]S32:若一次邻节点的度数中大于节点u的度数的个数为m,m小于等于设定的灵敏度,且一次邻节点的二次邻节点的度数中大于一次邻节点的度数的个数不等于m,节点u列入峰值点集,节点u对应的m阶数列入阶数集,执行S33,否则,执行S33;
[0018]S33:u自加1,执行步骤S31,直到遍历待检测节点集内的所有节点。
[0019]所述的步骤S4中,待检测节点集的元素更新为现有待检测节点集的元素的所有邻节点去除已检测节点集的元素后剩余的元素。
[0020]所述的用户关注信息通过爬虫获取。
[0021]所述的种子节点通过基于适应度函数的贪心策略扩张形成社区。
[0022]一种计算机可读存储介质,所述计算机可读存储介质上储存有计算机程序,所述计算机程序被处理器执行所述的网络社交平台用户分类方法。
[0023]一种终端,包括处理器及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述的网络社交平台用户分类方法。
[0024]与现有技术相比,本专利技术具有以下优点:
[0025](1)在“局部度数峰值”概念的基础上进一步完善,结合阶数集改进呈现了“多阶局部度数峰值点”的概念,结合阶数选择的种子节点极大程度上提高了社区发现精确度和稳定性。
[0026](2)提供了新型的选择种子节点的方法作为框架,该框架可与不同的扩张社区方法结合,可移植性好。
附图说明
[0027]图1为本专利技术的流程图;
[0028]图2为本专利技术实施例的“m阶局部度数准峰值点”示意图;
[0029]图3为本专利技术实施例的“m阶局部度数峰值点”示意图;
[0030]图4a为本专利技术实施例基于L-shell扩张算法的传统“局部度数峰值”效果图;
[0031]图4b为本专利技术实施例基于L-shell扩张算法的“多阶局部度数峰值”效果图;
[0032]图5a为本专利技术实施例基于局部模块度R扩张算法的传统“局部度数峰值”效果图;
[0033]图5b为本专利技术实施例基于局部模块度R扩张算法的“多阶局部度数峰值”效果图。
具体实施方式
[0034]下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。
[0035]实施例
[0036]本实施例提供一种网络社交平台用户分类方法,如图1所示,包括以下步骤:
[0037]S1:获取网络社交平台的用户关注信息,并基于用户关注信息构建无向图G;
[0038]S2:在无向图G中选取初始节点v,待检测节点集S的元素初始化为初始节点v,已检测节点集H初始化为空集
[0039]S3:检测待检测节点集S内的节点,得到峰值点集F和与峰值点集F对应的阶数集Fn;
[0040]S4:判断峰值点集F是否为空集,若是,更新已检测节点集H的元素为待检测节点集S和已检测节点集H或运算后的元素,更新待检测节点集S的元素为现有待检测节点集的元素的所有邻节点,执行步骤S3,若否,阶数集Fn中数值最小的元素对应的节点作为种子节点;
[0041]S5:种子节点扩张形成社区,完成网络社交平台用户分类。
[0042]具体而言:
[0043]步骤S1的无向图G中,用户作为节点,任意两用户之间的关注作为无向边,若任意两用户之间为多重关注,只保留单个关注。
[0044]步骤S2中初始节点可以为随机选择的节点。
[0045]步骤S3中,得到峰值点集F和与峰值点集F对应的阶数集Fn的过程包括:
[0046]对于待检测节点集S中的每个节点u,得到该节点的度数D
u
、该节点的邻居节点集合Nu、Nu中各节点的度数组成的集合D
Nu
;如果集合D
Nu...

【技术保护点】

【技术特征摘要】
1.一种网络社交平台用户分类方法,其特征在于,该方法包括以下步骤:S1:获取网络社交平台的用户关注信息,并基于用户关注信息构建无向图;S2:在无向图中选取初始节点,待检测节点集的元素初始化为初始节点,已检测节点集初始化为空集;S3:检测待检测节点集内的节点,得到峰值点集和与峰值点集对应的阶数集;S4:判断峰值点集是否为空集,若是,更新已检测节点集的元素为待检测节点集和已检测节点集或运算后的元素,更新待检测节点集的元素为现有待检测节点集的元素的所有邻节点,执行步骤S3,若否,阶数集中数值最小的元素对应的节点作为种子节点;S5:种子节点扩张形成社区,完成网络社交平台用户分类。2.根据权利要求1所述的一种网络社交平台用户分类方法,其特征在于,步骤S1的无向图中,用户作为节点,任意两用户之间的关注作为无向边。3.根据权利要求2所述的一种网络社交平台用户分类方法,其特征在于,若任意两用户之间为多重关注,只保留单个关注。4.根据权利要求1所述的一种网络社交平台用户分类方法,其特征在于,所述步骤S2中初始节点为随机选择的节点。5.根据权利要求1所述的一种网络社交平台用户分类方法,其特征在于,所述的步骤S3中,得到峰值点集和与峰值点集对应的阶数集的过程包括:S31:检测待检测节点集内的节点u,得到节点u的一次邻节点,并进一步得到...

【专利技术属性】
技术研发人员:齐鹏王得翊陈音拿焦澳琛
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1