本发明专利技术涉及一种基于选举标签传播的社区发现方法,包括以下步骤:1、对于给定社会网络,计算每个网络节点的影响力;2、利用候选者产生策略分别从网络节点的邻居节点中选出若干个节点作为候选者;3、根据影响力大小比较各候选者与其邻居节点,相互竞争产生胜出者;4、根据票数高低比较各胜出者与其邻居胜出者,相互竞争产生新胜出者;5、对支持率低于设定值的胜出者进行调整,从其邻居胜出者中选出新胜出者;6、根据网络节点标签进行网络节点的社区划分并输出,即对于所有网络节点,通过将具有相同标签者归属到同一社区的方法构造网络的社区结构。该方法能够提高社区发现的有效性和稳定性,有效发现隐藏于社交网络的社区结构模式。
【技术实现步骤摘要】
本专利技术涉及网络社区发现
,特别是一种应用于社会网络的基于选举标签传播的社区发现方法。
技术介绍
诸如万维网、社会关系网络与生物网络等多种自然或社会复杂系统都可以用复杂网络来描述,复杂网络具有度幂律分布、高聚集系数与模块化社区等特征。本质上,网络的社区结构是指这样的节点集合:集合内的节点之间的链接稠密而集合内节点与集合外节点的链接稀疏。例如,具有复杂网络研究兴趣的学者之间联系比较紧密,他们构成一个社区,目前常在一起探讨问题,而与图形图像研究者沟通不多。社区结构能够刻画复杂系统功能部件间的拓扑关系,从复杂系统网络中挖掘出隐藏的潜在有价值的社区结构模式是一个很有意义但包含挑战的工作。近年来,网络社区发现研究同时在物理学、社会学与计算机科学等不同领域中备受关注,涌现出的算法五花八门。绝大多数现有的社区发现算法都有着较高的计算复杂度,例如,GN算法的时间复杂度为O(m2n),模块度优化法的时间复杂度为O(mklogn)。过高的计算成本使得这些传统社区发现方法无法满足大规模复杂网络社区模式发现的需要。在此背景下,具有近似线性时间复杂度的标签传播算法(Label Propagation Algorithm,LPA)在大规模网络社区发现研究中倍受青睐。Raghavan等人最早于2007年首先提出基于标签传播算法的社区发现方法RAK,该方法首先将每个节点初始化为一个独特的社区标签,然后通过迭代过程将每个节点的标签都更新为其大多数邻近节点的标签,最后密集连接的节点组会逐步从一个独特标签变成了一个具有共识的社区节点从而形成网络社区结构。RAK承袭了标签传播算法的高效计算特性,但由于其在初始标签、选择邻居节点和更新顺序等方面都采用随机策略,这使得发现的网络社区结构具有很大随机性,甚至可能产生所有节点属于同一社区的奇异解。针对此,社区发现研究者从多个方面对LPA算法进行了改进。随机初始标签方面,Subelj等人提出一种新的标签传播算法DPA以层次方式将防御保护与进攻扩展两种社区形成策略组合起来,通过递归方式提取社区核心与调整社区核心来发现微小社区(whisker communities)。Leung等人通过Web网络社区发现的实验,发现节点标签跳 衰减策略与节点强度传播策略能有效提升LPA算法的性能。考虑到随机选取邻居节点标签的更新策略会降低LPA算法的鲁棒性,Zhang等人提出在出现多个最优的不同标签时应选择与当前待更新节点存在局部环的标签对当前节点更新。Lin等人提出一种基于社区核的标签传播算法CK-LPA,根据节点在网络中的重要性对其赋值并以此值对节点标签进行异步更新。为了避免产生众多碎小社区,赵卓翔等人提出了一种基于标签影响力的社区发现算法LIB,该算法首先选取一个小的顶点集作为种子集并赋予每个种子唯一的标签再以种子集作为起点进行传播,在对节点标签更新时需要对顶点邻居中相同标签所占比例、顶点度数和边的权重等多种因素进行综合考虑。为了避免产生怪兽社区(同一网络内所有节点都隶属同一个社区),Barber等人提出了一种模块化标签传播算法LPAm,通过给定一个目标函数,使得标签传播算法在迭代传播过程中受到约束,将社区发现的问题转化成为寻找目标函数最优解的问题,在邻居标签个数相同的基础上定义一个目标函数利用标签传播算法发现函数的局部化的最优值。注意到LPAm因容易陷入模块度局部极大值而损害结果社区的准确性,Liu等人提出了LPAm+算法,将LPAm算法与多步贪心聚合(MSG)相结合,利用MSG同时合并多个相似社区以避免陷入局部最大值,实现更加精准地检测网络社区。Subelj等人提出的BPA算法,先计算每个节点的平衡因子,再通过累加相同标签的平衡因子来选取最大的邻居集合,避免了奇异解的产生。Xie等人提出基于Speaker和Listener概念的社区发现算法SLPA,武志昊等提出基于平衡归属系数(Balanced belonging coefficient)社区发现算法。上述算法虽然在一定程度上提升了结果社区的质量,但简单的传播规则无法适应更加复杂的社区网络。针对此,本文提出了一种基于选举标签传播的社区发现方法(Voting-based Label Propagation algorithm for Non-Overlapping communities detection,VLPNO)。
技术实现思路
本专利技术的目的在于提供一种基于选举标签传播的社区发现方法,该方法能够提高社区发现的有效性和稳定性,有效发现隐藏于社交网络的社区结构模式。为实现上述目的,本专利技术的技术方案是:一种基于选举标签传播的社区发现方法,包括以下步骤:步骤S1:对于给定社会网络,计算每个网络节点的影响力;步骤S2:对于各网络节点,利用候选者产生策略分别从其邻居节点中选出若干个节点作为候选者;步骤S3:对于各候选者,根据影响力大小比较各候选者与其邻居节点,相互竞争产生胜出者;步骤S4:对于各胜出者,根据票数高低比较各胜出者与其邻居胜出者,相互竞争产生新胜出者;步骤S5:对支持率低于设定值的胜出者进行调整,从其邻居胜出者中选出新胜出者;步骤S6:根据网络节点标签进行网络节点的社区划分并输出,即对于所有网络节点,通过将具有相同标签者归属到同一社区的方法构造网络的社区结构。进一步的,所述步骤S1中,对于网络节点u,其影响力p(u)为:其中其中,deg(u)为节点u的度,N(u)是节点u的邻居节点集合。进一步的,所述步骤S2中,利用候选者产生策略分别从各网络节点的邻居节点中选出若干个节点作为候选者,具体包括以下步骤:步骤S21:对于网络节点u,对其邻居节点集合N(u)中的节点进行依影响力的降序排序,根据影响力从N(u)中选择K个影响力大于p(u)的节点作为候选者,若N(u)中影响力大于p(u)的节点不足K个,则以N(u)中所有影响力大于p(u)的节点作为候选者;步骤S22:所有候选者构成候选者集合Vh,Vh中的每个候选者的票箱Bbox中的票数初始均为1,同时给Vh中的每个候选者都赋予唯一的社区标签。进一步的,所述步骤S3中,对于候选者v,将v与N(v)中的节点进行影响力比较,若N(v)中存在影响力大于p(v)的节点,则从中选择具有最大影响力的节点作为胜出者,同时将v降为投票者并对所述胜出者进行投票,即进行将所述胜出者的票数加1与将v的社区标签更新为所述胜出者的社区标签的操作,否则,候选者v成为胜出者,并保持其社区标签不变,同时将v的票数加1。进一步的,所述步骤S4中,重复如下竞争过程直至票数稳定或者达到最大迭代数:对于胜出者w,将w与其邻居胜出者进行票数比较,若在w的邻居胜出者中存在票数高于w的节点,则从中选择具有最高票数的节点作为新胜出者,同时将w降为投票者并将w的社区标签与支持w的投票者的社区标签都更新为所述新胜出者的社区标签,否则,w还是胜出者,并保持其社区标签不变。进一步的,所述步骤S5中,对于胜出者y,若其支持率Support(y)低于设定值,则从其邻居胜出者中选择具有最高支持率的节点作为新胜出者,同时将y降为投票者并将y的标签与支持y的投票者的社区标签都更新为所述新胜出者的社区标签,其中 ly与lv分别为节点y与v的社区标签,δ(ly,lv)本文档来自技高网...
【技术保护点】
一种基于选举标签传播的社区发现方法,其特征在于,包括以下步骤:步骤S1:对于给定社会网络,计算每个网络节点的影响力;步骤S2:对于各网络节点,利用候选者产生策略分别从其邻居节点中选出若干个节点作为候选者;步骤S3:对于各候选者,根据影响力大小比较各候选者与其邻居节点,相互竞争产生胜出者;步骤S4:对于各胜出者,根据票数高低比较各胜出者与其邻居胜出者,相互竞争产生新胜出者;步骤S5:对支持率低于设定值的胜出者进行调整,从其邻居胜出者中选出新胜出者;步骤S6:根据网络节点标签进行网络节点的社区划分并输出,即对于所有网络节点,通过将具有相同标签者归属到同一社区的方法构造网络的社区结构。
【技术特征摘要】
1.一种基于选举标签传播的社区发现方法,其特征在于,包括以下步骤:步骤S1:对于给定社会网络,计算每个网络节点的影响力;步骤S2:对于各网络节点,利用候选者产生策略分别从其邻居节点中选出若干个节点作为候选者;步骤S3:对于各候选者,根据影响力大小比较各候选者与其邻居节点,相互竞争产生胜出者;步骤S4:对于各胜出者,根据票数高低比较各胜出者与其邻居胜出者,相互竞争产生新胜出者;步骤S5:对支持率低于设定值的胜出者进行调整,从其邻居胜出者中选出新胜出者;步骤S6:根据网络节点标签进行网络节点的社区划分并输出,即对于所有网络节点,通过将具有相同标签者归属到同一社区的方法构造网络的社区结构。2.根据权利要求1所述的一种基于选举标签传播的社区发现方法,其特征在于,所述步骤S1中,对于网络节点u,其影响力p(u)为:其中其中,deg(u)为节点u的度,N(u)是节点u的邻居节点集合。3.根据权利要求2所述的一种基于选举标签传播的社区发现方法,其特征在于,所述步骤S2中,利用候选者产生策略分别从各网络节点的邻居节点中选出若干个节点作为候选者,具体包括以下步骤:步骤S21:对于网络节点u,对其邻居节点集合N(u)中的节点进行依影响力的降序排序,根据影响力从N(u)中选择K个影响力大于p(u)的节点作为候选者,若N(u)中影响力大于p(u)的节点不足K个,则以N(u)中所有影响力大于p(u)的节点作为候选者;步骤S22:所有候选者构成候选者集合Vh,Vh中的每个候选者的票箱Bb...
【专利技术属性】
技术研发人员:黄发良,何万莉,元昌安,汪焱,
申请(专利权)人:福建师范大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。