一种基于局部影响力的标签传播社区发现方法技术

技术编号:18050600 阅读:61 留言:0更新日期:2018-05-26 08:24
本发明专利技术公开了一种基于局部影响力的标签传播社区发现方法,包括以下步骤:将给定的复杂网络数据表示为图模型形式;依据度中心性大小生成节点序列表,并为节点序列表中的每个节点分配一个唯一的标签;对于网络中每个节点,分别计算其对各邻居节点的局部影响力;依据制定的标签更新策略,按照节点序列表的顺序遍历更新所有节点的标签;最后当满足迭代终止条件时,将具有相同标签的节点归类到同一社区中,得到网络划分社区结果。本发明专利技术从节点标签更新次序和标签更新策略两方面对经典标签传播算法进行改进,减少了节点标签更新过程中的随机性,有效提高了划分社区结构的稳定性与准确性,可用于网络舆情监控、信息检索、电子商务推荐系统等领域。

【技术实现步骤摘要】
一种基于局部影响力的标签传播社区发现方法
本专利技术属于复杂网络中的社区发现
,具体涉及一种基于局部影响力的标签传播社区发现方法。
技术介绍
现实世界中的诸多复杂系统都可以抽象表示为复杂网络,如在线社交网络、人际关系社会网络、蛋白质交互网络以及交通运输网络等。随着互联网技术及应用的发展,复杂网络的研究得到越来越多各领域研究者的广泛关注,人们发现网络中普通存在潜在的社区结构,即群体内部节点之间连接相对紧密,各个群体之间节点的连接相对稀疏。网络社区结构的发现已成为当前研究复杂网络的热点趋势,对深入研究复杂网络结构与特征具有重要的价值与意义,已广泛应用于网络舆情监控、信息检索、疾病传播控制、电子商务网站推荐系统等诸多领域。目前,研究学者们已经提出存在一些经典的复杂网络社区结构发现方法,如KL算法、谱平分法、GN(GirvanNewman)算法、Newman快速算法、CNM算法等。其中,KL算法是一种基于贪婪思想的优化算法,谱平分算法需要利用邻接矩阵的特征值和特征向量进行社区划分,但该两种算法都必须预先知晓划分社区的数目及社区内包含的节点数量;GN算法是具有代表性的分裂算法,但每次分裂都需要重新计算每条连接边的边介数,时间复杂度较高;Newman快速算法是一种基于模块度优化的经典凝聚算法,其算法思想需要不断计算合并网络社区前后模块度增量的变化,且每次合并都向着模块度增量最多的方向进行,而Newman、Moore和Clauset等人在Newman快速算法基础上提出的CNM算法,CNM算法通过构建模块度增量矩阵代替原来的邻接矩阵计算模块度增量,将时间复杂度降低,大大提升了社区发现的效率。传统社区发现算法普遍存在算法复杂度较高,需要预先明确网络社区数目、社区规模等先验条件的不足,限制了算法的应用效率。2007年,Raghavan等人提出了一种基于标签传播的社区发现算法LPA,该算法初始时为每个节点分配唯一的标签,迭代过程中选择邻居节点中标签出现频率最高的标签来更新当前节点的标签,通过多次迭代,网络中各节点的标签趋于稳定,从而具有相同标签的节点则被规划到同一社区中。随着网络规模的不断增大,LPA算法因其算法简单,计算速度快,具有接近线性的复杂度,且无需社区数量等先验知识,适合在大规模网络中进行社区发现而受到广泛关注。但是,传统标签传播算法在进行节点标签更新的过程中存在大量随机性,一方面在节点标签遍历顺序上,随机对节点进行排序,没有考虑节点自身的重要性对标签传播的影响,容易产生标签“逆流”现象,导致一些重要性较小的节点反过来影响重要性较大的节点;另一方面,当邻居节点中标签出现频率最高的标签不止一个时,随机选择节点标签进行更新,从而导致社区划分结果不够稳定且准确度较低,划分社区结构质量不高。因此,需要寻找一个明确而合理的标签更新策略,而不是随机选择,以此提高社区划分结果的稳定性与准确性。
技术实现思路
针对LPA算法的不足进行了改进,本专利技术提供一种基于局部影响力的标签传播社区发现方法,该方法考虑到邻居节点中相同标签的总影响力对标签更新策略的重要影响,定义了节点对与之直接相连节点的局部影响力,同时利用节点邻域中具有相同标签的节点局部影响力之和来描述邻域中同一标签的影响力之和,以此制定新的标签更新策略,使得节点的标签选择更加准确,从而有效地提高了划分社区结构的稳定性与准确性。为实现上述目的,本专利技术采用的技术方案如下:本专利技术提供一种基于局部影响力的标签传播社区发现方法,包括以下步骤:步骤S1:对于给定复杂网络数据,将其抽象表示为图模型形式,构造节点关系邻接矩阵;步骤S2:依据度中心性大小对所有节点进行降序排序,从而生成节点序列表;步骤S3:为节点序列表中的每个节点分配一个唯一的标签,代表节点所属社区的标识;步骤S4:基于网络邻接矩阵,对于网络中每个节点,分别计算其对各邻居节点的局部影响力,从而得到网络中节点对与之直接相连节点的局部影响力矩阵;步骤S5:在每一次标签迭代更新过程中,按照节点序列表的顺序开始遍历更新所有节点的标签,对于每一个待更新节点,标签更新原则为计算其邻居中具有相同标签的节点局部影响力之和,选取局部影响力之和最大的邻居标签进行代替,其中如果影响力最大的邻居标签不止一个,则从这些邻居标签中选取总度数最大的标签;步骤S6:判断是否满足迭代终止条件,如果满足则将具有相同标签的节点归类到同一社区中,得到最终的网络社区划分结果,否则返回步骤S5继续按照更新规则进行节点标签更新。进一步的,所述步骤S1中,一个具体的复杂网络可抽象表示为无向图G=(V,E),其中V表示网络节点集合,E表示节点间连边的集合,n=|V|表示网络中节点的个数,网络图G的邻接矩阵A的取值元素为0或1,若任意节点i、j之间有边相连时A(i,j)=1,否则A(i,j)=0。进一步的,所述步骤S2中,依据度中心性大小对所有节点进行降序排序,从而生成节点序列表V′,其中对于网络内任意节点i,中心性定义为:其中,k(i)表示节点i的度数,A(i,j)为邻接矩阵中第i行第j列的元素值。进一步的,所述步骤S3中,按照生成的节点序列表V′中节点顺序,依次为每个节点分配一个唯一的标签Lab,即Lab(V′(i))=i,i∈[1,n]。进一步的,所述步骤S4中,对于网络中任意节点j,通过节点j所属的初步局部社区α(j)来衡量其对邻居节点i的影响力,具体公式为:其中,(1)α(j)=N(j,i)∪{j},N(j,i)为不包含邻居节点i的邻居节点集,α(j)是由节点j及其邻居节点组成的节点集,可近似表示为节点j所处的初步局部社区;k(i)表示节点i的度数,为节点i与局部社区α(j)内部节点存在连边的数目;因此,通过衡量节点j的局部社区α(j)对节点i的吸引力来表示节点j对相邻节点i的吸引力,吸引力越大则表明节点i被划分到节点j所在局部社区的可能性越大,节点j对节点i的影响力越大;cij为节点i及其与局部社区α(j)内相连的所有节点构成的子网络的网络密度,表示了节点间连接的亲密度,亲密度越大则节点i被划分到节点j所在局部社区的可能性越大,节点j对节点i的影响力越大,mt为节点i、j及其共同邻居节点构成的子网络中实际存在的连边总数,mT为节点i、j及其共同邻居节点构成的子网络中期望形成的最大连边总数,mT=T(T-1)/2,T为仅由节点i、j及其共同邻居节点构成的子网络中节点数目。进一步的,所述步骤S5中,通过计算邻居节点中具有相同标签的节点局部影响力之和,选取局部影响力之和最大的邻居标签进行代替,节点标签更新具体公式为:其中,NL(i)表示拥有标签为L的节点i的所有邻居节点集合,标签L的取值范围为节点i的所有邻居标签集合;若出现局部影响力之和最大的邻居标签不止一个,则从这些邻居标签中选取总度数最大的标签,具体公式为:其中,Lmax表示节点i的局部影响力之和最大的邻居标签集合。进一步的,所述步骤S6中,迭代终止条件为每一个节点的标签不再发生变化时,即节点的标签都与相邻节点中标签影响力之和最大的标签相同,算法划分结束得到最终社区结构。与现有技术相比,本专利技术具有以下有益技术效果:1.本专利技术分别从节点标签更新次序和标签更新策略两方面对LPA算法进行改进,在节点标签更新次序本文档来自技高网
...
一种基于局部影响力的标签传播社区发现方法

【技术保护点】
一种基于局部影响力的标签传播社区发现方法,其特征在于,所述方法包括如下步骤:S1:对于给定复杂网络数据,将其抽象表示为图模型形式,构造节点关系邻接矩阵;S2:依据度中心性大小对所有节点进行降序排序,从而生成节点序列表;S3:为节点序列表中的每个节点分配一个唯一的标签,代表节点所属社区的标识;S4:对于网络中每个节点,分别计算其对与之直接相连的各节点的局部影响力,从而得到网络节点间局部影响力矩阵;S5:在每一次标签迭代更新过程中,按照节点序列表的顺序遍历更新所有节点的标签,对于每一个待更新节点,标签更新原则为计算其邻居中具有相同标签的节点局部影响力之和,选取局部影响力之和最大的邻居标签进行代替,其中如果影响力最大的邻居标签不止一个,则从这些邻居标签中选取总度数最大的标签;S6:判断是否满足迭代终止条件,如果满足则将具有相同标签的节点归类到同一社区中,得到最终的网络社区划分结果,否则返回步骤S5继续按照更新规则进行节点标签更新。

【技术特征摘要】
1.一种基于局部影响力的标签传播社区发现方法,其特征在于,所述方法包括如下步骤:S1:对于给定复杂网络数据,将其抽象表示为图模型形式,构造节点关系邻接矩阵;S2:依据度中心性大小对所有节点进行降序排序,从而生成节点序列表;S3:为节点序列表中的每个节点分配一个唯一的标签,代表节点所属社区的标识;S4:对于网络中每个节点,分别计算其对与之直接相连的各节点的局部影响力,从而得到网络节点间局部影响力矩阵;S5:在每一次标签迭代更新过程中,按照节点序列表的顺序遍历更新所有节点的标签,对于每一个待更新节点,标签更新原则为计算其邻居中具有相同标签的节点局部影响力之和,选取局部影响力之和最大的邻居标签进行代替,其中如果影响力最大的邻居标签不止一个,则从这些邻居标签中选取总度数最大的标签;S6:判断是否满足迭代终止条件,如果满足则将具有相同标签的节点归类到同一社区中,得到最终的网络社区划分结果,否则返回步骤S5继续按照更新规则进行节点标签更新。2.根据权利要求1所述的一种基于局部影响力的标签传播社区发现方法,其特征在于,所述步骤S1中,一个具体的复杂网络可抽象表示为无向图G=(V,E),其中V表示网络节点集合,E表示节点间连边的集合,n=|V|表示网络中节点的个数,网络图G的邻接矩阵A的取值元素为0或1,若任意节点i、j之间有边相连时A(i,j)=1,否则A(i,j)=0。3.根据权利要求2所述的一种基于局部影响力的标签传播社区发现方法,其特征在于,所述步骤S2中,依据度中心性大小对所有节点进行降序排序,从而生成节点序列表V′,其中对于网络内任意节点i,中心性定义为:其中,k(i)表示节点i的度数,A(i,j)为邻接矩阵中第i行第j列的元素值。4.根据权利要求3所述的一种基于局部影响力的标签传播社区发现方法,其特征在于,所述步骤S3中,按照生成的节点序列表V′中节点顺序,依次为每个节点分配一个唯一的标签Lab,即Lab(V′(i))=i,i∈[1,n]。5.根据权利要求3所述的一种基...

【专利技术属性】
技术研发人员:顾亦然陈雨晴孟繁荣
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1