基于k节点更新与相似度矩阵的多目标社区检测方法技术

技术编号:15792812 阅读:91 留言:0更新日期:2017-07-10 02:07
本发明专利技术公开了一种基于k节点更新与相似度矩阵的多目标社区检测方法,解决现有技术社区检测效果差及无法处理多类型网络的问题。实现步骤是:输入网络数据;初始化种群和权重向量,得到每一权重向量邻居下标集合;计算网络中任意两节点间相似度值得到相似度矩阵;用k节点更新策略对网络预划分;计算种群中个体目标函数值并初始化目标函数参考点;对种群中个体进化,得到子代群体;计算子代种群目标函数值,用目标函数值更新目标函数参考点;用子代种群对当代种群中个体的邻居更新;达最大进化代数,终止检测;否则,转至种群进化,直至完成社区检测。本发明专利技术社区检测精度高,能够有效检测出无符号网络和符号网络的社区结构。

【技术实现步骤摘要】
基于k节点更新与相似度矩阵的多目标社区检测方法
本专利技术属于复杂网络的社区挖掘
,主要涉及到多目标社区检测,具体是一种基于k节点更新与相似度矩阵的多目标社区检测方法,可用于无符号与符号社交网络的社区检测。
技术介绍
复杂网络常用于描述现实网络中的各类复杂系统。近些年来,随着互联网的高速发展,对于社交网络的社区检测技术的研究已经成为复杂网络研究领域的一个重要分支。在复杂网络领域中,社区是指其内部连接相对于外部连接较为紧密的节点的集合,也称之为模块。对于社交网络中的社区检测,能够了解网络中的结构组织形式及功能模块,以便为用户提供更好的服务。社区检测也称为社区挖掘,其实质是通过网络数据检测出网络中具有这种组织结构的节点的集合,即社区。常用的社区检测技术是建立优化模型,并通过适当的优化技术对模型进行求解。近年来,尤其是多目标进化方法的应用,不仅能在一定程度上克服优化模型所存在的分辨率极限问题,而且能够在一次运行中产生多个解,称之为Pareto解集,并根据决策者的偏好选择更为合理的解。如MOEA/D-net技术采用一种基于分解的多目标进化方法用于社区检测,MOGA-net技术采用多目标非支配排序方法进行社区检测,SNMOGA是一种进化与局部精致技术并用于符号网络的社区检测。这些技术方法均是基于多目标进化模型的社区检测技术,并取得了良好的效果。对于多目标社区检测技术,首先要建立多目标优化模型,然后使用某种编码方式对网络进行编码,得到初始化种群,并通过设计合理的遗传操作方法对个体进行操作,种群进化到一定的代数后即可终止进化过程,最后通过对末代种群中个体的解码得到合理的网络划分。然而现存的多目标社区检测技术存在以下缺点:(1)没有充分利用网络的先验信息,遗传操作方法的设计缺陷导致现有技术在搜索空间中进行了很多无用搜索,造成了大量的时间开销以及社区检测的精度不高;(2)大多数社区检测方法仅能够处理无符号社交网络(简称为无符号网络),而无法处理符号社交网络(简称为符号网络);(3)少数社区检测技术针对于符号网络而设计,但无法处理无符号网络或在无符号网络上的检测效果较差。总之,处理的网络类型较为单一以及检测精度不高是现有社区检测技术的主要缺陷。
技术实现思路
本专利技术的目的在于针对于上述现有技术的缺陷,提出了一种检测精度较高,能够处理多种网络类型的基于k节点更新及相似度矩阵的多目标社区检测方法。本专利技术是一种基于k节点更新与相似度矩阵的多目标社区检测方法,其特征在于,包括有如下步骤:步骤1:输入网络数据,读入一个用邻接矩阵A表示的无符号网络或符号网络,该网络数据隐含着一定数量的社区。步骤2:随机初始化一定规模的种群和权重向量,得到每一个权重向量的邻居下标集合。2.1初始化种群pop,种群规模为popsize,种群中每一个个体均代表对输入网络划分的一种编码方式,编码长度与输入网络中节点个数相同,个体的基因位即编码表示对应节点所属的社区标签;2.2同时,初始化与种群规模相同的且均匀分布的权重向量计算任意两个权重向量之间的欧氏距离,对于每一个权重向量,找出与之距离最近的nt个权重向量并存储这些向量的下标值,这些下标值即每一个权重向量对应个体的邻居下标值。步骤3:计算输入网络中任意两个节点之间的相似度值,得到相似度矩阵,将无符号网络中用于计算节点之间相似度的函数拓展到符号网络中,得到一个泛化的相似度函数;根据该泛化的相似度函数计算输入网络中任意两个邻接节点vi,vj((vi,vj)∈E)之间的相似度值S(vi,vj),得到输入网络节点的相似度矩阵S。步骤4:使用k节点更新策略完成对网络的预划分,根据节点的相似度矩阵S,找出与节点相似度最大的k个邻接节点,并使用这k个节点的社区标签来更新待处理节点的社区标签,称之为k节点更新策略;根据更新策略,对节点的社区标签更新多次,完成对网络的预划分,即得到一定数量的局部子社区。步骤5:计算种群中个体的目标函数值并初始化目标函数的参考点z*。步骤6:对种群中的个体进行进化操作,从而得到子代种群,设置种群的最大进化代数为maxgen,设置当前的进化代数为t。6.1对于种群中的每一个个体,随机选中该个体ind的两个邻居;6.2对这两个邻居个体进行交叉合并操作,得到子代个体;6.3对该个体ind进行基于相似度矩阵的变异操作,得到子代个体;6.4重复执行6.1-6.3,对种群所有个体进行进化操作,得到子代种群child。步骤7:计算子代种群child的目标函数值,并使用这些目标函数值来更新目标函数的参考点z*。步骤8:使用子代种群child对种群pop中所有个体的邻居进行更新。8.1根据契比雪夫方法,对于种群pop中的每一个个体,计算该个体的邻居个体的契比雪夫值和子代种群child中个体的契比雪夫值;8.2比较上述契比雪夫值的大小,若子代种群child中个体的契比雪夫值小于邻居个体的契比雪夫值,则使用该子代个体来取代邻居个体;否则,不使用子代个体更新邻居个体。使用契比雪夫方法处理完种群中的所有个体后,即完成对种群中个体的邻居更新过程。步骤9:判断是否达到种群的进化代数maxgen,如果达到最大进化代数,则终止进化过程,对种群中的个体编码进行解码,得到输入网络的最终社区划分,并输出检测到的网络社区;否则,更新t←t+1,并转至步骤(6.1),继续对种群进行进化操作,完成种群的进化过程和对种群中个体的邻居更新过程,直至完成输入网络的社区检测。本专利技术就是基于k节点更新策略与相似度矩阵的多目标社区检测方法并用于社交网络的社区挖掘。本专利技术与现有技术相比存在以下优点:1.本专利技术将无符号网络中的节点相似度测量扩展到符号网络中的节点相似度测量,并因此设计出可以处理无符号网络与符号网络的k节点更新策略。这种预处理策略的使用能够有效地避免噪声节点对社区标签更新过程的影响,并且迅速地将连接紧密的节点集精确地识别并聚集成局部子社区,从而提高本专利技术的检测精度以及减少进化过程中进行的无用搜索。2.本专利技术针对预划分的网络精心设计了交叉合并方法以及基于相似度矩阵的变异方法。交叉合并方法能够将本专利技术初期所得到的局部子社区进行有效地合并,从而得到合理的社区个数,不用人为地确定社区的个数;基于相似度矩阵的变异方法使用轮盘赌的方式选择变异的方向,一方面,节点变异方向指向相似度高的节点所在社区可以提高变异的精度,另一方面,低相似度的邻接节点也能够以低概率决定变异节点所在的社区,从而提高了变异方向的多样性。这些技术的应用均有利于提高社区检测的精度。3.本专利技术分别构建了无符号网络与符号网络中的多目标优化模型。不仅能够处理无符号网络的社区检测问题,还能够处理符号网络的社区检测问题,并且大幅地提高了在这两类网络上的社区检测精度,比以往的多目标社区检测方法具有明显的优势。附图说明图1是本专利技术的实现流程图;图2是本专利技术与现有技术中的MOGA-net、MOEA/D-net在无符号LFR基准网络上的社区检测精度对比图。其中,图2(a)为三种方法在归一化互信息(NMI)指标上的检测结果,图2(b)是三种方法在权重的归一化互信息(WNMI)指标上的检测结果;图3是本专利技术与现有技术中的SNMOGA在符号SLFR基准网络上的社区检测精度对比图。图3中SLFR本文档来自技高网
...
基于k节点更新与相似度矩阵的多目标社区检测方法

【技术保护点】
一种基于k节点更新与相似度矩阵的多目标社区检测方法,其特征在于,包括有如下步骤:步骤1:输入网络数据,读入一个用邻接矩阵A表示的无符号网络或符号网络,该网络数据隐含着一定数量的社区;步骤2:随机初始化一定规模的种群和权重向量,得到每一个权重向量的邻居下标集合,2.1初始化种群pop,种群规模为popsize,种群中每一个个体均代表对输入网络划分的一种编码方式,编码长度与输入网络中节点个数相同,个体的基因位即编码表示对应节点所属的社区标签;2.2同时,初始化与种群规模相同的且均匀分布的权重向量

【技术特征摘要】
1.一种基于k节点更新与相似度矩阵的多目标社区检测方法,其特征在于,包括有如下步骤:步骤1:输入网络数据,读入一个用邻接矩阵A表示的无符号网络或符号网络,该网络数据隐含着一定数量的社区;步骤2:随机初始化一定规模的种群和权重向量,得到每一个权重向量的邻居下标集合,2.1初始化种群pop,种群规模为popsize,种群中每一个个体均代表对输入网络划分的一种编码方式,编码长度与输入网络中节点个数相同,个体的基因位即编码表示对应节点所属的社区标签;2.2同时,初始化与种群规模相同的且均匀分布的权重向量计算任意两个权重向量之间的欧氏距离,对于每一个权重向量,找出与之距离最近的nt个权重向量并存储这些向量的下标值,这些下标值即每一个权重向量对应个体的邻居下标值;步骤3:计算输入网络中任意两个节点之间的相似度值,得到相似度矩阵,将无符号网络中用于计算节点之间相似度的函数拓展到符号网络中,得到一个泛化的相似度函数;根据该泛化的相似度函数计算输入网络中任意两个邻接节点vi,vj((vi,vj)∈E)之间的相似度值S(vi,vj),得到输入网络节点的相似度矩阵S;步骤4:使用k节点更新策略完成对网络的预划分,根据节点的相似度矩阵S,找出与节点相似度最大的k个邻接节点,并使用这k个节点的社区标签来更新待处理节点的社区标签,称之为k节点更新策略;根据更新策略,对节点的社区标签更新多次,完成对网络的预划分,即得到一定数量的局部子社区;步骤5:计算种群中个体的目标函数值并初始化目标函数的参考点z*;步骤6:对种群中的个体进行进化操作,从而得到子代种群,设置种群的最大进化代数为maxgen,设置当前的进化代数为t,6.1对于种群中的每一个个体,随机选中该个体ind的两个邻居;6.2对这两个邻居个体进行交叉合并操作,得到子代个体;6.3对该个体ind进行基于相似度矩阵的变异操作,得到子代个体;6.4重复执行6.1-6.3,对种群所有个体进行进化操作,得到子代种群child;步骤7:计算子代种群child的目标函数值,并使用这些目标函数值来更新目标函数的参考点z*;步骤8:使用子代种群child对种群pop中所有个体的邻居进行更新,8.1根据契比雪夫方法,对于种群pop中的每一个个体,计算该个体的邻居个体的契比雪夫值和子代种群child中个体的契比雪夫值;8.2比较上述契比雪夫值的大小,若子代种群child中个体的契比雪夫值小于邻居个体的契比雪夫值,则使用该子代个体来取代邻居个体;否则,不使用子代个体更新邻居个体;使用契比雪夫方法处理完种群中的所有个体后,即完成对种群中个体的邻居更新过程;步骤9:判断是否达到种群的进化代数maxgen,如果达到最大进化代数,则终止进化过程,对种群中的个体编码进行解码,得到输入网络的最终社区划分,并输出检测到的网络社区;否则,更新t←t+1,并转至步骤(6.1),继续对种群进行进化操作,完成种群的进化过程和对种群中个体的邻居更新过程,直至完成输入网络的社区检测。2.根据权利要求1所述的一种基于k节点更新策略与相似度矩阵的多目标社区检测方法,其特征在于,步骤3中所述的输入网络节点的相似度矩阵S具体计算公式如下:其中,S(vi,vj)表示节点vi与节点vj之间的相似度值,代表相似度矩阵S中第i行第j列的元素;Γ+(vi)表示与节点vi具有正关系的邻接节点的集合,Γ-(vi)表示与节点vi具有负关系的邻接节点的集合;|Γ+(vi)∩Γ+(vj)|表示节点vi与节点vj之间所共同拥有的正邻居的个数,|Γ-(vi)∩Γ-(vj)|表示节点vi与节点vj之间所共同拥有的负邻居的个数;代表节点vi的度,即与节点vi相连接的边数之和。3.根据权利要求1所述的一种基于k节点更新策略与相似度矩...

【专利技术属性】
技术研发人员:尚荣华刘欢焦李成刘芳马文萍王蓉芳马晶晶王爽侯彪
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1