The invention discloses a community discovery method based on central node expansion, which generates candidate list by calculating node cohesion degree and ranking of users; then, the user with the greatest node cohesion degree in candidate list is regarded as the initial central node, and then gradually expands the community, expands the user who enters the community, and from the candidate column. Delete from the table, select the initial central node to extend the community after the extended community is completed, until there are no users in the candidate list; finally, merge similar communities. The stability of the extended community is improved according to the size of the node cohesion. Experiments are carried out on the open data set Dolphin social network. The experimental results show that the method of the present invention can perform community discovery of complex social networks with good accuracy and effectiveness.
【技术实现步骤摘要】
一种基于中心节点扩展的社区发现方法
本专利技术属数据挖掘
,更为具体地讲,涉及一种基于中心节点扩展的社区发现方法。
技术介绍
通常将网络抽象成一个图,用户用图中的节点表示,用户之间的关系用边表示,这种网络中所表现出的这种结构被称之为社区。社区内部节点间连接密度较高,而不同社区间的节点连接密度较低。社区发现是分析社交网络的一种有效方法,社区发现作为社交网络数据挖掘领域的研究热点,已经得到越来越多的学者的重视。在社区发现领域,许多学者提出或总结出一些经典的社区发现算法:文献[KernighnBW,LinS.Aefficientheuristicprocedureforpartitioninggraphs[J].BellSystemTechn-IcalJournal,1970,49(2):292~307.]提出了K-L算法。K-L算法是一种试探优化法,算法中引入一个增益函数Q,然后采用贪婪算法原理交换节点对来使Q值达到最大,最后划分出两个大小已知的社区。该算法的缺点在于只能划分出两个社区且必须知道两个社区成员的数量。文献[GirvanM,NewmanMEJ.Communitystructureinsocialandbiologicalnetworks[J].ProceedingsoftheNationalAcademyofScience,2002,99(12):7821-7826.]提出了GN算法。GN算法的思想在于社区间的边的介数大于社区内部边的介数,通过不断的移除介数最大的边,直到整个网络退化成一个社区为止。该算法的优点在于不需要预先知道社区的数目,但 ...
【技术保护点】
1.一种基于中心节点扩展的社区发现方法,其特征在于,包括以下步骤:(1)、将社交网络抽象成一个图:用户用图中的节点表示,用户之间的关系用边表示,然后计算节点(用户)凝聚度,并根据节点凝聚度从大到小,对用户进行排序,生成候选列表;(2)、选择候选列表中节点凝聚度最大的用户作为初始中心节点,依据局部适应度函数,对初始中心节点逐步扩展社区,扩展进入社区的用户,从候选列表中删除,扩展社区完毕后,得到一个社区;然后,进行下一个社区发现:重新在选择候选列表中节点凝聚度最大的用户作为初始中心节点,重复进行扩展社区,得到下一个社区,直到候选列表中没有用户为止;(3)、计算得到社区的相似度并将相似的社区进行合并。
【技术特征摘要】
1.一种基于中心节点扩展的社区发现方法,其特征在于,包括以下步骤:(1)、将社交网络抽象成一个图:用户用图中的节点表示,用户之间的关系用边表示,然后计算节点(用户)凝聚度,并根据节点凝聚度从大到小,对用户进行排序,生成候选列表;(2)、选择候选列表中节点凝聚度最大的用户作为初始中心节点,依据局部适应度函数,对初始中心节点逐步扩展社区,扩展进入社区的用户,从候选列表中删除,扩展社区完毕后,得到一个社区;然后,进行下一个社区发现:重新在选择候选列表中节点凝聚度最大的用户作为初始中心节点,重复进行扩展社区,得到下一个社区,直到候选列表中没有用户为止;(3)、计算得到社区的相似度并将相似的社区进行合并。2.根据权利要求1所述的基于中心节点扩展的社区发现方法,其特征在于,所述节点凝聚度CDs(i)依据以下公式进行计算:其中,ki表示节点i的度值,kmax为社交网络中节点的最大度值,kmin为网络中节点的最小度值,A为节点i的邻接节点集合,kj为节点j的度值,aij是当节点i与邻接节点j有边相连时值为1,无边相连时值为0,zij表示同时连接节点i与节点j的节点数量。3.根据权利要求1所述的基于中心节点扩展的社区发现方法,其特征在于,所述的局部适应度函数用fG表示为:是社区G中节点连向社区内节点的度总和,是社区G中的节点连向社区外节点的度总和。4.根据权利要求1所述的基于中心节点扩展的社区发现方法,其特征在于,所述的扩展社区的过程为:2.1)、查看候选列表中,是否有节点(用户),如果没有则进入步骤(3),如果有,则进行步骤2.2);2.2)、选取候选列表中节点凝聚度最大的用户作为初始中心节点并初始化为社区G;2.3)、判断社区G邻接节点中是否所有节点引起社区G的适应度变化值都为负,如果是,则社区G扩展完毕,则返回步骤2.1)如果不是,则进行步...
【专利技术属性】
技术研发人员:邢玲,吴红海,马强,高建平,谢萍,朱家磊,
申请(专利权)人:河南科技大学,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。