本发明专利技术公开了一种复杂网络社团的发现方法,包括以下步骤:步骤一:建立所需分析网络的邻接矩阵表示;步骤二:确定初始划分点的值;步骤三:计算网络中每个节点的度;步骤四:选出节点的度数最高的K个点作为初始划分点;步骤五:选取具体需要的划分点;步骤六:根据步骤五得到的最后的划分点,由计算机给出最后的社团发现结果。本发明专利技术提出了计算机的基于划分点的处理复杂网络社团的发现方法,解决了现有技术不能够利用计算机处理大规模复杂网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系统资源,提高计算机的运算速度和效率;同时,还实现了向下分解和向上聚合方法的统一。
【技术实现步骤摘要】
本专利技术涉及复杂网络技术,同时也涉及web数据挖掘技术,具体地说是一种复杂 网络社团的发现方法。
技术介绍
网络科学是目前一个交叉学科中很重要的研究方向,而在网络科学中有一个突出 并且富有前景的研究问题就是社团发现。而以前网络科学主要关注于度的指数分布以及小 世界效应。复杂网络的结构描述一直是近几年来物理学家关心的重要问题。从个体微观层 次的度、聚集系数到宏观整体统计特性的度分布、整体聚集系数等。而在这两个比较极端的 中间有一个处于中间层次的描述就是社团描述。因此社团发现现已成为复杂网络研究的一 个研究热点。现实世界中的诸多系统都以网络形式存在,如生态系统中的神经元网、基因调控 网和蛋白质交互网、科技系统中的电话网、因特网和万维网等。由于这些网络具有很高的复 杂性,因此被称为“复杂网络(complex network) 复杂网络已成为当前最重要的多学科 交叉研究领域之一。与小世界性、无标度性等基本统计特性相并列,网络社团结构是复杂网 络最普遍和最重要的拓扑结构属性之一,具有相同社团节点相互连接密集、不同社团节点 相互连接稀疏的特点。复杂网络社团的发现方法旨在揭示出复杂网络中真实存在的网络簇 结构。研究复杂网络社团发现对分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂 网络中的隐藏规律以及预测复杂网络的行为不仅具有十分重要的理论意义,而且具有广泛 的应用前景,目前已被应用于新陈代谢网络分析、蛋白质交互网络分析和未知蛋白质功能 预测、基因调控网络分析和主控基因识别等各种生物网络分析以及Web社区挖掘和基于主 题词的Web文档聚类和搜索引擎等众多领域。近几年研究发现,尽管客观世界中的复杂系统功能各样,但它们对应的复杂网络 在结构上却具有十分惊人的相似性。根据网络结构的特点,科学家把绝大多数的复杂网络 归纳为3类随机网络、小世界网络和无标度网络。复杂网络的核心研究内容是揭示复杂 网络功能和结构之间的内在联系。目前,用于刻画复杂网络结构的重要属性是平均路长、聚 类系数、度分布、网络Motif和网络社团结构。借助复杂网络社团结构分析方法,科学家取 得了一些有关网络功能和结构的初步研究结果。目前已存在多种复杂网络社团发现方法,按照所采用的基本求解策略,可以归纳 为两大类基于优化的方法和启发式方法。前者将复杂网络社团发现问题转化为优化问 题,通过最优化预定义的目标函数来计算复杂网络的社团结构,例如,谱方法将网络聚类问 题转化为二次型优化问题,通过计算特殊矩阵的特征向量来优化预定义的“截”函数,“截” 即指子网间的连接密度.具有最小“截”的划分被认为是最优的网络划分,针对不同问题, 提出了不同的“截”函数,例如,针对分布式系统负载平衡提出的“平均截”、针对大规模集 成电路设计提出的“比率截”以及针对图像分割提出的“规范截”等。而后者将复杂网络聚 类问题转化为预定义启发式规则的设计问题,例如,由Girvan和Newman在2002年提出的Girvan和Newman (简称GN)算法也采用反复识别和删除簇间连接的策略聚类复杂网 络,但GN算法采用了新的启发式规则簇间连接的边介数应大于簇内连接的边介数,连接 的边介数定义为网络中经过该连接的任意两点间最短路径的条数,GN算法通过反复计算 边介数、识别簇间连接、删除簇间连接,以自顶向下的方式建立一棵层次聚类树。然而,计算 机利用GN算法进行计算的最大缺点是计算速度慢,需要占用大量的计算机存储空间和计 算机系统资源,且只能处理中小规模的网络问题,无法处理大规模的复杂网络问题。
技术实现思路
本专利技术的目的在于提供,该方法能够使计算机用 来处理大规模的复杂网络问题,并能够在计算过程中节省大量的计算机存储空间,减少计 算所占用的系统资源,提高计算机的运算速度和效率。为实现上述目的,本专利技术可采取下述技术方案 本专利技术,包括以下步骤步骤一建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的 元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;步骤二 确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始 划分点的值K=2 ;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关 系式2Κ>Μ ;步骤三编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节 点的度,所述节点的度是指该节点与其它节点相连的边的个数; 步骤四选出节点的度数最高的K个点作为初始划分点;步骤五根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分 点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点 中选择最终的划分点;步骤六根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所 述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划 分成不同的社团。与现有技术相比本专利技术的有益效果是1.本专利技术,提出了计算机的基于划分点的处理复杂网络 社团的发现方法,通过计算每个节点的度,然后选出度数最高的前K个点作为划分点,计算 量很小,无论拥有多少节点的复杂网络,社团发现结果只需要存储在几个划分点上,而不是 把每个复杂网络中的节点属于哪个社团都记录下来,并且如果原来的的网络原本就带有度 的信息,那就几乎不需要什么计算了,解决了现有技术不能够利用计算机处理大规模复杂 网络的技术问题,并能够在计算过程中节省大量的计算机存储空间,减少计算所占用的系 统资源,提高计算机的运算速度和效率;2.与现有的计算机的社团发现方法不同,当网络中增删一部分点和边时,本专利技术方法 几乎不需要重新计算,这是因为社团划分结果是根据划分点给出的,而划分点是复杂网络 中度数最高的点,增删一部分点和边几乎不会影响节点中度数最高的几个点,也就不会改 变划分点,因而具有鲁棒性;3.无论需要社团发现的网络是有向的还是无向的,边是否有权重,本专利技术方法关心的 是节点的度,因此都能适用,同时,还能根据不同的实际需求,在步骤五中采用自行设计的 度量函数对划分点进行优化选取;4.传统的计算机的社团发现算法主要分为自顶向下的递归分解和自底向上的递归聚 合方法,本专利技术方法的步骤四就是自顶向下的“分”,将整个网络分为2K个小的基本社团,实 现了向下分解和向上聚合方法的统一。具体实施例方式本专利技术,包括以下步骤步骤一建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的 元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;步骤二 确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始 划分点的值Κ=2 ;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关 系式2Κ>Μ ;步骤三编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节 点的度,所述节点的度是指该节点与其它节点相连的边的个数; 步骤四选出节点的度数最高的K个点作为初始划分点;步骤五根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分 点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点 中选择最终的划分点;步骤六根据上述步骤五本文档来自技高网...
【技术保护点】
一种复杂网络社团的发现方法,其特征在于包括以下步骤:步骤一:建立所需分析网络的邻接矩阵表示,所述网络的邻接矩阵表示是指矩阵中的元素只为0或者1,0表示行和列代表的节点不相连,1表示行和列代表的节点是相连的;步骤二:确定初始划分点的值,在没有确定的需要划分的社团数目M的情况下,取初始划分点的值K=2;在需要划分的社团的数目最多为M的情况下,初始划分点的值K,应满足关系式2↑[K]>M;步骤三:编制计算步骤一每个节点的度的计算机程序,输入计算机,计算网络中每个节点的度,所述节点的度是指该节点与其它节点相连的边的个数;步骤四:选出节点的度数最高的K个点作为初始划分点;步骤五:根据具体需要,从上述步骤四中得出的K个划分点中,选取具体需要的划分点;或设定满足特定需求的度量函数,通过度量函数所确定的条件,由计算机从初始划分点中选择最终的划分点;步骤六:根据上述步骤五得到的最后的划分点,由计算机给出最后的社团发现结果,所述最后的社团发现结果是指,将网络中的每个节点,依据其是否与所述划分点相连而被划分成不同的社团。
【技术特征摘要】
【专利技术属性】
技术研发人员:王益文,姚敏,
申请(专利权)人:浙江大学,
类型:发明
国别省市:86[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。