一种社团挖掘方法技术

技术编号：14211596 阅读：156 留言：0更新日期：2016-12-18 20:55

一种社团挖掘方法，用以加强马尔可夫聚类算法正反馈机制，使得算法的准确率和效率都得到提升。包括：S1、模拟网络中流的随机流动，即基于T的M随机流动，其中T为流的转移矩阵，M为流的分布矩阵；S2、执行所述M到所述T的反馈操作；S3、执行所述T的正则化操作；S4、计算所述M在当前时间步长中的变化量；S5、判断所述的变化量是否达到阈值，若是，则转入步骤S6，否则，转入步骤S1；S6、归结并输出社团。本发明专利技术对正则马尔可夫聚类算法中正反馈系统进行增强，提出了一种新的社团挖掘方法(P‑MCL)，具有更高的准确率和更少的时间消耗。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及软件算法领域，尤其是一种社团挖掘方法。
技术介绍
现实世界中有许多复杂的系统可以用复杂网络表示，如社交网络、生物网络、蛋白质网络等等。社团结构是复杂网络的一个重要性质，对于分析网络功能，解释网络表征有重要的作用。由于社团结构的重要作用，学者们提出了很多算法进行社团挖掘，包括基于优化的方法，基于模型的方法，谱方法等。基于优化的方法通常用一个基于网络拓扑结构的评价函数作为目标函数，如模块度Q。之后，基于现有的搜索算法，如蚁群算法、遗传算法等等，寻找使得目标函数达到最大值的社团划分。基于随机分块(Stochastic block)的社团挖掘算法是一种典型的基于模型的方法。该模型将拓扑性质相似的点逐步合并，形成最终的社团。谱方法包含所有基于网络的邻接矩阵特征值的方法。以基于Laplace矩阵的谱方法为列，先求出Laplace矩阵的特征值和特征向量，并找出第二小的特征值对应的特征向量。该特征向量中正元素所对应的节点组成一个社团，负元素所对应的节点组成另一个社团。如果需要将一个网络分成两个以上的社团，则重复以上步骤。这些算法的易用性和效率限制了它们的应用。马尔可夫聚类算法是一类通过模拟一种特殊的网络中的流扩散行为进行图聚类方法。得益于其高效和易用性，此算法在生物信息学领域得到广泛应用。但该类算法的效率和准确性同样有待提高。马尔可夫聚类算法的核心机制是一个正反馈系统。通过进一步实验发现，现有马尔可夫聚类算法的正反馈系统可以进一步加强，从而提高算法的准确性和效率。如何加强其正反馈机制，使得算法的准确率和效率都得到提升，是当前亟待解决的问题。【专利技...
一种社团挖掘方法

【技术保护点】
一种社团挖掘方法，其特征在于，包括下列步骤：S1、模拟网络中流的随机流动，即基于T的M随机流动，其中T为流的转移矩阵，M为流的分布矩阵；S2、执行所述M到所述T的反馈操作；S3、执行所述T的正则化操作；S4、计算所述M在当前时间步长中的变化量；S5、判断所述的变化量是否达到阈值，若是，则转入步骤S6，否则，转入步骤S1；S6、归结并输出社团。

【技术特征摘要】
1.一种社团挖掘方法，其特征在于，包括下列步骤：S1、模拟网络中流的随机流动，即基于T的M随机流动，其中T为流的转移矩阵，M为流的分布矩阵；S2、执行所述M到所述T的反馈操作；S3、执行所述T的正则化操作；S4、计算所述M在当前时间步长中的变化量；S5、判断所述的变化量是否达到阈值，若是，则转入步骤S6，否则，转入步骤S1；S6、归结并输出社团。2.如权利要求1所述的社团挖掘方法，其特征在于，所述步骤S1中具体采用马尔可夫概率转移方式模拟网络中流的随机流动；在t时刻，流的分布矩阵表示为Mt，流的转移矩阵表示为Tt，则游走步长l的随机流动通过M与T之间的矩阵连乘实现，具体参见公式1：3.如权利要求1所述的社团挖掘方法，其特征在于，步骤S2中执行所述M到T的反馈流，具体参见公式2：Tt+1(i，j)＝(1-λ)[Mt+1(i，j)]u+λTt 公式2；公式2中λ控制该反馈流对T的影响程度，u控制反馈流M元素差异性的放大程度。4.如权利要求1所述的社团挖掘方法，其特征在于，步骤S3中执行所述T的正则化操作，具体参见公式3：5.如权利要求1所述的社团挖掘方法，其特征在于，步骤S4中计算所述M在当前时间步长中的变化量，具体取所述M中元素在单步迭代过程中的最大值作为变化量，该变化量以Energy表示，参见公式4：6.如...

【专利技术属性】
技术研发人员：李向华，梁鸣心，高超，张自力，
申请(专利权)人：西南大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人