社团发现方法及系统技术方案

技术编号:10405148 阅读:116 留言:0更新日期:2014-09-10 14:15
本发明专利技术涉及一种社团发现方法及系统,所述方法包括:根据一有向加权图中多个节点之间的关系建立一邻接矩阵;对所述邻接矩阵进行预处理,得到一输入矩阵;对所述输入矩阵进行非负矩阵分解;获取所述多个节点与至少一社团之间的关系;根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点。本发明专利技术通过对有向加权图进行邻接矩阵转换和非负矩阵分解等处理,得到所述有向加权图中各节点与至少一社团之间的关系,进而方便、准确地确定所述至少一社团的结构。

【技术实现步骤摘要】
社团发现方法及系统
本专利技术涉及数据处理技术,尤其涉及一种社团发现方法及系统。
技术介绍
随着互联网规模的不断扩大和应用领域的日益扩张,社交网络的应用越来越广泛,在社交网络中,节点之间的相互连接、影响,形成许多社团结构。社团内的节点相互联系密切,相互共享信息或者进行合作,如微博、Facebook(脸谱)、Twitter(推特)等网络应用中,有共同兴趣的节点相互分享视频、评论等信息,形成一种社团结构。近年来不断复杂的网络结构,使得网络中隐含大量社团信息,通过挖掘社团结构,可以对网络属性和行为进行研究,有效控制网络的发展。因此如何从复杂网络中准确的发现社团成为亟待解决的问题。
技术实现思路
有鉴于此,本专利技术的一个目的是提供一种社团发现方法及系统,以准确的从复杂的网络中发现社团信息,为网络属性和行为的进一步研究做好准备。为解决上述技术问题,一方面,本专利技术提供了一种社团发现方法,包括:根据一有向加权图中多个节点之间的关系建立一邻接矩阵;对所述邻接矩阵进行预处理,得到一输入矩阵;对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系;根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点。另一方面,本专利技术还提供了一种社团发现系统,包括:邻接矩阵建立模块,用于根据一有向加权图中多个节点之间的关系建立一邻接矩阵;预处理模块,用于对所述邻接矩阵进行预处理,得到一输入矩阵;非负矩阵分解模块,用于对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系;社团确定模块,用于根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点。根据本专利技术的上述技术方案中至少一个技术方案通过对有向加权图进行转换和处理,得到所述有向加权图中各节点与至少一社团之间的关系,进而方便、准确地确定所述至少一社团的结构。附图说明图1a和图1b分别为本专利技术实施例的一种社团发现方法的流程图;图2为本专利技术实施例的一种有向加权图的结构示意图;图3为与图2所示的有向加权图对应的邻接矩阵的示意图;图4为本专利技术实施例的另一种社团发现方法的流程图;图5为本专利技术实施例的又一种社团发现方法的流程图;图6为本专利技术实施例的一种社团发现系统的结构示意框图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细说明。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。如图1a和1b所示,本申请实施例提供了一种社团发现方法,包括:S110根据一有向加权图中多个节点之间的关系建立一邻接矩阵;S120对所述邻接矩阵进行预处理,得到一输入矩阵;S130对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系;S140根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点。本申请实施例通过对有向加权图进行邻接矩阵转换和非负矩阵分解等处理,得到所述有向加权图中各节点与至少一社团之间的关系,进而方便、准确地确定所述至少一社团的结构。通过下面的实施方式进一步说明本申请实施例方法中的各步骤:S110根据一有向加权图中多个节点之间的关系建立一邻接矩阵。以一有向加权图中有n个节点为例,所述邻接矩阵G则为一个n行n列的矩阵,其元素gij表示第i个节点与第j个节点之间关系的权重大小,其中i和j不大于n,并且i=j时,gij=0。例如,所述第i个节点与所述第j个节点之间有且仅有从所述第i个节点到所述第j个节点的链接关系,并且权重为1,则所述元素gij为1,元素gji为0。由有向加权图建立所述邻接矩阵具体可以参见图2和实施例,这里不再赘述。S120对所述邻接矩阵进行预处理,得到一输入矩阵。由于对矩阵进行转置变换,并不改变节点属于哪个社团的特性,只是将社团之间的关系结构进行了转置变换,因此在本申请实施例一种可能的实施方式中,所述步骤S120包括:将所述邻接矩阵与所述邻接矩阵的转置相加,得到所述输入矩阵。可以通过下面的公式表示:A=G+GT其中,A为所述输入矩阵。S130对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系。在本申请实施例的一种可能的实施方式中,所述非负矩阵分解为三项非负矩阵分解。所述对所述输入矩阵进行非负矩阵分解包括:对所述邻接矩阵进行三项非负矩阵分解,得到G≈XSXT;根据所述邻接矩阵的三项非负矩阵分解得到所述输入矩阵的三项非负矩阵分解:A=XSXT+XSTXT=X(S+ST)XT其中:X为用于指示所述多个节点与所述至少一社团之间的关系的社团指示矩阵,其元素xij表示第i个节点属于第j个社团的数值大小;S为用于指示所述至少一社团之间的社团关系的社团关系矩阵,其元素sij表示第i个社团与第j个社团的密切程度。由于社团指示矩阵X包含有更丰富的节点之间的连接关系权重,因此,输入矩阵A中的元素aij更能准确反映节点之间的链接关系大小。其中,对于aij∈A:当i=j时,∵gij=0,∴aij=0,当i≠j时,aij=gij+gji,若gij=gji=0,则aij=0,说明i节点和j节点没有链接关系;若gij=0,gji≠0,则aij=gji,说明j节点到i节点有链接关系,关系的强弱由gji值决定;若gji=0,gij≠0,则aij=gij,说明j节点到i节点有链接关系,关系的强弱由gij值决定;若gij≠0,gji≠0,则aij=gij+gji,说明j节点与i节点有双向链接关系,强弱由gij+gji值决定;aij=xij(sij+sji)xji,此时,节点属于哪个社团仍由xij决定,社团之间的结构由sij+sji共同决定。得到上面的输入矩阵A的三项分解表示后,所述步骤S130中所述计算得到所述多个节点与至少一社团之间的关系包括:通过一目标函数对非负矩阵分解后的所述输入矩阵进行计算,得到所述多个节点与至少一社团之间的关系。在本申请实施例一种可能的实施方式中,所述目标函数为:满足:0≤X≤I;W≥0;(WK)οI≥0;(KW)οI≥0;ο为向量形式的数据的内积运算符号;其中||||F为F范数,||||1为l1范数,λ为用来平衡所述社团指示矩阵X和近似精度的平衡值,I为单位矩阵,B是A的近似矩阵,表示对A的近似,可以表示为B=XWXT,K是社团数量,对称矩阵W=S+ST。通过上述的目标函数,可以得到所述社团指示矩阵X各元素的值。由于所述社团指示矩阵X中的元素xij表示第i个节点属于第j个社团的大小,对于一个社团指示矩阵Xn×k,其中n表示所述有向加权图中有n个节点,k表示所述有向加权图中包含k个社团,则对于一个节点i,其属于所述k个社团的大小分别为xi1、xi2…xik。其中,取与节点i相关的多个元素中,上述值最大的元素对应的社团即为所述节点所属的社团。具体参见下面所述的实施例:以图2所示的网络中经常使用的Zacharykarate有向加权图的数据集为例,该数据集反映了美国一个karate俱乐部内34个成员(即n为34)之间的关系连接,这34个成员可以分为两个社团(即k为2)。根据图2所示的有向加权图,可以得到如图3所示的邻接矩阵G,其中最上面一行和最左边一行为节点号,其它数值为所述邻接矩阵G的元素。将所述邻本文档来自技高网...
社团发现方法及系统

【技术保护点】
一种社团发现方法,其特征在于,包括:根据一有向加权图中多个节点之间的关系建立一邻接矩阵;对所述邻接矩阵进行预处理,得到一输入矩阵;对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系;根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点。

【技术特征摘要】
1.一种社团发现方法,其特征在于,包括:根据一有向加权图中多个节点之间的关系建立一邻接矩阵;对所述邻接矩阵进行预处理,得到一输入矩阵;对所述输入矩阵进行非负矩阵分解,并计算得到所述多个节点与至少一社团之间的关系;根据所述多个节点与所述至少一社团之间的关系确定所述至少一社团中的每个社团包含的所有节点;所述非负矩阵分解为三项非负矩阵分解;所述对所述输入矩阵进行非负矩阵分解包括:对所述邻接矩阵进行三项非负矩阵分解,得到G≈XSXT;根据所述邻接矩阵的三项非负矩阵分解得到所述输入矩阵的三项非负矩阵分解:A=XSXT+XSTXT=X(S+ST)XT其中,G为所述邻接矩阵,X为用于指示所述多个节点与所述至少一社团之间的关系的社团指示矩阵,S为用于指示所述至少一社团之间的社团关系的社团关系矩阵,A为所述输入矩阵。2.如权利要求1所述的方法,其特征在于,所述对所述邻接矩阵进行预处理,得到一输入矩阵包括:将所述邻接矩阵与所述邻接矩阵的转置相加,得到所述输入矩阵。3.如权利要求1所述的方法,其特征在于,所述计算得到所述多个节点与至少一社团之间的关系包括:通过一目标函数对非负矩阵分解后的所述输入矩阵进行计算,得到所述多个节点与至少一社团之间的关系。4.如权利要求3所述的方法,其特征在于,所述目标函数为:满足:0≤X≤I;W≥0;为向量形式的数据的内积运算符号;其中||||F为F范数,||||1为l1范数,λ为用来平衡所述社团指...

【专利技术属性】
技术研发人员:朱军
申请(专利权)人:南京泰锐斯通信科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1