一种多关系社交网络的社团划分方法技术

技术编号:16970693 阅读:253 留言:0更新日期:2018-01-07 07:12
本发明专利技术属于计算机应用技术领域,公开了一种多关系社交网络的社团划分方法,所述多关系社交网络的社团划分方法包括以下步骤:首先将原始网络数据转化为相似度张量,接着建立分析模型;然后利用张量分解方法得到张量的分解结果;最后利用聚类分析方法得到社团的划分结果。本发明专利技术利用多关系网络数据进行社团划分,划分准确性优于只利用单关系数据进行社团划分的结果,而且利用的张量分解方法较传统的方法更加高效和准确;与现有的多关系网络社团划分相比能够充分利用数据信息,利用成熟的数学理论方法,得到了更好的划分结果。

【技术实现步骤摘要】
一种多关系社交网络的社团划分方法
本专利技术属于计算机应用
,尤其涉及一种多关系社交网络的社团划分方法。
技术介绍
在社交网络中人与人之间的联系往往是多种多样的,把这种包含多种社交关系的网络称为多关系社交网络,在现实生活中是普遍存在的。在多关系社交网络中,网络中的节点往往存在聚类的现象,把这种聚类当中的每一个簇叫做一个社团。Tang等人发表的文章“UncoveringGroupsviaHeterogeneousInteractionAnalysis”中研究了多关系网络的社团划分问题,然而在社团划分时未考虑各个关系之间的权重问题。多关系社交网络社团划分的关键在于如何考虑每一维度关系对社团划分的影响。本专利技术提出用具体数据来确定各个关系权重的思想,一切由数据决定。另外,目前存在的采用张量分解进行多关系社交网络社团划分的方法复杂度高,而且性能不好。综上所述,现有技术存在的问题是:在确定各个关系之间的权重时,缺少理论指导,多关系社交网络区别于单关系社交网络主要在于各个关系对于社团成型的贡献是不一样的,分析各个关系的权重是多关系社交网络社团划分的关键问题。利用传统的HOOI(HighOrderOrthogonalIteration)方法进行张量分解的社团划分方法复杂度高,不适合大规模社交网络。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种多关系社交网络的社团划分方法。本专利技术是这样实现的,一种多关系社交网络的社团划分方法,所述多关系社交网络的社团划分方法包括以下步骤:首先将原始网络数据转化为相似度张量,接着建立分析模型;然后利用张量分解方法得到张量的分解结果;最后利用聚类分析方法得到社团的划分结果。进一步,所述多关系社交网络的社团划分方法利用谱聚类的思想建立多关系社交网络社团划分的谱聚类方法,谱聚类的具体包括:对于任意的单关系网络G=(V,E),节点的数量为N,W是存储网络数据的邻接矩阵,D是一个对角阵,它的元素是节点度的数量;其中L=D-W称作拉普拉斯矩阵,而且标准化的拉普拉斯矩阵表示如下:LNcut=D-1/2LD-1/2=I-SN;其中,I是单位矩阵,SN是称作标准化的相似矩阵;SN和LNcut具有相同的特征向量,而且特征值满足对于多关系网络,对每一种维度计算相似度矩阵,根据谱聚类的方法可以建立如下的分析模型:s.t.UTU=I其中,trace(·)算子是求矩阵的迹,是松弛分配矩阵,M为社团数量。由于SN是半正定矩阵,问题转化为Frobenius范数分析模型:s.t.UTU=I其中,表示二范数算子;通过对问题的求解得到U矩阵,通过对U矩阵进行聚类分析得到社团的划分结果。进一步,所述多关系社交网络的社团划分方法具体包括以下步骤:步骤一,原始网络数据转化为相似度张量,并建立优化问题;步骤二,相似度张量的分解,采用张量分解的方法对相似度张量进行分解,在实际应用中根据不同的需求选择具体的张量分解方法;步骤三,聚类分析,对于得到的U矩阵进行聚类分析,得到社团的划分结果。进一步,所述步骤一具体包括:(1)多关系网络以不同的观测维度可以得到类似于单关系网络对象的相似度矩阵,所有K个观察角度可以得到K个相似度矩阵,相似度张量的生成过程是将K个相似度矩阵叠加在一起,每种关系矩阵构成张量;(2)在多关系网络中,每种关系对网络聚类的贡献或影响是不一样的,每种关系对网络聚类的影响由数据决定,每种关系对网络聚类的权重朝着网络聚类结果更明显的方向调整;进一步,参照单目标关系网络的谱聚类优化问题建立多关系网络的谱聚类分析模型:其中,wk为每个维度上的权重因子,对于K种关系的权重,归一化处理,建立多关系的谱聚类问题。进一步,所述步骤二具体包括:(a)用Tucker分解来分解张量,对得到的相似度张量,采用Tucker分解来解决原始问题,如下式:分别表示张量与UT进行模1乘积、与UT进行模2乘积、与WT进行模3乘积;(b)对于Tucker分解的方法,如下式:本专利技术的另一目的在于提供一种应用所述多关系社交网络的社团划分方法的社交网络。本专利技术的优点及积极效果为:利用本专利技术可以得到多关系网络的社团划分结果,由于多关系社交网络包含丰富的社会信息,因此多关系网络的社团划分更加真实地反映了社团结构。本专利技术利用多关系网络数据进行社团划分,划分准确性优于只利用单关系数据进行社团划分的结果,而且利用的张量分解方法较传统的方法更加高效和准确;与现有的多关系网络社团划分相比能够充分利用数据信息,利用成熟的数学理论方法,得到了更好的划分结果。从图6中也可以看出利用HOOI方法进行社团划分的NMI性能优于KPFCMP;CrNc-BB和CrNc-comb是两种CrNc方法计算最优步长的两种方法,从图7中可以看出,CrNc方法的性能优于HOOI方法。附图说明图1是本专利技术实施例提供的多关系社交网络的社团划分方法流程图。图2是本专利技术实施例提供的三阶张量的矩阵展开示意图。图3是本专利技术实施例提供的相似度张量来表示示意图。图4是本专利技术实施例提供的Tucker分解的形式示意图。图5是本专利技术实施例提供的采用NMI准则来衡量示意图。图6是本专利技术实施例提供的利用单维数据进行社团划分的NMI和利用多维网络数据进行社团划分的NMI示意图。图7是本专利技术实施例提供的HOOI算法和CrNc算法的运行时间对比示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面结合附图对本专利技术的应用原理作详细的描述。如图1所示,本专利技术实施例提供的多关系社交网络的社团划分方法包括以下步骤:S101:将原始网络数据转化为相似度张量,接着建立分析模型;S102:利用张量分解方法得到张量的分解结果;S103:利用聚类分析方法得到社团的划分结果。本专利技术实施例提供的多关系社交网络的社团划分方法的多关系社交网络包含丰富的网络信息,为了完整的描述网络信息,采用张量来存储多关系网络。在单关系社交网络中,谱聚类可以得到很好的社团划分结果,而且计算复杂度低。本专利技术是利用谱聚类的思想建立多关系社交网络社团划分的谱聚类方法,谱聚类的具体流程如下:对于任意的单关系网络G=(V,E),节点的数量为N,W是存储网络数据的邻接矩阵,D是一个对角阵,它的元素是节点度的数量。其中L=D-W称作拉普拉斯矩阵,而且标准化的拉普拉斯矩阵表示如下:LNcut=D-1/2LD-1/2=I-SN\*MERGEFORMAT(1)其中,I是单位矩阵,SN是称作标准化的相似矩阵。SN和LNcut具有相同的特征向量,而且特征值满足这样的关系。对于多关系网络,本专利技术对每一种维度计算相似度矩阵,具体的问题建立可以根据具体的实际数据。下面本专利技术给出一个例子,根据谱聚类的方法可以建立如下的分析模型:其中,trace(·)算子是求矩阵的迹,是松弛分配矩阵,M为社团数量。由于SN是半正定矩阵,上面的问题可以转化为Frobenius范数分析模型:其中,表示二范数算子。通过对问题的求解可以得到U矩阵,通过对U矩阵进行聚类分析得到社团的划分结果。下面结合附图对本专利技术的应用原理作进一步的描述。1、张量背景知识介绍张量就是高维数组,一维数组叫作本文档来自技高网...
一种多关系社交网络的社团划分方法

【技术保护点】
一种多关系社交网络的社团划分方法,其特征在于,所述多关系社交网络的社团划分方法包括以下步骤:首先将原始网络数据转化为相似度张量,接着建立分析模型;然后利用张量分解方法得到张量的分解结果;最后利用聚类分析方法得到社团的划分结果。

【技术特征摘要】
1.一种多关系社交网络的社团划分方法,其特征在于,所述多关系社交网络的社团划分方法包括以下步骤:首先将原始网络数据转化为相似度张量,接着建立分析模型;然后利用张量分解方法得到张量的分解结果;最后利用聚类分析方法得到社团的划分结果。2.如权利要求1所述的多关系社交网络的社团划分方法,其特征在于,所述多关系社交网络的社团划分方法利用谱聚类的思想建立多关系社交网络社团划分的谱聚类方法,谱聚类的具体包括:对于任意的单关系网络G=(V,E),节点的数量为N,W是存储网络数据的邻接矩阵,D是一个对角阵,它的元素是节点度的数量;其中L=D-W称作拉普拉斯矩阵,而且标准化的拉普拉斯矩阵表示如下:LNcut=D-1/2LD-1/2=I-SN;其中,I是单位矩阵,SN是称作标准化的相似矩阵;SN和LNcut具有相同的特征向量,而且特征值满足对于多关系网络,对每一种维度计算相似度矩阵,根据谱聚类的方法可以建立如下的分析模型:其中,trace(·)算子是求矩阵的迹,是松弛分配矩阵,M为社团数量。由于SN是半正定矩阵,问题转化为Frobenius范数分析模型:其中,表示二范数算子;通过对问题的求解得到U矩阵,通过对U矩阵进行聚类分析得到社团的划分结果。3.如权利要求1所述的多关系社交网络的社团划分方法,其特征在于,所述多关系社交网络的社团划分方法具体包括以下步骤:步骤一,原始网络数据转化为相似度张量,并建立优化问题...

【专利技术属性】
技术研发人员:刘雪芳李国伟杨清海
申请(专利权)人:西安电子科技大学西安中电科西电科大雷达技术协同创新研究院有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1