一种基于属性图信息的社交网络社团发现方法和系统技术方案

技术编号:26730772 阅读:17 留言:0更新日期:2020-12-15 14:31
本发明专利技术提出了一种基于属性图信息的社交网络社团发现方法和系统,包括网络构建模块、数据预处理模块、模型构建模块、模型求解模块、社团发现模块以及结果展示模块,其中,所述网络构建模块将社交网络数据构建为属性网络,数据预处理模块执行服务器计算指令,获得网络的邻接矩阵、属性关联度矩阵而隶属度矩阵,模型构建模块获取输入参数后在服务器构建关于隶属度矩阵的最优化问题,模型求解模块在得到模型构建模块构建完成的指令后开始对最优化问题进行迭代求解,计算获得最有的隶属度矩阵,社团发现模块在得到最优的隶属度矩阵后执行社团发现指令,最后将社团发现结果通过展示模块进行输出展示。本发明专利技术直接作用于带有属性的社交网络数据集合,能够针对社交网络进行社团发现功能,效果准确度高,能够解决社交网络中的社团发现问题。

【技术实现步骤摘要】
一种基于属性图信息的社交网络社团发现方法和系统
本专利技术涉及计算机数据处理
,特别涉及到社交网络中的社团发现问题。
技术介绍
目前,现有的社交网络社团发现方法仅仅主要是基于社交网络中的拓扑结构来完成社团发现工作,即仅考虑了社交网络中用户与用户之间的联系。然而,这种仅基于社交网络中拓扑结构的社团发现方法忽视了社交网络中与用户相关联的属性信息。这会使得一些具有实际意义的社团没有被发现。例如,某社交软件上的用户本着其爱好加入了一个群,但他可能和群里的任何一个人都不是好友。如果仅仅基于网络拓扑结构,这样的社团就很难被发现出来。尽管有一些额外考虑节点属性信息的社团发现方法被提出,但它们所识别的社团在准确性上的表现欠佳。
技术实现思路
针对上述缺陷和不足,本专利技术的目的在于提供一种基于属性图信息的社交网络社团发现方法和系统,通过综合考量社交网络中节点间的邻接程度和属性关联程度实现社团发现。本专利技术通过以下技术方案来实现:本专利技术公开了一种基于属性图信息的社交网络社团发现方法,包括以下步骤:步骤一,对社交网络中的数据进行预处理,其中包括:将社交网络中的用户抽象为网络中节点,获取包括所有节点构成的集合,两节点之间边构成的集合,与节点相关联的所有属性的集合;步骤二,根据步骤一预处理的结果通过应用统计学知识和信息学理论计算出所述社交网络中每对节点间的属性关联程度;步骤三,根据步骤一所得的所有节点、所有边和步骤二所得每对节点间的属性关联程度,组成节点的邻接矩阵和节点属性关联度矩阵;步骤四,定义要发现的社团数量,并根据要发现的社团数量和步骤一所得的所有节点定义节点对于社团的隶属度矩阵;步骤五,输入模型参数,基于步骤三所得节点的邻接矩阵、属性关联度矩阵和步骤四所得隶属度矩阵,构建关于隶属度矩阵的最优化问题;步骤六,求解步骤五所得求最优化问题的解,即最佳的隶属度矩阵;步骤七,根据步骤六所得最佳的隶属度矩阵,获取所发现得社团。步骤六在求解最优化问题时,采用了拉格朗日乘子法,通过引入拉格朗日乘子,构建Karush-Kuhn-Tucker(KKT)条件来获得更新公式。在初始化隶属度矩阵的情况下,根据更新公式不断地更新迭代,直到步骤五所得最优化问题的目标函数收敛。此时的隶属度矩阵作即为最佳的隶属度矩阵。本专利技术还公开了一种基于属性图信息的社交网络社团发现系统,该系统包括:网络构建模块,将包含了大量属性信息的社交网络构建成为一个属性网络;数据预处理模块,根据前一个模块中的得到的网络进行数据预处理获得节点的邻接矩阵和节点属性关联度矩阵,定义社团数量,初始化节点对于社团的隶属度矩阵;模型构建模块,输入模型参数,根据前一模块得到的邻接矩阵、属性关联度矩阵和隶属度矩阵,构建关于隶属度矩阵的最优化模型;模型求解模块,对前一模块所得最优化模型进行求解,获得最佳的隶属度矩阵;社团发现模块,根据前一模块所得的最佳的隶属度矩阵来进行社团发现。结果展示模块,将前一模块发现的社团进行输出。与现有技术相比,本专利技术具有以下有益的技术效果:本专利技术公开的一种社交网络社团发现方法从以下方面解决现有技术在社交网络社团发现时的缺陷:在算法设计过程中,利用网络拓扑结构和节点的属性信息来完成社团发现任务,通过构建最优化问题来提高社所发现社团的准确性。本专利技术还公开了能够实现上述社交网络社团发现方法的系统,系统功能主要由以下六个部分组成:网络构建模块、数据预处理模块、模型构建模块、模型求解模块、社团发现模块和结果展示模块。首先,网络构建模块将社交网络构建成为一个属性网络。其次,数据预处理模块对得到的属性网络进行预处理,获得邻接矩阵、属性关联度矩阵、社团数量和隶属度矩阵。然后,模型构建模块将所得矩阵构建成一个关于隶属度矩阵的最优化模型。随后,模型求解模块利用拉格朗日乘子对最优化模型进行求解,获得最优的隶属度矩阵。最后,社团发现模块根据最优的隶属度矩阵将节点划分到社团中来实现社团发现目的。结果展示模块则展示了社团发现的结果。附图说明图1为本专利技术基于属性图信息的社交网络社团发现系统的逻辑结构图;图2为最优化问题示意图。具体实施方式为使本专利技术的目的、技术方案及优点更加清晰明白,以下参照附图并举实施例,对本专利技术作进一步详细说明。本专利技术公开的一种基于属性图信息的社交网络社团发现系统,其功能结构如图1所示,系统功能主要由以下六个部分组成:网络构建模块、数据预处理模块、模型构建模块、模型求解模块、社团发现模块以及结果展示模块。适用于基于属性图信息的社交网络社团发现方法,包括以下步骤:步骤一,预处理社交网络中的数据,具体的,将社交网络中的用户抽象为网络中节点,将用户之间的联系抽象为网络中的边,整理获得所有节点构成的集合、所有边构成的集合、与节点相关联的所有属性的集合;步骤二,根据步骤一预处理的结果,本专利技术方法通过应用统计学知识和信息学理论计算出所述社交网络中每对节点间的属性关联程度;步骤三,根据步骤一所得的节点集合、边集合和步骤二所得每对节点间的属性关联程度,构建节点的邻接矩阵和节点属性关联度矩阵;步骤四,定义要发现的社团数量,并根据要发现的社团数量和步骤一所得的所有节点定义节点对于社团的隶属度矩阵;步骤五,输入模型参数,基于步骤三所得节点的邻接矩阵、属性关联度矩阵和步骤四所得隶属度矩阵,构建关于隶属度矩阵的带有约束的最优化问题;步骤六,对步骤五所构建的最优化问题进行求解,获得最优的隶属度矩阵;步骤七,根据步骤六所得最优的隶属度矩阵,将所有节点划分到各个社团中,获得最终所发现得社团。其中,本专利技术系统所述的最优化问题如图2所示。这里的,矩阵D和矩阵A分别为步骤三中所述的邻接矩阵和属性关联度矩阵,矩阵U为步骤四中所述的隶属度矩阵。矩阵S中的元素β,θ,为模型参数。该最优化模型可以使得发现的社团满足:社团内的用户具有紧密联系、社团内的用户属性密切相关。下面对各个模块进行具体的介绍:1、网络构建模块第一步,构建网络。将社交网络中的用户抽象为网络中节点,将用户之间的联系抽象为网络中的边。第二步,存储网络信息。整理网络所有节点构成的集合V={vi}(1≤i≤nV)、所有边构成的集合E={eij}、与节点相关联的所有属性的集合Λ={Λm}{1≤m≤nΛ}并进行存储。2、数据预处理模块第一步,获得邻接矩阵。根据前一个模块中的得到的节点集合和网络构建网络的邻接矩阵D。其中如果两个节点i和j之间存在边eij,则dij=1,否则dij=0。第二步,获得属性关联度矩阵。具体的计算属性关联度矩阵的方法如下:2-1假设valp和valq分别是属性Λm和Λn(Λm,Λn∈Λ)中的值,是分别具有属性值valp和valq的相邻节点对的数量,是任意一方具有属性值valp的相邻节点对的数量,是任意一本文档来自技高网...

【技术保护点】
1.一种基于属性图信息的社交网络社团发现方法,其包括以下步骤:/nS1.服务器对社团发现装置发出社交网络社团发现的指令;/nS2.社团发现装置装置接收社交网络中海量的数据信息,将社交网络抽象为网络数据;/nS3.社团发现装置应用统计学知识和信息学理论对网络数据进行预处理,并构建邻接矩阵、属性关联度矩阵和隶属度矩阵;/nS4.社团发现装置基于S3中的邻接矩阵、属性关联度矩阵和隶属度矩阵,构建关于隶属度矩阵的最优化模型;/nS5.针对S4中得到最优化模型,社团发现装置通过应用拉格朗日乘子法,引入拉格朗日乘子,通过Karush-Kuhn-Tucker(KKT)条件来获得更新公式。/nS6.社团发现装置初始化隶属度矩阵,基于S5得到的更新公式迭代更新隶属度矩阵直到S4中的最优化模型收敛,记录此时的隶属度矩阵作为最佳隶属度矩阵。/nS7.社团发现装置根据S6所得最佳的隶属度矩阵,获取所发现得社团。/n

【技术特征摘要】
1.一种基于属性图信息的社交网络社团发现方法,其包括以下步骤:
S1.服务器对社团发现装置发出社交网络社团发现的指令;
S2.社团发现装置装置接收社交网络中海量的数据信息,将社交网络抽象为网络数据;
S3.社团发现装置应用统计学知识和信息学理论对网络数据进行预处理,并构建邻接矩阵、属性关联度矩阵和隶属度矩阵;
S4.社团发现装置基于S3中的邻接矩阵、属性关联度矩阵和隶属度矩阵,构建关于隶属度矩阵的最优化模型;
S5.针对S4中得到最优化模型,社团发现装置通过应用拉格朗日乘子法,引入拉格朗日乘子,通过Karush-Kuhn-Tucker(KKT)条件来获得更新公式。
S6.社团发现装置初始化隶属度矩阵,基于S5得到的更新公式迭代更新隶属度矩阵直到S4中的最优化模型收敛,记录此时的隶属度矩阵作为最佳隶属度矩阵。
S7.社团发现装置根据S6所得最佳的隶属度矩阵,获取所发现得社团。


2.根据权利要求1所述的一种基于属性图信息的社交网络社团发现方法,其特征在于,步骤S2在计算属性关联度矩阵时首先考虑属性间是否存在关联,再通过信息学理论计算属性间的关联程度,最后获得节点间的属性关联程度,以满足充分考虑社交网络中与节点相关联的属性信息。


3.一种根据权利要求1-2任意一项所述的基于属性图信息的社交网络社团发现方法的社团发现装置,其特征在于,包括网络构建模块、数据预处理模块、模型构建模块、模型求解模块、社...

【专利技术属性】
技术研发人员:许明潘翔宇胡伦
申请(专利权)人:深圳市万佳安人工智能数据技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1