基于联合贝叶斯生成模型的社团检测和语义识别的方法技术

技术编号：22817669 阅读：36 留言：0更新日期：2019-12-14 13:21

本发明专利技术属于复杂网络领域，具体涉及一种基于联合贝叶斯生成模型的社团检测和语义识别的方法，该方法包括如下步骤：S1属性网络的定义、S2联合贝叶斯生成模型、S3模型的优化过程。本发明专利技术对构建的属性网络进行社团检测，并且给出每个社团的语义描述。同时对网络的结构以及网络中节点的属性进行建模，并且给出结构社团与属性主题之间的关系。

Community detection and semantic recognition based on joint Bayesian generation model

全部详细技术资料下载

【技术实现步骤摘要】
基于联合贝叶斯生成模型的社团检测和语义识别的方法
本专利技术属于复杂网络领域，具体涉及融合网络结构和属性的广义社团检测和社团语义识别的方法。
技术介绍
近年来，随着大数据时代的到来以及获取数据渠道的多样化，现实世界中复杂系统的大量数据都可以得到。复杂网络通常作为复杂系统的有力表示，例如社交网络、生物网络、文献网络等。我们不仅可以获得复杂系统中多种多样的实体，还能获得对这些实体的多样描述，属性复杂网络通常用来研究和分析这些数据。识别网络中的社团结构以及社团的语义特征是复杂网络分析中的重要任务。国内外学者社团检测问题进行了大量的研究，提出了一些经典的方法。例如，层次聚类的方法，模块度优化的方法，统计推理的方法，谱方法，生成模型，马尔科夫动态的方法等。真实的网络往往具有多种多样的内在结构规则，传统的已提出的社团检测方法仅仅适用于同构的社团结构，现实的网络可能具有异构结构(二分结构)，混合结构(同时混合同构和异构结构规则)以及其他类型的结构。因此，广义社团检测是当前社团检测任务所面临的新的挑战。同时，在属性网络中节点的属性提供了节点及网络的潜在语义信息，当网络的结构与节点的属性同时应用于社团检测时，缺失的结构信息能够得到补充同时能够进行更深层次的社团检测。同一个社团中的节点所具有的属性，可以为社团提供语义描述，这些描述可以帮助解释为何一些确定的节点能够划分到同一个社团以及划分的社团的具体语义。Newman等人提出了一个混合模型来探索网络的结构规则，他们对社团与节点之间的关系进行建模，能够检测具有多种规则的网络

【技术保护点】
1.基于联合贝叶斯生成模型的社团检测和语义识别的方法，其特征在于，该方法包括如下步骤：/nS1：属性网络的定义：/n(1)将具有N个节点和M个属性的属性网络G定义为一个N×N维的邻接矩阵A和N×M的属性矩阵X；/n(2)邻接矩阵A中a

【技术特征摘要】
1.基于联合贝叶斯生成模型的社团检测和语义识别的方法，其特征在于，该方法包括如下步骤：
S1：属性网络的定义：
(1)将具有N个节点和M个属性的属性网络G定义为一个N×N维的邻接矩阵A和N×M的属性矩阵X；
(2)邻接矩阵A中aij＝1表示节点vi和vj之间有连边，aij＝0表示vi和vj之间没有连边；属性矩阵X中xit＝1表示节点vi具有第t个属性wt；
S2：联合贝叶斯生成模型：
(1)模型参数的定义：模型主要包括三种类型的变量：观测变量、潜在变量和模型参数；
观测变量：社团数目K,节点数目N,属性数目M,邻接矩阵A和属性矩阵X；
潜在变量：社团标签z，主题标签g；
模型参数：π＝(πr)1×N,πr表示社团r中的节点所占的比例；
θ＝(θrj)K×N，θrj表示社团r中的节点和节点vj连接的概率；
η＝(ηks)K×K，ηks是节点vi属于第r个社团，主题是s的概率；Ф＝(Фst)K×M，Фst是主题s生成属性wt的概率；
α,β,γ,ξ属于模型的超参数；
(2)模型定义：
定义了参数η＝(ηks)K×K，网络中的一个社团可能会具有多个主题，社团和主题并不是相互匹配的关系，ηr代表了社团r的主题分布；
当一个节点的社团标签确定之后，利用转移矩阵来获得节点属性的主题，然后根据参数Ф来生成节点的属性；
(3)模型的生成过程：
a)从以α为参数的狄利克雷分布中生成参数π
b)对于每个社团r属于{1，2…K}
i.从以β为参数的狄利克雷分布中生成参数θr
ii.从以γ为参数的狄利克雷分布中生成参数ηr
c)对于每个主题s
i.从以ξ为参...

【专利技术属性】
技术研发人员：朱莹莹，戴维迪，焦鹏飞，王文俊，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人