当前位置: 首页 > 专利查询>天津大学专利>正文

动态异质网络演化聚类分析方法技术

技术编号:20724952 阅读:28 留言:0更新日期:2019-03-30 17:42
本发明专利技术公开一种动态异质网络演化聚类方法,主要步骤有,首先研究数据的数据及处理:具体为确定所需研究领域,获取期刊数据;提取研究字段;对获取得数据字段进行提取研究主题,消除无意义词以及常用词。其次是动态异质网络演化聚类。本发明专利技术构建动态异质网络的演化聚类框架,旨在对异构网络进行演化分析。通过对其进行分析,得到不同时刻的书目网络的聚类结果,从而可以分析不同类型实体之间的演化趋势,发现网络的出现、消失、合并、分离等演化行为。最后结合现有领域知识,分析网络演化原因与未来发展趋势。通过对书目网络进行全面的分析,可以为领域研究提供有价值的信息,指导未来领域研究发展。

【技术实现步骤摘要】
动态异质网络演化聚类分析方法
本专利技术属于复杂网络领域,具体涉及一种动态异质网络演化聚类分析方法。
技术介绍
近年来,随着诸如社交网络、生物网络、书目网络等网络规模的不断扩大,研究人员从不同的角度对这些网络进行研究。这些网络有共同的属性,即它们包含不同类型的实体。与广泛研究的同构信息网络相比,异构网络包含了全面的结构信息和丰富的语义信息,为数据挖掘任务提供了新的机遇。与传统的聚类方法不同,动态异构信息网络考虑了不同对象的类型,对不同类型节点进行聚类分析,并分析其演化行为,使得分析结果更具有一般性。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种动态异质网络演化聚类方法。本专利技术为解决上述
技术介绍
中提出的技术问题,采用的技术方案是:动态异质网络演化聚类方法,该方法包括如下步骤:S1:研究数据的获取及处理:(1)确定需要研究的领域,提取领域期刊数据;(2)提取所需研究字段;(3)对获取的字段进行预处理;S2:动态异质网络演化聚类:(1)对预处理所得的数据,确定不同时间片的网络快照;(2)在第一个时刻,根据经验知识确定先验概率,将网络初始化为k类,在其他时刻,先验概率为将前一时刻的聚类作为下一时刻的先验分布;(3)为每个聚类建立基于排序的概率生成模型,即可以通过调整相应聚类中对象的类型类分解相应的概率;(4)为每种对象类型计算后验概率P(ck|o),可以通过以下方式来计算:pt(ck|o)∝p(o|ck)×pt(ck);(5)一旦后验概率计算完成,对象o可以使用一个向量进行表示v0=(P(c1|o),P(c2|o),...,P(cK|o)),通过使用先前的聚类分配,聚类之心的向量v为该聚类对象的平均值,通过使用v0和聚类质心之间的余弦相似度值,将对象o重新分配到每个聚类中;(6)迭代第三步和第四步,直到聚类结果不会发生变化;(7)返回聚类结果,并根据聚类结果,分析每个时间片的成员聚类,通过结合现有知识,分析产生聚类的原因,进一步了解发展现状,指导未来研究。本专利技术步骤S1(1)中确定需要研究的领域提取领域期刊数据。本专利技术步骤S1(2)中研究字段包括论文、作者、时间、发表期刊/会议,主题词字段。本专利技术步骤S1(3)中预处理包括去除无意义词和重复词。有益效果1、本专利技术构建动态异质网络的演化聚类框架,旨在对异构网络进行演化分析。以书目网络为例,构建并分析诸如作者,会议/期刊,文献和术语不同实体之间的关系。如每个作者与论文之间的书写关系,文献与会议之间的发布关系及论文与其包含每个术语之间的包含关系,其异构网络如附图所示。通过对其进行分析,得到不同时刻的书目网络的聚类结果,从而可以分析不同类型实体之间的演化趋势,发现网络的出现、消失、合并、分离等演化行为。最后结合现有领域知识,分析网络演化原因与未来发展趋势。通过对书目网络进行全面的分析,可以为领域研究提供有价值的信息,指导未来领域研究发展。2、本专利技术对构建的动态异构网络进行演化聚类分析,得到不同类型的节点的演化行为,可以识别社区的诞生、延续及缓慢消失等演化行为。以书目网络为例进行实证分析,将作者、会议、术语、论文这些不同实体的节点构建在一个异构网络中,对其进行演化分析,可以发现领域研究趋势及演化行为。通过各个类型的节点聚类结果的相互影响,提高聚类效果,有利于进一步的分析研究。附图说明图1是书目网络。具体实施方式下面结合附图和具体实施例对本专利技术技术方案作进一步详细描述,所描述的具体实施例仅对本专利技术进行解释说明,并不用以限制本专利技术。本专利技术通过构建书目网络演化聚类模型,对网络进行全面的分析。该技术主要应用于对某学科领域发展的梳理,在对书目网络进行分析时,可以按照下面的步骤进行:第一步:确定所需研究领域,获取期刊数据;第二步:提取研究字段,这里研究字段为作者、文献发表时间、发表所在期刊/会议、文献主题词;第三步:对获取的数据字段进行预处理,这个包括我们从论文的标题中提取其研究主题,消除无意义词以及常用词;第四步:根据节点之间的关系,构建动态异质网络,其中节点分别为作者、时间、期刊/会议、主题词,边为每个作者与论文之间的书写关系,论文与期刊/会议之间的发表关系,论文与每个术语之间的包含关系,通过构建的动态异构网络来分析网络中各类节点及其整个网络的演化模式;第五步:将网络划分时间片,在第一个时间步中,初始网络聚类数量k由经验确定,在其它时刻,将前一个时刻的聚类结果作为下一时刻的先验,保证聚类结果一致性;第六步:为每个聚类建立基于排序的概率生成模型可以通过调整聚类中对象的类型来分解相应的概率,将P(o|ck)分解为P(o|T0,ck)与P(T0|ck)的乘积。其中P(T0|ck)可以使用表示为在我们构建的异构网络中,类型为T0的对象在聚类结果ck中的最大似然。P(o|T0,ck)可以使用简单的排序算法进行计算;第七步:为目标对象计算后验概率pt(ck|o),并且调整其聚类分配;第八步:迭代第六步和第七步,直到聚类结果不会发生变化;第九步:返回聚类结果;第十步:根据聚类结果,分析每个时间片上的成员聚类,并分析其网络演化。对每种节点类型分别进行分析,分析作者关系的聚类演化。以下详细描述本专利技术的实现过程:研究数据的获取和处理:本专利技术以书目网络数据为例,提取基因编辑与和合成生物期刊数据,进行网络建模分析。首先是数据获取,根据确定的研究领域在LetPub检索对应的期刊,确定该领域期刊列表,获取期刊数据。其次,进行数据处理,提取分析所需字段,分别为文献、作者、期刊、术语、发表年份。构建数据之间的对应关系,每篇文献与其发文的每个作者相对应,与发表所在的期刊相对应,与包含的每个术语相对应。对数据集中的每篇文献对象,提取其作者列表、期刊列表、文献题目列表、文献中术语列表,并构建数据之间的关系。基于此,构建的数据文件为author.txt、conf.txt、paper.txt、paper_author.txt、paper_conf.txt、paper_conf.txt、paper_year.txt、term.txt。对于提取的term.txt,删除无意义的词及常用词,并且进行单复数的合并操作。接下来,对于提取的字段进行建模分析。动态异质网络演化聚类:对于给定的数据,确定不同时刻的图的快照,在每个图上都包含多种类型的节点,我们找到连续时间快照中,网络的关联关系,从而确定网络的演化。这里定义GS为划分的图序列,表示不同时刻的网络状态。对于任意时间片上的网络Gi(Ei,Vi,Wi),其中Ei表示时刻i不同类型的节点集合,Vi表示时刻i不同节点对应的连接关系,Wi表示时刻i不同连接边对应的权重。本文使用当前时间快照中获得的簇分布作为下一个聚类分析的先验,从而保证了时间的平滑,使得分析结果有更高的一致性。下面对算法进行一个详细的说明.第一步:在第一个时刻中,先验概率由经验来确定,可以根据对数据研究领域的了解,将数据初始化为k类,在其它时刻,先验概率为表示前一时刻的网络中簇的划分。把前一时刻的聚类结果作为下一时刻的先验,保证了时间平滑性,提高网络聚类一致性,有利于网络演化的分析。第二步:为每个聚类建立基于排序的概率生成模型,即可以通过调整相应聚类中对象的类型来分解相应的概率。这里可以将P(o|c本文档来自技高网...

【技术保护点】
1.动态异质网络演化聚类分析方法,其特征在于,该方法包括如下步骤:S1:研究数据的获取及处理:(1)确定需要研究的领域,提取领域期刊数据;(2)提取所需研究字段;(3)对获取的字段进行预处理;S2:动态异质网络演化聚类:(1)对预处理所得的数据,确定不同时间片的网络快照;(2)在第一个时刻,根据经验知识确定先验概率,将网络初始化为k类,在其他时刻,先验概率为

【技术特征摘要】
1.动态异质网络演化聚类分析方法,其特征在于,该方法包括如下步骤:S1:研究数据的获取及处理:(1)确定需要研究的领域,提取领域期刊数据;(2)提取所需研究字段;(3)对获取的字段进行预处理;S2:动态异质网络演化聚类:(1)对预处理所得的数据,确定不同时间片的网络快照;(2)在第一个时刻,根据经验知识确定先验概率,将网络初始化为k类,在其他时刻,先验概率为将前一时刻的聚类作为下一时刻的先验分布;(3)为每个聚类建立基于排序的概率生成模型,即可以通过调整相应聚类中对象的类型类分解相应的概率;(4)为每种对象类型计算后验概率P(ck|o),可以通过以下方式来计算:pt(ck|o)∝p(o|ck)×pt(ck);(5)一旦后验概率计算完成,对象o可以使用一个向量进行表示v0=(P(c1|o),P(c2|o),......

【专利技术属性】
技术研发人员:戴维迪李胜男
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1