基于融合结构特征的属性网络表示学习方法技术

技术编号:21629655 阅读:32 留言:0更新日期:2019-07-17 11:19
本发明专利技术涉及网络表示学习领域,提供一种基于融合结构特征的属性网络表示学习方法,包括:步骤1,获取网络图数据;步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型;步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型;步骤4,将步骤2得到的属性模型和步骤3得到的结构模型进行联合建模,得到最小化目标函数;步骤5,设置学习过程的终止条件;步骤6,根据步骤4得到的最小化目标函数和步骤5设置的终止条件,求得最小化目标函数的解,得到学习到的特征结果。本发明专利技术能够使节点属性的相似性更好的表示到嵌入向量的相似性当中,提高网络节点分类的精确性和可靠性。

Attribute Network Representation Learning Method Based on Fusion of Structural Features

【技术实现步骤摘要】
基于融合结构特征的属性网络表示学习方法
本专利技术涉及网络表示学习领域,尤其涉及一种基于融合结构特征的属性网络表示学习方法。
技术介绍
社会生活中各种网络形式的存在,使得众多学者们开始涌向去分析网络,挖掘出所需要的信息。比如,社交网络中用户与用户之间的相互关注和互相添加好友的形式便可形成一个网络,通过该网络,我们可以挖掘出用户与用户之间的相关性和对用户聚类产生多个社区,便于后期的好友推荐、可能感兴趣的文章的推荐以及商品推荐等。学术网络中,文章与文章的引用和学者间的相互合作形成了两种不同类型的网络,通过分析这两个网络,我们可以知道文章所属的学科、分析学者们的合作模式、为学者推荐可能感兴趣的文章以及推测哪两个学者未来可能存在合作关系。对于这些网络的分析,传统的方法往往基于图的结构数据。比如在聚类和社区发现中,先前学者们主要是通过矩阵分解的方法,然而该方法至少与节点的个数的平方成正比,具有极高的时间复杂度,对于有大量节点的图来说,没有很好的可度量性。由于一个图往往比较稀疏,对应的邻接矩阵的元素多为0且为离散的值、不连续,不利于拿来用于直接对图的分析。网络表示学习在图的挖掘方面取得了很好的结果。网络表示学习是通过一个学习算法,将图上的每一个节点用一个n维的特征向量去表示,向量与向量之间的相关性表示了节点之间的相关性。被学习到的n个向量可以作为节点的n个特征值,能够通过现有的相关算法(比如线性回归等)进行后续工作,比如链路预测、网络聚类、情感分析以及节点分类等。
技术实现思路
本专利技术主要解决现实网络中不仅节点的个数较多,属性也较多且复杂多样,现有属性网络表示学习方法计算复杂度较高,易忽略网络结构与节点属性相关性,导致网络节点分类的精确性和可靠性较差等技术问题,提出一种基于融合结构特征的属性网络表示学习方法,能够同时考虑节点属性和网络结构,不会因为节点和属性个数的增多而计算复杂。本专利技术的算法不仅具有可度量性,并且能够在属性缺失的情况下依然可以取得可观的结果。本专利技术提供了一种基于融合结构特征的属性网络表示学习方法,包括以下过程:步骤1,获取网络图数据;步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型;步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型;步骤4,将步骤2得到的属性模型和步骤3得到的结构模型进行联合建模,得到最小化目标函数;步骤5,设置学习过程的终止条件;步骤6,根据步骤4得到的最小化目标函数和步骤5设置的终止条件,求得最小化目标函数的解,得到学习到的特征结果。进一步的,步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型,具体包括:将节点属性的相似性融合到嵌入向量中,用两个节点嵌入向量的点积去接近它们的属性亲近度,得到如下属性模型的最小化函数公式:其中,JA表示属性模型的最小化函数,S表示节点的属性向量的余弦值矩阵,F表示矩阵的F范式,H∈Rn*d表示所有节点的嵌入向量矩阵。进一步的,步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型,具体包括:对亲近度矩阵M进行分解,得到如下结构建模的最小化函数公式:其中,JG表示结构模型的最小化函数,M表示亲近度矩阵,C表示为节点的文本向量矩阵。本专利技术提供的一种基于融合结构特征的属性网络表示学习方法,首先对结点属性进行属性建模,然后对网络结构进行结构建模,之后将其合并进行联合建模,最后对算法进行优化,该算法更全面地利用了网络结构和节点的属性值,更好的体现两者的相关性,并可并行求解,具有很强的创新性,和一定的可行性与可靠性;本专利技术通过同时考虑了节点属性和网络结构,实现使节点属性的相似性更好的表示到嵌入向量的相似性当中,提高网络节点分类的精确性和可靠性。附图说明图1是本专利技术基于融合结构特征的属性网络表示学习方法的实现流程图;图2(a)为本专利技术在网络节点分类中BlogCatalog上的宏F值结果对比值;图2(b)为本专利技术在网络节点分类中BlogCatalog上的微F值结果对比值;图3(a)为本专利技术在网络节点分类中Flickr上的宏F值结果对比值;图3(b)为本专利技术在网络节点分类中Flickr上的微F值结果对比值;图4(a)为本专利技术在网络节点分类中Citeseer上的宏F值结果对比值;图4(b)为本专利技术在网络节点分类中Citeseer上的微F值结果对比值。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。图1是本专利技术基于融合结构特征的属性网络表示学习方法的实现流程图。如图1所示,本专利技术实施例提供的基于融合结构特征的属性网络表示学习方法包括以下过程:步骤1,获取网络图数据。网络图表示为G=(V,W,A),V表示网络图中所有节点的集合,n为网络图的节点个数,即n=|V|。W∈Rn*n是邻接矩阵,若节点i到j有边,则wij表示i到j边的权重;否则wij为0。若该网络图所有的边都是无向边,则wij=wji。A∈Rn*m表示该网络图节点的属性矩阵,其中m为属性个数。若节点i含有属性j,则Aij表示含有该属性的个数,通常该值为1。给定一个由上面所定义的网络图G,需要通过一个学习算法为一个节点i学习一个嵌入向量hi∈R1*d,其中d表示嵌入的维度且d远远小于n。让H∈Rn*d表示所有节点的嵌入向量矩阵,每行代表一个节点的嵌入向量。被学习到的H能够同时在网络结构和节点属性信息两方面保存了节点之间的亲近度。步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型,具体包括:将节点属性的相似性融合到嵌入向量中,用两个节点嵌入向量的点积去接近它们的属性亲近度,得到如下属性模型的最小化函数公式:其中,JA表示属性模型的最小化函数,S表示节点的属性向量的余弦值矩阵,F表示矩阵的F范式。步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型,具体包括:对亲近度矩阵M进行分解,得到如下结构建模的最小化函数公式:其中,JG表示结构模型的最小化函数,C表示为节点的文本向量矩阵,。步骤4,将步骤2得到的属性模型和步骤3得到的结构模型进行联合建模,得到最小化目标函数,具体包括:联合属性模型的最小化函数公式(1)和结构建模的最小化函数公式(2),并设置一个参数λ去控制权重,得到联合建模的最小化目标函数,公式如下:其中,λ表示控制权重的参数。步骤5,设置学习过程的终止条件。终止条件具体为W,A,λ,d,ρ的目标值,随机初始化矩阵H,H表示嵌入向量矩阵,ρ为惩罚参数,λ表示控制权重的参数。步骤6,根据步骤4得到的最小化目标函数和步骤5设置的终止条件,求得最小化目标函数的解,得到学习到的特征结果,具体包括以下子步骤:步骤601,令Zk=Hk,Uk=0,k=0。其中,Z为中间变量U∈Rn*d是被扩充的矩阵,ρ为惩罚参数。步骤602,利用以下公式计算亲近度矩阵M并标准化,并计算节点的属性向量的余弦值矩阵S。其中,T表示概率矩阵,即Tij为由节点i出发到节点j的概率,t本文档来自技高网...

【技术保护点】
1.一种基于融合结构特征的属性网络表示学习方法,其特征在于,包括以下过程:步骤1,获取网络图数据;步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型;步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型;步骤4,将步骤2得到的属性模型和步骤3得到的结构模型进行联合建模,得到最小化目标函数;步骤5,设置学习过程的终止条件;步骤6,根据步骤4得到的最小化目标函数和步骤5设置的终止条件,求得最小化目标函数的解,得到学习到的特征结果。

【技术特征摘要】
2018.12.19 CN 20181155156721.一种基于融合结构特征的属性网络表示学习方法,其特征在于,包括以下过程:步骤1,获取网络图数据;步骤2,利用获取网络图数据,对结点属性的相似性进行属性建模,得到属性模型;步骤3,利用获取网络图数据,对网络结构的相似性进行结构建模,得到结构模型;步骤4,将步骤2得到的属性模型和步骤3得到的结构模型进行联合建模,得到最小化目标函数;步骤5,设置学习过程的终止条件;步骤6,根据步骤4得到的最小化目标函数和步骤5设置的终止条件,求得最小化目标函数的解,得到学习到的特征结果。2.根据权利要求1所述的基于融合结构特征的属性网络表示学习方法,...

【专利技术属性】
技术研发人员:徐博郑翔宇
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1