当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于路径聚合的复杂属性网络表示模型的构建方法技术

技术编号:27448142 阅读:15 留言:0更新日期:2021-02-25 04:20
本发明专利技术提供一种基于路径聚合的复杂属性网络表示模型的构建方法,该方法利用了更多网络信息,如属性信息以及网络的全局结构信息,并在处理上更加精细,节点表示向量能够更好的表示节点在网络中的作用和地位,使得后续的数据挖掘任务更加高效和准确。在捕获网络的全局结构信息时,本发明专利技术在原始随机游走算法上加以改进,相对于现有技术,不仅保留了随机游走算法捕获信息的高效率,更提升了信息捕获的准确性。在提取节点属性信息时,相对于现有技术,本发明专利技术考虑和设计的更加精细和高效,分别提出了类型间与类型内的属性信息的提取方法,不仅保留了不同类型属性的区分性还获得了不同类型属性的高阶交互关系。属性的高阶交互关系。属性的高阶交互关系。

【技术实现步骤摘要】
一种基于路径聚合的复杂属性网络表示模型的构建方法


[0001]本专利技术涉及表示学习
,更具体地,涉及一种基于路径聚合的复杂属性网络表示模型的构建方法。

技术介绍

[0002]如今,互联网已经走进了千家万户,人们之间的交流不再仅限于电话、短信、甚至于物理空间中面对面的交流,活跃于各大网络社交平台已经成为了人们生活的一部分。社交网络的崛起带来了大量的数据信息,也带来了大量的商机,如何从网络结构的大数据中挖掘潜在的信息是目前的研究热点。
[0003]网络表示是解决网络上数据挖掘问题的重要工具之一。网络表示是对节点信息进行提取表示,将原始网络中的每一个节点映射到低维表示空间中的方法,即使用低维向量来表示节点。作为许多数据挖掘任务的第一步,网络表示决定了后续操作的上界,其重要性不言而喻。为了能够更好的挖掘网络中的信息,网络表示模块应该尽可能多的保留原始网络的结构以及每个节点的属性信息。然而现实中的网络具有高度的非线性和分散性,潜在的网络信息复杂繁多,因此设计一个好的网络表示模块是一个复杂且棘手的问题。
[0004]目前常用的网络表示模块通常是利用深度模型将网络节点表示为低维向量,同时尽可能保留其原始网络的结构信息。例如,许多网络表示模块利用原始网络中直接相连或存在多个共同邻居的节点在物理空间中的相似性来限制其在低维表示空间中对应的表示向量的相似性,从而保留原始网络的结构信息。现实网络中节点的属性信息丰富而多样,例如在社交网络中,一个人的兴趣标签、个性签名、发表的图片和视频等均可以看作是节点的属性信息,这些丰富的属性信息是对网络结构信息的补充,对网络表示的学习也是十分重要的。但值得一提的是,现有工作更多的是面向局部信息、网络结构信息的。由于现实网络结构往往十分稀疏,仅考虑局部信息和网络结构信息难以得到较好的节点网络表示。节点属性信息的丰富多样性在为网络表示学习带来了新的机遇的同时也带来了新的挑战,如何尽可能的从丰富多样的节点属性中提取并利用信息,同时考虑网络全局信息,成为网络表示领域的迫切问题。
[0005]申请号为201810922587.X的专利说明书中公开了一种基于深度网络结构和节点属性的网络表示方法,本申请构造节点间邻接矩阵和属性关系矩阵;获得节点间结构概率转移矩阵和属性概率转移矩阵;根据结构概率转移矩阵和属性概率转移矩阵利用个性化随机游走模型获得多阶概率关系矩阵;将多阶概率关系矩阵通过衰减函数合并得到全局信息矩阵;将全局信息矩阵输入自动编码器,通过训练自动编码器得到网络节点低维特征表示。本专利技术解决数据稀疏性问题,通过构建深度神经网络将网络中节点的全局信息编码到低维、稠密的向量空间,保证了对网络中节点的精准表示。然而,该专利无法实现分别提出了类型间与类型内的属性信息的提取方法,不仅保留了不同类型属性的区分性还获得了不同类型属性的高阶交互关系。

技术实现思路

[0006]本专利技术提供一种基于路径聚合的复杂属性网络表示模型的构建方法,该方法现实社交网络中更加有效的进行数据挖掘等任务。
[0007]为了达到上述技术效果,本专利技术的技术方案如下:
[0008]一种基于路径聚合的复杂属性网络表示模型的构建方法,包括以下步骤:
[0009]S1:构建节点属性嵌入模块,节点属性嵌入模块采集社交网络图中节点的属性输出节点的一组属性表示向量;
[0010]S2:构建特征融合模块,特征融合模块输入节点属性嵌入模块输出节点属性表示向量,输出是节点的src向量,src向量是节点的高阶特征表示向量;
[0011]S3:构建随机游走模块,随机游走模块采集社交网络图的结构,输出节点的随机游走序列;
[0012]S4:构建节点聚合模块,节点聚合模块输入随机游走模块输出节点的随机游走序列,输出节点的dst向量;
[0013]S5:构建结构建模模块,结构建模模块根据对节点的dst向量进行约束,使用节点在网络物理空间中的相似性来约束其表示向量在表示空间中的相似性,即使节点的dst向量与节点的src向量相互约束;将训练完成的节点的src向量与dst向量进行拼接,即将节点的src向量与dst向量输入到concat层中,经过concat层的输出向量即为最终的节点表示向量。
[0014]进一步地,节点属性嵌入模块的输入是社交网络图中节点的属性,输出是节点的一组属性表示向量;节点属性嵌入模块对属性进行预处理,对于离散属性,直接进行独热编码,对于连续属性,首先将属性离散化,再进行独热编码;节点属性嵌入模块将使用独热编码表示的属性转换到低维表示空间中,得到属性表示向量。
[0015]进一步地,特征融合模块将节点的一组属性表示向量按照属性类型进行划分,每个节点得到n组属性表示向量,n为属性类型数;特征融合模块对划分好的n组属性表示向量进行操作,将相同类型的属性表示向量进行mean-pooling操作,即将n组属性表示向量分别通过mean-pooling层,得到n个属性表示向量;特征融合模块对不同类型的属性表示向量进行拼接,即将这n个属性表示向量通过concat层,得到一个属性表示向量,这个向量为节点的初始特征表示向量;特征融合模块从节点的初始特征表示向量中提取出高阶交叉特征,得到节点的高阶特征表示向量,该向量作为节点的src向量,具体操作为将节点的初始特征表示向量输入至MLP层,经过MLP层后的输出即为节点的高阶特征表示向量。
[0016]进一步地,步骤S1的具体过程是:
[0017]节点属性刻画了节点的特征,将刻画节点不同方面特征的属性看作是不同类型的属性,将刻画节点同一方面特征的属性看作是相同类型的属性;对于不同类型的属性,通过一个独特的转换矩阵将其转换到低维表示空间中;
[0018][0019]其中为属性类型是A
j
的第i个属性的二进制向量表示,为权重矩阵,表示类型为A
j
的属性的二进制向量维度,表示类型为的A
j
属性转换到低维
表示空间的维度;一个节点的属性可以由一组属性表示向量进行表示。
[0020]进一步地,所述步骤S2的具体过程是:
[0021]S21:将表示一个节点的一组属性表示向量根据类型进行划分,得到N
A
组属性表示向量,N
A
表示属性类型的总数,即将转变成
[0022]S22:对于同一类型的属性特征,采用均值池化的方式进行聚合,
[0023][0024]其中|A
j
|表示属性类型A
j
的属性个数;由得到
[0025]S23:在得到节点不同类型属性的特征表示后,将其输入concat层,使得它们按比例拼接在一起,对不同类型属性的权重进行了归一化处理,即N
A
表示属性类型的总数:
[0026][0027]S24:将得到的节点的初始特征表示向量通过多层感知机MLP,来对不同类型的特征进行特征交叉,得到具有更丰富内涵的表示向量:
[0028][0029]表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,包括以下步骤:S1:构建节点属性嵌入模块,节点属性嵌入模块采集社交网络图中节点的属性输出节点的一组属性表示向量;S2:构建特征融合模块,特征融合模块输入节点属性嵌入模块输出节点属性表示向量,输出是节点的src向量,src向量是节点的高阶特征表示向量;S3:构建随机游走模块,随机游走模块采集社交网络图的结构,输出节点的随机游走序列;S4:构建节点聚合模块,节点聚合模块输入随机游走模块输出节点的随机游走序列,输出节点的dst向量;S5:构建结构建模模块,结构建模模块根据对节点的dst向量进行约束,使用节点在网络物理空间中的相似性来约束其表示向量在表示空间中的相似性,即使节点的dst向量与节点的src向量相互约束;将训练完成的节点的src向量与dst向量进行拼接,即将节点的src向量与dst向量输入到concat层中,经过concat层的输出向量即为最终的节点表示向量。2.根据权利要求1所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,节点属性嵌入模块的输入是社交网络图中节点的属性,输出是节点的一组属性表示向量;节点属性嵌入模块对属性进行预处理,对于离散属性,直接进行独热编码,对于连续属性,首先将属性离散化,再进行独热编码;节点属性嵌入模块将使用独热编码表示的属性转换到低维表示空间中,得到属性表示向量。3.根据权利要求2所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,特征融合模块将节点的一组属性表示向量按照属性类型进行划分,每个节点得到n组属性表示向量,n为属性类型数;特征融合模块对划分好的n组属性表示向量进行操作,将相同类型的属性表示向量进行mean-pooling操作,即将n组属性表示向量分别通过mean-pooling层,得到n个属性表示向量;特征融合模块对不同类型的属性表示向量进行拼接,即将这n个属性表示向量通过concat层,得到一个属性表示向量,这个向量为节点的初始特征表示向量;特征融合模块从节点的初始特征表示向量中提取出高阶交叉特征,得到节点的高阶特征表示向量,该向量作为节点的src向量,具体操作为将节点的初始特征表示向量输入至MLP层,经过MLP层后的输出即为节点的高阶特征表示向量。4.根据权利要求3所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,步骤S1的具体过程是:节点属性刻画了节点的特征,将刻画节点不同方面特征的属性看作是不同类型的属性,将刻画节点同一方面特征的属性看作是相同类型的属性;对于不同类型的属性,通过一个独特的转换矩阵将其转换到低维表示空间中;其中为属性类型是A
j
的第i个属性的二进制向量表示,为权重矩阵,表示类型为A
j
的属性的二进制向量维度,表示类型为的A
j
属性转换到低维表
示空间的维度;一个节点的属性可以由一组属性表示向量进行表示。5.根据权利要求4所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,所述步骤S2的具体过程是:S21:将表示一个节点的一组属性表示向量根据类型进行划分,得到N
A
组属性表示向量,N
A
表示属性类型的总数,即将转变成S22:对于同一类型的属性特征,采用均值池化的方式进行聚合,其中|A
j
|表示属性类型A
j
的属性个数;由得到S23:在得到节点不同类型属性的特征表示后,将其输入concat层,使得它们按比例拼接在一起,对不同类型属性的权重进行了归一化处理,即N
A
表示属性类型的总数:S24:将得到的节点的初始特征表示向量通过多层感知机MLP,来对不同类型的特征进行特征交叉,得到具有更丰富内涵的表示向量:行特征交叉,得到具有更丰富内涵的表示向量:表示节点自身的信息,它是节点的第一个表示向量。6.根据权利要求5所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,步骤S23中,其中λ
j
表示属性类型A
i
的权重,权重越大,表示根据先验知识,该类型属性特征能够起到的作用越大。7.根据权利要求6所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,所述步骤S3的具体过程是:对于每一个节点对<i,j>而言,节点对间信息传输量可以被估计为:其中w
i,j
表示边e
i,j
的权重,d
i
表示节点i的度数,α表示平滑系数,M
<i,j>
不具有对称性,即不成立,表示的是节点i向节点j传递的信息量,考虑了边的方向性,将该式扩展到了更一般的情况:其中w
i

j
表示有向边e
i

j
的权重,表示节点i的入度,表示节点j的出度,即:
节点集合V=...

【专利技术属性】
技术研发人员:印鉴肖想邱爽刘威余建兴
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1