【技术实现步骤摘要】
一种基于路径聚合的复杂属性网络表示模型的构建方法
[0001]本专利技术涉及表示学习
,更具体地,涉及一种基于路径聚合的复杂属性网络表示模型的构建方法。
技术介绍
[0002]如今,互联网已经走进了千家万户,人们之间的交流不再仅限于电话、短信、甚至于物理空间中面对面的交流,活跃于各大网络社交平台已经成为了人们生活的一部分。社交网络的崛起带来了大量的数据信息,也带来了大量的商机,如何从网络结构的大数据中挖掘潜在的信息是目前的研究热点。
[0003]网络表示是解决网络上数据挖掘问题的重要工具之一。网络表示是对节点信息进行提取表示,将原始网络中的每一个节点映射到低维表示空间中的方法,即使用低维向量来表示节点。作为许多数据挖掘任务的第一步,网络表示决定了后续操作的上界,其重要性不言而喻。为了能够更好的挖掘网络中的信息,网络表示模块应该尽可能多的保留原始网络的结构以及每个节点的属性信息。然而现实中的网络具有高度的非线性和分散性,潜在的网络信息复杂繁多,因此设计一个好的网络表示模块是一个复杂且棘手的问题。
[0004]目前常用的网络表示模块通常是利用深度模型将网络节点表示为低维向量,同时尽可能保留其原始网络的结构信息。例如,许多网络表示模块利用原始网络中直接相连或存在多个共同邻居的节点在物理空间中的相似性来限制其在低维表示空间中对应的表示向量的相似性,从而保留原始网络的结构信息。现实网络中节点的属性信息丰富而多样,例如在社交网络中,一个人的兴趣标签、个性签名、发表的图片和视频等均可以看作是节点的属性信息,这 ...
【技术保护点】
【技术特征摘要】
1.一种基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,包括以下步骤:S1:构建节点属性嵌入模块,节点属性嵌入模块采集社交网络图中节点的属性输出节点的一组属性表示向量;S2:构建特征融合模块,特征融合模块输入节点属性嵌入模块输出节点属性表示向量,输出是节点的src向量,src向量是节点的高阶特征表示向量;S3:构建随机游走模块,随机游走模块采集社交网络图的结构,输出节点的随机游走序列;S4:构建节点聚合模块,节点聚合模块输入随机游走模块输出节点的随机游走序列,输出节点的dst向量;S5:构建结构建模模块,结构建模模块根据对节点的dst向量进行约束,使用节点在网络物理空间中的相似性来约束其表示向量在表示空间中的相似性,即使节点的dst向量与节点的src向量相互约束;将训练完成的节点的src向量与dst向量进行拼接,即将节点的src向量与dst向量输入到concat层中,经过concat层的输出向量即为最终的节点表示向量。2.根据权利要求1所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,节点属性嵌入模块的输入是社交网络图中节点的属性,输出是节点的一组属性表示向量;节点属性嵌入模块对属性进行预处理,对于离散属性,直接进行独热编码,对于连续属性,首先将属性离散化,再进行独热编码;节点属性嵌入模块将使用独热编码表示的属性转换到低维表示空间中,得到属性表示向量。3.根据权利要求2所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,特征融合模块将节点的一组属性表示向量按照属性类型进行划分,每个节点得到n组属性表示向量,n为属性类型数;特征融合模块对划分好的n组属性表示向量进行操作,将相同类型的属性表示向量进行mean-pooling操作,即将n组属性表示向量分别通过mean-pooling层,得到n个属性表示向量;特征融合模块对不同类型的属性表示向量进行拼接,即将这n个属性表示向量通过concat层,得到一个属性表示向量,这个向量为节点的初始特征表示向量;特征融合模块从节点的初始特征表示向量中提取出高阶交叉特征,得到节点的高阶特征表示向量,该向量作为节点的src向量,具体操作为将节点的初始特征表示向量输入至MLP层,经过MLP层后的输出即为节点的高阶特征表示向量。4.根据权利要求3所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,步骤S1的具体过程是:节点属性刻画了节点的特征,将刻画节点不同方面特征的属性看作是不同类型的属性,将刻画节点同一方面特征的属性看作是相同类型的属性;对于不同类型的属性,通过一个独特的转换矩阵将其转换到低维表示空间中;其中为属性类型是A
j
的第i个属性的二进制向量表示,为权重矩阵,表示类型为A
j
的属性的二进制向量维度,表示类型为的A
j
属性转换到低维表
示空间的维度;一个节点的属性可以由一组属性表示向量进行表示。5.根据权利要求4所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,所述步骤S2的具体过程是:S21:将表示一个节点的一组属性表示向量根据类型进行划分,得到N
A
组属性表示向量,N
A
表示属性类型的总数,即将转变成S22:对于同一类型的属性特征,采用均值池化的方式进行聚合,其中|A
j
|表示属性类型A
j
的属性个数;由得到S23:在得到节点不同类型属性的特征表示后,将其输入concat层,使得它们按比例拼接在一起,对不同类型属性的权重进行了归一化处理,即N
A
表示属性类型的总数:S24:将得到的节点的初始特征表示向量通过多层感知机MLP,来对不同类型的特征进行特征交叉,得到具有更丰富内涵的表示向量:行特征交叉,得到具有更丰富内涵的表示向量:表示节点自身的信息,它是节点的第一个表示向量。6.根据权利要求5所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,步骤S23中,其中λ
j
表示属性类型A
i
的权重,权重越大,表示根据先验知识,该类型属性特征能够起到的作用越大。7.根据权利要求6所述的基于路径聚合的复杂属性网络表示模型的构建方法,其特征在于,所述步骤S3的具体过程是:对于每一个节点对<i,j>而言,节点对间信息传输量可以被估计为:其中w
i,j
表示边e
i,j
的权重,d
i
表示节点i的度数,α表示平滑系数,M
<i,j>
不具有对称性,即不成立,表示的是节点i向节点j传递的信息量,考虑了边的方向性,将该式扩展到了更一般的情况:其中w
i
→
j
表示有向边e
i
→
j
的权重,表示节点i的入度,表示节点j的出度,即:
节点集合V=...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。