System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图表示学习,具体地,涉及一种社交网络中兼具个性化与全局特征的节点表示方法。
技术介绍
1、节点表示方法,也称图表示学习,是一项基本而又艰巨的任务。它涉及将图中的节点或边嵌入到低维向量空间中,同时保留其原有的结构和特征信息。通过节点表示方法得到的节点嵌入可以适用于各种下游任务,如节点聚类和链接预测。
2、早期用于图结构数据的节点表示方法包括一些经典技术,如laplacianeigenmaps、matrix factorization和node2vec。近年来,图卷积网络(graphconvolutional network,gcn)作为一种新的消息传递机制,在许多图学习任务中取得了先进的性能。gcn通过图上的卷积操作,可以捕获数据中复杂的模式和依赖关系,显著提高了节点表示方法的性能。然而,这种方法有两个主要的局限性:
3、局限1:尽管基于gcn的技术能够通过堆叠多个神经网络层来捕获图中的长距离依赖关系(即全局信息),但大量叠加神经网络层往往会导致节点嵌入的区分性逐渐降低,最终导致过平滑问题。这种现象使得节点的嵌入变得几乎不可区分,削弱了模型在图结构中的表征能力。因此,大多数图卷积神经网络仅限于使用两层或三层的结构,以避免过平滑问题的发生。然而,这种限制也阻碍了模型对全局信息的获取,模型的表现能力受到了一定的限制。
4、局限2:基于gcn的方法在每一层中都包含了两个关键操作,即特征聚合和特征提取。特征聚合负责从邻居节点中获取信息,并将其整合到目标节点中,而特征提取则用于更新节点的特征表示
5、总的来说,这一挑战强调了将gcn扩展到更大的邻域和大规模图的局限性。克服这些挑战对于提升图数据的处理能力至关重要。
6、节点表示方法另一个重要的方面是如何合理地设计损失函数,以指导特征提取的过程。对于无监督节点表示学习,相关的研究方法可以根据其优化目标分为两组:(1)重构邻接矩阵;(2)重构特征矩阵。例如,图自动编码器(gae)、变分图自动编码器(vgae)使用邻接矩阵的重建作为损失函数,gala和argat利用特征矩阵的重建作为损失函数。这些方法侧重于图结构的不同方面,以提高节点嵌入的质量。然而,这些方法的重构损失可能并不总是与真实世界的应用程序相一致,并且它们在某种程度上忽略了图中组内和组之间的连接(或者,类内和类之间)的连接。因此,他们并不能总是取得最好的结果。
技术实现思路
1、为了克服现有技术中的至少一个不足,本申请提供一种社交网络中兼具个性化与全局特征的节点表示方法。
2、第一方面,提供一种社交网络中兼具个性化与全局特征的节点表示方法,包括:
3、根据图的邻接矩阵计算得到拉普拉斯平滑滤波器,基于拉普拉斯平滑滤波器对初始节点特征矩阵进行多层次的特征聚合,得到每个层次特征聚合后的节点特征矩阵;最后一个层次特征聚合后的节点特征矩阵即为全局特征;
4、基于每个层次特征聚合后的节点特征矩阵计算每个层次的权重矩阵;根据每个层次的权重矩阵计算保留个性化特征的组合特征;
5、将组合特征输入到编码器中进行社区特征提取,得到节点嵌入矩阵。
6、在一个实施例中,根据图的邻接矩阵计算得到拉普拉斯平滑滤波器,采用以下公式:
7、p=i-λlsym
8、
9、其中,p为拉普拉斯平滑滤波器,i为单位矩阵,λ为实数,lsym为对称归一化的图拉普拉斯矩阵,为带自环的图的邻接矩阵,为对应的度矩阵,为带自环的图拉普拉斯矩阵。
10、在一个实施例中,基于拉普拉斯平滑滤波器对初始节点特征矩阵进行多层次的特征聚合,得到每个层次特征聚合后的节点特征矩阵,采用以下公式:
11、xt=pxt-1
12、其中,xt为第t层次特征聚合后的节点特征矩阵,p为拉普拉斯平滑滤波器,xt-1为第t-1层次特征聚合后的节点特征矩阵;当t=1时,xt-1为初始节点特征矩阵。
13、在一个实施例中,每个层次的权重矩阵,采用以下公式表示:
14、
15、其中,wt为第t层次的权重矩阵,为第t层次第i个节点的权重,1≤i≤n,n为图中节点个数,为第t层次特征聚合后的节点特征矩阵xt中第i个节点的特征[xt]i与初始节点特征矩阵x中第i个节点的特征[x]i之间的余弦相似度,l为层次个数,diag表示形成对角矩阵。
16、在一个实施例中,组合特征为:
17、
18、其中,x′为组合特征,l为层次个数,wt为第t层次的权重矩阵,xt为第t层次特征聚合后的节点特征矩阵。
19、在一个实施例中,编码器为训练后的编码器,训练过程中采用的损失函数为:
20、l=l1+l2
21、其中,l为损失函数,l1为第一损失函数,l2为第二损失函数;
22、第一损失函数l1:
23、
24、pos={(i,j)|(i,j)∈top_α(s)}
25、
26、其中,pos为节点对集合,i,j为节点对中的两个节点,top_α(s)为从相似度矩阵s中选取的相似度值最高的前α个节点对构成的集合,z为节点嵌入矩阵,zt为z的转置,为2范数的平方;σ为sigmoid激活函数,sij为节点对(i,j)的相似度值;
27、第二损失函数l2采用以下方式构建:
28、对训练过程中编码器输出的节点嵌入矩阵z进行聚类,将节点嵌入矩阵z中的所有节点分成多个类别,并确定每个类别的初始聚类中心;节点嵌入矩阵z中包括每个节点多个维度的嵌入特征;
29、计算每个类别中每个节点与类别的初始聚类中心之间的距离,并根据距离选取距离最小的前β%个节点构成类别对应的可靠集合;
30、计算每个类别对应的可靠集合中所有节点的嵌入特征的均值,作为新的聚类中心;
31、根据新的聚类中心,构建第二损失函数l2:
32、
33、其中,k1和k2为不同类别的标号,k为类别个数,hk1为类别k1对应的新的聚类中心,hk2为类别k2对应的新的聚类中心,‖‖2为2范数,<hk1,hk2>为hk1,hk2的内积。
34、在一个实施例中,编码器为mlp编码器。
35、第二方面,提供一种社交网络中兼具个性化与全局特征的节点表示装置,包括:
36、全局特征提取模块,用于根据图的邻接矩阵计算得到拉普拉斯平滑滤波器,基于拉普拉斯平滑滤波器对初始节点特征矩阵进行多层次的特征聚合,得到每个层次特征聚合后的节点特征矩阵;最后一个层次特征聚合后的节点特征矩阵即为全局特征;
37、个性化特征保留模块,用于基于每个层次特本文档来自技高网...
【技术保护点】
1.一种社交网络中兼具个性化与全局特征的节点表示方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,其中,根据图的邻接矩阵计算得到拉普拉斯平滑滤波器,采用以下公式:
3.如权利要求1所述的方法,其特征在于,其中,基于所述拉普拉斯平滑滤波器对初始节点特征矩阵进行多层次的特征聚合,得到每个层次特征聚合后的节点特征矩阵,采用以下公式:
4.如权利要求1所述的方法,其特征在于,所述每个层次的权重矩阵,采用以下公式表示:
5.如权利要求1所述的方法,其特征在于,所述组合特征为:
6.如权利要求1所述的方法,其特征在于,所述编码器为训练后的编码器,训练过程中采用的损失函数为:
7.如权利要求1所述的方法,其特征在于,所述编码器为MLP编码器。
8.一种社交网络中兼具个性化与全局特征的节点表示装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,以实现权利要求1-7任意一项所述的社交网络中兼具个性化与全局
10.一种计算机程序产品,其特征在于,包括计算机程序/指令,所述计算机程序/指令被处理器执行时,以实现权利要求1-7任意一项所述的社交网络中兼具个性化与全局特征的节点表示方法。
...【技术特征摘要】
1.一种社交网络中兼具个性化与全局特征的节点表示方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,其中,根据图的邻接矩阵计算得到拉普拉斯平滑滤波器,采用以下公式:
3.如权利要求1所述的方法,其特征在于,其中,基于所述拉普拉斯平滑滤波器对初始节点特征矩阵进行多层次的特征聚合,得到每个层次特征聚合后的节点特征矩阵,采用以下公式:
4.如权利要求1所述的方法,其特征在于,所述每个层次的权重矩阵,采用以下公式表示:
5.如权利要求1所述的方法,其特征在于,所述组合特征为:
6.如权利要求1所述的方法,其特征在于,所述编码器为训...
【专利技术属性】
技术研发人员:尹小燕,薛文慧,林瑶,白聪睿,李晶,陈晓江,房鼎益,
申请(专利权)人:西北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。