【技术实现步骤摘要】
一种基于超图神经网络的关键结点集发现方法
[0001]本专利技术涉及图数据挖掘
,更具体的说是涉及种基于超图神经网络的关键结点集发现方法。
技术介绍
[0002]在图类型的网络(例如社交网络,交通网络,文章引用网络)中,关键结点的存在维系着整个网络的结构,对于结点之间的互相交流有着十分重要的影响。因此找到这些关键的结点是非常有必要的。在传统普通图结构中,一条边只能连接两个顶点,只能表示顶点间的二元关系。然而在超图中,允许一条超边连接两个及两个以上的顶点,可以表示多元关系,能够更好的对现实世界进行建模。
[0003]但是,在超图数据中定义结点的重要性是一个问题。现有的技术大多首先是针对图定义一种内聚子图结构,如k
‑
core,并设计高效的算法进行计算。k
‑
core模型要求子图中每个顶点的度大于等于k,通过迭代删除度不符合要求的顶点,可以在线性时间复杂度下计算出结果,具有很高的计算效率。
[0004]获得k
‑
core之后,定义结点的重要性为当该结点离开k
‑
core后其他跟随该结点离开的结点(follower)数量。因此在超图数据集上进行关键结点集发现的问题可抽象为在k
‑
core子图中找到结点集U,其中U的大小为b,使得当U中所有结点从k
‑
core中删除后,跟随这些结点一同删除的其他结点的数量最大。这个问题是一个NP
‑
hard的问题。
[0005]现有的技术 ...
【技术保护点】
【技术特征摘要】
1.一种基于超图神经网络的关键结点集发现方法,其特征在于,包括以下步骤:S1、基于原始数据集构建多模态超图G,G=(V,E,W),其中V代表顶点集,E代表超边集,W代表超边的权重;S2、在超图结构数据集上进行k
‑
core子图搜寻;S3、计算超图k
‑
core中任意结点v的重要性Cr(v),Cr(v)定义为在超图k
‑
core中将一个结点v删除后整个k
‑
core结点减少的个数;S4、在k
‑
core子图上进行结点的采样产生训练数据集;S5、将采样产生的训练数据作为输入,在超图神经网络(HGNN)基础上融合自注意力机制进行训练;S6、在给定图G,k
‑
core值k以及结点集大小b等参数下,使用训练完成的网络预测在给定部分关键结点集U后,剩下所有结点作为关键结点加入结果集U的概率P;S7、找到图数据上的关键结点集U
max
,U
max
=argmax
U
Cr(U)。2.根据权利要求1所述的一种基于超图神经网络的关键结点集发现方法,其特征在于,所述步骤S1具体包括:S11、基于原始数据集的各个模态构建多个超图G1,G2,
…
G
n
,G
n
=(V
n
,E
n
,W
n
);其中V
n
代表第n个模态的顶点集,E
n
代表超边集,W
n
代表超边的权重;S12、将超图G
n
表示为|V
n
|
×
|E
n
|关联矩阵H
n
的形式,其中S13、将超图G1,G2,
…
G
n
对应的关联矩阵H1,H2,
…
H
n
进行连接,得到的H对应多模态的超图G。3.根据权利要求1所述的一种基于超图神经网络的关键结点集发现方法,其特征在于,所述步骤S2具体包括:S21、计算V中所有结点v的度d(v);S22、赋值k为1;S23、判断超图G是否为空,若为空跳转至S211;S24、判断是否存在v∈V,使得d(v)≤k;若不存在,跳转至S210;S25、遍历E(v)中的每条边e;S26、对于e中的所有结点u,赋值d(u)为d(u)
‑
1;S27、将e从E中删除,跳转S25直至遍历完E(V)中的所有边;S28、将v从V中删除;S29、赋值core(v)为k,跳转S24直至遍历完所有顶点v;S210、赋值k为k+1,跳转S23直至超图G为空;S211、k
‑
core为core(v)大于等于k的所有结点v以及结点之间的边所构成的图;S212、返回k
‑
core图C
k
(G)。4.根据权利要求1或3所述的一种基于超图神经网络的关键结点集发现...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。