System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 节点分类模型获取方法、电子设备和存储介质技术_技高网

节点分类模型获取方法、电子设备和存储介质技术

技术编号:43678452 阅读:17 留言:0更新日期:2024-12-18 21:01
本发明专利技术提供了一种节点分类模型获取方法、电子设备和存储介质,首先,基于注意力机制,得到节点之间的注意力权重,将注意力权重作为狄利克雷分布的基分布,接着,从狄利克雷分布中抽样具有随机性的注意力权重,与对应的邻居节点做聚合,经过图卷积层的堆叠,得到最终的节点表示并进行节点分类。本发明专利技术可以提高节点分类的准确率,缓解因堆叠多层图卷积层而带来的过平滑问题。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别是涉及一种节点分类模型获取方法、电子设备和存储介质


技术介绍

1、数据之间的紧密关联性普遍存在,如社交网络、引文网络和生物网络等。图结构数据通常包括节点之间的拓扑关系和节点的属性,可以很好地表示数据间的关联特性。作为一种非欧结构数据,图数据间的复杂关联性对现有的深度学习模型以及机器学习算法提出了更高的要求。与图像等规则的欧式数据不同,图中节点的顺序不固定,节点的邻居数量各不相同。早期在图上学习的方法主要是基于循环神经网络。这些方法包括一个迭代传播节点特征的过程,直到节点特征达到一个稳定的点。目前,图神经网络作为一种有效的图嵌入工具,在图机器学习中取得了巨大的成功。特别是图卷积网络(graph convolutionalnetwork,gcns)受到了广泛的关注,它在后续图神经网络的发展中起着基础性的作用。图卷积通过聚合邻域信息来更新节点特征。与基于递归的方法相比,gcns在学习图结构数据方面效率更高。但在堆叠多层图卷积块后,出现过平滑现象,即节点表示趋于一致,导致来自不同簇的顶点可能会变得无法区分,从而影响节点分类等下游任务的性能。已有一些工作尝试来缓解过平滑问题并构建深度图卷积网络模型。正则化是训练一般深度神经网络的常用技术,已被开发用于解决过平滑问题。dropout策略即节点信息丢弃和边缘丢弃,以解决过平滑问题。以上两种方法可以缓解过平滑问题,但随着图卷积层数的增加,仍会出现过平滑现象,其中dropout策略对原始数据进行随机丢弃,可能会带来信息偏差。


技术实现思

1、针对上述技术问题,本专利技术采用的技术方案为:

2、根据本专利技术第一方面,提供了一种节点分类模型获取方法,所述方法包括如下步骤:

3、s100,获取图数据集g并将获取的g划分为训练集、测试集和验证集,其中,g=(v,a,x),v为g对应的节点集,a为g对应的邻接矩阵,x为g对应的原始特征矩阵。

4、s200,利用g对应的特征矩阵、邻接矩阵和分类标签对当前的节点分类模型进行训练,当前的节点分类模型的初始值为初始的节点分类模型,节点分类模型包括n层图神经网络,每层图神经网络具有m个注意力头。

5、s300,将g对应的邻接矩阵、分类标签和当前特征矩阵输入到当前的节点分类模型的第k层图神经网络中,并获取所述训练集中的任一节点i对应的固定注意力权重集αik={αik1,αik2,……,αikp,……,αikm},αikp为基于第k层图神经网络层的第p个注意力头获取的节点i对应的固定注意力权重集,i的取值为1到n,n为g中的节点的数量,p的取值为1到m,αikp={αi1kp,αi2kp,……,αijkp,……,αinkp},αijkp为节点i和节点j之间的固定注意力权重,j的取值为1到n,节点i对应的当前特征矩阵的初始值为节点i对应的原始特征矩阵,k的取值为1到n。

6、s400,以αikp作为基分布bikp,以作为扩散强度构建对应的狄利克雷分布ddikp并从ddikp中抽取与bikp对应的分布作为节点i的随机注意力权重πikp,为输入第k层图神经网络层中的节点i对应的收敛因子。

7、s500,利用πikp对节点i对应的当前特征向量进行更新,得到更新后的特征向量作为节点i对应的当前特征向量;设置k=k+1,如果k≤n,执行s300,否则,执行s600。

8、s600,基于当前的节点分类模型的训练结果判断当前的节点分类模型对应的当前损失函数值是否满足预设模型收敛条件,如果满足,执行s700,否则,基于当前损失函数值更新当前的节点分类模型,执行s200;所述训练结果为所述训练集对应的节点的分类结果。

9、s700,利用所述验证集对应的特征矩阵、邻接矩阵和分类标签对当前的节点分类模型进行验证,如果验证结果表征当前的节点分类模型的损失函数值满足预设模型收敛条件,利用所述测试集对当前的节点分类模型进行测试,如果测试结果表征当前的节点分类模型的损失函数值满足预设模型收敛条件,将当前的节点分类模型作为目标节点分类模型,否则,执行s200。

10、根据本专利技术第二方面,提供一种节点分类模型构建装置,包括:

11、数据获取模块,获取图数据集g并将获取的g划分为训练集、测试集和验证集,其中,g=(v,a,x),v为g对应的节点集,a为g对应的邻接矩阵,x为g对应的原始特征矩阵。

12、注意力权重获取模块,用于将g对应的邻接矩阵、分类标签和当前特征矩阵输入到当前的节点分类模型的第k层图神经网络中,并获取所述训练集中的任一节点i对应的固定注意力权重集αik={αik1,αik2,……,αikp,……,αikm},αikp为基于第k层图神经网络层的第p个注意力头获取的节点i对应的固定注意力权重集,i的取值为1到n,n为g中的节点的数量,p的取值为1到m,αikp={αi1kp,αi2kp,……,αijkp,……,αinkp},αijkp为节点i和节点j之间的固定注意力权重,j的取值为1到n,节点i对应的当前特征矩阵的初始值为节点i对应的原始特征矩阵,k的取值为1到n,n为节点分类模型的图神经网络层的数量。

13、注意力权重抽样模块,用于以αikp作为基分布bikp,以作为扩散强度构建对应的狄利克雷分布ddikp并从ddikp中抽取与bikp对应的分布作为节点i的随机注意力权重πikp,为输入第k层图神经网络层中的节点i对应的收敛因子。

14、节点聚合模块,用于利用πikp对节点i对应的当前特征向量进行更新,得到更新后的特征向量作为节点i对应的当前特征向量。

15、训练测试模块,用于基于当前的节点分类模型的训练结果判断当前的节点分类模型对应的当前损失函数值是否满足预设模型收敛条件,如果满足,利用验证集和测试集对当前的节点分类模型分别进行验证和测试,并基于验证结果和测试结果确定当前的节点分类模型是否为目标节点分类模型。

16、根据本专利技术第三方面,提供了一种电子设备,包括处理器和存储器;所述处理器通过调用所述存储器存储的程序或指令,用于执行本专利技术第一方面所述方法的步骤。

17、根据本专利技术第四方面,提供了一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质存储程序或指令,所述程序或指令使计算机用于执行本专利技术第一方面所述方法的步骤。

18、本专利技术至少具有以下有益效果:

19、本专利技术实施例提供的节点分类模型获取方法,首先,基于注意力机制,得到节点之间的注意力权重,将注意力权重作为狄利克雷分布的基分布,接着,从狄利克雷分布中抽样具有随机性的注意力权重,与对应的邻居节点做聚合,经过图卷积层的堆叠,得到最终的节点表示并进行节点分类。这样构建的模型一方面可以提高节点分类的准确率,另一方面,在不损失原始特征的前提下,可通过控制节点特征表示方差来缓解因堆叠多层图卷积层而带来的过平滑问题。

20、应当理解,本部分所描述的内容并非旨在标识本专利技术的本文档来自技高网...

【技术保护点】

1.一种节点分类模型获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,αijkp满足如下条件:

3.根据权利要求2所述的方法,其特征在于,在S500中,通过如下条件对节点i对应的当前特征向量进行更新:

4.根据权利要求1所述的方法,其特征在于,满足如下条件:

5.一种节点分类模型构建装置,其特征在于,包括:

6.根据权利要求5所述的装置,其特征在于,αijkp满足如下条件:

7.根据权利要求5所述的装置,其特征在于,通过如下条件对节点i对应的当前特征向量进行更新:

8.根据权利要求5所述的装置,其特征在于,满足如下条件:

9.一种电子设备,其特征在于,包括处理器和存储器;

10.一种非瞬时性计算机可读存储介质,其特征在于,所述非瞬时性计算机可读存储介质用于存储程序或指令,所述程序或指令使计算机执行如权利要求1至5任一项所述方法的步骤。

【技术特征摘要】

1.一种节点分类模型获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,αijkp满足如下条件:

3.根据权利要求2所述的方法,其特征在于,在s500中,通过如下条件对节点i对应的当前特征向量进行更新:

4.根据权利要求1所述的方法,其特征在于,满足如下条件:

5.一种节点分类模型构建装置,其特征在于,包括:

6.根据权利要求5所述的装置,其特征在...

【专利技术属性】
技术研发人员:杨桂彩卢敏周辉张杰
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1