System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据网络图的嵌入方法、装置、计算机设备和存储介质制造方法及图纸_技高网

数据网络图的嵌入方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40341964 阅读:5 留言:0更新日期:2024-02-09 14:29
本申请涉及一种数据网络图的嵌入方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于人工智能和智能交通网领域,包括:通过第一网络嵌入模型对数据网络图和负样本网络图进行节点特征提取,得到正样本嵌入向量和负样本嵌入向量;通过第一网络嵌入模型对数据网络图的第一增强图和第二增强图进行节点特征提取,得到第一全局嵌入向量和第二全局嵌入向量;确定第一匹配度和第二匹配度;依据第一匹配度和第二匹配度确定的损失值调整第一网络嵌入模型的参数;基于调整后的第一网络嵌入模型对数据网络图进行节点特征提取,得到用于对数据网络图中各节点分类的嵌入向量。采用本方法能提取出鲁棒的嵌入向量以提高数据网络图的分类效果。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种数据网络图的嵌入方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、在一些应用场景中,在获得数据集之后,需要对数据集内的数据进行分类。传统的数据分类方案中,通常是将获得的数据集转换成数据网络图,然后采用网络嵌入模型对数据网络图进行节点嵌入,得到该数据网络图的嵌入向量,然后利用该嵌入向量进行分类。然而,获得的数据集通常可能是不平衡数据集,因此对应的数据网络图中不同类别节点间的特征存在差异,采用传统方案中所得的数据网络图的嵌入向量在进行节点分类时,导致分类效果较差。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种数据网络图的嵌入方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,能够提取出鲁棒的嵌入向量以提高数据网络图的分类效果。

2、第一方面,本申请提供了一种数据网络图的嵌入方法。所述方法包括:

3、通过第一网络嵌入模型对数据网络图和负样本网络图进行节点特征提取,得到正样本嵌入向量和负样本嵌入向量;所述数据网络图为正样本网络图,是基于不平衡的对象数据集构建所得的不平衡网络图;

4、通过所述第一网络嵌入模型对所述数据网络图的第一增强图和第二增强图进行节点特征提取,得到第一全局嵌入向量和第二全局嵌入向量;

5、确定所述正样本嵌入向量与所述第一全局嵌入向量、所述第二全局嵌入向量之间的第一匹配度,以及确定所述负样本嵌入向量与所述第一全局嵌入向量、所述第二全局嵌入向量之间的第二匹配度;

6、依据所述第一匹配度和所述第二匹配度确定损失值,并基于所述损失值调整所述第一网络嵌入模型的参数;

7、基于调整后的所述第一网络嵌入模型对所述数据网络图进行节点特征提取,得到用于对所述数据网络图中各节点分类的嵌入向量。

8、第二方面,本申请还提供了一种数据网络图的嵌入装置。所述装置包括:

9、第一提取模块,用于通过第一网络嵌入模型对数据网络图和负样本网络图进行节点特征提取,得到正样本嵌入向量和负样本嵌入向量;所述数据网络图为正样本网络图,是基于不平衡的对象数据集构建所得的不平衡网络图;

10、第二提取模块,用于通过所述第一网络嵌入模型对所述数据网络图的第一增强图和第二增强图进行节点特征提取,得到第一全局嵌入向量和第二全局嵌入向量;

11、确定模块,用于确定所述正样本嵌入向量与所述第一全局嵌入向量、所述第二全局嵌入向量之间的第一匹配度,以及确定所述负样本嵌入向量与所述第一全局嵌入向量、所述第二全局嵌入向量之间的第二匹配度;

12、调整模块,用于依据所述第一匹配度和所述第二匹配度确定损失值,并基于所述损失值调整所述第一网络嵌入模型的参数;

13、第三提取模块,用于基于调整后的所述第一网络嵌入模型对所述数据网络图进行节点特征提取,得到用于对所述数据网络图中各节点分类的嵌入向量。

14、在其中的一个实施例中,所述装置还包括:

15、增强模块,用于对所述数据网络图进行第一数据增强处理,得到所述第一增强图;对所述数据网络图进行第二数据增强处理,得到所述第二增强图;其中,所述第一数据增强处理与所述第二数据增强处理分别为特征掩盖、边扰动或子图提取。

16、在其中的一个实施例中,所述增强模块,还用于在所述数据网络图中选取采样节点,以所述第一采样节点为中心点逐级扩散采样,并在逐级扩散采样过程中,将每次采样的邻居节点置于第一采样集内;当所述第一采样集内的节点数量达到目标值时,停止采样,得到所述第一增强图;对所述数据网络图进行特征掩盖,得到所述第二增强图。

17、在其中的一个实施例中,所述装置还包括:

18、打乱模块,用于对所述数据网络图中的节点对应的特征进行乱序处理,得到负样本网络图;其中,所述负样本网络图的节点结构与所述数据网络图的节点结构一致。

19、在其中的一个实施例中,所述装置还包括:

20、构建模块,用于获取所述对象数据集和所述对象数据集内各对象数据之间的关联关系;以所述对象数据集内的各对象数据为节点、以所述关联关系为各所述节点的边构建数据网络图。

21、在其中的一个实施例中,所述第一增强图和所述第二增强图分别是对所述数据网络图进行数据增强所得的增强图;

22、所述第二提取模块,还用于通过所述第一网络嵌入模型,分别从所述第一增强图和所述第二增强图中提取各节点的第一局部嵌入向量和第二局部嵌入向量;分别对所述第一局部嵌入向量和所述第二局部嵌入向量进行池化处理,得到所述第一全局嵌入向量和所述第二全局嵌入向量。

23、在其中的一个实施例中,所述第二提取模块,还用于获取所述第一增强图中各节点的第一邻接矩阵和第一特征矩阵;将所述第一邻接矩阵和所述第一特征矩阵输入至所述第一网络嵌入模型,以使所述第一网络嵌入模型基于所述第一邻接矩阵、所述第一邻接矩阵的度矩阵、所述第一特征矩阵和所述第一网络嵌入模型的权重矩阵,生成所述第一增强图中各节点的第一局部嵌入向量;获取所述第二增强图中各节点的第二邻接矩阵和第二特征矩阵;将所述第二邻接矩阵和所述第二特征矩阵输入至所述第一网络嵌入模型,以使所述第一网络嵌入模型基于所述第二邻接矩阵、所述第二邻接矩阵的度矩阵、所述第一特征矩阵和所述第一网络嵌入模型的权重矩阵,生成所述第二增强图中各节点的第二局部嵌入向量。

24、在其中的一个实施例中,所述装置还包括:

25、第四提取模块,用于通过第二网络嵌入模型对所述数据网络图进行节点特征提取,并基于提取的节点特征重构出目标邻接矩阵;

26、所述调整模块,还用于依据所述目标邻接矩阵和矩阵标签之间的损失值,对所述第二网络嵌入模型的参数进行调整;

27、所述第四提取模块,还用于当调整后的所述第二网络嵌入模型达到收敛条件时,通过调整后的所述第二网络嵌入模型获得所述数据网络图中各节点的结构信息;将所述嵌入向量和所述结构信息之间的拼接向量,作为用于对所述数据网络图中各节点分类的目标嵌入向量。

28、在其中的一个实施例中,所述装置还包括:

29、分类模块,用于通过分类器对所述目标嵌入向量进行分类处理,得到预测结果;

30、所述调整模块,还用于基于所述预测结果与分类标签之间的损失值,对所述分类器进行参数调整;当调整后的所述分类器达到所述收敛条件时,停止训练过程。

31、在其中的一个实施例中,所述装置还包括:

32、第一应用模块,用于获取文献引用关系图;通过所述第一网络嵌入模型提取所述文献引用关系图的第一嵌入向量;通过所述第二网络嵌入模型提取所述文献引用关系图的第一结构数据;通过所述分类器,对拼接所述第一嵌入向量和所述第一结构数据所得的目标嵌入向量进行分类处理,得到各文献的主题或所属领域。

33、在其中的一个实施例中,所述装置还包括:

34、第二应用模块,用于获本文档来自技高网...

【技术保护点】

1.一种数据网络图的嵌入方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述数据网络图进行第一数据增强处理,得到所述第一增强图包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述第一增强图和所述第二增强图分别是对所述数据网络图进行数据增强所得的增强图;

7.根据权利要求6所述的方法,其特征在于,所述通过所述第一网络嵌入模型,分别从所述第一增强图和所述第二增强图中提取各节点的第一局部嵌入向量和第二局部嵌入向量包括:

8.根据权利要求1至7任一项所述的方法,其特征在于,所述基于调整后的所述第一网络嵌入模型对所述数据网络图进行节点特征提取,得到用于对所述数据网络图中各节点分类的嵌入向量之后,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的方法,其特征在于,所述方法还包括:

11.根据权利要求9所述的方法,其特征在于,所述方法还包括:

12.根据权利要求9所述的方法,其特征在于,所述方法还包括:

13.一种数据网络图的嵌入装置,其特征在于,所述装置包括:

14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12任一项所述的方法的步骤。

15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12任一项所述的方法的步骤。

16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至12任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种数据网络图的嵌入方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述数据网络图进行第一数据增强处理,得到所述第一增强图包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述第一增强图和所述第二增强图分别是对所述数据网络图进行数据增强所得的增强图;

7.根据权利要求6所述的方法,其特征在于,所述通过所述第一网络嵌入模型,分别从所述第一增强图和所述第二增强图中提取各节点的第一局部嵌入向量和第二局部嵌入向量包括:

8.根据权利要求1至7任一项所述的方法,其特征在于,所述基于调整后的所述第一网络嵌入模型对所述数据网络图进行节点特征提取,得到用于对所述数据网络图中...

【专利技术属性】
技术研发人员:张杰黄文董井然陈守志陈川张梓旸
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1