当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于多视图的图神经网络的重要节点识别方法技术

技术编号:33252512 阅读:11 留言:0更新日期:2022-04-30 22:51
本发明专利技术公开了一种基于多视图的图神经网络的重要节点识别方法,从社交平台上获取用户信息;根据用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构;扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入;利用高阶的拓扑结构矩阵表示节点之间的关系,使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点;本发明专利技术不仅能够提高模型的表达能力,同时能够泛化到没有明显图结构的数据上,提取新的关系,建立图结构,利用图神经网络模型,提高网络中重要节点识别的性能。中重要节点识别的性能。中重要节点识别的性能。

【技术实现步骤摘要】
一种基于多视图的图神经网络的重要节点识别方法


[0001]本专利技术涉及网络中重要节点识别,主要使用图神经网络的方法,从多视图的角度学习节点的表示,然后使用多层感知器得到节点的重要性评分。

技术介绍

[0002]网络是描述现实世界中普遍存在的对象与对象之间关系的一种数据形式,如神经系统网络、生物网络、交通网络、社交网络、金融交易网络等等。大量的物理学家开始研究现实世界中更加复杂多变的网络,发展出复杂网络这一研究方向,研究者们主要从统计物理的角度研究复杂网络模型如小世界网和无标度网等)及其复杂结构(如社团、层次、节点分类等)、网络上的动力学(如信息传播、网络演化等)等等。最近十几年,得益于机器学习,特别是深度学习的快速发展,研究者开始从机器学习的角度研究网络。
[0003]目前,深度学习已经成为人工智能领域最炙手可热的技术之一,在图像、语音和自然语言处理领域表现出最优的性能。基于通用近似理论,深度学习架构能够拟合现实世界中非常复杂的函数,因此深度学习模型在提取数据底层复杂模式的表达能力被广泛认可。然而网络作为表示关系数据的一般形式,深度学习处理网络数据却是一个难点,如何利用深度学习技术进行复杂的网络数据分析已经吸引了大量的研究者。
[0004]将传统深度学习技术扩展到网络领域主要存在以下挑战。首先网络是不规则领域,同图像、文本具有清晰的网格结构不同,网络数据是非欧几里得空间,传统的卷积、池化等操作难以直接用到网络数据上。其次是可扩展性,大数据时代,实际的网络数据经常数百万,甚至数十亿规模,例如社交网络、电商交易网络等,算法的可扩展性是其能否落地的关键因素。然后是网络数据的多变性,网络可以是无向图和有向图、静态的和动态的、有符号的和无符号的、同质的和异质的等等,处理不同的数据类型需要设计不同的模型架构。最后是跨学科,网络通常和其他学科,如化学、生物等学科息息相关,结合领域知识设计模型更加困难,例如分子图生成,目标函数和化学约束通常不可微分,无法使用梯度下降的训练方式。
[0005]重要节点识别是网络分析中一个重要的问题,传统上使用启发式的算法,基于网络的拓扑节点,例如节点度,k

shell,接近中心性等方法来识别重要的节点。使用图神经网络的方法,可以同时利用拓扑结构和节点丰富的属性信息以及神经网络强大的拟合能力,更好的识别出重要的节点。

技术实现思路

[0006]专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于多视图的图神经网络的重要节点识别方法,本专利技术基于图神经网络的方法识别网络中重要的节点,潜在的应用场景包括众包(指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的而且通常是大型的大众志愿者的做法),利用社交网络识别重要的大众志愿者,能够更好的完成任务。
[0007]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0008]一种基于多视图的图神经网络的重要节点识别方法,包括如下步骤:
[0009]步骤1,数据采集阶段,从社交平台上获取用户信息。
[0010]步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构。
[0011]步骤3,网络嵌入阶段:根据步骤2得到的网络图结构的基础上,扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入。
[0012]步骤4,计算多视图:利用高阶的拓扑结构矩阵表示节点之间的关系。
[0013]步骤5,重要节点识别阶段:基于步骤4得到的高阶的拓扑结构矩阵表示节点之间的关系使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点。
[0014]优选的:步骤2中建立网络数据的方法
[0015]步骤2a),对用户信息中数据缺失的属性进行补0。
[0016]步骤2b),将所有用户表示为节点,用户之间的关系表示为连边建立图结构。
[0017]步骤2c),用户的相关属性处理为网络中节点的特征,得到网络图结构。
[0018]优选的:步骤4中利用高阶的拓扑结构矩阵表示节点之间的关系的方法如下:
[0019]步骤4a),在图上进行信息传播是获得节点之间相似性的一种方法,传播能够得到节点对之间的高阶拓扑结构相似性,首先使用个性化的PageRank方法得到传播矩阵。
[0020]步骤4b),基于节点的特征向量矩阵,计算得到图数据的另一种视图

特征相似性矩阵。
[0021]步骤4c),基于步骤2得到的网络图结构、步骤4a)得到的传播矩阵、步骤4b)得到特征相似性矩阵,得到三种视图,分别从局部接近性、全局接近性和特征相似性三个方面描述网络中节点之间的关系。
[0022]步骤4d),步骤4c)得到的三种视图分别使用图卷积神经网络得到节点的表示。
[0023]优选的:步骤5中识别出重要节点的方法如下:
[0024]步骤5a),使用通道注意力机制融合三种视图下节点的表示。
[0025]步骤5b),基于节点的表示使用多层感知器计算得到节点的重要性评分。
[0026]步骤5c),基于神经网络学习到的节点重要性评分,计算排序损失,得到端到端训练模型。
[0027]步骤5d),根据步骤5a)

步骤5c),构造出一个端到端的基于多视图的图神经网络。
[0028]优选的:步骤1用户信息包括年龄、性别、职业、教育背景、粉丝、关注。
[0029]本专利技术相比现有技术,具有以下有益效果:
[0030]1,相对于传统的基于网络拓扑信息识别中的节点,本专利技术使用图神经网络的方法,能够同时利用拓扑信息和节点的属性信息。
[0031]2,基于多视图的方法融合网络数据的多视图信息,能够得到比较完整的数据信息,刻画真实的数据分布。同时基于通道注意力的方法能够自适应融合不同视图的信息,学习到更优的节点表示。
[0032]3,该模型是端到端训练,数据驱动的,能够更准确的识别网络中的重要节点。
附图说明
[0033]图1为本专利技术的方法整体流程图。
具体实施方式
[0034]下面结合附图和具体实施例,进一步阐明本专利技术,应理解这些实例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0035]一种基于多视图的图神经网络的重要节点识别方法,如图1所示,包括如下步骤:
[0036]步骤1,数据采集阶段,从社交平台上获取足够多的用户,提取年龄、性别、职业、教育背景、粉丝、关注等属性的数据。
[0037]步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多视图的图神经网络的重要节点识别方法,其特征在于,包括如下步骤:步骤1,数据采集阶段,从社交平台上获取用户信息;步骤2,数据预处理阶段:对用户信息进行预处理,然后根据预处理的用户信息将所有用户表示为节点,用户之间的关系表示为连边,用户的相关属性表示为特征,建立网络图结构;步骤3,网络嵌入阶段:根据步骤2得到的网络图结构的基础上,扩展为多视图,从不同角度描述数据,在不同视图上使用图神经网络的方法得到节点的嵌入;步骤4,计算多视图:利用高阶的拓扑结构矩阵表示节点之间的关系;步骤5,重要节点识别阶段:基于步骤4得到的高阶的拓扑结构矩阵表示节点之间的关系使用注意力的方法融合多视图信息,得到节点最终的表示,预测节点的重要性,得到端到端训练模型,识别出重要的节点。2.根据权利要求1所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤2中建立网络数据的方法步骤2a),对用户信息中数据缺失的属性进行补0;步骤2b),将所有用户表示为节点,用户之间的关系表示为连边建立图结构;步骤2c),用户的相关属性处理为网络中节点的特征,得到网络图结构。3.根据权利要求2所述一种基于多视图的图神经网络的重要节点识别方法,其特征在于:步骤4中利用高阶的拓扑结构矩阵表示节点之间的关系的方法如...

【专利技术属性】
技术研发人员:王崇骏袁金亮徐鸣孙浩然张雷
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1