当前位置: 首页 > 专利查询>之江实验室专利>正文

一种增量式的元路径存储及动态维护的方法及系统技术方案

技术编号:37993742 阅读:10 留言:0更新日期:2023-06-30 10:07
本发明专利技术涉及一种增量式的元路径存储及动态维护的方法,包括初始化阶段获取所有的元路径实例,并将给定异质图及给定类型元路径的元路径实例转化为一种新颖的元路径实例的存储格式:路径图;在图更新发生后,响应于接收到的图更新信息,对路径图执行动态维护,即对上述元路径存储格式进行遍历,得到元路径更新的位置并对其进行更新;对于元路径长度大于2且中心部位对称的元路径,上述存储格式进行中心合并操作,以简化该存储格式,并且加速后续还原步骤;对不满足合并条件的路径图则执行恢复操作。本发明专利技术利用图更新的特点得到元路径更新的局部性,结合元路径实例内部关系特性,大大提高元路径生成速度,使动态异质图模型的实时推理成为可能。理成为可能。理成为可能。

【技术实现步骤摘要】
一种增量式的元路径存储及动态维护的方法及系统


[0001]本专利技术涉及图神经网络加速系统
,尤其涉及一种增量式的元路径存储及动态维护的方法及系统。

技术介绍

[0002]图数据的应用越来越广泛,对于同质图(Homogeneous graph)的研究已经很完善了,随之而来的是异质图(Heterogeneous Graph)的兴起。异质图被广泛应用于情感对话生成、恶意账户检测、垃圾邮件审查检测等领域。由于异质图比齐次图能更全面地反映顶点和边的信息,许多著名的企业和公司在实践中广泛使用异质图来解决问题。例如,阿里巴巴使用异质图检测垃圾邮件,滴滴使用异质图预测用户的出租车信息。此外,论文引用数据集,如DBLP,也包含不同的顶点和边缘类型,代表作者、论文、会议等信息。因此,基于异质图的模型越来越多,包括异质信息网络嵌入(Heterogeneous Information Network Embedding)和异质图神经网络(Heterogeneous Graph Neural Network)。
[0003]异质图中多类型的节点和关系之间存在复杂的交互,如何精确地提取出不同的语义信息成为研究的难点。现今异质图最主要的应用程序是基于元路径的,借助元路径对多类型节点和关系的引导,可以捕捉到异质图中的多重语义表示。元路径是一个顶点类型序列(通常表示为V1V2…
V
n
),表示多个顶点之间关系的组合,而元路径实例就是实例化的元路径(通常表示为v1v2…
v
n
)。通过元路径,可以有效地获取异质图中的语义和结构信息。
[0004]在基于元路径的异质图中获取语义和结构信息需要事先匹配元路径实例,然后在元路径实例的基础上进行基于元路径的聚合,包括元路径内部的聚合(结构信息聚合)以及元路径之间的聚合(语义信息聚合)。基于元路径的图模型通常可以分为两种类型,一种是使用所有元路径实例,另一种是通过采样使用部分元路径实例。在现实世界中,图通常是不断变化的,这意味着会对顶点或边进行一系列的添加或删除。当图发生变化时,每次都需要重新匹配元路径进行模型推理,这导致了显著的模型延迟,更重要的是对动态异质图进行实时推理,例如滴滴打车系统就需要对用户打车信息进行实时预测。如果延迟过高,则会导致非常糟糕的用户体验。
[0005]现有的面对动态异质图神经网络中生成元路径的方法主要是通过预处理的方法,即:对于每种元路径,对异质图中的每个顶点都进行顺序遍历,以匹配元路径实例。由于图的稀疏性和不规则性,这种匹配方法带来的时间开销很大,在面对需要实时推理的场景时,会产生巨大的时延。还有的方法使用候选集的方法在原有元路径实例的基础上进行修正式处理,但这种方法仅局限于少量图更新,一旦图更新次数增多,模型准确性将大大降低。
[0006]如上所述,基于元路径的异质图神经网络被广泛应用,但已公开的专利技术专利均没有解决本专利技术提出的问题。本专利技术旨在提出一种异质图神经网络中元路径的高效生成方法和系统,其研究重点在于加速基于元路径的异质图神经网络中的匹配元路径的阶段,该阶段在异质图神经网络实时推理过程中的耗时占比最高。
[0007]此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于申请人做出
本专利技术时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本专利技术不具备这些现有技术的特征,相反本专利技术已经具备现有技术的所有特征,而且申请人保留在
技术介绍
中增加相关现有技术之权利。

技术实现思路

[0008]针对现有技术无法实现异质图神经网络中元路径生成时间开销过大的问题,本专利技术提供了一种增量式的元路径实例的动态维护方法及系统,充分利用了动态图中图更新的特性,减少了在元路径生成过程中的大量无规则数据访问,达到提升算法性能的目的。
[0009]为实现上述目的,本专利技术提供了一种增量式的元路径实例的动态维护方法,包括:
[0010]将给定异质图及给定类型元路径的元路径实例转化为路径图;
[0011]执行图更新任务,并对经图更新任务的路径图执行动态维护;
[0012]对经动态维护的路径图执行触发条件查询,其中,
[0013]对满足触发条件的路径图执行合并操作;和
[0014]对不满足触发条件的路径图执行恢复操作。
[0015]优选地,将给定异质图及给定类型元路径的元路径实例转化为路径图可以包括:
[0016]S11:针对给定原始图和给定类型的元路径,匹配图中满足元路径定义的元路径实例;
[0017]S12:遍历S11得到的元路径实例以将元路径实例转化为路径图。
[0018]优选地,执行图更新任务,并对经图更新任务的路径图执行动态维护可以包括:
[0019]S21:判断所增加或删除的点或边的类型是否影响现有的元路径实例,若影响,则执行后续步骤,否则跳过;
[0020]S22:若图更新类型为删除边,则遍历该条边类型在路径图中的对应类型的点集合,并对其执行删除操作;
[0021]S23:若图更新类型为增加边,则遍历该条边类型在路径图中的对应类型的点集合的邻居集合,以确定需要在路径图中增加的点或边的位置;
[0022]S24:若图更新类型为增加或删除点,则转化为增加或删除多条边的操作,并重复步骤S22和S23。
[0023]特别地,步骤S22中,若删除操作同时产生一个或多个独立点,则需要将这些独立点一并删除。
[0024]优选地,对满足触发条件的路径图执行合并操作可以包括:
[0025]S31:获取所有给定元路径类型中满足元路径定义的元路径;
[0026]S32:针对步骤S31中获取的元路径,获取其对应的路径图;
[0027]S33:针对步骤S32中获取的路径图,将其中心部位进行合并操作。
[0028]特别地,满足元路径定义的元路径具体可以是满足长度大于预设长度(如2)且中心部位对称(如中心部位满足V
i
V
j
V
i
形式)的元路径。此外,将满足元路径定义的元路径的中心部位进行合并操作可以是仅保留V
i
V
j
V
i
的V
j
部分。
[0029]优选地,对不满足触发条件的路径图执行恢复操作可以包括:
[0030]S41:针对未执行合并操作的路径图,按照顺序遍历路径图,以得到所有的元路径实例;
[0031]S42:针对已执行合并操作的路径图,从其中心开始向两侧的方向遍历路径图,以得到所有的元路径实例。
[0032]优选地,步骤S11可以包括:
[0033]S111:针对原始图和给定类型的元路径,从图中某个顶点出发,依次匹配符合元路径定义的实例;
[0034]S112:重复步骤S111,直至遍历整个原始图以获取所有的元路径实例;
[0035]S113:针对给定的不同类型的元路径本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种增量式的元路径存储及动态维护的方法,其特征在于,包括:将给定异质图及给定类型元路径的元路径实例转化为路径图;执行图更新任务,并对经历图更新的路径图执行动态维护;对经所述动态维护的路径图执行触发条件查询,其中,对满足触发条件的所述路径图执行合并操作;和对不满足触发条件的所述路径图执行恢复操作。2.根据权利要求1所述的方法,其特征在于,所述将给定异质图及给定类型元路径的元路径实例转化为路径图包括:针对给定原始图和给定类型的元路径,匹配图中满足元路径定义的元路径实例;遍历所述元路径实例以将所述元路径实例转化为路径图。3.根据权利要求1或2所述的方法,其特征在于,所述执行图更新任务,并对经历图更新的路径图执行动态维护包括:判断所增加或删除的点或边的类型是否影响现有的元路径实例,若影响,则执行后续步骤,否则跳过;若图更新类型为删除边,则遍历该条边类型在路径图中的对应类型的点集合,并对其执行删除操作;若图更新类型为增加边,则遍历该条边类型在路径图中的对应类型的点集合的邻居集合,以确定需要在路径图中增加的点或边的位置;若图更新类型为增加或删除点,则转化为增加或删除多条边的操作,并重复“若图更新类型为删除边,则遍历该条边类型在路径图中的对应类型的点集合,并对其执行删除操作”或“若图更新类型为增加边,则遍历该条边类型在路径图中的对应类型的点集合的邻居集合,以确定需要在路径图中增加的点或边的位置”之步骤。4.根据权利要求1~3任一项所述的方法,其特征在于,所述对满足触发条件的所述路径图执行合并操作包括:获取所有给定元路径类型中满足元路径定义的元路径;针对满足元路径定义的所述元路径,获取其对应的路径图;针对所述路径图,将其中心部位进行合并操作。5.根据权利要求1~4任一项所述的方法,其特征在于,所述对不满足触发条件的所述路径图执行恢复操作包括:针对未执行合并操作的路径图,按照顺序遍历路径图,以得到所有的元路径实例;针对已执...

【专利技术属性】
技术研发人员:郑龙何海恒廖小飞金海陈聃黄禹
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1