一种基于稀疏注意力的动态图链接预测方法和系统技术方案

技术编号：40794458 阅读：19 留言：0更新日期：2024-03-28 19:22

本发明专利技术公开了一种基于稀疏注意力的动态图链接预测方法，包括：获取待分析的、包括源节点和目标节点的节点对的节点对信息，从获取的待分析的节点对的节点对信息进行邻居采样处理，以得到节点对的邻域信息列表集合，对节点对的邻域信息列表集合进行数据格式规范化处理，以得到规范化后的节点对的邻域子图信息列表集合，将规范化后的节点对的邻域子图信息列表集合输入预先训练好的基于稀疏注意力的动态图链接预测模型中，以得到节点对的链接预测结果。本发明专利技术能够解决现有基于时间随机游走的动态图链接预测方法的时间随机游走采样过程的时间复杂度与游走次数和深度成正比，导致较为低效的训练效率的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于动态图链接预测领域，更具体地，涉及一种基于稀疏注意力的动态图链接预测方法和系统。

技术介绍

1、动态图可以根据其离散或连续时间的性质分类为离散时间动态图(discrete-time dynamic graph，简称dtdg)和连续时间动态图(continuous-time dynamic graph，简称ctdg)，其中ctdg可以视为一系列带时间戳的事件流，其随着节点级和边级时间而演变，例如节点u和节点v在时间t时发生的相互作用表示为元组(u,v,t)，其更接近现实场景，能允许更精细的时间分辨率。近年来，图数据以惊人的速度增长，存在于诸如社交网络、科学引用与写作、交通系统以及推荐系统等等现实场景，这些数据中的节点可能代表人、帖子、论文、商品等等，而链接则可能代表回复、引用、购买等等，这些链接往往是海量的且随时间不断演化的，因此预测未来某些链接是否会发生具有很大的商业价值与实现意义，其中链接预测(link prediction)是指给定两个节点预测其在未来某个时间是否会有交互。总的来说，研究连续时间动态图链接预测是迈向真实世界的实用机器学习的重要一步。

2、当前主流的动态图链接预测方法主要有如下几类：基于时间随机游走的动态图链接预测方法、基于时间图神经网络的动态图链接预测方法、基于内存网络的动态图链接预测方法、以及基于序列模型的动态图链接预测方法；针对基于时间随机游走的动态图链接预测方法，其采用因果抽取和基于集合的匿名化，前者按照时序倒序抽取游走，后者对一组采样游走用节点的命中次数替换节点身份，提升了c

3、然而，上述方法都存在一些不可忽略的缺陷：

4、1、基于时间随机游走的动态图链接预测方法的时间随机游走采样过程的时间复杂度与游走次数和深度成正比，这一部分相对于嵌入表示学习部分反而成了训练过程的最大瓶颈，导致较为低效的训练效率；

5、2、基于时间图神经网络的动态图链接预测方法存在关键的邻域聚合步骤，该方法的计算图会随模型深度的增加呈指数增长，导致出现邻域爆炸问题；

6、3、基于内存网络的动态图链接预测方法分别对源节点和目标节点聚合时间邻域信息时采用rnn类架构，这会导致高额的计算成本，并在优化过程中存在梯度的消失问题，从而无法捕获长期的依赖关系；

7、4、基于序列模型的动态图链接预测方法引入了transformer模型，但由于注意力模块具有相对于上下文大小二次的时间和空间复杂度，导致其存在冗余的特征学习和扩展性问题。

技术实现思路

1、针对现有技术的以上缺陷或改进需求，本专利技术提供了一种基于稀疏注意力的动态图链接预测方法。其目的在于，解决现有基于时间随机游走的动态图链接预测方法的时间随机游走采样过程的时间复杂度与游走次数和深度成正比，导致较为低效的训练效率的技术问题；以及现有基于时间图神经网络的动态图链接预测方法存在关键的邻域聚合步骤，该方法的计算图会随模型深度的增加呈指数增长，导致出现邻域爆炸的技术问题；以及现有基于内存网络的动态图链接预测方法由于在两个目标交互节点的时间邻域聚合信息时采用rnn类架构，导致高额的计算成本以及在优化过程中存在梯度的消失问题，从而无法捕获长期的依赖关系的技术问题；以及现有基于序列模型的动态图链接预测方法由于使用了相对于上下文大小二次的时间和空间复杂度注意力模块，导致冗余的特征学习和扩展性的技术问题。

2、为实现上述目的，按照本专利技术的一个方面，提供了一种基于稀疏注意力的动态图链接预测方法，包括以下步骤：

3、(1)获取待分析的、包括源节点和目标节点的节点对的节点对信息。

4、(2)从步骤(1)获取的待分析的节点对的节点对信息进行邻居采样处理，以得到节点对的邻域信息列表集合；

5、(3)对步骤(2)得到的节点对的邻域信息列表集合进行数据格式规范化处理，以得到规范化后的节点对的邻域子图信息列表集合；

6、(4)将步骤(3)规范化后的节点对的邻域子图信息列表集合输入预先训练好的基于稀疏注意力的动态图链接预测模型中，以得到节点对的链接预测结果。

7、优选地，步骤(2)具体为，首先，基于最近时间优先获取源节点在时间戳ts之前有过链接交互的u个邻居，以及目标节点在时间戳ts之前有过链接交互的u个邻居；然后，使用源节点的u个邻居的节点id创建第一节点id列表，使用目标节点的u个邻居的节点id创建第二节点id列表，其中第一节点id列表的每个条目为源节点的一个邻居的节点id，第二节点id列表的每个条目为目标节点的一个邻居的节点id；随后，使用源节点与u个邻居相连的边id创建第一边id列表，使用目标节点与u个邻居相连的边id创建第二边id列表，其中第一边id列表的每个条目为源节点与其一个邻居的链接边的id，第二边id列表的每个条目为目标节点与其一个邻居的链接边的id；接着，使用源节点与u个邻居交互的时间戳创建第一时间戳列表，使用目标节点与u个邻居交互的时间戳创建第二时间戳列表，其中第一时间戳列表的每个条目为源节点与其一个邻居的链接交互时间戳，第二时间戳列表的每个条目为目标节点与其一个邻居的链接交互时间戳；最后第一节点id列表、第二节点id列表、第一边id列表、第二边id列表、第一时间戳列表和第二时间戳列表共同组成节点对的邻域信息列表集合，其中以上6个列表的条目总数均为u。

8、优选地，步骤(3)包括如下子步骤：

9、(3-1)判断节点对的邻域信息列表集合中的第一节点id列表、第二节点id列表、第一边id列表、第二边id列表、第一时间戳列表和第二时间戳列表中的条目总数是否均大于m(其中m的取值一般大于u，优选为32)，如果是则进入步骤(3-2)，否则进入步骤(3-3)；

10、(3-2)截取第一节点id列表、第二节点id列表、第一边id列表、第二边id列表、第一时间戳列表和第二时间戳列表中的倒数m个条目，以得到条目总数均为m的更新后的第一节点id列表、第二节点id列表、第一边id列表、第二边id列表、第一时间戳列表和第二时间戳列表，然后进入步骤(3-4)；

11、(3-3)将第一节点id列表、第二节点id列表、第一边id列表、第二边id列表、第一时间戳列表和第二时间戳列表的末尾都扩充m-本文档来自技高网...

【技术保护点】

1.一种基于稀疏注意力的动态图链接预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于稀疏注意力的动态图链接预测方法，其特征在于，步骤(2)具体为，首先，基于最近时间优先获取源节点在时间戳ts之前有过链接交互的U个邻居，以及目标节点在时间戳ts之前有过链接交互的U个邻居；然后，使用源节点的U个邻居的节点id创建第一节点id列表，使用目标节点的U个邻居的节点id创建第二节点id列表，其中第一节点id列表的每个条目为源节点的一个邻居的节点id，第二节点id列表的每个条目为目标节点的一个邻居的节点id；随后，使用源节点与U个邻居相连的边id创建第一边id列表，使用目标节点与U个邻居相连的边id创建第二边id列表，其中第一边id列表的每个条目为源节点与其一个邻居的链接边的id，第二边id列表的每个条目为目标节点与其一个邻居的链接边的id；接着，使用源节点与U个邻居交互的时间戳创建第一时间戳列表，使用目标节点与U个邻居交互的时间戳创建第二时间戳列表，其中第一时间戳列表的每个条目为源节点与其一个邻居的链接交互时间戳，第二时间戳列表的每个条目为目标节点与其一个邻居的链

3.根据权利要求1或2所述的基于稀疏注意力的动态图链接预测方法，其特征在于，步骤(3)包括如下子步骤：

4.根据权利要求1至3中任意一项所述的基于稀疏注意力的动态图链接预测方法，其特征在于，

5.根据权利要求4所述的基于稀疏注意力的动态图链接预测方法，其特征在于，

6.根据权利要求5所述的基于稀疏注意力的动态图链接预测方法，其特征在于，基于稀疏注意力的动态图链接预测模型是通过以下步骤训练得到的：

7.根据权利要求6所述的基于稀疏注意力的动态图链接预测方法，其特征在于，步骤(4-2)具体包括以下子步骤：

8.根据权利要求7所述的基于稀疏注意力的动态图链接预测方法，其特征在于，步骤(4-2-3)包括如下子步骤：

9.根据权利要求8所述的基于稀疏注意力的动态图链接预测方法，其特征在于，

10.一种基于稀疏注意力的动态图链接预测系统，其特征在于，包括：

...

【技术特征摘要】

1.一种基于稀疏注意力的动态图链接预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于稀疏注意力的动态图链接预测方法，其特征在于，步骤(2)具体为，首先，基于最近时间优先获取源节点在时间戳ts之前有过链接交互的u个邻居，以及目标节点在时间戳ts之前有过链接交互的u个邻居；然后，使用源节点的u个邻居的节点id创建第一节点id列表，使用目标节点的u个邻居的节点id创建第二节点id列表，其中第一节点id列表的每个条目为源节点的一个邻居的节点id，第二节点id列表的每个条目为目标节点的一个邻居的节点id；随后，使用源节点与u个邻居相连的边id创建第一边id列表，使用目标节点与u个邻居相连的边id创建第二边id列表，其中第一边id列表的每个条目为源节点与其一个邻居的链接边的id，第二边id列表的每个条目为目标节点与其一个邻居的链接边的id；接着，使用源节点与u个邻居交互的时间戳创建第一时间戳列表，使用目标节点与u个邻居交互的时间戳创建第二时间戳列表，其中第一时间戳列表的每个条目为源节点与其一个邻居的链接交互时间戳，第二时间戳列表的每个条目为目标节点与其一个邻居的链接交互时间戳；最后第一...

【专利技术属性】
技术研发人员：唐卓，吴优，李肯立，肖雄，张嘉鹏，陈长建，唐哲浩，安振宇，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人