基于NUMA架构的时变图处理方法、电子设备、介质技术

技术编号：36833017 阅读：32 留言：0更新日期：2023-03-12 01:57

本发明专利技术公开了一种基于NUMA架构的时变图处理方法、电子设备、介质，所述方法将顶点在不同快照上的若干副本组织成顶点组，并设计基于顶点组的时变图数据结构；采用时变图分割方法将顶点组分配存储至不同NUMA节点；再进行时变图处理，包括：依次对每个NUMA节点进行聚合计算，在每轮聚合计算的过程中，每个NUMA节点的每个顶点组向下一个NUMA节点发送聚合请求，下一个NUMA节点完成聚合任务后，再向其下一个NUMA节点发送聚合请求，直到所有NUMA节点都完成聚合，其中，每个NUMA节点对应的所有顶点组被并行执行。本发明专利技术方法有效减少了远程NUMA节点的随机访问次数，使时变图计算的内存访问效率得到显著提升。率得到显著提升。率得到显著提升。

全部详细技术资料下载

【技术实现步骤摘要】
基于NUMA架构的时变图处理方法、电子设备、介质

[0001]本专利技术涉及时变图计算
，具体涉及一种基于NUMA架构的时变图处理方法、电子设备、介质。

技术介绍

[0002]大数据时代的来临，推动着时变图计算的发展。时变图由多张快照组成，每个快照表示图数据结构演变过程中某个时间点的状态，通过分析时变图，可以预测现实世界未来的发展趋势，为国家安全、政府、企业等提供决策支持。时变图算法往往需要在多快照上执行同一静态图算法，当执行每个快照时，顶点被并行执行；每个顶点需要访问它的邻居顶点，产生高频率细粒度的内存访问。
[0003]NUMA（Non
‑
uniform memory access）架构，是指计算机的系统架构由多个节点（Node）组成，而每个节点内部可以拥有多个CPU，节点内部的CPU使用共有的内存控制器；节点之间通过互联模块进行连接和信息交互。NUMA架构的远程随机访问的速度要比顺序访问的速度慢一个数量级。对于时变图计算而言，每个顶点需要访问它的邻居顶点，由于图数据结构的复杂性，邻居顶点随机地分布在本地节点的内存和远程节点的内存，因此整个计算过程产生大量的远程随机内存访问（即访问远程节点的内存），很大程度上降低了时变图算法的执行速度。尽管该问题可能会对图计算的效率产生很大的影响，但是现有的大部分图处理系统并没有考虑NUMA架构对算法执行效率的影响，如Graphchi、Ligra、X
‑
stream等，它们主要专注于其他方面，如改进外存访问效率等。
[00...

【技术保护点】

【技术特征摘要】
1.一种基于NUMA架构的时变图处理方法，其特征在于，所述方法包括：将顶点在不同快照上的若干副本组织成顶点组，并设计基于顶点组的时变图数据结构；采用时变图分割方法将顶点组分配存储至不同NUMA节点；通过Notify
‑
Fly
‑
Notify进行时变图处理，包括：依次对每个NUMA节点进行聚合计算，在每轮聚合计算的过程中，每个NUMA节点的每个顶点组向下一个NUMA节点发送聚合请求，下一个NUMA节点完成聚合任务后，再向其下一个NUMA节点发送聚合请求，直到所有NUMA节点都完成聚合。2.根据权利要求1所述的基于NUMA架构的时变图处理方法，其特征在于，所述顶点组由顶点的ID及N个表示顶点在不同快照的状态值组成，其中N为快照的数量。3.根据权利要求2所述的基于NUMA架构的时变图处理方法，其特征在于，基于顶点组的时变图数据结构包括：顶点组ID、顶点在不同快照的状态值、顶点在不同快照的聚合值。4.根据权利要求1或3所述的基于NUMA架构的时变图处理方法，其特征在于，NUMA节点的数据布局包括设计的基于顶点组的时变图数据结构和任务队列数据结构。5.根据权利要求4所述的基于NUMA架构的时变图处理方法，其特征在于，任务队列数据结构包括：顶点ID、入边邻居ID列表、顶点在不同快照的聚合值。6.根据权利要求1所述的基于NUMA架构的时变图处理方法，其特征在于，所述时变图分割方法选自METIS、SGP或RoundRobin。7.根据权利要求1所述的基于NUMA架构的时变图处理方法，其特征在于，通...

【专利技术属性】
技术研发人员：程永利，陈光，曾令仿，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人