图特征缓存方法技术

技术编号：38125599 阅读：5 留言：0更新日期：2023-07-08 09:29

本说明书实施例提供图特征缓存方法，其中所述图特征缓存方法包括：获取样本图，其中，样本图基于多个样本节点数据以及各样本节点数据之间的关联关系构建；根据训练平台中计算单元组的数量和样本图中样本节点数据间的关联关系分布，分割样本图，获得多个样本子图，其中，计算单元组包括具有连接关系的至少两个计算单元；基于多个样本子图，确定各计算单元组中计算单元的采样信息；将采样信息对应分发至各计算单元，以使各计算单元基于采样信息对图特征进行采样并缓存，并基于图特征对图处理模型进行训练。通过确定各计算单元对应的采样信息，减少控制单元与计算单元之间的数据传输，进而提升后续对图处理模型的训练效率。进而提升后续对图处理模型的训练效率。进而提升后续对图处理模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
图特征缓存方法

[0001]本说明书实施例涉及计算机
，特别涉及图特征缓存方法。

技术介绍

[0002]随着计算机技术的不断发展，图神经网络(GNN)被广泛应用于各种场景，例如，商品推荐、意向预测等。
[0003]为了实现对图神经网络的训练，通常需要由CPU到GPU的数据传输，进而由GPU实现对图神经网络的训练；但CPU到GPU的数据传输效率较低，进而会影响对图神经网络的训练效率和效果。
[0004]为了解决上述问题，目前的方案通常是将频繁使用的图特征缓存至GPU中；但在图特征较多的情况下，受到GPU存储上限的限制，无法对所需图特征进行完整存储，进而影响图神经网络的训练。
[0005]因此，如何实现对提升对图神经网络的训练效率成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0006]有鉴于此，本说明书实施例提供了图特征缓存方法。本说明书一个或者多个实施例同时涉及图特征缓存装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0007]根据本说明书实施例的第一方面，提供了一种图特征缓存方法，包括：
[0008]获取样本图，其中，所述样本图基于多个样本节点数据以及各样本节点数据之间的关联关系构建；
[0009]根据训练平台中计算单元组的数量和所述样本图中样本节点数据间的关联关系分布，分割所述样本图，获得多个样本子图，其中，所述计算单元组包括具有连接关系的至少两个计算单元；
[0010]基于所述...

【技术保护点】

【技术特征摘要】
1.一种图特征缓存方法，包括：获取样本图，其中，所述样本图基于多个样本节点数据以及各样本节点数据之间的关联关系构建；根据训练平台中计算单元组的数量和所述样本图中样本节点数据间的关联关系分布，分割所述样本图，获得多个样本子图，其中，所述计算单元组包括具有连接关系的至少两个计算单元；基于所述多个样本子图，确定各计算单元组中计算单元的采样信息；将所述采样信息对应分发至各计算单元，以使各计算单元基于采样信息对图特征进行采样并缓存，并基于所述图特征对图处理模型进行训练。2.如权利要求1所述的方法，根据训练平台中计算单元组的数量和所述样本图中样本节点数据间的关联关系分布，分割所述样本图，获得多个样本子图，包括：获取所述多个样本节点数据间的关联关系；根据所述多个样本节点数据间的关联关系以及训练平台中计算单元组的数量，利用预设的图分割算法，对所述样本图进行分割，获得多个样本子图。3.如权利要求1所述的方法，基于所述多个样本子图，确定各计算单元组中计算单元的采样信息，包括：确定第一计算单元组中的计算单元数量，其中，所述第一计算单元组为任一计算单元组；基于所述计算单元数量，从目标样本子图中确定所述第一计算单元组中各计算单元对应的子分区，其中，所述目标样本子图为所述第一计算单元组对应的样本子图；相应地，将所述采样信息对应分发至各计算单元，包括：将各子分区的信息作为采样信息对应分发给所述第一计算单元组中的各计算单元，以使所述各计算单元基于所述子分区确定采样起始点。4.如权利要求1所述的方法，基于所述多个样本子图，确定各计算单元组中计算单元的采样信息之前，还包括：获取各样本子图的样本节点热度和节点关系热度；基于所述节点关系热度对样本节点数据之间的关联关系进行排序，获得关系排列顺序；基于所述样本节点热度对样本节点数据进行排序，获得节点排列顺序；相应地，基于所述多个样本子图，确定各计算单元组中计算单元的采样信息，包括：确定各计算单元对应的子分区；根据所述子分区、所述节点排列顺序和所述关系排列顺序确定各计算单元的采样信息。5.如权利要求4所述的方法，根据所述子分区、所述节点排列顺序和所述关系排列顺序确定各计算单元的采样信息，包括：确定所述训练平台中各计算单元的任务处理空间；根据所述任务处理空间对所述节点排列顺序和所述关系排列顺序进行调整，获得目标节点排列顺序和目标关系排列顺序；基于所述目标节点排列顺序、所述目标关系排列顺序和所述子分区确定各计算单元对
应的采样信息。6.如权利要求4所述的方法，基于所述多个样本子图，确定各计算单元组中计算单元的采样信息之前，还包括：获取图采样事物总数，其中，所述图采样事物总数基于对所述样本图的预采样获得；基于所述图采样事物总数、所述节点关系热度、所述样本节点热度、所述节点排列顺序和所述关系排列顺序计算各计...

【专利技术属性】
技术研发人员：孙杰，沈雯婷，王磊，于文渊，李永，周靖人，苏立，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人