一种内存管理方法、装置、设备及介质制造方法及图纸

技术编号：32218790 阅读：19 留言：0更新日期：2022-02-09 17:24

本申请公开了一种内存管理方法、装置、设备及介质，包括：对异构加速计算系统的主机端的内存和各AI加速器设备的板载内存分别进行切片处理，得到相应的内存切片空间；从全部所述内存切片空间中确定出公共内存切片空间；对全部所述公共内存切片空间进行统一地址空间编址，得到相应的编址空间；在执行人工智能算法计算任务时，将人工智能算法模型部署于所述编址空间，以便各处理器访问所述编址空间中相应的公共内存切片空间，完成所述人工智能算法计算任务。能够突破AI异构加速设备间的内存物理隔离限制，提高异构加速计算系统的计算资源和内存资源利用效率。和内存资源利用效率。和内存资源利用效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种内存管理方法、装置、设备及介质

[0001]本申请涉及存储
，特别涉及一种内存管理方法、装置、设备及介质。

技术介绍

[0002]随着数据集规模的增加和模型的日趋复杂，AI(即Artificial Intelligence，人工智能)网络模型的计算成本越来越高，算力作为承载人工智能应用的平台和基础，其发展推动了整个人工智能系统的进步和快速演进，是人工智能最核心的要素之一。以解决人工智能应用计算系统的新型混合异构计算体系结构已成为国内外工业界和学术界共同角逐的热点。面向人工智能算法应用加速的异构加速器层出不穷，例如GPU(即graphics processing unit，图形处理器)、FPGA(即Field Programmable Gate Array，现场可编程逻辑门阵列))、TPU(即tensor processing unit，张量处理器)及各种定制化AI加速器等异构设备的发展为AI场景应用提供了多样性的底层硬件支持。
[0003]随着AI应用场景的复杂性提高，以及定制化AI异构加速器往往面向特定计算场景进行适配优化，人工智能应用对混合异构计算系统提出了需求。为了提高人工智能计算系统的能效，在单一服务器系统中同时集成具有不同计算特性的AI异构加速设备，在同一种复杂AI应用场景种采用不同的AI加速器分别负责不同的计算任务，通过构建高效的超异构计算系统，实现在同一个人工智能计算系统中不同AI异构加速设备之间的高效协同。虽然不同的AI加速器均提供了高容量的板载内存，但由于不同AI异构加速器设备之间...

【技术保护点】

【技术特征摘要】
1.一种内存管理方法，其特征在于，包括：对异构加速计算系统的主机端的内存和各AI加速器设备的板载内存分别进行切片处理，得到相应的内存切片空间；从全部所述内存切片空间中确定出公共内存切片空间；对全部所述公共内存切片空间进行统一地址空间编址，得到相应的编址空间；在执行人工智能算法计算任务时，将人工智能算法模型部署于所述编址空间，以便各处理器访问所述编址空间中相应的公共内存切片空间，完成所述人工智能算法计算任务。2.根据权利要求1所述内存管理方法，其特征在于，所述从全部所述内存切片空间中确定出公共内存切片空间，包括：分别将所述主机端对应的全部内存切片空间、各所述AI加速器设备的板载内存对应的全部内存切片空间中的指定内存切片空间确定为私有内存切片空间；将全部非指定内存切片空间确定为公共内存切片空间。3.根据权利要求1所述的内存管理方法，其特征在于，对异构加速计算系统中的各AI加速器设备的板载内存分别进行切片处理，包括：对异构加速计算系统中的所有AI加速器设备进行遍历，对遍历到的各AI加速器设备的板载内存分别进行切片处理。4.根据权利要求1所述的内存管理方法，其特征在于，所述异构加速计算系统中，所有所述AI加速器设备基于PCIe接口挂载至所述主机端中。5.根据权利要求1所述的内存管理方法，其特征在于，所述异构加速计算系统中包括不同架构的所述AI加速器设备。6.根据权利要求1所述的内存管理办法，其特征在于，所述对异构加速计算系统的主机端内存和各AI加速器设备的板载内存分别进行...

【专利技术属性】
技术研发人员：郭振华，赵雅倩，李仁刚，王丽，范宝余，
申请(专利权)人：浪潮电子信息产业股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人