加速器控制器中心制造技术

技术编号：33515852 阅读：17 留言：0更新日期：2022-05-19 01:24

用于加速器控制器中心(ACH)的方法和装置。ACH可以是独立组件，或者集成在诸如GPU之类的加速器中的管芯或封装上。ACH可以包括主机设备链路(HDL)接口、一个或多个快速外围组件互连(PCIe)接口、一个或多个高性能加速器链路(HPAL)接口以及路由器，该路由器可操作地耦合到HDL接口、一个或多个PCIe接口以及一个或多个HPAL接口中的每一个。HDL接口配置为经由HDL链路耦合到主机CPU，并且一个或多个HPAL接口配置为耦合到一个或多个HPAL，该一个或多个HPAL用于访问高性能加速器结构(HPAF)，例如，NVlink结构和CCIX(用于加速器的高速缓存一致性互连)结构。包括ACH的平台或具有集成的ACH的加速器支持使用RDMA语义来进行RDMA传送，从而在没有CPU参与的情况下实现在发起方上的加速器存储器与目标之间的传送。速器存储器与目标之间的传送。速器存储器与目标之间的传送。

全部详细技术资料下载

【技术实现步骤摘要】
加速器控制器中心

技术介绍

[0001]近年来，图形处理单元(GPU)作为并行可编程加速器已经取得了显著的增长。虽然许多GPU最初旨在用于加速图形性能(例如，用于视频游戏)，但GPU的内部架构使其非常适合于在机器学习(ML)和人工智能(AI)部署中使用。当用于ML和AI时，GPU可以被认为是通用GPU(GPGPU)。如本文所使用的，GPU、GPGPU和其他并行可编程加速器设备被称为XPU。
[0002]在高性能加速的系统中，主机
‑
设备链路(HDL)正在成为瓶颈。以下是说明此问题的三个示例。
[0003]网络数据摄取：由更大的AI模型或HPC(高性能计算)工作负载驱动的不断增长的计算需要有时要求跨两个或更多个服务器节点中的XPU拆分问题，这些服务器节点是使用高速网络(如InfiniBand或以太网)连接的。网络接口卡(NIC)通过主机
‑
设备结构(HDF)连接到主机CPU(中央处理单元)。因此，所有网络数据流都受到XPU HDL带宽的限制。
[0004]存储数据摄取：存储驱动器通过HDF连接到主机CPU。虽然像从SSD(固态驱动器)到XPU存储器的直接RDMA(远程直接存储器访问)之类的先进技术阻止了主机存储器中的额外的数据复制，但有效带宽仍然受到XPU HDL带宽的限制。
[0005]模型大小的增长速度快于设备存储器容量(如高带宽存储器(HBM)容量)的增长速度。先进的XPU存储器虚拟化方法(例如，统一共享存储器方案)实现应用透明的设备存储器超额预订(oversubscri...

【技术保护点】

【技术特征摘要】
1.一种集成电路，包括：中心，所述中心包括，主机设备链路(HDL)接口；一个或多个输入
‑
输出(IO)接口；一个或多个加速器链路接口；路由器，所述路由器能够操作地耦合到以下各项中的每一个：所述HDL接口、所述一个或多个IO接口和所述一个或多个加速器链路接口，其中，所述中心被配置为将源自一个或多个加速器的数据传送到一个或多个IO设备，所述一个或多个加速器连接到所述一个或多个加速器链路接口，所述一个或多个IO设备连接到所述一个或多个IO接口。2.根据权利要求1所述的集成电路，其中，所述一个或多个IO接口包括：一个或多个快速外围组件互连(PCIe)接口，并且其中，所述中心还包括：PCIe到HDL桥接器，所述PCIe到HDL桥接器能够操作地耦合到所述一个或多个PCIe接口和所述路由器。3.根据权利要求1或2所述的集成电路，其中，所述一个或多个IO接口包括：一个或多个快速外围组件互连(PCIe)接口，并且其中，所述中心还包括：PCIe到加速器链路桥接器，所述PCIe到加速器链路桥接器能够操作地耦合到所述一个或多个PCIe接口和所述路由器。4.根据前述权利要求中任一项所述的集成电路，还包括：具有一个或多个存储器通道的存储器接口，所述存储器接口耦合到所述路由器和所述HDL接口中的至少一个。5.根据前述权利要求中任一项所述的集成电路，还包括：一个或多个存储器排序逻辑块，所述一个或多个存储器排序逻辑块能够操作地耦合到相应的IO接口或加速器链路接口或集成在相应的IO接口或加速器链路接口中。6.根据权利要求5所述的集成电路，其中，所述存储器排序逻辑块包括：围栏单元，所述围栏单元被配置为排空以耦合到加速器链路接口的加速器为目标的先前写入。7.根据权利要求1所述的集成电路，还包括：加速器，所述中心被集成在所述加速器中。8.根据权利要求7所述的集成电路，其中，所述加速器包括图形处理单元GPU，并且所述中心包括GPU集成输入输出(GPU
‑
IIO)块，所述GPU
‑
IIO块具有至少两个IO接口。9.根据权利要求8所述的集成电路，其中，所述GPU包括耦合到所述GPU IIO块的GPU核心，并且所述GPU包括被配置为耦合到一个或多个存储器设备的存储器接口或者包括嵌入式存储器。10.一种系统，包括：主机中央处理单元(CPU)，所述主机CPU包括存储器控制器；主机存储器，所述主机存储器包括耦合到所述存储器控制器的一个或多个主机存储器设备；加速器处理单元(XPU)，所述XPU经由至少一个主机设备链路(HDL)耦合到所述主机CPU，所述XPU包括，处理单元；以及集成中心，所述集成中心耦合到所述处理单元，所述集成中心具有一个或多个输入
‑
输出(IO)设备接口并且包括路由器；以及一个或多个IO设备，所述一个或多个IO设备耦合到所述集成中心上的相应的IO设备接
口，其中，所述系统被使得能够使用直接存储器访问(DMA)传送，经由所述集成中心在所述主机存储器与所述一个或多个IO设备之间传送数据。11.根据权利要求10所述的系统，还包括：加速器存储器，所述加速器存储器耦合到所述加速器或者被嵌入在所述加速器上，其中，所述系统被配置为：...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人