【技术实现步骤摘要】
使用可编程网络设备的基于度量和安全性的加速器服务重新调度和自动缩放
[0001]实施例总体上涉及数据处理,并且更具体地,涉及使用可编程网络设备的基于度量和安全性的加速器服务重新调度和自动缩放。
技术介绍
[0002]在数据中心中,分解式计算(disaggregated computing)正在兴起。云服务提供商(CSP)正在部署解决方案,其中,对工作负载的处理被分布在分解的计算资源上,例如CPU、GPU和硬件加速器(包括现场可编程门阵列(FPGA)),这些资源经由网络连接,而不是位于同一平台上且经由物理链路(例如,外围组件快速互连(PCIe))连接。分解式计算通过使得能够更高效地使用可用资源来提高资源利用率并降低拥有成本。分解式计算还使得能够为大型计算池化大量硬件加速器,从而使计算更高效,执行更好。
[0003]在分解式计算环境中,计算集群中的典型工作节点能够同时处理数百个容器工作负载。这些工作节点还可以具有针对计算密集型任务优化的静态附连的专用硬件加速器。例如,可以优化一类硬件加速器,以高效地运行密码和压缩算法,例如分别是传输层安全(TLS)或zlib。然而,由于资源稀缺,静态硬件加速器资源通常并非对于在工作节点上运行的每个工作负载都是可用的。为了以有意义的方式加速计算繁重的操作,硬件加速器资源不能分散得太开,以至于不能确保服务质量(QoS)。
附图说明
[0004]为了能够详细理解本实施例的上述特征,可以通过参考实施例来对以上简要概括的实施例进行更具体的描述,一些实施例示出在附图中。然而, ...
【技术保护点】
【技术特征摘要】
1.一种装置,包括:一个或多个处理器,用于:收集与由服务网格管理的服务的微服务之间的通信链路对应的度量;基于对所述度量的分析,确定能够通过卸载到硬件加速器设备来加速所述服务的工作负载;生成用于引起所述硬件加速器设备被分配给为所述服务配置的硬件设备集群的缩放请求;引起所述缩放请求被发送到管理所述硬件加速器设备的可编程网络设备,所述可编程网络设备将所述硬件加速器设备分配给所述集群,并将所述硬件加速器设备注册到所述服务网格;以及将所述服务的工作负载调度给所述硬件加速器设备。2.根据权利要求1所述的装置,其中,所述度量包括遥测数据,所述遥测数据包括新传输层安全性(TLS)连接的数量、每秒传输的字节的数量、微服务之间的业务模式或所述集群的硬件设备的利用率中的至少一个。3.根据权利要求1
‑
2中任一项所述的装置,其中,所述一个或多个处理器识别所述工作负载能够被加速还包括:所述一个或多个处理器注解所述服务,以指示所述服务是在所述硬件加速器设备中调度的候选者,并且其中,所述注解引起所述服务网格的控制平面调度器将所述服务调度给所述硬件加速器设备。4.根据权利要求1
‑
3中任一项所述的装置,其中,所述一个或多个处理器基于对所述度量的分析,确定能够通过卸载到所确定的类型的硬件加速器设备来加速所述工作负载,所确定的类型的硬件加速器设备包括图形处理单元(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、密码加速器设备、推理加速器设备或压缩加速器设备中的至少一个。5.根据权利要求1
‑
4中任一项所述的装置,其中,所述缩放请求被传递到托管所述一个或多个处理器和所述硬件加速器设备的数据中心的中央资源编排器,所述中央资源编排器管理至少托管所述一个或多个处理器、所述可编程网络设备和所述硬件加速器设备的数据中心中的一组硬件资源。6.根据权利要求1
‑
5中任一项所述的装置,其中,所述一个或多个处理器包括调度器扩展器电路,用于扩展所述服务网格的控制平面调度器的操作,并且其中,所述控制平面调度器将所述服务的工作负载调度在数据中心中的一个或多个可用硬件资源上,所述一个或多个可用硬件资源至少包括所述硬件加速器设备。7.根据权利要求1
‑
6中任一项所述的装置,其中,作为将所述硬件加速器设备分配给所述集群的一部分,所述一个或多个处理器还认证所述硬件加速器设备。8.根据权利要求1
‑
7中任一项所述的装置,其中,所述一个或多个处理器还为所述硬件加速器设备建立共享密钥,以用于所述硬件加速器设备与将工作负载调度给所述硬件加速器设备的所述服务网格的控制平面调度器之间的安全通信。9.根据权利要求1
‑
8中任一项所述的装置,其中,所述一个或多个处理器在可信执行环境(TEE)内执行调度器扩展器以隔离所述调度器扩展器,并且
其中,所述调度器扩展器执行收集、确定、生成和引起。10.根据权利要求1
‑
9中任一项所述的装置,其中,所述一个或多个处理器基于所述硬件加速器设备的过去性能历史、所述硬件加速器设备的环境条件或与所述硬件加速器设备的服务对应的服务水平协议(SLA),识别所述硬件加速器设备。11.根据权利要求1
‑
10中任一项所述的装置,其中,所述一个或多个处理器还与在所述可编程网络设备上执行的集群节点代理通信,所述集群节点代理基于所述缩放请求,在所述集群的一个或多个硬件资源上配置带宽。12.根据权利要求1
‑
11中任一项所述的装置,其中,在托管所述一个或多个处理器、所述可编程网络设备和所述硬件加速器设备的数据中心中,所述可编程网络设备和所述硬件加速器设备与单独的服务器设备中的所述一个或多个处理器是分离的。13.根据权利要求1
‑
12中任一项所述的装置,其中,所述可编程网络设备包括基础设施处理单元(IPU)或数据处理单元(DPU)中的至少一个。14.一种非瞬时性计算机可读存储介质,其上存储有可执行计算机程序指令,所述指令当由一个或多个处理器执行时,引起所述一个或多个处理器执行以下操作,包括:通过所述一个或多个处理器收集与由服务网格管理的服务的微服务之间的通信链路对应的度量;基于对所述度量的分析,确定能够通过卸载到硬件加...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。