System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及计算机,尤其涉及一种资源调整方法、装置、设备和存储介质。
技术介绍
1、随着人工智能(artificial intelligence,ai)技术的快速发展,推理服务在各行业中的应用变得越来越普遍。其中,推理服务是一种通过人工智能模型推理方法,进行推理计算从而实现数据资源的快速处理的服务方法。然而,目前大多数推理服务的计算资源,是在部署时为推理服务分配特定数量的计算资源,也即是推理服务的计算资源是固定的,那么当出现突发情况时会出现无法应对的现象,导致推理服务的性能较差,计算资源利用率较低。
技术实现思路
1、本申请实施例提供一种资源调整方法、装置、设备和存储介质,可以提高推理服务性能和计算资源利用率。
2、第一方面,本申请实施例提供了一种资源调整方法,包括:
3、确定每个推理服务节点的计算资源使用量;
4、根据每个所述推理服务节点的计算资源使用量,对计算资源进行调整。
5、第二方面,本申请实施例提供了一种资源调整装置,包括:
6、资源确定模块,用于确定每个推理服务节点的计算资源使用量;
7、资源调整模块,用于根据每个所述推理服务节点的计算资源使用量,对计算资源进行调整。
8、第三方面,本申请实施例提供了一种电子设备,包括:
9、处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行如前述第一方面实施例以及各实现方式所述的资
10、第四方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行如前述第一方面实施例以及各实现方式所述的资源调整方法。
11、第五方面,本申请实施例提供了一种包含程序指令的计算机程序产品,当所述程序指令在电子设备上运行时,使得所述电子设备执行如前述第一方面实施例以及各实现方式所述的资源调整方法。
12、本申请实施例公开的技术方案,通过确定每个推理服务节点的计算资源使用量,进而根据每个推理服务节点的计算资源使用量,对计算资源进行动态调整,从而可以提高推理服务性能和计算资源利用率。
本文档来自技高网...【技术保护点】
1.一种资源调整方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述推理服务节点的计算资源使用量,对计算资源进行调整,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据第一调整方式进行计算资源调整,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据第二调整方式进行计算资源调整,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述确定目标推理服务节点,包括:
7.根据权利要求6所述的方法,其特征在于,所述待使用计算资源量包括:可用推理工作流数量、中央处理器可用资源量和图形处理器可用资源量;
8.一种资源调整装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至7中任一项所述的方法。
11.一种包含程序指令的计算机程序产品,其特征在于,
...【技术特征摘要】
1.一种资源调整方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述推理服务节点的计算资源使用量,对计算资源进行调整,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据第一调整方式进行计算资源调整,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据第二调整方式进行计算资源调整,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述确定目标推理服务节点,包括:
【专利技术属性】
技术研发人员:刘尚阳,
申请(专利权)人:合肥中科类脑智能技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。