System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机,尤其涉及一种gpu算力单元的调度方法、gpu算力单元的调度装置。
技术介绍
1、随着网络技术的不断发展,算力网络逐渐成为未来网络演进的重要方向,gpu作为重要的计算资源正越来越多地被应用到通用计算领域,而在算力网络之中,gpu资源多以gpu集群形式出现,单块gpu资源调度策略无法满足算力网络环境下的gpu资源调度需求,因此,在多gpu调度的情况下,其调度策略不够成熟,导致算力网络的计算效率较低和资源闲置率较高。
技术实现思路
1、本申请实施例提供一种gpu算力单元的调度方法、gpu算力单元的调度装置,能够解决算网环境下的多gpu调度的问题。
2、第一方面,本申请实施例提供了一种gpu算力单元的调度方法,该方法包括:在检测到第一虚拟机发起的调度请求的情况下,获取所述调度请求携带的计算任务的任务相关信息,其中,所述任务相关信息包括目的虚拟机的地址、目标gpu算力单元的标识和目标资源需求,所述目的虚拟机为所述第一虚拟机,所述调度请求用于指示所述第一虚拟机中的目标gpu算力单元的本地注册资源不满足所述目标资源需求;从所述第一虚拟机起,按照调度层级依次遍历gpu调度系统包括的各个虚拟机对应的gpu算力单元,将当前遍历的所述gpu算力单元添加至备选集合,直至所述备选集合中的所述gpu算力单元的个数大于或等于预设备选数量为止,其中,所述调度层级包括虚拟机调度层、服务器调度层和资源池中心调度层,所述虚拟机调度层受所述服务器调度层调度控制,所述服务器调度层受所述资源
3、第二方面,本申请实施例提供了一种gpu算力单元的调度装置,该装置包括:获取模块,用于在检测到第一虚拟机发起的调度请求的情况下,获取所述调度请求携带的计算任务的任务相关信息,其中,所述任务相关信息包括目的虚拟机的地址、目标gpu算力单元的标识和目标资源需求,所述目的虚拟机为所述第一虚拟机,所述调度请求用于指示所述第一虚拟机中的目标gpu算力单元的本地注册资源不满足所述目标资源需求;遍历模块,用于从所述第一虚拟机起,按照调度层级依次遍历gpu调度系统包括的各个虚拟机对应的gpu算力单元,将当前遍历的所述gpu算力单元添加至备选集合,直至所述备选集合中的所述gpu算力单元的个数大于或等于预设备选数量为止,其中,所述调度层级包括虚拟机调度层、服务器调度层和资源池中心调度层,所述虚拟机调度层受所述服务器调度层调度控制,所述服务器调度层受所述资源池中心调度层调度控制;调度模块,用于根据所述备选集合,调度第一gpu算力单元执行所述计算任务,其中,所述备选集合包括所述第一gpu算力单元。
4、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
5、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
6、第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
7、在本申请实施例中,通过在检测到第一虚拟机发起的调度请求的情况下,获取调度请求携带的计算任务的任务相关信息,其中,任务相关信息包括目的虚拟机的地址、目标gpu算力单元的标识和目标资源需求,目的虚拟机为第一虚拟机,调度请求用于指示第一虚拟机中的目标gpu算力单元的本地注册资源不满足目标资源需求;从第一虚拟机起,按照调度层级依次遍历gpu调度系统包括的各个虚拟机对应的gpu算力单元,将当前遍历的gpu算力单元添加至备选集合,直至备选集合中的gpu算力单元的个数大于或等于预设备选数量为止,其中,调度层级包括虚拟机调度层、服务器调度层和资源池中心调度层,虚拟机调度层受服务器调度层调度控制,服务器调度层受资源池中心调度层调度控制;根据备选集合,调度第一gpu算力单元执行计算任务,其中,备选集合包括第一gpu算力单元,实现了分布式资源调度,虚拟机先对gpu算力资源进行调度,当虚拟机中本地注册资源不足以处理时在由服务器调度层进行调度,若仍不足再通过资源池中心调度层进行处理,能够解决算网环境下的多gpu调度问题,并能够避免在大型集群环境中,纯中心式的调度器有可能因为计算任务请求量过大而导致网络拥堵的问题,从而提高算力网络的计算效率和资源利用率。
本文档来自技高网...【技术保护点】
1.一种GPU算力单元的调度方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述GPU调度系统还包括算力控制中心,所述资源池中心调度层受所述算力控制中心调度控制,所述资源池中心调度层包括所述服务器调度层中的至少一个服务器,每个所述服务器包括所述虚拟机调度层中的至少一个虚拟机,每个所述虚拟机包括至少一个所述GPU算力单元,至少一个所述虚拟机包括所述第一虚拟机。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一虚拟机起,按照调度层级依次遍历GPU调度系统包括的各个虚拟机对应的GPU算力单元,包括:
4.根据权利要求1所述的方法,其特征在于,获取所述调度请求携带的计算任务的任务相关信息,包括:
5.根据权利要求1所述的方法,其特征在于,在检测第一虚拟机发起的调度请求之前,还包括:
6.根据权利要求1所述的方法,其特征在于,所述将当前遍历的所述GPU算力单元添加至备选集合,包括:
7.根据权利要求6所述的方法,其特征在于,根据所述备选集合,调度第一GPU算力单元执行所述计算任务,包括:
...【技术特征摘要】
1.一种gpu算力单元的调度方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述gpu调度系统还包括算力控制中心,所述资源池中心调度层受所述算力控制中心调度控制,所述资源池中心调度层包括所述服务器调度层中的至少一个服务器,每个所述服务器包括所述虚拟机调度层中的至少一个虚拟机,每个所述虚拟机包括至少一个所述gpu算力单元,至少一个所述虚拟机包括所述第一虚拟机。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一虚拟机起,按照调度层级依次遍历gpu调度系统包括的各个虚拟机对应的gpu算力单元,包括:
4.根据权利要求1所述的方法,其特征在于,获取所述调度请求携带的计算任务的任务相关信息,包括:
5.根据权利要求...
【专利技术属性】
技术研发人员:吴杰,高宇,黄军,王珏,李志勇,钱雯,
申请(专利权)人:中国移动通信集团浙江有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。