System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于算力调度领域,特别涉及一种算力调度方法和系统。
技术介绍
1、人工智能平台需要处理大量的计算任务,包括模型训练、推理等。但是不同计算任务对算力的需求各不相同,如果为计算任务分配到不合适的计算资源,可能会导致计算任务因资源不足而无法执行。
2、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、为了解决现有技术中存在的不足,本专利技术提供了一种算力调度方法和系统,以解决为计算任务分配到不合适的计算资源导致计算任务因资源不足而无法执行的技术问题。
2、为解决上述技术问题,本专利技术采用如下的技术方案。
3、本专利技术首先公开了一种算力调度方法,该方法包括以下步骤:
4、在算力调度任务下,针对用户选择的配置信息、任务资源以及工作流定义,确定算力业务需求;
5、基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务,其中,所述预设维度包括成本维度以及距离维度的其中一种。
6、本专利技术进一步包括以下优选方案:
7、所述基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径的步骤之前,进一步包括:
8、接收算力节点反馈的算力特征信息、算力服务信息以及网络指标信息;
9、确定不同算力节点之间的时延信息以及路径信息;
11、根据所述算力节点的资源信息,确定全网算力资源信息。
12、所述根据所述算力节点的资源信息,确定全网算力资源信息,进一步包括:
13、基于分布式架构的cfn协议,接收cfn路由器发送的算力节点的资源信息,确定全网算力资源信息。
14、所述分布式架构为智能分布式部署合成组件,所述智能分布式部署合成组件在中央部署节点集成了pxe服务、dhcp服务、tftp服务以及mysql服务;其中,
15、pxe服务负责在节点启动最初的阶段,进行网络引导;
16、dhcp服务为部署的节点匹配mac地址,并且下发ip地址;
17、tftp服务负责传输引导文件,其中,所述引导文件包括内核文件和初始化根文件系统;
18、mysql服务负责记录节点部署情况,以方便系统管理与维护。
19、所述分布式架构用于根据集群的硬件信息,自动生成节点的网络配置和存储配置,并根据registry的优化放置,生成openstack的部署参数kolla的配置,从openstack的官方github上获取组件后部署安装包,最后节点准备和配置完成,并采用kolla一键部署成openstack集群。
20、所述基于分布式架构的cfn协议,接收cfn路由器发送的算力节点的资源信息,确定全网算力资源信息,进一步包括:
21、基于预设收集方式,通过cfn路由器收集所述算力节点的资源信息之后接收所述cfn路由器发送的算力节点的资源信息,其中,所述预设收集方式包括第一收集方式和第二收集方式,所述第一收集方式为算力节点将资源信息注册给所述cfn路由器的方式,所述第二收集方式为通过所述cfn路由器周期性进行信息采集的方式。
22、所述预设调度机制包括第一第一调度机制和第二调度机制,所述第一调度机制为基于虚拟机的调度机制,所述第二调度机制为基于容器的调度机制;其中,
23、所述基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务,进一步包括:
24、基于全网算力资源信息,按照所述第一调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务;或,
25、基于全网算力资源信息,按照所述第二调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务。
26、本专利技术同时公开了一种利用前述算力调度方法的算力调度系统,包括:
27、确定模块,用于在算力调度任务下,针对用户选择的配置信息、任务资源以及工作流定义,确定算力业务需求;
28、完成模块,用于基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务,其中,所述预设维度包括成本维度以及距离维度的其中一种。
29、相应地,本申请还公开了一种设备,包括处理器及存储介质;
30、所述存储介质用于存储指令;
31、所述处理器用于根据所述指令进行操作以执行根据前述算力调度方法的步骤。
32、相应地,本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述算力调度方法的步骤。
33、本专利技术的有益效果在于,与现有技术相比,本专利技术提供了一种算力调度方法和系统,针对用户选择的配置信息、任务资源以及工作流定义,确定算力业务需求;基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径,基于所述目标调度路径完成所述算力调度任务,解决了为计算任务分配到不合适的计算资源导致计算任务因资源不足而无法执行技术问题,使得算力调度的执行更加高效和可靠,进而避免某些计算任务因资源不足而无法执行。
本文档来自技高网...【技术保护点】
1.一种算力调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径的步骤之前,进一步包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述算力节点的资源信息,确定全网算力资源信息,进一步包括:
4.根据权利要求3所述的方法,其特征在于,所述分布式架构为智能分布式部署合成组件,所述智能分布式部署合成组件在中央部署节点集成了PXE服务、DHCP服务、TFTP服务以及MySql服务;其中,
5.根据权利要求3所述的方法,其特征在于,所述分布式架构用于根据集群的硬件信息,自动生成节点的网络配置和存储配置,并根据registry的优化放置,生成OpenStack的部署参数Kolla的配置,从OpenStack的官方GitHub上获取组件后部署安装包,最后节点准备和配置完成,并采用Kolla一键部署成OpenStack集群。
6.根据权利要求3所述的方法,其特征在于,所述基于分布式架构的CFN协议,接收CFN
7.根据权利要求1所述的方法,其特征在于,所述预设调度机制包括第一第一调度机制和第二调度机制,所述第一调度机制为基于虚拟机的调度机制,所述第二调度机制为基于容器的调度机制;其中,
8.一种算力调度系统,其特征在于,所述系统包括:
9.一种设备,包括处理器及存储介质;其特征在于:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的算力调度方法的步骤。
...【技术特征摘要】
1.一种算力调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于全网算力资源信息,按照预设调度机制确定所述算力业务需求在不同预设维度下的目标调度路径的步骤之前,进一步包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述算力节点的资源信息,确定全网算力资源信息,进一步包括:
4.根据权利要求3所述的方法,其特征在于,所述分布式架构为智能分布式部署合成组件,所述智能分布式部署合成组件在中央部署节点集成了pxe服务、dhcp服务、tftp服务以及mysql服务;其中,
5.根据权利要求3所述的方法,其特征在于,所述分布式架构用于根据集群的硬件信息,自动生成节点的网络配置和存储配置,并根据registry的优化放置,生成openstack的部署参数kolla的配置,从...
【专利技术属性】
技术研发人员:郭兴泉,刘海,肖艳玲,陈美灵枝,
申请(专利权)人:南京苏逸实业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。