System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及算力协同,特别是涉及一种跨地域算力协同系统及方法。
技术介绍
1、随着云计算、大数据、人工智能等技术的发展,算力需求持续增长,且呈现出多样化和分布化的特点。传统的算力通常局限于单一数据中心或区域内,难以高效利用全球范围的计算资源,导致资源利用率低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高资源利用率的跨地域算力协同系统及方法。
2、第一方面,本申请提供了一种跨地域算力协同系统,包括全局资源发现模块、动态集群结对模块以及分布式调度器模块,其中:
3、所述全局资源发现模块,用于获取全局范围内各地域的算力集群节点的算力资源信息;
4、所述动态集群结对模块,用于根据所述全局范围内各地域的算力集群节点的算力资源信息,得到集群结对策略,根据所述集群结对策略得到逻辑上的算力集群组;所述算力集群组中的算力集群节点用于相互协同计算;
5、所述分布式调度器模块,用于获取任务处理请求,所述任务处理请求中的信息包含业务属性、算力需求以及数据量;以及根据所述任务处理请求以及所述算力集群组中的算力集群节点的算力资源信息,从所述算力集群组中确定与所述业务属性、所述算力需求以及所述数据量相匹配的目标算力集群节点,并将所述任务处理请求发送至所述目标算力集群节点。
6、在其中一个实施例中,所述算力集群节点的算力资源信息包括所述算力集群节点的资源状态、网络延迟、带宽信息以及业务标签;
7、所述动态集群结对模块,还
8、在其中一个实施例中,所述动态集群结对模块,还用于获取算力集群组中算力集群节点的整体运行状态,并根据所述整体运行状态更新集群结对策略,根据所述更新后的集群结对策略修改所述算力集群组中对应的算力集群节点的结对标签。
9、在其中一个实施例中,所述分布式调度器模块,还用于获取所述目标算力集群节点反馈的对应于所述任务处理请求的任务处理结果,在所述任务处理结果表明所述任务处理请求未执行完成的情况下,将所述任务处理请求发送至所述算力集群组中与所述目标算力集群节点相距最近的算力集群节点。
10、在其中一个实施例中,所述全局资源发现模块包括分布式数据库以及元数据管理系统;所述全局资源发现模块通过api接口或消息队列获取全局范围内各地域算力集群节点的算力资源信息。
11、在其中一个实施例中,所述分布式调度器模块通过api接口与所述算力集群节点进行交互。
12、第二方面,本申请提供了一种跨地域算力协同方法,包括:
13、获取全局范围内各地域的算力集群节点的算力资源信息;
14、根据所述全局范围内各地域的算力集群节点的算力资源信息,得到集群结对策略,根据所述集群结对策略得到逻辑上的算力集群组;所述算力集群组中的算力集群节点用于相互协同计算;
15、获取任务处理请求,所述任务处理请求中的信息包含业务属性、算力需求以及数据量;根据所述任务处理请求以及所述算力集群组中的算力集群节点的算力资源信息,从所述算力集群组中确定与所述业务属性、所述算力需求以及所述数据量相匹配的目标算力集群节点,并将所述任务处理请求发送至所述目标算力集群节点。
16、在其中一个实施例中,所述算力资源信息包括各地域的算力集群节点的资源状态、网络延迟、带宽信息以及业务标签;
17、所述根据所述全局范围内各地域的算力集群节点的算力资源信息,得到集群结对策略,根据所述集群结对策略得到逻辑上的算力集群组,包括:
18、根据所述资源状态、所述网络延迟、所述带宽信息以及所述业务标签,得到集群结对策略,根据所述集群结对策略对多个地域的算力集群节点进行结对标记,得到逻辑上的算力集群组,并将结对标签分配给所述算力集群组中对应的算力集群节点。
19、在其中一个实施例中,所述方法还包括:获取算力集群组中算力集群节点的整体运行状态,并根据所述整体运行状态更新集群结对策略,根据所述更新后的集群结对策略修改所述算力集群组中对应的算力集群节点的结对标签。
20、在其中一个实施例中,所述方法还包括:获取所述目标算力集群节点反馈的对应于所述任务处理请求的任务处理结果,在所述任务处理结果表明所述任务处理请求未执行完成的情况下,将所述任务处理请求发送至所述算力集群组中与所述目标算力集群节点相距最近的算力集群节点。
21、上述跨地域算力协同系统及方法,前述系统包括全局资源发现模块、动态集群结对模块以及分布式调度器模块,其中:全局资源发现模块,用于获取全局范围内各地域的算力集群节点的算力资源信息;动态集群结对模块,用于根据全局范围内各地域的算力集群节点的算力资源信息,得到集群结对策略,根据集群结对策略得到逻辑上的算力集群组;算力集群组中的算力集群节点用于相互协同计算;分布式调度器模块,用于获取任务处理请求,任务处理请求中的信息包含业务属性、算力需求以及数据量;以及根据任务处理请求以及算力集群组中的算力集群节点的算力资源信息,从算力集群组中确定与业务属性、算力需求以及数据量相匹配的目标算力集群节点,并将任务处理请求发送至目标算力集群节点。本申请实施例中,系统通过全局资源发现模块实时进行资源发现,通过动态集群结对模块合理的进行集群结对,减少了全局范围内各地域的闲置算力资源,使得算力集群节点可以高效的参与计算任务。本实施例中的跨地域算力协同系统,不仅解决了单一地域内算力资源不足的问题,还通过智能化的资源调度与管理,提高了全局算力资源的综合利用率,推动了计算能力的高效协同。
本文档来自技高网...【技术保护点】
1.一种跨地域算力协同系统,其特征在于,所述系统包括全局资源发现模块、动态集群结对模块以及分布式调度器模块,其中:
2.根据权利要求1所述的系统,其特征在于,所述算力集群节点的算力资源信息包括所述算力集群节点的资源状态、网络延迟、带宽信息以及业务标签;
3.根据权利要求2所述的系统,其特征在于,所述动态集群结对模块,还用于获取算力集群组中算力集群节点的整体运行状态,并根据所述整体运行状态更新集群结对策略,根据所述更新后的集群结对策略修改所述算力集群组中对应的算力集群节点的结对标签。
4.根据权利要求1所述的系统,其特征在于,所述分布式调度器模块,还用于获取所述目标算力集群节点反馈的对应于所述任务处理请求的任务处理结果,在所述任务处理结果表明所述任务处理请求未执行完成的情况下,将所述任务处理请求发送至所述算力集群组中与所述目标算力集群节点相距最近的算力集群节点。
5.根据权利要求1所述的系统,其特征在于,所述全局资源发现模块包括分布式数据库以及元数据管理系统;所述全局资源发现模块通过API接口或消息队列获取全局范围内各地域算力集群节点
6.根据权利要求1所述的系统,其特征在于,所述分布式调度器模块通过API接口与所述算力集群节点进行交互。
7.一种跨地域算力协同方法,其特征在于,所述方法包括:
8.根据权利要求7所述的方法,其特征在于,所述算力资源信息包括各地域的算力集群节点的资源状态、网络延迟、带宽信息以及业务标签;
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
...【技术特征摘要】
1.一种跨地域算力协同系统,其特征在于,所述系统包括全局资源发现模块、动态集群结对模块以及分布式调度器模块,其中:
2.根据权利要求1所述的系统,其特征在于,所述算力集群节点的算力资源信息包括所述算力集群节点的资源状态、网络延迟、带宽信息以及业务标签;
3.根据权利要求2所述的系统,其特征在于,所述动态集群结对模块,还用于获取算力集群组中算力集群节点的整体运行状态,并根据所述整体运行状态更新集群结对策略,根据所述更新后的集群结对策略修改所述算力集群组中对应的算力集群节点的结对标签。
4.根据权利要求1所述的系统,其特征在于,所述分布式调度器模块,还用于获取所述目标算力集群节点反馈的对应于所述任务处理请求的任务处理结果,在所述任务处理结果表明所述任务处理请求未执行完成的情况下,将所述任务处理请求发送...
【专利技术属性】
技术研发人员:王李明,陈禹旭,段祥,纪伟,孙凯,张志远,易锋,
申请(专利权)人:南方电网数字平台科技广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。