一种任务调度方法和装置制造方法及图纸

技术编号:39487240 阅读:9 留言:0更新日期:2023-11-24 11:07
本公开提出了一种任务调度方法和装置,涉及算力调度技术领域

【技术实现步骤摘要】
一种任务调度方法和装置


[0001]本公开涉及算力调度
,特别涉及一种任务调度方法和装置


技术介绍

[0002]相关技术中,算力平台的调度系统大多基于预先设定的算法规则进行任务调度

并且,相关技术在进行任务调度时,往往假设工作节点的运行时环境是暂时稳定的

例如,假设工作集群中的工作节点在运行时的性能保持不变

另外,相关技术中,算力平台上的工作节点多为异构节点,这为任务的高效调度增加了难度


技术实现思路

[0003]本公开提出了一种任务调度方法和装置

[0004]根据本公开的第一方面,提出了一种任务调度方法,包括:获取待调度任务的任务信息

以及多个工作节点中每个工作节点的历史性能指标值;根据所述每个工作节点的历史性能指标值,利用与所述每个工作节点的类型对应的性能预测模型,确定所述每个工作节点在将来指定时间段的性能指标预测值,所述将来指定时间段包含所述待调度任务的计划执行时间段;根据每个工作节点在所述将来指定时间段的性能指标预测值

以及所述待调度任务的任务信息,利用调度模型,对所述待调度任务在所述多个工作节点之间进行调度

[0005]在一些实施例中,所述利用调度模型,对所述待调度任务在所述多个工作节点之间进行调度包括:根据所述每个工作节点在将来指定时间段的性能指标预测值,判断所述每个工作节点是否存在性能瓶颈;将所述多个工作节点中的不存在性能瓶颈的工作节点,作为调度候选节点;利用调度模型,对所述待调度任务在所述调度候选节点之间进行调度

[0006]在一些实施例中,任务调度方法还包括:在对所述待调度任务在所述多个工作节点之间进行调度之后,获取所述多个工作节点在将来指定时间段的性能指标测量值;根据所述多个工作节点在将来指定时间段的性能指标测量值和所述性能指标预测值,确定与所述每个工作节点的类型对应的性能预测模型的预测准确率;在所述预测准确率小于准确率阈值的情况下,对与所述每个工作节点的类型对应的性能预测模型进行调整

[0007]在一些实施例中,任务调度方法还包括:基于多个类型中每个类型的工作节点的性能指标样本数据,对第一神经网络模型进行训练,以得到与所述每个类型对应的性能预测模型

[0008]在一些实施例中,所述工作节点的类型包括中央处理器

图形处理器

现场可编程门阵列中的至少一种

[0009]在一些实施例中,任务调度方法还包括:基于工作节点的性能指标样本数据

以及任务样本数据,对第二神经网络模型进行训练,以得到所述调度模型

[0010]在一些实施例中,所述第二神经网络模型为基于多智能体的强化学习模型,所述基于工作节点的性能指标样本数据

以及任务样本数据,对第二神经网络模型进行训练包
括:基于工作节点的性能指标样本数据

以及任务样本数据,以联合奖励函数最大为目标,对所述基于多智能体的强化学习模型进行训练

[0011]在一些实施例中,所述联合奖励函数包括:根据任务的完成时间确定的奖励项

根据工作节点之间的性能差异确定的奖励项

根据任务完成所需的能耗确定的奖励项

以及根据任务的优先级确定的奖励项

[0012]在一些实施例中,任务调度方法还包括:在对所述待调度任务在所述多个工作节点之间进行调度之后,根据所述待调度任务的执行情况确定调度效率指标;在所述调度效率指标小于效率阈值的情况下,对所述调度模型进行调整

[0013]根据本公开的第二方面,提出了一种任务调度装置,包括:获取模块,被配置为获取待调度任务的任务信息

以及多个工作节点中每个工作节点的历史性能指标值;确定模块,被配置为根据所述每个工作节点的历史性能指标值,利用与所述每个工作节点的类型对应的性能预测模型,确定所述每个工作节点在将来指定时间段的性能指标预测值,所述将来指定时间段包含所述待调度任务的计划执行时间段;调度模块,被配置为根据每个工作节点在所述将来指定时间段的性能指标预测值

以及所述待调度任务的任务信息,利用调度模型,对所述待调度任务在所述多个工作节点之间进行调度

[0014]根据本公开的第三方面,提出一种任务调度装置,包括:存储器;以及,耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如上述的任务调度方法

[0015]根据本公开的第四方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现如上述的任务调度方法

[0016]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚

附图说明
[0017]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理

[0018]参照附图,根据下面的详细描述,可以更加清楚地理解本公开

[0019]图1为根据本公开一些实施例的任务调度方法的流程示意图

[0020]图2为根据本公开另一些实施的任务调度方法的流程示意图

[0021]图3为根据本公开一些实施的任务调度装置的结构示意图

[0022]图4为根据本公开一些实施的任务调度系统的结构示意图

[0023]图5为根据本公开一些实施例的任务调度装置的结构示意图

[0024]图6为根据本公开一些实施例的计算机系统的结构示意图

具体实施方式
[0025]现在将参照附图来详细描述本公开的各种示例性实施例

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置

数字表达式和数值不限制本公开的范围

[0026]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际
的比例关系绘制的

[0027]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制

[0028]对于相关领域普通技术人员已知的技术

方法和设备可能不作详细讨论,但在适当情况下,所述技术

方法和设备应当被视为授权说明书的一部分

[0029]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制

因此,示例性实施例的其它示例可以具有不同的值

[0030]应注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种任务调度方法,包括:获取待调度任务的任务信息

以及多个工作节点中每个工作节点的历史性能指标值;根据所述每个工作节点的历史性能指标值,利用与所述每个工作节点的类型对应的性能预测模型,确定所述每个工作节点在将来指定时间段的性能指标预测值,所述将来指定时间段包含所述待调度任务的计划执行时间段;根据每个工作节点在所述将来指定时间段的性能指标预测值

以及所述待调度任务的任务信息,利用调度模型,对所述待调度任务在所述多个工作节点之间进行调度
。2.
根据权利要求1所述的任务调度方法,其中,所述利用调度模型,对所述待调度任务在所述多个工作节点之间进行调度包括:根据所述每个工作节点在将来指定时间段的性能指标预测值,判断所述每个工作节点是否存在性能瓶颈;将所述多个工作节点中的不存在性能瓶颈的工作节点,作为调度候选节点;利用调度模型,对所述待调度任务在所述调度候选节点之间进行调度
。3.
根据权利要求1所述的任务调度方法,还包括:在对所述待调度任务在所述多个工作节点之间进行调度之后,获取所述多个工作节点在将来指定时间段的性能指标测量值;根据所述多个工作节点在将来指定时间段的性能指标测量值和所述性能指标预测值,确定与所述每个工作节点的类型对应的性能预测模型的预测准确率;在所述预测准确率小于准确率阈值的情况下,对与所述每个工作节点的类型对应的性能预测模型进行调整
。4.
根据权利要求1所述的任务调度方法,还包括:基于多个类型中每个类型的工作节点的性能指标样本数据,对第一神经网络模型进行训练,以得到与所述每个类型的工作节点对应的性能预测模型
。5.
根据权利要求1所述的任务调度方法,其中,所述工作节点的类型包括中央处理器

图形处理器

现场可编程门阵列中的至少一种
。6.
根据权利要求1所述的任务调度方法,还包括:基于工作节点的性能指标样本数据

以及任务样本数据,对第二神经网络模型进行训练,以得到所述调度模型

【专利技术属性】
技术研发人员:郭雪芳王望子赵继壮程帅贾冠一
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1