一种数据中心作业调度方法、系统、存储介质及计算设备技术方案

技术编号:29211334 阅读:9 留言:0更新日期:2021-07-10 00:48
本发明专利技术公开了一种数据中心作业调度方法、系统、存储介质及计算设备,利用模拟器对调度器进行训练;然后在每个调度时刻,调度器根据先到先服务原则依次遍历现存未完成作业中包含的未完成任务,将可以接受这一任务执行的服务器的状态参数和任务的参数组成一个服务器

【技术实现步骤摘要】
一种数据中心作业调度方法、系统、存储介质及计算设备


[0001]本专利技术属于数据中心能耗管理
,具体涉及一种数据中心作业调度方法、系统、存储介质及计算设备。

技术介绍

[0002]近年来随着计算机科学技术的发展,硬件的计算能力不断提升,而互联网业务的蓬勃发展,也使得互联网数据量呈现爆炸式增长。这些都导致了对计算资源的需求飞速提升。单机的计算能力已经不能满足需求。因此云计算应运而生。云计算是分布式计算、并行计算、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。云计算将大量的服务器通过虚拟机技术虚拟为一个个计算资源节点,用户无需关心硬件的实现和维护,只需要在云端购买计算资源,即可快速的获取自己所需的资源。而云计算的背后离不开数据中心的支撑。
[0003]数据中心是由数万台服务器,数百台网络设备,以及冷却设备、供电设备等构成。数据中心能耗十分巨大,降低数据中心典礼能耗具有重大的社会意义。同时,据统计,在数据中心长期运营成本中,电力能耗成本所占比率约为50%,降低数据中心电力能耗也有助于降低数据中心长期运营成本,具有重大的现实意义。
[0004]在数据中心中,能耗主要由四部分所消耗,包括:IT设备,冷却设备,供电设备和照明设备。其中IT设备能耗约占60%,冷却设备约占30%。供电设备和照明设备共占约10%。由此可见,IT设备能耗是数据中心能耗的主要组成部分。因此降低IT设备能耗能有效降低数据中心能耗,其具有重要意义。
[0005]降低IT设备能耗的相关研究通常可以分为硬件层面的节能和系统层面的节能,分别指使用动态电压缩放等技术节省各IT设备部件能耗和进行作业或虚拟机调度来节能。IT设备的能耗较高的原因除了本身硬件能效低之外,主要就是作业或虚拟机分配的不合理,目前的研究点主要就集中在合理分配设备资源,例如通过作业调度或虚拟机迁移技术来关闭空闲设备。
[0006]然而,目前数据中心规模不断扩大,大型数据中心中可能部署了数千台服务器。而且随着数据中心的不断发展,数据中心中新旧服务器并存,服务器的参数各不相同。因此设计一个面向能耗最小化的专家系统用于作业调度越来越难以实现。而近年来深度强化学习在复杂系统控制方面取得了突出成就。深度强化学习在围棋和电子游戏上都取得了比人类更优异的成绩。因此深度强化学习在面向能耗最小化的数据中心作业调度器设计方面有着优异的前景,也受到了学界的关注。
[0007]然而,现存的面向能耗最小化基于深度强化学习的数据中心作业调度器设计通常是把整个集群的状展平输入到神经网络中。这种方法存在以下问题:
[0008]1.不支持弹性伸缩。云计算最为关键的特性就是可扩展性。数据中心作为云计算的基础设施,也必然要支持新服务器的加入和服务器的退出。由于神经网络的特性决定了输入的维度必须是固定的。因此简单地将整个集群的信息输入神经网络显然无法支持新服
务器的加入,或者说集群规模的扩大。而服务器的宕机退出虽然可以简单地把对应服务器的剩余资源设置为0来规避调度,但是显然这也增加了神经网络的学习难度。
[0009]2.维度爆炸。当数据中心规模增大时,状态空间和动作空间规模会线性增长,有维度爆炸的风险。
[0010]3.冗余信息过多。正常运行的数据中心集群应处于一个较繁忙的状态。此时大部分服务器无法承担新任务的运行。将整个集群的状态都输入网络会导致神经网络接受到很多冗余信息,增加了学习难度。

技术实现思路

[0011]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种数据中心作业调度方法、系统、存储介质及计算设备,解决数据中心作业调度器存在不支持弹性伸缩、维度爆炸,冗余信息过多的问题。
[0012]本专利技术采用以下技术方案:
[0013]一种数据中心作业调度方法,利用模拟器对调度器进行训练至收敛;然后在每个调度时刻,调度器根据先到先服务原则依次遍历现存未完成作业中包含的未完成任务,将未完成任务的资源需求与集群中各服务器可提供的资源做对比,将可以接受这一任务执行的服务器的状态参数和任务的参数组成一个服务器

作业对保存;对比完成后,将保存的服务器

作业对列表输入到神经网络中计算对应的Q值,选择Q值最高的服务器

作业对作为调度决策,将任务调度到被选择的服务器

作业对中对应的服务器上执行;如果作业中所有未调度任务都已经完成调度决策,则标记为已完成,继续遍历未完成作业列表,完成作业调度。
[0014]具体的,调度器的单次调度过程具体为:
[0015]调度器判断当前时刻是否存在未完成调度的作业,如果没有,则结束;如果存在未完成的调度作业,选取最先到达的作业进行调度;
[0016]判断作业是否存在未作出调度决策的任务,如果存在,选取任务做出调度决策;
[0017]如果作业不存在未作出调度决策的任务,标记作业在当前时刻完成调度。
[0018]具体的,调度决策具体为:
[0019]调度器选取本次要调度的任务后,遍历集群中所有的服务器,对比服务器剩余资源和任务需求,判断服务器是否满足任务需求,如果满足需求,服务器特征和任务特征组成服务器

作业对machine_job_pair,将服务器

作业对加入服务器

作业对列表machine_job_pair_list中;遍历结束后,将machine_job_pair_list作为一个batch输入到神经网络中,神经网络输出一个Q_list,选择Q_list中最大值对应的machine_job_pair作为调度决策,将任务调度到machine_job_pair中对应服务器上执行。
[0020]具体的,训练调度器具体为:
[0021]使用两个结构相同的价值网络和目标网络,采用基于episode的方式在模拟器中对调度器进行训练,目标网络选择价值网络中Q值最大的动作作为自己的动作用于更新价值网络;每间隔固定的迭代次数后将价值网络的参数复制到目标网络;
[0022]在每个episode中,作业按照对应的到达时间提交到模拟器中;定义调度器的奖励函数,在每个时间步,调度器根据状态做出动作,然后根据奖励函数获得奖励,使用折扣方
式更新价值函数Q(s
t
,a);
[0023]在每次做出调度决策时将Q值最大的服务器

作业对作为状态s
t
,然后将(s
t
‑1,r
t
‑1,s
t
,is_done)四元组存入记忆池中,每次更新价值网络网络时从记忆池中采样一个batch的样本;
[0024]当每次有新作业到达时,调度器在每个时间步进行调度,直至不存在未完全调度的作业;调度器训练完毕。
[0025]进一步的,调度器的累计奖励函数为从当前时刻t到未来的奖励之和R(t),具体为:
[0026][0027本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心作业调度方法,其特征在于,利用模拟器对调度器进行训练至收敛;然后在每个调度时刻,调度器根据先到先服务原则依次遍历现存未完成作业中包含的未完成任务,将未完成任务的资源需求与集群中各服务器可提供的资源做对比,将可以接受这一任务执行的服务器的状态参数和任务的参数组成一个服务器

作业对保存;对比完成后,将保存的服务器

作业对列表输入到神经网络中计算对应的Q值,选择Q值最高的服务器

作业对作为调度决策,将任务调度到被选择的服务器

作业对中对应的服务器上执行;如果作业中所有未调度任务都已经完成调度决策,则标记为已完成,继续遍历未完成作业列表,完成作业调度。2.根据权利要求1所述的方法,其特征在于,调度器的单次调度过程具体为:调度器判断当前时刻是否存在未完成调度的作业,如果没有,则结束;如果存在未完成的调度作业,选取最先到达的作业进行调度;判断作业是否存在未作出调度决策的任务,如果存在,选取任务做出调度决策;如果作业不存在未作出调度决策的任务,标记作业在当前时刻完成调度。3.根据权利要求1所述的方法,其特征在于,调度决策具体为:调度器选取本次要调度的任务后,遍历集群中所有的服务器,对比服务器剩余资源和任务需求,判断服务器是否满足任务需求,如果满足需求,服务器特征和任务特征组成服务器

作业对machine_job_pair,将服务器

作业对加入服务器

作业对列表machine_job_pair_list中;遍历结束后,将machine_job_pair_list作为一个batch输入到神经网络中,神经网络输出一个Q_list,选择Q_list中最大值对应的machine_job_pair作为调度决策,将任务调度到machine_job_pair中对应服务器上执行。4.根据权利要求1所述的方法,其特征在于,训练调度器具体为:使用两个结构相同的价值网络和目标网络,采用基于episode的方式在模拟器中对调度器进行训练,目标网络选择价值网络中Q值最大的动作作为自己的动作用于更新价值网络;每间隔固定的迭代次数后将价值网络的参数复制到目标网络;在每个episode中,作业按照对应的到达时间提交到模拟器中;定义调度器的奖励函数,在每个时间步,调度器根据状态做出动作,然后根据奖励函数获得奖励,使用折扣方式更新价值函数Q(s
t
,a);在每次做出调度决策时将Q值最大的服务器

作业对作为状态s
t
,然后将(s
t
‑1,r
t
‑1,s
t
,is_done)四元组存入记忆池中,每次更新价值网络网络时从记忆池中采样一个batch的样本;当每次有新作业到达时,调度器在每个时间步进行调度,直至不存在未完全调度的作业;调度器训练完毕。5...

【专利技术属性】
技术研发人员:伍卫国康益菲王今雨马春苗
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1