一种节点调度方法、装置及设备制造方法及图纸

技术编号:27472861 阅读:16 留言:0更新日期:2021-03-02 17:39
本申请提供一种节点调度方法、装置及设备,每个时间段各节点不尽相同的使用率,通过确定在当前时间之前的历史时间段内超级计算机系统中各节点运行作业情况的特征值;利用训练好的LSTM模型中,预测在未来时间段内负载小于设定负载阈值的节点数量,并从本系统各节点中,选取与预测的节点数量相同的且负载小于设定负载阈值的目标节点,以为本系统在未来时间段内留有灵活调度目标节点的时间,进而使各节点尽可能发挥本节点的性能优势,同时达到防止因频繁降频或断电目标节点,引起的额外能耗损失。因此,应用本申请实施例能够在不同时间段内动态地确定负载小的目标节点,以使各节点尽可能发挥本节点的性能优势的同时,达到降低能耗的目的。耗的目的。耗的目的。

【技术实现步骤摘要】
一种节点调度方法、装置及设备


[0001]本专利技术涉及计算机
,尤其涉及一种节点调度方法、装置及设备。

技术介绍

[0002]随着超级计算机系统性能规模的不断扩大,整个系统能耗随之也会呈指数增长,相应地,整个系统能耗也会导致巨大的运行开销,同时还会带来严重的环境污染。因此,降低系统能耗已经成为超级计算机系统研制需要解决的重点问题。
[0003]目前,在超级计算机系统中,常用的节能方法是通过查询系统中各节点截止当前时间的空闲时间,如果存在空闲时间大于预设的时间阈值的节点,则将这些节点确定为闲置节点,并对闲置节点进行降频或断电处理,在降频或断电处理后,针对新的作业任务,再重新启动闲置节点,进而达到降低系统能耗的目的。
[0004]然而在实际应用中,每个时间段各节点运行作业的使用率不尽相同,而上述通过时间阈值确定闲置节点的方法,属于一刀切,不够灵活,在面对新的作业任务进行分配时,使得降频和断电后的闲置节点重新上电,如果时间阈值设定不准确,还会造成闲置节点频繁开关机的现象,反而会加大系统的能耗。

技术实现思路

[0005]有鉴于此,本专利技术提供一种节点调度方法、装置及设备,以在不同时间段内动态地确定负载小的目标节点,以使各节点尽可能发挥本节点的性能优势的同时,达到降低能耗的目的。
[0006]具体地,本申请是通过如下技术方案实现的:
[0007]第一方面,本申请实施例提供一种节点调度方法,所述方法包括:
[0008]依据在当前时间之前的第一时间段内超级计算机系统中各个节点的作业运行情况,确定对应的至少一个特征值;
[0009]将所述至少一个特征值输入到已训练好的长短期记忆网络LSTM模型中,得到预测结果,所述预测结果用于表征预测出的在所述当前时间之后的第二时间段内负载小于设定负载阈值的节点数量N;所述负载用于表征节点运行的作业量;
[0010]依据所述超级计算机系统中各节点在当前时间的作业运行情况,从所述超级计算机系统中选择M个负载小于设定负载阈值的目标节点,所述M小于或等于N;
[0011]调度选择的M个目标节点以处理所述第二时间段内待处理的作业。
[0012]第二方面,基于相同的构思,本申请还提供一种节点调度装置,所述装置包括:
[0013]特征值确定单元,用于依据在当前时间之前的第一时间段内超级计算机系统中各个节点的作业运行情况,确定对应的至少一个特征值;
[0014]节点数量预测单元,用于将所述至少一个特征值输入到已训练好的长短期记忆网络LSTM模型中,得到预测结果,所述预测结果用于表征预测出的在所述当前时间之后的第二时间段内负载小于设定负载阈值的节点数量N;所述负载用于表征节点运行的作业量;
[0015]节点选择单元,用于依据所述超级计算机系统中各节点在当前时间的作业运行情况,从所述超级计算机系统中选择M个负载小于设定负载阈值的目标节点,所述M小于或等于N;
[0016]调度单元,用于调度选择的M个目标节点以处理所述第二时间段内待处理的作业。
[0017]第三方面,本申请实施例提供一种电子设备,该电子设备包括处理器和存储器;
[0018]所述存储器,用于存储机器可执行指令;
[0019]所述处理器,用于读取并执行所述存储器存储的机器可执行指令,以实现上述实施例所述的节点调度方法的方法步骤。
[0020]由以上技术方案可以看出,本申请实施例中,通过确定超级计算机系统中各节点在当前时间之前的历史时间段内运行作业情况的特征值;利用训练好的LSTM模型中,预测在未来时间段内负载小于设定负载阈值的节点数量,并从本系统各节点中,选取与预测的节点数量相同的且负载小于设定负载阈值的目标节点,以为本系统在未来时间段内留有灵活调度目标节点的时间,进而使各节点尽可能发挥本节点的性能优势,同时达到防止因频繁降频或断电目标节点,引起的额外能耗损失。因此,应用本申请实施例提供的技术方案能够在不同时间段内动态地确定负载小的目标节点,以使各节点尽可能发挥本节点的性能优势的同时,达到降低能耗的目的。
附图说明
[0021]图1是本申请实施例提供的一种节点调度方法的流程示意图;
[0022]图2是本申请实施例提供的另一种节点调度方法的流程示意图;
[0023]图3是本申请实施例提供的一种节点调度装置的硬件结构示意图;
[0024]图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]在实际应用中,每个时间段超级计算机系统中各节点运行作业的使用率不尽相同,而现有技术通过时间阈值确定闲置节点的方法,属于一刀切,不够灵活,而且在面对新的作业任务进行分配时,又需要对已经降频或断电后的闲置节点重新上电,以运行新的业务,但是,对于运行作业少的、且还具备提供继续处理其他业务能力的节点在耗能的同时,却未能够得到充分发挥本节点的性能优势。而且如果时间阈值设定不准确,还会造成闲置节点频繁开关机的现象,反而会加大系统的能耗。为解决这一技术问题,本申请实施例提供了一种节点调度方法、装置及设备。
[0027]本申请的一个实施例中,提供了一种节点调度方法,该方法包括:依据在当前时间之前的第一时间段内超级计算机系统中各个节点的作业运行情况,确定对应的至少一个特征值;将至少一个特征值输入到已训练好的长短期记忆网络LSTM模型中,得到预测结果,预测结果用于表征预测出的在当前时间之后的第二时间段内负载小于设定负载阈值的节点
数量N;负载用于表征节点运行的作业量;依据超级计算机系统中各节点在当前时间的作业运行情况,从超级计算机系统中选择M个负载小于设定负载阈值的目标节点,所述M小于或等于N;调度选择的M个目标节点以处理所述第二时间段内待处理的作业。
[0028]由以上可见,应用本实施例提供的方案针对每个时间段各节点不尽相同的使用率,基于各个节点当前时间的历史时间段内运行作业情况的特征值,利用训练好的LSTM模型动态地预测未来时间段内负载小于设定负载阈值的节点数量,进而依据预测的节点数量确定出负载小于设定负载阈值的目标节点,以为本系统在未来时间段内留有灵活调度目标节点的时间,以使各节点尽可能发挥本节点的性能优势,同时达到防止因频繁降频或断电目标节点,引起的额外能耗损失。因此,应用本申请实施例提供的技术方案能够在不同时间段内动态地确定负载小的目标节点,以使各节点尽可能发挥本节点的性能优势的同时,达到降低能耗的目的。
[0029]请参见图1,图1是本申请实施例提供的一种节点调度方法的流程示意图,该方法可以包括如下步骤:
[0030]步骤101、依据在当前时间之前的第一时间段内超级本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种节点调度方法,其特征在于,所述方法包括:依据在当前时间之前的第一时间段内超级计算机系统中各个节点的作业运行情况,确定对应的至少一个特征值;将所述至少一个特征值输入到已训练好的长短期记忆网络LSTM模型中,得到预测结果,所述预测结果用于表征预测出的在所述当前时间之后的第二时间段内负载小于设定负载阈值的节点数量N;所述负载用于表征节点运行的作业量;依据所述超级计算机系统中各节点在当前时间的作业运行情况,从所述超级计算机系统中选择M个负载小于设定负载阈值的目标节点,所述M小于或等于N;调度选择的M个目标节点以处理所述第二时间段内待处理的作业。2.根据权利要求1所述的方法,其特征在于,所述至少一个特征值至少包括以下任一或任一组合:处于运行作业状态的节点的节点属性信息,所述节点属性信息至少包括:在第一时间段内被使用的CPU的数量、被使用的内存量、运行的作业量、以及运行作业的总时长;在第一时间段内处于运行作业状态的节点的节点数量;在第一时间段内处于作业挂起状态的节点数量;在第一时间段内处于作业挂起状态的作业挂起总时长;在第一时间段内处于闲置状态的节点数量,所述闲置状态用于指示未运行作业且不存在已被挂起的作业。3.根据权利要求1所述的方法,其特征在于,所述M个目标节点包括第一类节点和第二类节点,所述第一类节点是指处于作业运行状态的节点,所述第二类节点是指处于闲置状态的节点,所述闲置状态用于指示未运行作业且不存在已被挂起的作业;所述调度选择的M个目标节点以处理所述第二时间段内待处理的作业包括:针对待处理作业,先检查所述第一类节点中是否存在用于运行该待处理作业的节点,如果是,调度所述第一类节点中存在的用于运行该待处理作业的节点运行该待处理作业,如果否,从所述第二类节点中选择用于运行该待处理作业的节点,调度所述第二类节点中存在的用于运行该待处理作业的节点运行该待处理作业。4.根据权利要求3所述的方法,其特征在于,该方法进一步包括:将所述第二类节点中未被调度处理所述第二时间段内任一作业的节点进行降频处理或断电处理。5.根据权利要求3所述的方法,其特征在于,若所述第二时间段内不存在待处理作业,该方法进一步包括:对所述M个目标节点中处于闲置状态的节点进行降频处理或断电处理...

【专利技术属性】
技术研发人员:陈拓李韬
申请(专利权)人:新华三人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1