System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及云际智算任务的调度技术,具体涉及一种多租户智算任务的多维需求感知调度方法及系统。
技术介绍
1、近年来,随着大模型人工智能的出现和火爆,云际计算环境中以深度学习训练任务为代表的智算任务需求迅速增长,由于巨大的需求量与智算任务有别于常规任务的特点,需要针对智算任务提出新的调度策略和算法。为了保证智算任务顺利完成、提高租户的满意度,如何对多租户的需求进行感知,综合考虑智算任务的执行时间、成本等多方面调度因素,为不同租户提供高质量的定制化调度服务,成为待解决的问题。
2、现有对智算任务调度的研究大多考虑任务运行在同构即复数个同类gpu上,这显著降低了调度难度,因为一个任务在一类gpu上的执行时间与开销是确定的。然而,在真实的生产环境中,任务常常需要在多个异构gpu上完成调度。不同类的gpu不仅影响任务的执行时间,而且开销也各不相同,专业级gpu与入门级gpu的性能差距甚至会达到十数倍之多,相应的,开销即租用单价也不在同一个量级。而对于云际异构环境下的智算任务调度,现有的方法也难以兼顾多租户对智算任务的多维需求。它们通常只顾及满足截止时间、减少任务完成时间、降低经济成本中的一环,缺乏对用户需求的考量,也不具备综合考虑多方面调度目标进行调度的能力。
3、要将独立的训练任务调度到多个异构的gpu上,提高调度质量和用户的满意度,对用户需求的考察至关重要。不同的用户对效率、成本和截止时间满足的要求不尽相同,需要为用户提供定制化服务来保证调度的相对公平性。而进一步对智算任务进行调度,主要有以下三个难点:一是训
技术实现思路
1、本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种多租户智算任务的多维需求感知调度方法及系统,本专利技术旨在解决多租户智算任务调度搜索空间过大难以收敛的问题,满足多租户的多维需求,对智算任务进行高质量的调度,达到权衡满足截止时间、完成时间、经济成本三大调度目标的目的。
2、为了解决上述技术问题,本专利技术采用的技术方案为:
3、一种多租户智算任务的多维需求感知调度方法,包括:
4、步骤s101,对任务队列中的待调度任务进行预处理以估算待调度任务在某一gpu上的执行时间 e以及效率敏感度 es;
5、步骤s102,采用基于待调度任务的截止时间、经济成本、待调度任务在某一gpu上的执行时间 e以及效率敏感度 es所构建的启发式评估函数 f,对预处理完成的任务通过启发式评估函数 f进行启发式搜索最优部署方案;
6、步骤s103,将最优部署方案部署至各个异构的gpu中。
7、可选地,步骤s101中对任务队列中的待调度任务进行预处理时,待调度任务的函数表达式为:
8、,
9、上式中,为任务队列中的待调度任务,~分别为第1~n个待调度任务,且任意待调度任务所包含的信息包括训练模型类别、模型迭代次数 i、截止时间 d和成本敏感度 cs,其中训练模型类别和模型迭代次数 i为智算任务的参数,成本敏感度 cs取值在0 ~1区间内,越高表示用户越重视经济成本。
10、可选地,步骤s101中估算待调度任务在某一gpu上的执行时间 e的函数表达式为:
11、,
12、上式中, eb为该训练模型类别训练冷启动前几次迭代的时间, i为模型迭代次数, ib为冷启动迭代次数, ts为该训练模型类别迭代时间稳定后单次迭代所需时间。
13、可选地,步骤s101中计算效率敏感度 es的函数表达式为:
14、,
15、上式中, cs为待调度任务的成本敏感度。
16、可选地,步骤s102中基于待调度任务在某一gpu上的执行时间 e以及效率敏感度 es所构建的启发式评估函数 f的函数表达式为:
17、,
18、上式中,为预设的综合成本函数,为启发式成本,为gpu负载的启发式成本,且有:
19、,
20、上式中, q为待调度任务集合,为待调度任务集合中的任意一个待调度任务;为待调度任务在某一gpu上的执行时间 e的均值; d为截止时间;为成本因子; es为效率敏感度;为gpu均价; cs为成本敏感度;
21、,
22、上式中,为gpu集合, g为gpu集合上的任意一个gpu, cg为gpu上作业的综合成本函数之和,为gpu的综合成本函数的均值,m为gpu的数量:
23、,
24、上式中,表示gpu上的某一个作业,为任务等待时间,为目标gpu单价,为惩罚因子,为任务延迟时间,且有:
25、,
26、,
27、上式中,为gpu均价;为gpu数量;为待调度任务数量。
28、可选地,所述预设的综合成本函数的函数表达式为:
29、,
30、,
31、,
32、,
33、上式中,为综合成本函数,为延迟成本,为时间成本,为经济成本,为作业队列, es为效率敏感度, cs为待调度任务的成本敏感度,为惩罚因子,为任务延迟时间,为成本因子,为待本文档来自技高网...
【技术保护点】
1.一种多租户智算任务的多维需求感知调度方法,其特征在于,包括:
2.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤S101中对任务队列中的待调度任务进行预处理时,待调度任务的函数表达式为:
3.根据权利要求2所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤S101中估算待调度任务在某一GPU上的执行时间E的函数表达式为:
4.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤S101中计算效率敏感度ES的函数表达式为:
5.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤S102中基于待调度任务在某一GPU上的执行时间E以及效率敏感度ES所构建的启发式评估函数F的函数表达式为:
6.根据权利要求5所述的多租户智算任务的多维需求感知调度方法,其特征在于,所述预设的综合成本函数的函数表达式为:
7.根据权利要求5所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤S102中对预处理完成的任务通过启发式评估函数F进行
8.一种多租户智算任务的多维需求感知调度系统,包括相互连接的微处理器和存储器,其特征在于,所述微处理器被编程或配置以执行权利要求1~7中任意一项所述多租户智算任务的多维需求感知调度方法。
9.一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序/指令,其特征在于,该计算机程序/指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述多租户智算任务的多维需求感知调度方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述多租户智算任务的多维需求感知调度方法。
...【技术特征摘要】
1.一种多租户智算任务的多维需求感知调度方法,其特征在于,包括:
2.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤s101中对任务队列中的待调度任务进行预处理时,待调度任务的函数表达式为:
3.根据权利要求2所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤s101中估算待调度任务在某一gpu上的执行时间e的函数表达式为:
4.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤s101中计算效率敏感度es的函数表达式为:
5.根据权利要求1所述的多租户智算任务的多维需求感知调度方法,其特征在于,步骤s102中基于待调度任务在某一gpu上的执行时间e以及效率敏感度es所构建的启发式评估函数f的函数表达式为:
6.根据权利要求5所述的多租户智算任务的多维需求感知调度方法,其特征在于...
【专利技术属性】
技术研发人员:史佩昌,杨嘉诚,王怀民,高菲,成姝蒽,林墨恒,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。