作业调度设备和作业调度方法。当分配未分配的排队作业时,通过使用具有分配了活动作业的网状结构的CDA,作业调度设备(100)扫描包括关于作业的分配事件和释放事件的信息的事件列表、确定被保留的对应于排队作业的子网处的坐标和时间并且通过在CDA上重叠它们来安排子网。
【技术实现步骤摘要】
这里讨论的实施例涉及。
技术介绍
近几年来,用作执行科学和技术计算的信息处理设备的超级计算机具有例如多至 数以万计的计算节点。每个计算节点连接到网状网络。一类网状网络的示例是被形成为多 个标准组件的集合的网状网络,所述集合构成整个网状网络。因此,网状网络具有可以在标 准组件单元中扩展的特性,即,网状网络具有高的可扩展性的特性。利用超级计算机,为了防止作业之间的通信干扰,系统被划分成构成网状网络的 一部分的矩形或立方体局部区域(在下文中称为“子网”),并且划分后的系统执行分配给 它们的作业。然而,对子网的作业分配引起系统中的碎片,由此存在不能向其分配作业的子 网。这可造成系统中有效率的降低。在超级计算机运行的科学和技术计算领域(也被称为高性能计算(HPC)领域) 中,由于超级计算机在执行各种作业的同时不断地运行,因此子网上碎片的效应特别严重。 因此,为了减轻碎片,存在用于在作业调度中执行的回填的技术。在作业调度中,控制作业并执行作业。并且,存在以下方法其中通过提高低优先 级作业的优先级来在执行大型作业之前执行从一开始被给定低优先级的作业或小型作业 (由于执行先到达的大型作业或从一开始被给定高优先级的作业,所以从一开始被给定低 优先级的作业或小型作业等待很长一段时间)。这里,术语“大型”意味着“处理时间相对 较长”,反之,术语“小型”意味着“处理时间相对较短”。该调度方法被称为回填(回填)。针对回填,提出了两个算法,即,保守型的和积极型的。例如,积极型回填仅针对 最高优先级排队作业确保执行开始时间;而保守型回填针对所有排队作业确保执行开始时 间。由于该原因,保守型回填可以避免特定作业不被执行的资源缺乏现象,并且可以向用户 提交排队作业的执行开始时间,这些都是具有优势的。然而,当与积极型回填相比时,保守 型回填需要大量计算工作量,因此不利地影响调度性能。此外,关于积极型回填,由于对不能开始的排队作业没有执行操作,因此执行积极 型回填的计算工作量的数量与排队作业的数目成正比。相反,保守型回填为将来的使用保 留了计算资源(硬件资源)。由保守型回填执行的计算资源的保留具有两个事件,即,资源 获取和资源释放。事件按照发生的顺序被列出并且由被称为事件列表的列表来管理。关于保守型回填的算法,通过扫描事件列表并且搜索如下时段来执行调度在该 时段期间,对于需要的时段可以确保作业需要的计算资源(硬件资源)。因此,执行保守型 回填的计算工作量的数量与排队作业的数目的平方成正比。利用积极型和保守型回填,按 照高优先级的顺序来确定排队作业是否可以执行。需要大量计算工作量用于子网分配,并且此外,当同时执行子网分配和回填时,需 要另外的大量计算工作量。因此,利用保守型技术,很难研究出考虑网状拓扑的用于实际使 用的保守回填;因此,使用积极型回填或更简单的方法。更简单的方法的示例是如下技术其中,不考虑优先级并且不对子网进行保留,将在较短时间内执行的小作业首先向前移动 来执行。日本专利公布第2005-310139号。Y. Zhu 的文章,题为 “Efficient Processor AllocationStrategies for Mesh-Connected Parallel Computers,,,1992 年 12 月发表于 Journal of Parallel and Distributed Computing, vol. 16, issue 4,pp.328—327。Lifka,D. A 的文章,题为"The ANL/IBM SPScheduling System”, 1995 年发表于 In Proceedings of the Workshop onjob Scheduling Strategies For Parallel Processing, D. G. Feitelson and L. Rudolph, Eds.Lecture Notes In Computer Science,vol.949. Springer-Verlag, London, pp.295—303。Mu,alem, A. W.和 Feitelson 的文章,题为"Utilization, Predictability, Workloads, and User Runtime Estimates in Scheduling theIBM SP2with Backfilling,,,2001 年 6 月发表于 D.G. 2001IEEE Tran. Parallel Distrib. Syst. Vol. 12,No. 6,pp. 529-543。然而,利用上述技术,存在如下问题降低了执行作业的系统的有效率。具体地,利 用不考虑优先级而将小作业先向前移动的技术,由于花费较长执行时间的大作业可能出现 资源缺乏,因此需要使用其中对延迟作业给予提高的优先级的策略控制。此时,由于对延迟 作业执行优先化,因此不可能避免开始大作业的执行中的延迟。此外,使用回填来向前移动 被给定较高优先级的大作业最终是不可能的。结果,利用上述技术,降低了执行作业的系统 的有效率。因此,本专利技术实施例的一个方面中的目的是提供可以改善执行作业的系统的有效 率的作业调度设备和作业调度。
技术实现思路
根据本专利技术实施例的方面,用于向多个信息处理设备分配作业的作业调度设备包 括存储单元,在其中存储二维阵列,在所述二维阵列中存储将被分配到多个信息处理设备 的作业,使得将被分配的作业被数字化和被转换成与多个信息处理设备对应的阵列元素; 深度值计算单元,其使用存储在存储单元中的二维阵列来计算表示作业之间干扰程度的深 度值,基于二维阵列中被分配作业的阵列元素中存储的数值而计算深度值;搜索单元,其基 于由深度值计算单元计算的深度值而在二维阵列中搜索可以用于对应于将被分配的作业 的分配的阵列元素;以及安排单元,如果存在由搜索单元获得的可以用于分配的阵列元素, 那么安排单元通过数字化和转换成可以用于分配的阵列元素来安排将被分配的作业。附图说明图1是示出包括作业调度设备的系统的示例配置的示意图;图2是解释排队作业分配的示意图;图3是示出根据第一实施例的作业调度设备的示例配置的框图;图4是示出活动作业列表的示例的表格;图5是示出排队作业列表的示例的表格;4图6是示出事件列表的示例的表格;图7是示出根据第一实施例的排队作业分配处理的流程的流程图;图8是示出根据排队作业分配处理而处理的CDA的示例的示意图;图9是示出根据排队作业分配处理而处理的CDA的示例的示意图;图10是示出根据排队作业分配处理而处理的CDA的示例的示意图;图11是示出根据排队作业分配处理而处理的CDA的示例的示意图;图12是示出根据排队作业分配处理而处理的CDA的示例的示意图;图13是示出作业分配时段的时序图的示例的示意图;图14是示出根据排队作业分配处理而处理的事件列表的示例的表格;图15是示出根据排队作业分配处理而处理的事件列表的示例的表格;图16是示出根据排队作业分配处理而处理的事件列表的示例的表格;图17是示出在其中存储差值的CDA的示例的图;以及图18是示出执行作业调度程序的计算机的框图。具体实施例方式将参考附图解释本本文档来自技高网...
【技术保护点】
一种向多个信息处理设备分配作业的作业调度方法,所述作业调度方法包括:通过使用二维阵列来计算表示作业之间干扰程度的深度值,在所述二维阵列中以这种方式存储了将被分配到所述多个信息处理设备的作业:将被分配的作业被数字化和被转换成与所述多个信息处理设备对应的阵列元素,并且基于所述二维阵列中分配了作业的阵列元素中存储的数值来执行计算;基于通过深度值计算而计算出的深度值,在所述二维阵列中搜索与作业对应的可以用于分配的阵列元素;以及如果存在通过搜索获得的可以用于分配的阵列元素,那么通过将作业数字化和转换成可以用于分配的阵列元素来安排作业。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:安岛雄一郎,久门耕一,住元真司,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。