【技术实现步骤摘要】
本专利技术属于分布式计算下工作流任务调度技术、工作流任务建模技术,特别涉及一种分布式计算环境下的工作流任务调度方法。
技术介绍
分布式计算环境中任务调度是最重要的部分,并且在整个分布式基础设施中也发挥着不可替代的作用。分布式计算环境下的任务调度要求在考虑时间、成本、可靠性、可用性、吞吐量、资源利用率的情况下找到任务资源分配的最佳方案。分布式计算环境下的任务调度主要分为独立任务调度和工作流任务调度。工作流任务中包含了若干个任务,且这若干个任务间具有数据依赖关系。现有的方法在进行工作流任务调度时,以降低任务执行成本为主要目标,例如,基于小位置值规则的粒子群优化任务调度方法,根据小位置值规则更新粒子位置信息,收敛速度快,能够最小化任务调度执行成本;基于双目标优化的异构最早时间完成算法,充分考虑用户对预算和截止时间的要求进行任务调度,并取得了较好的效果。但是,上述算法均未考虑工作流任务之间的数据依赖关系对任务调度效果产生的影响,导致工作流任务通信成本较高、执行完成时间较长,工作流任务调度效率低下。
技术实现思路
本专利技术为解决现有技术中存在的以上问题,提供了一种分布式计算环境下的工作流任务调度方法,考虑了工作流任务之间的数据依赖关系对任务调度效果产生的影响,降低了工作流任务通信成本以及执行完成时间,提高了工作流任务调度效率。为了实现上述目的,本专利技术采用的技术方案是:一种分布式计算环境下的工作流任务调度方法,包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计 ...
【技术保护点】
一种分布式计算环境下的工作流任务调度方法,其特征在于包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计算资源有向无环图;步骤2:根据工作流任务有向无环图以及计算资源有向无环图,计算平均任务执行时间t1、平均数据传输时间t2;步骤3:若t1>t2,则被调度工作流任务为计算密集型任务,进入步骤4;若t1<t2,则所述工作流任务为IO密集型任务,进入步骤5;步骤4:根据计算密集型任务的有向无环图的节点权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤5:根据IO密集型任务的有向无环图的边权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤6:将得到的若干个任务集根据各任务集的计算数据量进行排序,并将计算资源根据其计算能力大小进行排序;步骤7:根据步骤6的排序结果,将计算数据量大的任务集分配给计算能力大的计算资源。
【技术特征摘要】
1.一种分布式计算环境下的工作流任务调度方法,其特征在于包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计算资源有向无环图;步骤2:根据工作流任务有向无环图以及计算资源有向无环图,计算平均任务执行时间t1、平均数据传输时间t2;步骤3:若t1>t2,则被调度工作流任务为计算密集型任务,进入步骤4;若t1<t2,则所述工作流任务为IO密集型任务,进入步骤5;步骤4:根据计算密集型任务的有向无环图的节点权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤5:根据IO密集型任务的有向无环图的边权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤6:将得到的若干个任务集根据各任务集的计算数据量进行排序,并将计算资源根据其计算能力大小进行排序;步骤7:根据步骤6的排序结果,将计算数据量大的任务集分配给计算能力大的计算资源。2.根据权利要求1所述分布式计算环境下的工作流任务调度方法,其特征在于,所述步骤1包括工作流任务有向无环图中节点的总数为I,其中,第i个节点的权值wi表示任务计算数据量,i∈[1,2,…,I];工作流任务有向无环图中边的总数为M,其中,第m个边的权值vm表示任务之间的数据传输量,m∈[1,2,…,M];计算资源有向无环图中节点的总数为J,其中,第j个节点的权值wj表示资源计算能力,j∈[1,2,…,J];计算资源有向无环图中边的总数为N,其中,第n个边的权值vn表示资源间的数据传输能力,n∈[1,2,…,N]。3...
【专利技术属性】
技术研发人员:段贵多,刘贵松,罗光春,秦科,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。