The invention discloses a dynamic workflow scheduling method based on genetic algorithm. The goal of the scheduling method is to optimize the average cost of each workflow cycle under the constraint of the maximum execution cycle specified by the user and the total execution time of one workflow cycle. Because the execution mode of workflow is dynamic and changeable in the implementation environment of cloud computing, the present invention constructs all possible flow topology results of dynamic workflow, corresponds to each possible flow topology result by establishing a series of subgraphs, and establishes overall model with probability model, thus comprehensively considers the dynamic and time-varying characteristics of workflow, and adopts legacy. The transmission algorithm optimizes the cycle cost of workflow execution in dynamic environment, thus improving the efficiency of workflow execution.
【技术实现步骤摘要】
基于遗传算法的动态工作流调度方法
本专利技术涉及云计算以及智能算法
,具体涉及一种基于遗传算法的动态工作流调度方法。
技术介绍
云计算通过对大量计算资源的虚拟聚合和共享,实现按需向用户提供各种各样的计算服务,因此能够满足日益增长的大数据处理需求。为了进一步提高云计算系统对大数据的管理和处理能力,如何合理、高效地调度云计算的资源从而实现向用户弹性地提供计算服务是提高云计算系统性能的关键。在云计算环境中,由于云计算资源的数量庞大、云系统所承担的计算服务量也相当巨大,云网络的使用状态也时刻变化,因此动态时变性是云计算系统运作过程中所具有的重要特征。在应用云计算处理大数据计算任务时,一类常用的任务组织方式是工作流。工作流定义为一个完成复杂目标的特定的任务序列。通常地,工作流可以通过有向无环图(DAG)的形式给出,图的节点表示单个任务,而节点之间的有向边表示任务之间的优先约束关系。然而,在现有的工作流调度模型中,一个工作流的控制流拓扑结构是固定不变的,即是由单一的DAG给出。在实际应用中,工作流的控制流结构可能还具有IF-THEN等选择分支,其控制流拓扑结构也具有动态时变的特性,如何能够在工作流调度过程中考虑云环境和工作流控制拓扑的动态时变特性,从而进一步提高工作流调度系统在动态、时变环境中的可用性,对工作流调度方法提出了新的挑战。随着优化技术的发展,如遗传算法等新型的元启发式智能计算方法为复杂优化问题的求解提供了新的有效手段。遗传算法是模拟自然界生物的进化现象而提出的一种随机式优化方法,它自20世纪60年代提出以来引起了广泛的关注,并且已经被成功地应用于众多 ...
【技术保护点】
1.一种基于遗传算法的动态工作流调度方法,其特征在于,所述的调度方法包括:S1、对动态工作流所有可能出现的流拓扑结果进行构造,通过建立一系列子图来对应每一种可能发生的流拓扑结果,并用概率模型进行整体建模,过程如下:S101、确定工作流中所有可能存在的拓扑结构总数n;S102、将工作流有向无环图改写成子图集合{Φ1,Φ2,…,Φn},其中Φi代表该动态工作流中可能出现的一种控制流拓扑结构;S103、建立{p1,p2,…,pn}概率集合,其中pi代表动态工作流采取Φi控制流拓扑结构执行工作的概率,pi根据工作流在此前的m次历史执行记录信息中采取Φi控制流拓扑结构的次数Ni而计算得出的,m≥500,即:
【技术特征摘要】
1.一种基于遗传算法的动态工作流调度方法,其特征在于,所述的调度方法包括:S1、对动态工作流所有可能出现的流拓扑结果进行构造,通过建立一系列子图来对应每一种可能发生的流拓扑结果,并用概率模型进行整体建模,过程如下:S101、确定工作流中所有可能存在的拓扑结构总数n;S102、将工作流有向无环图改写成子图集合{Φ1,Φ2,…,Φn},其中Φi代表该动态工作流中可能出现的一种控制流拓扑结构;S103、建立{p1,p2,…,pn}概率集合,其中pi代表动态工作流采取Φi控制流拓扑结构执行工作的概率,pi根据工作流在此前的m次历史执行记录信息中采取Φi控制流拓扑结构的次数Ni而计算得出的,m≥500,即:并且有:S2、对模型进行优化,其中,优化目标是找到一组工作流调度方式K,使得工作流在动态环境下执行的费用耗费的期望值最小化,其中K.C(Φj)是指调度K在控制流拓扑结构Φj下所需的开销。2.根据权利要求1所述的基于遗传算法的动态工作流调度方法,其特征在于,所述的步骤S2中对模型进行优化的过程如下:S201、初始化算法的交叉率px、变异率pm和种群大小参数popsize,并生成第一代种群,种群中每个个体的编码方式为K(k1,k2,…,kn)其中,ki表示将工作流的任务Ti匹配到相应的云计算服务执行;S202、评价种群中每个个体的适应值,评价的方式如下:根据动态工作流的每一种可能的控制流拓扑结构Φj,分别计算每个解K在该拓扑结构Φj下所需的执行时间K.T(Φj)和费用开销K.C(Φj),如果对于所有的拓扑结构{Φ1,Φ2,…Φn},都有K.T(Φj)≤Deadline,即所有拓扑结构下工作流的执行时间都能够满足用户所定义的完成期限Deadline,则解K的适应值K.fitness按如下式子计算:如果该调度K在一个或多个控制流拓扑结构中有K.T(Φj)>Deadline,即不能满足用户定义的完成期限,则该解K的适应值设置为适应值的上限MAX;S203、采用竞争选择的方式,从上一代种群中选出pop...
【专利技术属性】
技术研发人员:张军,陈伟能,詹志辉,余维杰,周淑姿,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。