The invention discloses an optimization method based on Monte Carlo simulation method of data flow scheduling, including the following steps: (1) create a pre schedule empty list L; and define a l input space, the input space l is a set of randomly generated each task execution time set in the processor; (2) generation phase, using the static scheduling algorithm for HEFT generation scheduling scheme, and in the pre schedule list L; (3) comparing the pre selection stage, each pre scheduling scheduling scheme in the L list completion time, to choose the optimal pre scheduling scheme. The invention has good versatility and can obtain an excellent scheduling scheme when the task execution time is randomly changed.
【技术实现步骤摘要】
一种基于蒙特卡络模拟法的数据流调度优化方法
本专利技术涉及一种基于流计算技术的任务调度方法,具体涉及一种基于蒙特卡络模拟法的数据流调度优化方法。
技术介绍
随着信息通信技术的高速发展,特别是泛在物联网技术的普及应用,时时刻刻产生着海量、实时的数据流,面对这些“无限"运动着的数据,需要进行在线且精确的计算和分类,从而能够及时挖掘出其中隐含的有价值信息。在云计算为代表的分布式流计算系统中,不仅包含了海量的静态、离线、结构化的数据,还有实时传输、持续生成的非结构化数据。为满足多任务并行处理的复杂计算需要,在分布式流计算系统中,将进行计算的海量数据切分成若干个小块数据流后交由多台计算机并行处理,并将局部计算结果整合得出最终结果。针对输入的同组数据流,其采用的调度算法不同,最终的计算效率差异非常大。目前针对动态数据流的调度算法有很多,主要有静态表调度(也就是HEFT算法);基于工作流的调度;引导搜索调度;基于聚类的调度;以及基于任务复制的调度等。但这些调度算法都仅适用于特定的应用环境下,通用性较差。在传统的分布式处理模式中,输入的大多是静态数据,在利用有向无环图DAG(DirectedAcyclicGraph)表示并行数据流在多处理机上进行任务调度时,其任务的执行时间是可预知的。由于分布式流计算系统中输入的是“无限"运动着的数据,而且这些数据的大小也是不确定的。这种不确定性的存在,使得传统的经典静态流据流HEFT调度方法将不再完全适用。
技术实现思路
针对现有技术存在的不足,本专利技术目的是提供一种通用性好的基于蒙特卡络模拟法的数据流调度优化方法,本专利技术在任务执行时 ...
【技术保护点】
一种基于蒙特卡络模拟法的数据流调度优化方法,其特征在于,具体包括以下几个步骤:(1)创建一个空的预调度方案列表L;并定义一个输入空间lg,所述输入空间lg是一组随机生成各任务在各处理机上执行时间的集合;(2)生成阶段,运用静态调度算法HEFT生成预调度方案,并存入到预调度方案列表L;(3)选择阶段,比较预调度方案列表L中每个预调度方案的完工时间,从而选出最优预调度方案。
【技术特征摘要】
1.一种基于蒙特卡络模拟法的数据流调度优化方法,其特征在于,具体包括以下几个步骤:(1)创建一个空的预调度方案列表L;并定义一个输入空间lg,所述输入空间lg是一组随机生成各任务在各处理机上执行时间的集合;(2)生成阶段,运用静态调度算法HEFT生成预调度方案,并存入到预调度方案列表L;(3)选择阶段,比较预调度方案列表L中每个预调度方案的完工时间,从而选出最优预调度方案。2.根据权利要求1所述的基于蒙特卡络模拟法的数据流调度优化方法,其特征在于,步骤(1)中,设g=(N,E)表示一组由节点N和一组边E组成的DAG有向无环图,形式都为(i→j),其中i,j∈N,节点i表示对应的任务,边i→j表示任务i和j之间任务间的依赖关系。3.根据权利要求2所述的基于蒙特卡络模拟法的数据流调度优化方法,其特征在于,所述输入空间lg定义如下:lg=(ETi,p:i∈N,p∈R),其中,ETi,p表示任务i在处理机p上的确切执行时间。4.根据权利要求3所述的基于蒙特卡络模拟法的数据流调度优化方法,其特征在于,步骤(2)中,运用静态调度算法HEFT生成预调度方案具体方法如下:(1-1)对所述输入空间lg中每个随机生成的任务执行时间进行抽样,...
【专利技术属性】
技术研发人员:施健,孟庆强,胡牧,刘士进,郑浩泉,孙立华,杨志,李端超,王松,黄太贵,
申请(专利权)人:国家电网公司,南京南瑞集团公司,南京南瑞信息通信科技有限公司,国网安徽省电力公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。