【技术实现步骤摘要】
用户作业调度方法及装置
本专利技术涉及信息
,尤其涉及一种用户作业调度方法及装置。
技术介绍
分布式系统基础架构(Hadoop)的缺省作业调度采用简单的单一主节点的主从结构,即一个主节点(JobTracker)管理一系列从节点(TaskTracker)。其中,JobTracker负责用户作业的任务划分、状态监控、错误恢复以及TaskTracker的状态维护;TaskTracker负责具体任务的执行和本地资源的管理。TaskTracker的计算能力以任务槽(slot)的形式提供,依据任务类型的不同,slot分为Map槽和Reduce槽,分别用于执行Map任务和Reduce任务。现有技术在多用户共享场景中,Hadoop的作业调度过程包含三个步骤:首先是作业选择,其次是在选定作业内选择一个任务,最后将该任务分发到请求任务的TaskTracker上执行。当一个计算节点的TaskTracker发现一个任务完成,存在可用的任务槽时,就会在下次的心跳消息中附加任务请求信息发送给主节点JobTracker,然后JobTracker执行调度算法,遍历所有作业的可执行任务,依据公平份额调度算法选取适合的任务分配给任务槽进行处理。但是,该方法执行效率低下。
技术实现思路
本专利技术提供一种用户作业调度方法和装置,用以解决现有技术中,用户作业调度方法执行效率低下的问题。一方面,本专利技术实施例提供一种用户作业调度方法,其特征在于,包括:管理节点接收任务调度触发信号;所述管理节点根据所述任务调度触发信号,在分布式系统的各计算节点中确定待作业任务处理时间最短的目标计算节点;所述管理 ...
【技术保护点】
一种用户作业调度方法,其特征在于,包括:管理节点接收任务调度触发信号;所述管理节点根据所述任务调度触发信号,在分布式系统的各计算节点中确定待作业任务处理时间最短的目标计算节点;所述管理节点将所述待作业任务发送至所述目标计算节点的任务缓存队列中。
【技术特征摘要】
1.一种用户作业调度方法,其特征在于,包括:管理节点接收任务调度触发信号;所述管理节点根据所述任务调度触发信号,在分布式系统的各计算节点中确定待作业任务处理时间最短的目标计算节点;所述管理节点将所述待作业任务发送至所述目标计算节点的任务缓存队列中;其中,所述管理节点根据所述任务调度触发信号,在分布式系统的各计算节点中确定待作业任务处理时间最短的目标计算节点,包括:所述管理节点根据所述分布式系统中每个所述计算节点的任务缓存队列中的空闲位置确定该计算节点可接收待作业任务数目的能力值;所述管理节点根据计算每个所述待作业任务在各所述计算节点上的预计执行时间;其中,所述Ui为第i个用户、所述Jj为用户的第j个作业、所述Tk为作业Jj中第k个任务、所述Sl为所有计算节点上的第l个任务槽、所述pr(Sl,Ui,Jj)为所述Sl处理所述Ui的Jj的速率、所述tert(Tk(Ui,Jj)Sl)为所述Ui的Jj中的Tk在Sl上预计执行时间;其中,所述d(Ui,Jj,Tk)为任务Tk(Ui,Jj)需要处理的数据块、所述bω(Sl,Sp)为任务槽Sl和Sp所在节点之间的统计带宽、所述D(Sl)为任务槽Sl的计算节点上由数据节点存储的全部数据块的集合、所述D(Sp)为任务槽Sp的计算节点上由数据节点存储的全部数据块的集合、所述n为任务槽能够容纳的任务总数;所述管理节点根据所述待作业任务的数目,以及所述待作业任务的优先级、每个所述计算节点可接收待作业任务数目的能力值,所述tert(Tk(Ui,Jj)Sl)确定每个所述待作业任务的目标计算节点。2.根据权利要求1所述的方法,其特征在于,所述确定待作业任务处理时间最短的目标计算节点之前,包括:所述管理节点确定所述分布式系统中包括的各计算节点的任务缓存队列中的空闲位置;所述管理节点根据所述各计算节点的任务缓存队列中的空闲位置确定所述待作业任务的数目;所述管理节点根据所述待作业任务的数目、待执行的任务群中各任务的优先级从待执行的任务群中获取所述待作业任务;3.一种用户作业调度方法,其特征在于,包括:计算节点的任务缓存队列中接收管理节点发送的待作业任务,所述计算节点为所述管理节点在分布式系统的各计算节点中确定的所述待作业任务处理时间最短的目标计算节点;其中,所述管理节点在分布式系统的各计算节点中确定的所述待作业任务处理时间最短的目标计算节点,包括:所述管理节点根据所述分布式系统中每个所述计算节点的任务缓存队列中的空闲位置确定该计算节点可接收待作业任务数目的能力值;所述管理节点根据计算每个所述待作业任务在各所述计算节点上的预计执行时间;其中,所述Ui为第i个用户、所述Jj为用户的第j个作业、所述Tk为作业Jj中第k个任务、所述Sl为所有计算节点上的第l个任务槽、所述pr(Sl,Ui,Jj)为所述Sl处理所述Ui的Jj的速率、所述tert(Tk(Ui,Jj)Sl)为所述Ui的Jj中的Tk在Sl上预计执行时间;其中,所述d(Ui,Jj,Tk)为任务Tk(Ui,Jj)需要处理的数据块、所述bω(Sl,Sp)为任务槽Sl和Sp所在节点之间的统计带宽、所述D(Sl)为任务槽Sl的计算节点上由数据节点存储的全部数据块的集合、所述D(Sp)为任务槽Sp的计算节点上由数据节点存储的全部数据块的集合、所述n为任务槽能够容纳的任务总数;所述管理节点根据所述待作业任务的数目,以及所述待作业任务的优先级、每个所述计算节点可接收待作业任务数目的能力值,所述tert(Tk(Ui,Jj)Sl)确定每个所述待作业任务的目标计算节点;所述计算节点执行所述任务缓存队列中存储的所述待作业任务。4.根据权利要求3所述方法,其特征在于,所述计算节点执行所述任务缓存队列中存储的所述待作业任务,包括:所述计算节点在本地数据库中查找所述任务缓存队列中待作业任务所需调用的数据;若所述本地数据库中存在所述所需调用的数据,所述计算节点根据所述待作业任务在所述任务缓存队列中的位置顺序执行所述待作业任务;若所述本地数据库中不存在所述所需调用的数据,所述计算节点从所述所需调用的数据的存储单元获取所述所需调用的数据后执行所述待作业任务。5.根据权利要求3或4所述方法,其特征在于,所述计算节点执行所述任务缓存队列中存储的所述待作业任务之后,还包括:若所述计算节点执行完所述任务缓存队列中所有待作业任务,则所述...
【专利技术属性】
技术研发人员:雷磊,张云勇,房秉毅,徐雷,裴小燕,贾川,路康,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。