【技术实现步骤摘要】
一种任务处理方法及装置
本申请涉及数据处理
,尤其涉及一种任务处理方法及装置。
技术介绍
目前,在大数据处理系统的数据处理过程中,通常包括任务提交和任务执行两个部分,即将各任务提交到集群,并在集群执行任务。其中,任务提交的过程中,对于每个待提交的任务,均需要准备相应的提交环境,即拷贝相关依赖到HDFS(英文全称:HadoopDistributedFileSystem;中文全称:分布式文件系统),并拉起一个JVM(英文全称:JavaVirtualMachine;中文全称:Java虚拟机),以运行任务提交器,实现相应任务的提交。然而,对于每个待提交的任务,均执行相关依赖的拷贝操作、JVM的拉起操作,不仅降低了任务的提交速度,而且限制了任务提交的并发量。
技术实现思路
本申请实施例的目的是提供一种任务处理方法及装置,以使相同任务类别的待提交任务可以在同一个提交环境中完成提交,而不再是一个提交环境仅提交一个任务,因此极大的提升了任务的提交速度和任务提交的并发量。第一方面,本申请实施例提供了一种任务处理方法,包括:根据预先确定的各任务类别的热点运行时段,在到达所述热点运行时段的起始时间之前,生成相应任务类别所对应的任务提交器;当接收到任务提交请求时,根据所述任务提交请求包括的待提交任务的任务信息,确定所述待提交任务所属的目标任务类别;确定是否存在所述目标任务类别所对应的第一任务提交器;若是,则将所述待提交任务分发给所述第一任务提交器,以使所述第一任务提交器执行所 ...
【技术保护点】
1.一种任务处理方法,其特征在于,包括:/n根据预先确定的各任务类别的热点运行时段,在到达所述热点运行时段的起始时间之前,生成相应任务类别所对应的任务提交器;/n当接收到任务提交请求时,根据所述任务提交请求包括的待提交任务的任务信息,确定所述待提交任务所属的目标任务类别;/n确定是否存在所述目标任务类别所对应的第一任务提交器;/n若是,则将所述待提交任务分发给所述第一任务提交器,以使所述第一任务提交器执行所述待提交任务的提交操作。/n
【技术特征摘要】
1.一种任务处理方法,其特征在于,包括:
根据预先确定的各任务类别的热点运行时段,在到达所述热点运行时段的起始时间之前,生成相应任务类别所对应的任务提交器;
当接收到任务提交请求时,根据所述任务提交请求包括的待提交任务的任务信息,确定所述待提交任务所属的目标任务类别;
确定是否存在所述目标任务类别所对应的第一任务提交器;
若是,则将所述待提交任务分发给所述第一任务提交器,以使所述第一任务提交器执行所述待提交任务的提交操作。
2.根据权利要求1所述的方法,其特征在于,所述根据预先确定的各任务类别的热点运行时段,在到达所述热点运行时段的起始时间之前,生成相应任务类别所对应的任务提交器之前,还包括:
获取预设历史时长内的任务提交记录信息;
根据所述任务提交记录信息,确定所述各任务类别的热点运行时段。
3.根据权利要求2所述的方法,其特征在于,所述预设历史时长包括:多个第一时段;所述第一时段包括多个子时段;所述任务提交记录信息包括:相应任务的任务模板标识和任务提交时间;
所述根据所述任务提交记录信息,确定所述各任务类别的热点运行时段,包括:
根据所述任务模板标识,从预设的第一关联关系中获取关联的任务类别,将获取的所述任务类别确定为相应任务所属的任务类别;其中,所述第一关联关系包括多个任务模板标识与任务类别的关联关系;
根据所述任务提交时间,统计在每个所述子时段内所提交的每个所述任务类别的任务的第一数量;
按照时间的先后顺序,根据预设的计算方式,对各所述第一时段中相同子时段内所提交的相同任务类别的任务的所述第一数量进行计算,得到第二数量;
确定每个所述任务类别中是否存在多个连续的大于预设数量的目标第二数量;
若是,则将所述目标第二数量所对应的子时段确定为相应任务类别的热点运行时段。
4.根据权利要求1所述的方法,其特征在于,所述任务信息包括:所述待提交任务的任务模版标识;
所述根据所述任务提交请求包括的待提交任务的任务信息,确定所述待提交任务所属的目标任务类别,包括:
确定所述任务模板标识是否为预设标识;
若是,则从所述任务信息中获取所述待提交任务的元信息,根据所述元信息确定所述待提交任务所属的目标任务类别;以及,根据所述元信息更新所述任务模板标识;
若否,则根据所述任务模板标识,从预设的第一关联关系中获取关联的任务类别,将获取的所述任务类别确定为所述待提交任务所属的目标任务类别;其中,所述第一关联关系包括多个任务模板标识与任务类别的关联关系。
5.根据权利要求4所述的方法,其特征在于,所述元信息包括:所述待提交任务的任务类型信息和任务依赖信息;
所述根据所述元信息确定所述待提交任务所属的目标任务类别,包括:
确定根据所述任务类型信息和所述任务依赖信息,从预设的第二关联关系中是否获取到关联的任务类别;其中,所述第二关联关系包括多个任务类型信息和任务依赖信息与任务类别的关联关系;
若是,则将获取的所述任务类别确定为所述待提交任务所属的目标任务类别;
若否,则生成新的任务类别,将生成的所述任务类别确定为所述待提交任务所属的目标任务类别。
6.根据权利要求4所述的方法,其特征在于,所述元信息还包括:所述待提交任务的执行入口信息和执行虚拟机信息;
所述根据所述元信息更新所述任务模板标识,包括:
确定根据所述执行入口信息和所述执行虚拟机信息,从预设的第三关联关系中是否获取到关联的任务模板标识;其中,所述第三关联关系包括多个执行入口信息和执行虚拟机信息与任务模板标识的关联关系;
若是,则将所述任务信息包括的所述任务模板标识更新为获取的所述任务模板标识;
若否,则生成新的任务模板标识,将所述任务信息包括的所述任务模板标识更新为生成的所述任务模板标识。
7.根据权利要求1所述的方法,其特征在于,所述生成相应任务类别所对应的任务提交器之后,还包括:
将所述任务类别的类别标识、所述任务提交器的提交器标识、以及表征所述任务提交器处于可用状态的第一状态信息进行关联记录,得到第一记录信息;
所述确定是否存在所...
【专利技术属性】
技术研发人员:王茂军,李涛,
申请(专利权)人:郑州阿帕斯数云信息科技有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。