【技术实现步骤摘要】
一种消息断链任务处理的方法、设备及系统
本专利技术涉及任务处理
,具体涉及一种消息断链任务处理的方法、设备及系统。
技术介绍
分布式串行任务是指在在分布式系统中由任务管理设备(TaskMgr)控制,在各个任务执行设备(SubSvr)之间串行执行任务的各个步骤(Step)。在执行分布式串行任务的过程中,TaskMgr向要执行任务的SubSvr发送执行消息,该SubSvr收到执行消息后会执行该Step并产生相应的执行结果,然后向TaskMgr返回执行结果。若TaskMgr和SubSvr之间的网络链接出现异常或者SubSvr死机,就会导致TaskMgr发送给SubSvr的执行消息没有被SubSvr收到,或者SubSvr执行该Step的结果没有返回给TaskMgr,这种情况成为消息断链,消息断链会导致TaskMgr不清楚该Step是否执行,当TaskMgr没有收到该Step的执行结果,则称当前Step处于未知状态,任务也停止执行。由这种消息断链导致的任务无法执行的问题,通常会被认为任务执行失败,需要重新执行该Step,既导致了资源浪费,又降低了任务执行速度。
技术实现思路
为了提高消息断链任务的执行速度,本专利技术实施例提供了一种消息断链任务处理的方法,可以在传输链路恢复后对消息断链任务进行接续执行,规避消息断链带来的短暂影响,从而提高任务执行速度。本专利技术实施例还提供了相应的设备及系统。本专利技术第一方面提供一种消息断链任务处理的方法,包括:任务管理设备确定目标任务执行设备上的消息断链任务,所述消息断链任务为在所述任务管理设备和所述目标任务执行设备的消息传输 ...
【技术保护点】
一种消息断链任务处理的方法,其特征在于,包括:任务管理设备确定目标任务执行设备上的消息断链任务,所述消息断链任务为在所述任务管理设备和所述目标任务执行设备的消息传输过程中发生消息断链的任务或者步骤,所述步骤为串行任务中的子任务;所述任务管理设备获取所述目标任务执行设备上所记录的状态信息,所述状态信息为所述消息断链任务在发生消息断链时所执行到的阶段状态信息;所述任务管理设备根据所述状态信息,以及所述任务管理设备所记录的所述消息断链任务的阶段状态信息,确定发生消息断链的操作;所述任务管理设备从发生消息断链的操作接续执行所述消息断链任务。
【技术特征摘要】
1.一种消息断链任务处理的方法,其特征在于,包括:任务管理设备确定目标任务执行设备上的消息断链任务,所述消息断链任务为在所述任务管理设备和所述目标任务执行设备的消息传输过程中发生消息断链的任务或者步骤,所述步骤为串行任务中的子任务;所述任务管理设备获取所述目标任务执行设备上所记录的状态信息,所述状态信息为所述消息断链任务在发生消息断链时所执行到的阶段状态信息;所述任务管理设备根据所述状态信息,以及所述任务管理设备所记录的所述消息断链任务的阶段状态信息,确定发生消息断链的操作;所述任务管理设备从发生消息断链的操作接续执行所述消息断链任务。2.根据权利要求1所述的方法,其特征在于,所述方法应用于分布式系统,所述分布式系统包括所述任务管理器和至少一个任务执行设备,所述目标任务执行设备为所述至少一个任务执行设备中的一个;当所述消息断链任务为分布式串行任务中发生消息断链的步骤。3.根据权利要求1或2所述的方法,其特征在于,所述任务管理设备确定目标任务执行设备上的消息断链任务,包括:所述任务管理设备获取为执行当前任务所发送消息的响应延迟,所述当前任务为所述任务管理设备与所述目标任务执行设备之间正在进行的任务或步骤;当所述响应延迟大于预设阈值时,所述任务管理设备确定目标链路发生消息断链,将所述当前任务确定为所述消息断链任务,所述目标链路为所述任务管理设备与所述目标任务执行设备之间的传输链路。4.根据权利要求3所述的方法,其特征在于,所述任务管理设备获取所述目标任务执行设备上所记录的状态信息之前,所述方法还包括:所述任务管理设备向所述目标任务执行设备发送针对所述目标链路的测试消息;当所述任务管理设备接收到测试响应,则确定所述目标链路恢复正常。5.根据权利要求1或2所述的方法,其特征在于,所述阶段状态信息包括预处理阶段Pre的状态标识和执行阶段Commit的状态标识,所述预处理阶段的状态标识与所述执行阶段的状态标识不同;所述任务管理设备根据所述状态信息,以及所述任务管理设备所记录的所述消息断链任务的阶段状态信息,确定发生消息断链的操作,包括:所述任务管理设备根据第一状态标识和第二状态标识,确定发生消息断链的操作,所述第一状态标识为从所述目标任务执行设备上获取的状态标识,所述第二状态标识为所述任务管理设备所记录的所述消息断链任务的状态标识。6.根据权利要求5所述的方法,其特征在于,所述任务管理设备根据第一状态标识和第二状态标识,确定发生消息断链的操作,包括:所述任务管理设备根据所述第一状态标识、第二状态标识,以及判断逻辑表确定发生消息断链的操作,所述判断逻辑表包括目标任务执行设备所维护的状态标识、任务管理设备所维护的状态标识、异常原因,以及状态判断结果之间的对应关系,所述状态判断结果包括发生消息断链的操作。7....
【专利技术属性】
技术研发人员:张振兴,方仲康,仇斌,唐斌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。