本发明专利技术公开了一种识别链路异常的方法,所述方法包括:中间件管理器探测中间件的连接状态,中间件的连接状态为异常时,确认中间件实例链路异常;中间件的连接状态为正常时,在发起服务请求前的一个时间片内中间件管理器记录的链路入服和退服次数大于第一阈值,链路的报错率大于第二阈值,且链路的报错次数大于第三阈值时,确认中间件实例链路异常;将所述异常的中间件实例链路中的中间件从中间件管理器的中间件集合中剔除,或隔离所述中间件。本发明专利技术还同时公开了另一种识别链路异常的方法及两种识别链路异常的装置。
【技术实现步骤摘要】
本专利技术涉及数据传输技术,尤其涉及一种识别链路异常的方法及装置。
技术介绍
在互联网时代,各种互联网信息呈几何级的增长,为了准确、稳定的保存及获取需要的信息,衍生了各种大型的信息技术(Information Technology,IT)系统;IT系统包括多个中间件实例,每个中间件实例包含多个应用服务;各应用服务之间相互调用使得数据传输的多个环节使用多点对多点的业务分发架构。多点对多点的业务分发架构可采用长连接链路模式或短连接链路模式;长连接链路模式是指连接一旦建立,链路不再断开;短连接链路模式是指连接需要时才申请建立连接链路。在使用短连接链路时,由于连接的频繁申请和建立,使得业务的处理效率降低,服务器资源消耗过大;在使用长连接链路时,若出现单链路偶发性异常,则长连接链路难以恢复,导致集群停服。系统的宕机或服务不可用直接影响企业的形象、营业额以及用户的用户体验。客户关系管理(Customer Relationship Management,CRM)系统为提高处理效率使用长连接链路模式,CRM系统中每台中间件实例由负载均衡器进行业务分发,工作模式如图1所示,客户请求的业务被负载均衡器随机分发至一台中间件上,中间件集群几十条链路相互独立,每个链路都可能接收到客户端发起的请求,并与后端数据库进行交互办理业务;因此,在出现中间件长连接链路偶发性异常时,由于负载均衡器不能及时判断中间件和服务的状态是否正常,仍会将新的业务请求分配至发生故障的中间件和服务链路上,导致部分用户办理业务失败。多点对多点的业务分发架构的下层部署监控程序在查证到某条链路异常时,便立即向上层发送停止请求;但是,由于上层有多点,反应速度快慢不一,反应速度慢的节点仍会因为时间差而发送多笔业务请求至下层的异常节点,导致多笔业务失败;并且,在下层某个节点出现死机等极端异常情况时,无法向上层传递断开请求,导致大量业务失败。多点对多点的业务分发架构的上层部署监控程序查证到某条链路异常时,即自动断开链路,停止发送请求;但是,遇到下层各节点的对外接口均出现统一的抖动等偶发性的异常时、或上层节点与下层节点之间的网络出现短时间异常时由于上层多节点之间彼此平等、互不统属导致下层多个节点被上层节点直接屏蔽,上层节点也无法获知下层各节点是否恢复正常工作,何时恢复正常工作,最终可能引起大规模的错误判断,影响业务办理。具体地,在CRM系统可能会出现如下局面:1、由于负载均衡器只能判断中间件实例是否正常,当中间件链路处于“假死”状态,而前端负载均衡器认为该中间件处于“在服状态”,仍会将客户端业务请求发送至该链路处理,不能及时的让客户端感知故障;2、当某一中间件办理业务效率总体下降时,负载均衡器只能判断中间件实例是否正常,不能统计一段时间内中间件业务办理的失败率;3、当中间件的某一服务发生异常时,不能根据单个中间件服务办理业务的失败率对异常中间件和服务链路进行隔离、恢复;4、当由于主机性能降低导致业务办理失败时,不能通过重启主机等主机层面的方法进行异常中间件和服务链路自动恢复;5、单一中间件实例和服务性能降低时,需要大量人力和时间分析、排除和回复异常中间件和服务链路。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种识别链路异常的方法及装置,能够统计一段时间内中间件业务办理的失败率,根据单个中间件服务办理业务的失败率对异常中间件和服务链路进行隔离和恢复,及时的智能的让客户端感知中间件实例故障。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种识别链路异常的方法,所述方法包括:中间件管理器探测中间件的连接状态,中间件的连接状态为异常时,确认中间件实例链路异常;中间件的连接状态为正常时,在发起服务请求前的一个时间片内中间件管理器记录的链路入服和退服次数大于第一阈值,链路的报错率大于第二阈值,且链路的报错次数大于第三阈值时,确认中间件实例链路异常;将所述异常的中间件实例链路中的中间件从中间件管理器的中间件集合中剔除,或隔离所述中间件。上述实现方案中,所述隔离的中间件信息在各中间件之间共享。上述实现方案中,所述方法还包括:中间件管理器监测、记录中间件实例链路的业务量和业务处理效率。本专利技术实施例还提供另一种识别链路异常的方法,所述方法包括:中间件服务在一个时间切片内反馈的中间件实例链路报错次数大于第四阈值时,中间件管理器确认中间件服务异常;或,接收到第三方应用推送的异常服务信息时,中间件管理器确认中间件服务异常;隔离异常的中间件服务。上述实现方案中,所述隔离的中间件服务信息在各中间件之间共享,所述确认中间件服务异常后,所述方法还包括:中间件管理器将接收的服务请求路由至正常的中间件服务。上述实现方案中,异常的中间件服务在时间一个切片内反馈的中间件实例链路报错次数小于第四阈值时,中间件管理器恢复所述异常中间件服务的链路路由。本专利技术实施例还提供一种识别链路异常的装置,所述装置应用于中间件管理器,所述装置包括:探测模块、第一确认模块、第一判断模块和第一处理模块;其中,所述探测模块,用于探测中间件的连接状态;所述第一确认模块,用于在探测模块探测中间件的连接状态为异常时,确认中间件实例链路异常;所述第一判断模块,用于在探测模块探测中间件的连接状态为正常时,判断在发起服务请求前的一个时间片内中间件管理器记录的链路入服和退服次数是否大于第一阈值,链路的报错率是否大于第二阈值,且链路的报错次数是否大于第三阈值;所述第一确认模块,还用于在所述第一判断模块判断在发起服务请求的一个时间片内中间件管理器记录的链路入服和退服次数大于第一阈值,链路的报错次数大于第二阈值,且链路的报错次数大于第三阈值时,确认中间件实例链路异常;所述第一处理模块,用于在第一确认模块确认中间件实例链路异常后,将所述中间件从中间件管理器的中间件集合中剔除,或隔离所述中间件。上述实现方案中,所述隔离的中间件信息在各中间件之间共享。上述实现方案中,所述装置还包括:记录模块,用于监测、记录中间件实例链路的业务量和业务处理效率。本专利技术实施例还提供另一种识别链路异常的装置,所述装置应用于中间件管理器,所述装置包括:第二判断模块、第二确认模块、接收模块和第二处理模块;其中,所述第二判断模块,用于判断中间件服务在一个时间切片内反馈的中间件实例链路报错次数是否大于第四阈值;所述第二确认模块,用于在所述第二判断模块判断中间件服务在一个时间切片内反馈的中间件实例链路报错次数大于第四阈值时,确认中间件服务异常;所述接收模块,用于接收第三方应用推送的异常服务信息;所述第二确认模块,还用于在所述接收模块接收到第三方应用推送的异常服务信息时,确认中间件服务异常;所述第二处理模块,用于隔离异常的中间件服务。上述实现方案中,所述隔离的中间件服务信息在各中间件之间共享,所述第二处理模块,还用于将接收的服务请求路由至正常的中间件服务。上述实现方案中,所述第二处理模块,还用于异常的中间件服务在一个时
间切片内反馈的中间件实例链路报错次数小于第四阈值时,恢复所述异常中间件服务的链路路由。本专利技术实施例所提供的识别链路异常的方法及装置,中间件管理器探测中间件的连接状态,中间件的连接状态为异常时,确认中间件实例链路异常;中间件的连接状态为正常时,在发起服务请本文档来自技高网...
【技术保护点】
一种识别链路异常的方法,其特征在于,所述方法包括:中间件管理器探测中间件的连接状态,中间件的连接状态为异常时,确认中间件实例链路异常;中间件的连接状态为正常时,在发起服务请求前的一个时间片内中间件管理器记录的链路入服和退服次数大于第一阈值,链路的报错率大于第二阈值,且链路的报错次数大于第三阈值时,确认中间件实例链路异常;将所述异常的中间件实例链路中的中间件从中间件管理器的中间件集合中剔除,或隔离所述中间件。
【技术特征摘要】
1.一种识别链路异常的方法,其特征在于,所述方法包括:中间件管理器探测中间件的连接状态,中间件的连接状态为异常时,确认中间件实例链路异常;中间件的连接状态为正常时,在发起服务请求前的一个时间片内中间件管理器记录的链路入服和退服次数大于第一阈值,链路的报错率大于第二阈值,且链路的报错次数大于第三阈值时,确认中间件实例链路异常;将所述异常的中间件实例链路中的中间件从中间件管理器的中间件集合中剔除,或隔离所述中间件。2.根据权利要求1所述识别链路异常的方法,其特征在于,所述隔离的中间件信息在各中间件之间共享。3.根据权利要求1或2所述识别链路异常的方法,其特征在于,所述方法还包括:中间件管理器监测、记录中间件实例链路的业务量和业务处理效率。4.一种识别链路异常的方法,其特征在于,所述方法包括:中间件服务在一个时间切片内反馈的中间件实例链路报错次数大于第四阈值时,中间件管理器确认中间件服务异常;或,接收到第三方应用推送的异常服务信息时,中间件管理器确认中间件服务异常;隔离异常的中间件服务。5.根据权利要求4所述识别链路异常的方法,其特征在于,所述隔离的中间件服务信息在各中间件之间共享,所述确认中间件服务异常后,所述方法还包括:中间件管理器将接收的服务请求路由至正常的中间件服务。6.根据权利要求4或5所述识别链路异常的方法,其特征在于,异常的中间件服务在时间一个切片内反馈的中间件实例链路报错次数小于第四阈值时,中间件管理器恢复所述异常中间件服务的链路路由。7.一种识别链路异常的装置,所述装置应用于中间件管理器,其特征在于,
\t所述装置包括:探测模块、第一确认模块、第一判断模块和第一处理模块;其中,所述探测模块,用于探测中间件的连接状态;所述第一确认模块,用于在探测模块探测中间件的连接状态为异常时,确认中间件实例链路异常;所述第一判断模块,用于在探测模块探测中间件的连接状态为正常时,判断在发起服务请求前...
【专利技术属性】
技术研发人员:杨名,郑水华,苏伟杰,
申请(专利权)人:中国移动通信集团四川有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。