System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及故障分析,尤其涉及一种故障分析方法、装置、电子设备、存储介质及产品。
技术介绍
1、运维监控系统是指对it基础设施进行监控、管理和维护的一体化平台。目前主流的运维监控系统大部分只有采集、告警等功能,在故障发生时无法定位到问题点以及问题发生的实际原因,仍然需要对业务熟悉以及具有专业运维技能的人员去分析处理才能解决,以致于提高了人工成本,降低了故障定位分析的效率和准确度。
技术实现思路
1、基于上述需求,本申请提出一种故障分析方法、装置、电子设备、存储介质及产品,能够降低人工成本,提高故障定位分析效率和准确度。
2、为实现上述目的,本申请提出如下技术方案:
3、根据本申请实施例的第一方面,提供了一种故障分析方法,包括:
4、基于故障发生时的初始异常应用节点的地址和预先构建的横向依赖关系,确定所述初始异常应用节点的依赖应用节点;其中,所述横向依赖关系包括各个应用节点之间的依赖关系和各个应用节点对应的应用处理时长;
5、根据所述依赖应用节点对应的应用处理时长,确定所述故障对应的目标异常应用节点;
6、基于预先构建的纵向依赖关系,从全栈数据中获取所述目标异常应用节点对应的目标监控数据,并利用所述目标监控数据,分析所述目标异常应用节点的故障原因;所述纵向依赖关系包括应用节点的运行环境与应用节点之间的依赖关系,所述全栈数据包括网络请求数据和系统监控数据。
7、可选的,所述横向依赖关系的构建过程,包括:
9、基于所述网络请求数据,确定所述网络请求数据中各个应用节点之间的依赖关系以及各个应用节点的应用处理时长,并基于各个应用节点之间的依赖关系以及各个应用节点的应用处理时长,构建横向依赖关系。
10、可选的,基于网络请求中的调用链路数据,确定网络请求数据,包括:
11、利用apm探针采集网络请求中的第一调用链路数据,和/或,利用ebpf探针采集网络请求中的第二调用链路数据;其中,第一调用链路数据和第二调用链路数据均为网络请求中应用节点调用请求的数据;
12、基于所述第一调用链路数据和/或所述第二调用链路数据,确定所述网络请求数据。
13、可选的,根据所述依赖应用节点对应的应用处理时长,确定所述故障对应的目标异常应用节点,包括:
14、若所述初始异常应用节点返回异常,则将所述初始异常应用节点作为所述故障对应的目标异常应用节点;
15、若所述初始异常应用节点未返回异常,则将应用处理时长占比达到预设阈值的依赖应用节点按照应用处理时长降序排序后,作为所述故障对应的目标异常应用节点。
16、可选的,基于预先构建的纵向依赖关系,从全栈数据中获取所述目标异常应用节点对应的目标监控数据,包括:
17、基于预先构建的纵向依赖关系,查询所述目标异常应用节点所依赖的目标运行环境;
18、从全栈数据中获取所述目标运行环境对应的数据作为所述目标异常应用节点对应的目标监控数据。
19、可选的,利用所述目标监控数据,分析所述目标异常应用节点的故障原因,包括:
20、基于所述目标监控数据,确定所述目标异常应用节点对应的中间信息;其中,所述中间信息包括:当前接口响应时长、接口响应时长均值、同期接口响应时长、当前业务量、同期业务量、预测响应时长和进程使用数据;
21、基于预先设置的故障类型判断规则,对所述目标异常应用节点对应的中间信息进行故障类型识别,确定所述目标异常应用节点的故障原因。
22、可选的,基于预先设置的故障类型判断规则,对所述目标异常应用节点对应的中间信息进行故障类型识别,确定所述目标异常应用节点的故障原因,包括:
23、将所述目标异常应用节点对应的中间信息输入到预先训练的故障类型识别模型中,得到所述目标异常应用节点的故障原因;
24、其中,所述故障类型识别模型是基于对样本异常节点对应的样本中间信息进行故障类型识别,以故障类型识别得到的预测故障原因和所述样本异常节点的真实故障原因之间的差异最小为目标训练得到的;所述样本异常节点对应的样本中间信息是基于预先采集的样本异常节点的样本监控数据确定的。
25、可选的,故障分析方法,还包括:
26、在所述故障为主机异常时,从所述全栈数据中获取所述主机对应的主机监控数据,并利用所述主机监控数据,分析所述故障对应的故障原因。
27、根据本申请实施例的第二方面,提供了一种故障分析装置,包括:
28、节点查询模块,用于基于故障发生时的初始异常应用节点的地址和预先构建的横向依赖关系,确定所述初始异常应用节点的依赖应用节点;其中,所述横向依赖关系包括各个应用节点之间的依赖关系和各个应用节点对应的应用处理时长;
29、异常节点确定模块,用于根据所述依赖应用节点对应的应用处理时长,确定所述故障对应的目标异常应用节点;
30、故障分析模块,用于基于预先构建的纵向依赖关系,从全栈数据中获取所述目标异常应用节点对应的目标监控数据,并利用所述目标监控数据,分析所述目标异常应用节点的故障原因;所述纵向依赖关系包括应用节点的运行环境与应用节点之间的依赖关系,所述全栈数据包括网络请求数据和系统监控数据。
31、根据本申请实施例的第三方面,提供了一种电子设备,包括:存储器和处理器;
32、所述存储器与所述处理器连接,用于存储程序;
33、所述处理器,用于通过运行所述存储器中的程序,实现上述故障分析方法。
34、根据本申请实施例的第四方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述故障分析方法。
35、根据本申请实施例的第五方面,提供了一种计算机程序产品,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器实现上述故障分析方法。
36、本申请提出的故障分析方法,基于故障发生时的初始异常应用节点的地址和预先构建的横向依赖关系,确定初始异常应用节点的依赖应用节点;其中,横向依赖关系包括各个应用节点之间的依赖关系和各个应用节点对应的应用处理时长;根据依赖应用节点对应的应用处理时长,确定故障对应的目标异常应用节点;基于预先构建的纵向依赖关系,从全栈数据中获取目标异常应用节点对应的目标监控数据,并利用目标监控数据,分析目标异常应用节点的故障原因;纵向依赖关系包括应用节点的运行环境与应用节点之间的依赖关系,全栈数据包括网络请求数据和系统监控数据。采用本申请的技术方案,能够通过横向依赖关系以及网络请求数据自动定位到故障节点,利用纵向依赖关系、系统监控数据和网络请求数据自动分析出故障原因,无需人工分析处理,降低了人工成本,提高了故障定位分析的效率和准确度。
本文档来自技高网...【技术保护点】
1.一种故障分析方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述横向依赖关系的构建过程,包括:
3.根据权利要求2所述的方法,其特征在于,基于网络请求中的调用链路数据,确定网络请求数据,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述依赖应用节点对应的应用处理时长,确定所述故障对应的目标异常应用节点,包括:
5.根据权利要求1所述的方法,其特征在于,基于预先构建的纵向依赖关系,从全栈数据中获取所述目标异常应用节点对应的目标监控数据,包括:
6.根据权利要求1所述的方法,其特征在于,利用所述目标监控数据,分析所述目标异常应用节点的故障原因,包括:
7.根据权利要求6所述的方法,其特征在于,基于预先设置的故障类型判断规则,对所述目标异常应用节点对应的中间信息进行故障类型识别,确定所述目标异常应用节点的故障原因,包括:
8.根据权利要求1至7中任意一项所述的方法,其特征在于,还包括:
9.一种故障分析装置,其特征在于,包括:
10.一种电子设备,
11.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至8中任意一项所述的故障分析方法。
12.一种计算机程序产品,其特征在于,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器实现如权利要求1至8中任意一项所述的故障分析方法。
...【技术特征摘要】
1.一种故障分析方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述横向依赖关系的构建过程,包括:
3.根据权利要求2所述的方法,其特征在于,基于网络请求中的调用链路数据,确定网络请求数据,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述依赖应用节点对应的应用处理时长,确定所述故障对应的目标异常应用节点,包括:
5.根据权利要求1所述的方法,其特征在于,基于预先构建的纵向依赖关系,从全栈数据中获取所述目标异常应用节点对应的目标监控数据,包括:
6.根据权利要求1所述的方法,其特征在于,利用所述目标监控数据,分析所述目标异常应用节点的故障原因,包括:
7.根据权利要求6所...
【专利技术属性】
技术研发人员:王学钾,陈今伟,陆军,柯方,余达,
申请(专利权)人:讯飞智元信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。