一种运维系统的根因节点的确定方法、装置及设备制造方法及图纸

技术编号:35429218 阅读:27 留言:0更新日期:2022-11-03 11:33
本发明专利技术公开了一种运维系统的根因节点的确定方法、装置及设备,其中,所述方法包括:根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点;获取所述各节点在所述目标数据指标下的权重;根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点。本发明专利技术的方案可以提升故障根因定位的准确性,加快响应异常时间、降低故障的平均修复时间。复时间。复时间。

【技术实现步骤摘要】
一种运维系统的根因节点的确定方法、装置及设备


[0001]本专利技术涉及运维系统数据处理
,特别是指一种运维系统的根因节点的确定方法、装置及设备。

技术介绍

[0002]随着信息技术的不断发展,软件系统的设计和实现变得越来越复杂,微服务的出现使得软件系统的支持和维护成本爆发式增加。在微服务系统中发生异常并演变为故障甚至事故的过程中,开发工程师和维护工程师往往疲于应对这些突如其来并且高度复杂的事件,使得异常事件长时间不能得到有效解决,服务中断时间可能被无限制的拉长,最终使得用户体验下降。为了降低故障的平均修复时间,采用自动化的根因定位方法是一种值得推荐的做法。
[0003]当前存在很多对运维系统进行根因定位的算法。这些根因定位算法大都依赖于复杂的基础指标数据体系,比如各业务服务的可用性指标以及KPI指标,响应时间指标以及成功率指标。这使得整个算法体系变得复杂难用,算法结果也多变、难以预测。在这样的指标数据体系下,算法往往过分追求更广泛的指标数据类型,而忽略了对相关指标数据的更多特征的深入分析。更为严重的是,这些复杂的算法由于过分追求算法的通用性,会使用各种评分手段和多种算法融合在一起定位根因,削弱了对特定场景微服务的运维系统下可解释性的应用,造成运维系统中的根因节点的定位不准确。

技术实现思路

[0004]本专利技术目的在于提供一种运维系统的根因节点的确定方法、装置及设备。可以提高运维系统根因节点定位的准确性。
[0005]为解决上述技术问题,本专利技术的技术方案如下:一种运维系统的根因节点的确定方法,包括:根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点;获取所述各节点在所述目标数据指标下的权重;根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点。
[0006]可选的,根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点,包括:根据用于表达节点处理效率的延迟和/或响应时间类的至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点。
[0007]可选的,获取所述各节点在所述目标数据指标下的权重,包括:对所述各节点的所述目标数据指标进行特征提取,得到至少一个目标特征值;根据所述至少一个目标特征值,获取所述各节点在所述目标数据指标下的权重。
[0008]可选的,根据所述至少一个目标特征值,获取所述各节点在所述目标数据指标下的权重,包括:通过获取所述各节点在所述目标数据指标下的权重;其中,表示节点的第i个目标数据指标的第j个目标特征的权重系数,表示节点的第i个目标数据指标的第j个目标特征值,表示节点的第j个目标特征值的最大值,;max表示取最大值。
[0009]可选的,根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离,包括:确定所述拓扑关系中,除所述起始节点外的其余各节点的连通情况,确定故障区域;获取所述故障区域中,各节点到所述起始节点的距离,所述距离为各节点到所述起始节点之间的通路上的节点总数减1。
[0010]可选的,根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点,包括:根据所述各节点的权重,确定出至少一个异常节点;在所述至少一个异常节点中,根据所述异常节点到所述起始节点的距离,确定故障根因节点。
[0011]可选的,在所述至少一个异常节点中,根据所述异常节点到所述起始节点的距离,确定故障根因节点,包括:在所述至少一个异常节点中,若只有一个异常节点,确定该异常节点为故障根因节点;在所述至少一个异常节点中,若存在两个以上异常节点,且各异常节点之间存在调用关系,确定到所述起始节点的距离最大的异常节点为故障根因节点;在所述至少一个异常节点中,若存在两个以上异常节点,且各异常节点之间不存在调用关系,确定各异常节点均为故障根因节点。
[0012]本专利技术还提供一种运维系统的根因节点的确定装置,包括:获取模块,用于根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点;获取所述各节点在所述目标数据指标下的权重;处理模块,用于根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点。
[0013]本专利技术还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的运维系统的根因分析方法。
[0014]本专利技术还提供一种计算机可读存储介质,包括:存储指令,当所述指令在计算机上运行时,使得计算机执行如上所述的运维系统的根因分析方法。
[0015]本专利技术的上述方案至少包括以下有益效果:本专利技术的上述方案,通过根据至少一个目标数据指标,确定运维系统的各节点的
拓扑关系中的起始节点;获取所述各节点在所述目标数据指标下的权重;根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点,使得运维系统基于目标数据指标实现了根因节点的定位,提升了运维系统故障根因节点定位的准确性,加快了响应异常的速度、降低了故障的平均修复时间。
附图说明
[0016]图1为本专利技术实施例提供的运维系统的根因节点的确定方法的流程示意图;图2为本专利技术实施例提供的运维系统的节点调用关系示意图;图3为本专利技术实施例提供的运维系统中的节点出现故障的第一场景示意图;图4为本专利技术实施例提供的运维系统中的节点出现故障的第二场景示意图;图5为本专利技术实施例提供的运维系统中的节点出现故障的第三场景示意图;图6为本专利技术实施例提供的运维系统中的节点出现故障的第四场景示意图;图7为本专利技术实施例提供的运维系统的根因节点的确定方法的又一具体流程示意图;图8为本专利技术实施例提供的运维系统的根因节点的确定装置的模块示意图。
具体实施方式
[0017]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0018]本专利技术的实施例中,运维系统是指运维对象实体集合的统称,例如某互联网公司在某地的机房,银行业务系统等。
[0019]节点:运维系统中实现单一功能的实体模块或抽象模块,例如微服务、服务器、中间件、业务应用、业务模块等。
[0020]如图1所示,本专利技术的实施例提供一种运维系统的根因节点的确定方法,包括:步骤11,根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点;步骤12,获取所述各节点在所述目标数据指标下的权重;步骤13,根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;步骤14,根据所述各节点的权重以及所述各节点到所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种运维系统的根因节点的确定方法,其特征在于,包括:根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点;获取所述各节点在所述目标数据指标下的权重;根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离;根据所述各节点的权重以及所述各节点到所述起始节点的距离,确定所述各节点中的故障根因节点。2.根据权利要求1所述的运维系统的根因节点的确定方法,其特征在于,根据至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点,包括:根据用于表达节点处理效率的延迟和/或响应时间类的至少一个目标数据指标,确定运维系统的各节点的拓扑关系中的起始节点。3.根据权利要求1所述的运维系统的根因节点的确定方法,其特征在于,获取所述各节点在所述目标数据指标下的权重,包括:对所述各节点的所述目标数据指标进行特征提取,得到至少一个目标特征值;根据所述至少一个目标特征值,获取所述各节点在所述目标数据指标下的权重。4.根据权利要求3所述的运维系统的根因节点的确定方法,其特征在于,根据所述至少一个目标特征值,获取所述各节点在所述目标数据指标下的权重,包括:通过获取所述各节点在所述目标数据指标下的权重;其中,表示节点的第i个目标数据指标的第j个目标特征的权重系数,表示节点的第i个目标数据指标的第j个目标特征值,表示节点的第j个目标特征值的最大值,;max表示取最大值。5.根据权利要求1所述的运维系统的根因节点的确定方法,其特征在于,根据所述各节点的拓扑关系,获取所述各节点到所述起始节点的距离,包括:确定所述拓扑关系中,除所述起始节点外的其余各节点的连通情况,确定故障区域;获取所述故障区域中,各节点到所述起始节点的距离,所述距离为各节点到所述起始节点之间的通路...

【专利技术属性】
技术研发人员:牛群严川张博
申请(专利权)人:云智慧北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1