一种根因分析方法及装置制造方法及图纸

技术编号:33128012 阅读:13 留言:0更新日期:2022-04-17 00:40
本发明专利技术提供了一种根因分析方法及装置,在启用单节点根因算法模式的情况下,计算异常服务器节点在报警时间段内的其它数据指标与异常数据指标之间的相关概率并将其进行展示。在启用多指标根因算法模式的情况下,利用异常服务器节点在报警时间段内的多个第一数据指标及其它服务器节点在报警时间段内的多个第二数据指标,对异常服务器节点对应的调用关系图进行随机游走,得到每个其它服务器节点的到达频率并将其进行展示。提供多种模式进行根因分析,且支持多数据指标溯因,提高确定故障的准确率以及满足多种业务场景。确率以及满足多种业务场景。确率以及满足多种业务场景。

【技术实现步骤摘要】
一种根因分析方法及装置


[0001]本专利技术涉及数据分析
,具体涉及一种根因分析方法及装置。

技术介绍

[0002]目前越来越多的公司进行应用微服务的改造,将单个应用分解为若干个微服务。为保证业务的正常运行,当业务出现异常时需要及时确定故障。
[0003]目前主要依赖于公有云异常根因分析算法来确定故障。但是,公有云异常根因分析算法只支持单指标溯因,如仅利用内存使用率或CPU使用率来粗略判断异常,而服务器在调用时通常会用到不同的微服务,不同的微服务需要用不同的指标来衡量异常,公有云异常根因分析算法确定故障的准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种根因分析方法及装置,以解决公有云异常根因分析算法确定故障的准确率较低等问题。
[0005]为实现上述目的,本专利技术实施例提供如下技术方案:
[0006]本专利技术实施例第一方面公开一种根因分析方法,所述方法包括:
[0007]从报警平台至少获取异常服务器节点对应的异常数据指标和报警时间段;
[0008]在启用单节点根因算法模式的情况下,计算所述异常服务器节点在所述报警时间段内的其它数据指标与所述异常数据指标之间的相关概率;
[0009]将计算得到的所述相关概率发送至所述报警平台进行展示;
[0010]在启用多指标根因算法模式的情况下,确定所述异常服务器节点对应的调用关系图,所述调用关系图由所述异常服务器节点和其它服务器节点构成;
[0011]获取所述异常服务器节点在所述报警时间段内的多个第一数据指标,以及获取所述其它服务器节点在所述报警时间段内的多个第二数据指标;
[0012]根据所述第一数据指标和所述第二数据指标,确定所述异常服务器节点与所述其它服务器节点之间的数据关联系数;
[0013]根据所述数据关联系数,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率;
[0014]将每个所述其它服务器节点的到达频率发送至所述报警平台进行展示。
[0015]优选的,在启用多指标根因算法模式的情况下,确定所述异常服务器节点对应的调用关系图,包括:
[0016]在启用多指标根因算法模式的情况下,从数据库中获取所述异常服务器节点对应的调用请求数据,以及扫描所述异常服务器节点的端口信息,所述端口信息指示所述异常服务器节点与其它服务器节点的连接关系;
[0017]根据所述调用请求数据和/或所述端口信息,构建所述异常服务器节点对应的调用关系图。
[0018]优选的,根据所述数据关联系数,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率,包括:
[0019]对于所述关系调用图中任意一对相邻的服务器节点,根据所述数据关联系数,计算所述任意一对相邻的服务器节点之间的转移概率;
[0020]利用所有计算得到的所述转移概率构建转移概率矩阵;
[0021]根据所述转移概率矩阵,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率。
[0022]优选的,获取所述异常服务器节点在所述报警时间段内的多个第一数据指标,以及获取所述其它服务器节点在所述报警时间段内的多个第二数据指标之后,还包括:
[0023]将所述多个第一数据指标和所述多个第二数据指标进行插值处理和筛选处理。
[0024]优选的,将每个所述其它服务器节点的到达频率发送至所述报警平台进行展示,包括:
[0025]对每个所述其它服务器节点的到达频率进行排序,并将排序结果发送至所述报警平台进行展示。
[0026]本专利技术实施例第二方面公开一种根因分析装置,所述装置包括:
[0027]第一获取单元,用于从报警平台至少获取异常服务器节点对应的异常数据指标和报警时间段;
[0028]第一处理单元,用于在启用单节点根因算法模式的情况下,计算所述异常服务器节点在所述报警时间段内的其它数据指标与所述异常数据指标之间的相关概率;
[0029]第一展示单元,用于将计算得到的所述相关概率发送至所述报警平台进行展示;
[0030]第二处理单元,用于在启用多指标根因算法模式的情况下,确定所述异常服务器节点对应的调用关系图,所述调用关系图由所述异常服务器节点和其它服务器节点构成;
[0031]第二获取单元,用于获取所述异常服务器节点在所述报警时间段内的多个第一数据指标,以及获取所述其它服务器节点在所述报警时间段内的多个第二数据指标;
[0032]确定单元,用于根据所述第一数据指标和所述第二数据指标,确定所述异常服务器节点与所述其它服务器节点之间的数据关联系数;
[0033]随机游走单元,用于根据所述数据关联系数,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率;
[0034]第二展示单元,用于将每个所述其它服务器节点的到达频率发送至所述报警平台进行展示。
[0035]优选的,所述第二处理单元具体用于:在启用多指标根因算法模式的情况下,从数据库中获取所述异常服务器节点对应的调用请求数据,以及扫描所述异常服务器节点的端口信息,所述端口信息指示所述异常服务器节点与其它服务器节点的连接关系;根据所述调用请求数据和/或所述端口信息,构建所述异常服务器节点对应的调用关系图。
[0036]优选的,所述随机游走单元具体用于:对于所述关系调用图中任意一对相邻的服务器节点,根据所述数据关联系数,计算所述任意一对相邻的服务器节点之间的转移概率;利用所有计算得到的所述转移概率构建转移概率矩阵;根据所述转移概率矩阵,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率。
[0037]本专利技术实施例第三方面公开一种电子设备,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如本专利技术实施例第一方面公开的根因分析方法。
[0038]本专利技术实施例第四方面公开一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行本专利技术实施例第一方面公开的根因分析方法。
[0039]基于上述本专利技术实施例提供的一种根因分析方法及装置,该方法为:从报警平台至少获取异常服务器节点对应的异常数据指标和报警时间段;在启用单节点根因算法模式的情况下,计算异常服务器节点在所述报警时间段内的其它数据指标与异常数据指标之间的相关概率;将计算得到的相关概率发送至报警平台进行展示;在启用多指标根因算法模式的情况下,确定异常服务器节点对应的调用关系图;获取异常服务器节点在报警时间段内的多个第一数据指标,以及获取其它服务器节点在报警时间段内的多个第二数据指标;根据第一数据指标和第二数据指标,确定异常服务器节点与其它服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种根因分析方法,其特征在于,所述方法包括:从报警平台至少获取异常服务器节点对应的异常数据指标和报警时间段;在启用单节点根因算法模式的情况下,计算所述异常服务器节点在所述报警时间段内的其它数据指标与所述异常数据指标之间的相关概率;将计算得到的所述相关概率发送至所述报警平台进行展示;在启用多指标根因算法模式的情况下,确定所述异常服务器节点对应的调用关系图,所述调用关系图由所述异常服务器节点和其它服务器节点构成;获取所述异常服务器节点在所述报警时间段内的多个第一数据指标,以及获取所述其它服务器节点在所述报警时间段内的多个第二数据指标;根据所述第一数据指标和所述第二数据指标,确定所述异常服务器节点与所述其它服务器节点之间的数据关联系数;根据所述数据关联系数,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率;将每个所述其它服务器节点的到达频率发送至所述报警平台进行展示。2.根据权利要求1所述的方法,其特征在于,在启用多指标根因算法模式的情况下,确定所述异常服务器节点对应的调用关系图,包括:在启用多指标根因算法模式的情况下,从数据库中获取所述异常服务器节点对应的调用请求数据,以及扫描所述异常服务器节点的端口信息,所述端口信息指示所述异常服务器节点与其它服务器节点的连接关系;根据所述调用请求数据和/或所述端口信息,构建所述异常服务器节点对应的调用关系图。3.根据权利要求1所述的方法,其特征在于,根据所述数据关联系数,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率,包括:对于所述关系调用图中任意一对相邻的服务器节点,根据所述数据关联系数,计算所述任意一对相邻的服务器节点之间的转移概率;利用所有计算得到的所述转移概率构建转移概率矩阵;根据所述转移概率矩阵,从所述异常服务器节点出发对所述关系调用图进行随机游走,得到每个所述其它服务器节点的到达频率。4.根据权利要求1所述的方法,其特征在于,获取所述异常服务器节点在所述报警时间段内的多个第一数据指标,以及获取所述其它服务器节点在所述报警时间段内的多个第二数据指标之后,还包括:将所述多个第一数据指标和所述多个第二数据指标进行插值处理和筛选处理。5.根据权利要求1所述的方法,其特征在于,将每个所述其它服务器节点的到达频率发送至所述报警平台进行展示,包括:对每个所述其它服务器节点的到达频率进行排序,并将排序结果发送至所述报警平台进行展示。6.一种根因...

【专利技术属性】
技术研发人员:徐洪鸣张俊卿刘雨晨
申请(专利权)人:中国民航信息网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1