一种基于因果推断的微服务故障根因定位方法及装置制造方法及图纸

技术编号:30049402 阅读:14 留言:0更新日期:2021-09-15 10:51
本发明专利技术提出一种基于因果推断的微服务故障根因定位方法及装置,解决了当前微服务故障根因定位方法无法兼顾定位准确度及定位效率,且网络运行开销耗费大的问题,其中方法包括故障网元定位、因果推断模型构建、故障根因定位三个阶段,本发明专利技术能够严格区分各组件节点间的因果关系,从而能够对冗余的节点进行剔除,克服传统人工或者简单的机器运维费时费力的缺点,同时因果溯源的特性能够快速精准地对故障根因进行定位,对智能运维的发展具有一定的研究价值和意义。究价值和意义。究价值和意义。

【技术实现步骤摘要】
一种基于因果推断的微服务故障根因定位方法及装置


[0001]本专利技术涉及数据分析和因果推断的
,更具体地,涉及一种基于因果推断的微服务故障根因定位方法及装置。

技术介绍

[0002]近年来,微服务框架的应用场景越来越广,在微服务体系结构中,一个应用程序可被解耦成多个微服务。在发生故障时,故障会在整个动态拓扑网络中传播,从而引起多个节点的告警并出现告警风暴,将导致运维难度成倍提高。因此,一旦微服务出现故障又无法迅速定位并解决根因,将直接影响用户体验,给应用的企业带来巨大的经济损失。
[0003]目前,有许多故障根因定位方法被提出,如基于事件相关性分析的方法、基于日志的方法、基于路径跟踪的方法等,其中,基于事件相关性分析的方法无法保障定位准确度,而由于微服务系统中日志数据量很大,使用基于日志的方法直接分析日志需要很高的开销;基于路径跟踪的方法则难以适应微服务的动态变化。
[0004]2020年3月17日,中国专利技术专利(CN110888755A)中公开一种微服务系统异常根因节点的查找方法,该专利所提出的方案通过微服务节点之间生成的依赖关系拓扑图,结合多种算法(如孤立森林算法、皮尔森相关系数算法),对依赖关系拓扑图中的各拓扑节点进行状态更新以及异常检测得到互为父子关系的异常根因节点之间的拓扑依赖关系,基于该拓扑依赖关系,进而计算出待定的各异常根因节点对目标故障节点的根因影响程度对应的各根因分值,最终实现快速查找出最大根因分值对应的异常根因节点,不需要人工对各拓扑节点对应的状态数据进行标注、也不需要人工进行状态数据的筛选,进而提高了微服务系统异常根因节点的排查效率,显著降低了人力成本,但过程需要复杂的算法和模型支撑,因此,相对而言费时且网络运行开销大。

技术实现思路

[0005]为解决当前微服务故障根因定位方法无法兼顾定位准确度及定位效率,且网络运行开销耗费大的问题,本专利技术提出一种基于因果推断的微服务故障根因定位方法及装置,克服了传统人工或者简单的机器运维费时费力的缺点,迅速精准地定位出发生故障的组件。
[0006]为了达到上述技术效果,本专利技术的技术方案如下:
[0007]一种基于因果推断的微服务故障根因定位方法,所述方法至少包括:
[0008]S1.采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
[0009]S2.根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
[0010]S3.确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
[0011]S4.确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
[0012]S5.故障网元组件节点基于因果推断模型进行偏相关随机游走,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
[0013]S6.根据故障得分排序,输出故障根因。
[0014]优选地,步骤S1所述的业务指标数据包括:微服务调用平均时间、调用成功次数及调用成功率,业务指标数据进行异常检测时采用3σ原则。
[0015]优选地,步骤S2所述定位微服务故障网元组件的具体过程为:
[0016]S21.将所定位的故障时刻时段处在同一个调用链ID的组件进行连接,完成微服务调用关系的还原,形成调用链拓扑图,所述调用链拓扑图中包各组件节点和调用关系;
[0017]S22.各组件节点采用随机游走算法在调用链拓扑图上进行随机游走,输出游走次数最多的组件节点,将其作为故障网元组件。
[0018]优选地,所述随机游走算法的随机游走种类包括前向游走、反向游走及自游走。
[0019]优选地,微服务故障网元组件的指标包括:内存指标、网络指标和中央处理器指标。
[0020]优选地,步骤S4所述对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型的具体过程为:
[0021]S41.设t时刻的时序指标数据表示为:N表示数据个数,初始化条件设S是的父亲节点;
[0022]S42.在显著性水平α下,若不能被拒绝,则从中删除X
t

ττ
,剔除无关条件,完成偏相关独立性检测,得到无关条件剔除后的全连接图;
[0023]S43.若其中,不包括X
t

ττ
以及则定出方向X
t

ττ

X
tj
,确定因果规则的走向,形成最终的因果推断模型。
[0024]优选地,步骤S5的具体过程为:
[0025]S51.首先对时序指标数据进行异常等级检测,异常等级检测采用阈值法,其中,成果率指标设置为低阈值,除成果率指标之外的其它指标设置为高阈值;
[0026]S52.计算时序指标数据的故障等级,表达式为:
[0027][0028]其中,表示故障等级,表示t时刻第j个时序数据,表示阈值数值;
[0029]S53.故障网元组件节点基于因果推断模型进行偏相关随机游走,得到节点游走次数v,根据节点游走次数计算故障得分,计算表达式为:
[0030][0031]其中,表示标准化的游走次数,表示标准化的故障等级,表示是控制参数。
[0032]优选地,步骤S6所述根据故障得分排序,输出故障根因时,选取故障得分排序位于前2~3个的根因作为故障根因输出。
[0033]本专利技术还提出一种基于因果推断的微服务故障根因定位装置,所述装置用于实现所述的基于因果推断的微服务故障根因定位方法,包括:
[0034]采集检测模块,用于采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
[0035]故障网元组件定位模块,根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
[0036]全连接图构建模块,用于确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
[0037]因果推断模型形成模块,用于确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
[0038]故障得分计算模块,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
[0039]输出模块,根据故障得分排序,输出故障根因。
[0040]一种存储介质,所述存储介质上存储有实现基于因果判断的微服务故障根因定位方法的程序,所述程序被处理器执行以实现所述的基于因果判断的微服务故障根因定位方法的步骤。
[0041]与现有技术相比,本专利技术技术方案的有益效果是:
[0042]本专利技术提出一种基于因果推断的微服务故障根因定位方法及装置,其中方法包括故障网元定位、因果推断模型构建、故障根因定位三个阶段,在故障网元定位阶段,对业务指标数据进行异常检测,根据时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于因果推断的微服务故障根因定位方法,其特征在于,所述方法至少包括:S1.采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;S2.根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;S3.确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;S4.确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;S5.故障网元组件节点基于因果推断模型进行偏相关随机游走,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;S6.根据故障得分排序,输出故障根因。2.根据权利要求1所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S1所述的业务指标数据包括:微服务调用平均时间、调用成功次数及调用成功率,业务指标数据进行异常检测时采用3σ原则。3.根据权利要求2所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S2所述定位微服务故障网元组件的具体过程为:S21.将所定位的故障时刻时段处在同一个调用链ID的组件进行连接,完成微服务调用关系的还原,形成调用链拓扑图,所述调用链拓扑图中包各组件节点和调用关系;S22.各组件节点采用随机游走算法在调用链拓扑图上进行随机游走,输出游走次数最多的组件节点,将其作为故障网元组件。4.根据权利要求3所述的基于因果推断的微服务故障根因定位方法,其特征在于,所述随机游走算法的随机游走种类包括前向游走、反向游走及自游走。5.根据权利要求1所述的基于因果推断的微服务故障根因定位方法,其特征在于,微服务故障网元组件的指标包括:内存指标、网络指标和中央处理器指标。6.根据权利要求5所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S4所述对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型的具体过程为:S41.设t时刻的时序指标数据表示为:N表示数据个数,初始化条件设S是的父亲节点;S42.在显著性水平α下,若不能被拒绝,则从中删除X
t

ττ
,剔除无关条件,完成偏相关独立性检测,得到无关条件剔除后的全连接...

【专利技术属性】
技术研发人员:朱文辉傅雪娟江智豪丁凯培刘跃群
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1