【技术实现步骤摘要】
一种故障分析方法以及相关设备
[0001]本申请实施例涉及服务器领域,尤其涉及一种故障分析方法以及相关设备。
技术介绍
[0002]随着服务器领域中的硬件系统以及软件系统的快速发展,智能运维产生的日志数据不断增多,日志格式千差万别,同时日志词量也不断增多,导致对日志数据进行分析的难度也不断增大。
[0003]服务器在运行过程中不可避免地会遭遇故障,在对故障进行处理时故障的症状表象是最先被发现的,但是找出导致这一故障的故障根因才是解决问题的关键。在日志数据中记录了故障根因的传播链路上的故障事件,准确地识别故障事件之间的关联性是定位故障根因的关键步骤。然而在现有技术中,上述问题未能得到很好的解决。
技术实现思路
[0004]本申请实施例提供了一种故障分析方法以及相关设备,能够确定故障传播链路,准确定位故障根因。
[0005]本申请第一方面提供了一种故障分析方法:
[0006]从日志中获取M个故障事件,M为大于1的正整数。基于M个故障事件的时序,确定M
‑
1个故障事件对;其中,每个故障事件对由时序相邻的两个故障事件组成;获取每个故障事件对的上下文语义体;其中,每个故障事件对的上下文语义体包括故障事件对中的两个故障事件的上下文语义体,其中,每个故障事件的上下文语义体依次由该故障事件的前序N个事件对应的特征向量矩阵,故障事件对应的特征向量矩阵以及故障事件的后序N个事件对应的特征向量矩阵组成。分别将M
‑
1个故障事件对的上下文语义体输入二分类模型,确定M ...
【技术保护点】
【技术特征摘要】
1.一种故障分析方法,其特征在于,包括:从日志中获取M个故障事件;所述M为大于1的正整数;基于所述M个故障事件的时序,确定M
‑
1个故障事件对;其中,每个故障事件对由时序相邻的两个故障事件组成;获取每个故障事件对的上下文语义体;其中,每个故障事件对的上下文语义体包括所述故障事件对中两个故障事件的上下文语义体,其中,每个故障事件的上下文语义体依次由该故障事件的前序N个事件对应的特征向量矩阵,故障事件对应的特征向量矩阵以及所述故障事件的后序N个事件对应的特征向量矩阵组成;其中,N为大于等于1的正整数;分别将所述M
‑
1个故障事件对的上下文语义体输入二分类模型,确定M
‑
1个关系概率值;其中,每个关系概率值用于指示对应故障事件对中两个故障事件之间的关联性;基于所述M
‑
1个关系概率值确定故障传播链路。2.根据权利要求1所述的方法,其特征在于,所述从日志中获取M个故障事件,包括:基于第一事件检测模型以及第二事件检测模型,从所述日志中获取M个故障事件;其中,所述第一事件模型为基于故障事件训练所确定的检测模型;所述第二事件检测模型为基于正常事件进行训练所确定的检测模型。3.根据权利要求2所述的方法,其特征在于,基于所述第一事件检测模型以及所述第二事件检测模型,从所述日志中获取M个故障事件,包括:从日志中获取多个事件;确定所述每个事件对应的特征向量矩阵;将每个事件的特征向量矩阵输入所述第一事件检测模型,得到每个事件的特征向量矩阵对应的第一输出特征向量矩阵;将每个事件的特征向量矩阵输入所述第二事件检测模型,得到第二输出特征向量矩阵;基于每个事件的特征向量矩阵及其对应的第一输出特征向量矩阵,确定第一误差值;基于每个事件的特征向量矩阵及其对应的第二输出特征向量矩阵,确定第二误差值;基于所述第一误差值和所述第二误差值,确定每个事件是否为故障事件。4.根据权利要求3所述的方法,其特征在于,基于所述第一误差值和所述第二误差值,确定每个事件是否为故障事件,包括:基于所述第一误差值计算第一隶属值;基于所述第二误差值计算第二隶属值;其中,所述第一隶属值的计算公式为:p1=1
‑
(x1
‑
a1)/(b1
‑
a1);其中,x1为每个事件的第一误差值,a1为多个第三误差中的最大值,b1为所述多个第三误差中的最小值;所述第三误差为基于第一特征向量矩阵及第三输出特征向量矩阵确...
【专利技术属性】
技术研发人员:吴施楷,梁永贵,曹瑞,
申请(专利权)人:超聚变数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。