基于有向图网络的故障根因分析方法和装置制造方法及图纸

技术编号:26170374 阅读:24 留言:0更新日期:2020-10-31 13:37
本公开提供了一种基于有向图网络的故障根因分析方法,该方法包括:根据故障事件产生的告警信息,定位所述告警信息所属的功能调用链;对告警信息所属的功能调用链进行剪枝,形成核心功能调用有向图;通过核心功能调用有向图,结合图神经网络,得到故障事件的根因节点推荐。本公开的基于有向图网络的故障根因分析方法可用于人工智能领域。本公开还提供了一种装置、一种电子设备以及一种计算机可读存储介质。

【技术实现步骤摘要】
基于有向图网络的故障根因分析方法和装置
本公开涉及人工智能
,特别是涉及一种基于有向图网络的故障根因分析方法和装置。
技术介绍
随着信息化进程的推进,越来越多的企业建立了数据中心,以实现信息系统的集中管理。数据中心对故障告警的定义是,业务办理受到影响或生产系统正常有效运行出现异常的监控告警,一般分为一至五级生产故障事件。由于数据中心应用类别多,告警量大,业务或功能调用关系复杂,故障分析常花费大量的时间和精力。根据告警收集分析故障事件的传统方法,在筛选告警过程中,掺杂了人工提取的干扰因素,圈定了故障影响时间范围,提取出来的离散型的告警和日志信息,既不利于故障根因的快速定位,也为机器学习的效果带来了不利影响。
技术实现思路
本公开的一个方面提供了一种基于有向图网络的故障根因分析方法,包括:根据故障事件产生的告警信息,定位上述告警信息所属的功能调用链;对上述告警信息所属的功能调用链进行剪枝,形成核心功能调用有向图;通过上述核心功能调用有向图,结合图神经网络,得到上述故障事件的根因节点推荐。根据本公开的实施例,上述通过上述核心功能调用有向图,结合图神经网络,得到上述故障事件的根因节点推荐包括:调取上述核心功能调用有向图的各节点的原始特征信息;将上述原始特征信息传入图神经网络,获取每个节点导致上述告警的概率值;根据上述概率值,得到故障事件的根因节点推荐。根据本公开的实施例,上述将上述原始特征信息传入图神经网络,获取每个节点导致上述告警的概率值包括:将上述原始特征信息输入共享参数图神经网络,得到提取后的特征信息;将上述提取后的上述特征信息输入全连接神经网络进行特征分析,求出每个节点导致上述告警的概率值。根据本公开的实施例,上述将上述原始特征信息输入共享参数图神经网络,得到提取后的特征信息包括:从共享参数图神经网络的第0层开始,计算节点在下一层的特征信息,直至得到上述节点在第n层的特征信息,作为提取后的特征信息,其中,n为共享参数图神经网络的层数。根据本公开的实施例,计算节点在下一层的特征信息包括:将核心功能调用有向图的节点的所有邻近节点在第m层的特征信息及邻近节点对应的权重参数相乘进行加权计算,得到邻近节点的加权计算结果,其中,0≤m<n,上述权重参数通过神经网络训练得到;采用激活函数对上述加权计算结果进行特征激活,得到节点在第m+1层的特征信息。根据本公开的实施例,上述将上述提取后的上述特征信息输入全连接神经网络进行特征分析,求出每个节点导致上述告警的概率值包括:将全部节点的提取后的特征信息后带入全连接神经网络;通过全连接神经网络将上述节点的提取后的特征信息对应到不同的故障分类,并得到上述节点对应的概率值。根据本公开的实施例,上述根据上述概率值,得到故障事件的根因节点推荐包括:将上述概率值与预定的阈值进行比较,若上述概率值大于上述阈值,则推荐上述节点作为上述故障事件的根因节点。根据本公开的实施例,上述根据故障事件产生的告警信息,定位该告警信息所属的功能调用链包括:确定故障时间窗口内产生告警信息的节点,通过告警信息发起故障根因分析请求,并划定故障时间窗口;在故障时间窗口内,通过产生告警信息的节点结合发生故障事件的应用功能,确定从应用功能请求源头流向请求装置的链路,作为故障所在的功能调用链。根据本公开的实施例,上述对故障发生所在功能调用链进行剪枝包括:对功能调用链中的环路进行去除,形成有向无环图,其中上述环路为应用功能的请求源头流向请求装置的过程中至少两次经过同一节点的循环链路。根据本公开的实施例,上述对故障发生所在功能调用链进行剪枝的方法包括:采用图的深度优先搜索算法、标签传播算法或利用知识图谱实现功能调用链的剪枝。本公开的另一个方面提供了一种基于有向图网络的故障根因分析装置,包括:功能调用链定位模块,用于根据故障事件产生的告警信息,定位上述告警信息所属的功能调用链;核心功能调用有向图生成模块,用于对告警信息所属的功能调用链进行剪枝,形成核心功能调用有向图;图神经网络模块,用于通过上述核心功能调用有向图,结合图神经网络,得到上述故障事件的根因节点推荐。根据本公开的实施例,上述图神经网络模块包括:特征信息调取子模块,用于调取上述核心功能调用有向图的各节点的原始特征信息;概率值求取子模块,用于将上述原始特征信息传入图神经网络,获取每个节点导致上述告警的概率值;根因节点推荐子模块,用于根据上述概率值,得到故障事件的根因节点推荐。根据本公开的实施例,上述概率值求取子模块包括:共享图神经网络模块,用于将上述原始特征信息输入共享参数图神经网络,得到提取后的特征信息;全连接神经网络模块,用于将上述提取后的上述特征信息输入全连接神经网络进行特征分析,求出每个节点导致上述告警的概率值。根据本公开的实施例,上述共享图神经网络模块用于从共享参数图神经网络的第0层开始,计算节点在下一层的特征信息,直至得到上述节点在第n层的特征信息,作为提取后的特征信息,其中,n为共享参数图神经网络的层数。根据本公开的实施例,共享图神经网络模块计算节点在下一层的特征信息包括:将核心功能调用有向图的节点的所有邻近节点在第m层的特征信息及邻近节点对应的权重参数相乘进行加权计算,得到邻近节点的加权计算结果,其中,0≤m<n,上述权重参数通过神经网络训练得到;采用激活函数对上述加权计算结果进行特征激活,得到节点在第m+1层的特征信息。根据本公开的实施例,上述全连接神经网络用于将全部节点的提取后的特征信息后带入全连接神经网络;通过全连接神经网络将上述节点的提取后的特征信息对应到不同的故障分类,并得到上述节点对应的概率值。根据本公开的实施例,上述根因节点推荐子模块用于将上述概率值与预定的阈值进行比较,若上述概率值大于上述阈值,则推荐上述节点作为上述故障事件的根因节点。根据本公开的实施例,上述功能调用链定位模块用于确定故障时间窗口内产生告警信息的节点,通过告警信息发起故障根因分析请求,并划定故障时间窗口;在故障时间窗口内,通过产生告警信息的节点结合发生故障事件的应用功能,确定从应用功能请求源头流向请求装置的链路,作为故障所在的功能调用链。根据本公开的实施例,上述核心功能调用有向图生成模块用于对功能调用链中的环路进行去除,形成有向无环图,其中上述环路为应用功能的请求源头流向请求装置的过程中至少两次经过同一节点的循环链路。根据本公开的实施例,上述核心功能调用有向图生成模块采用图的深度优先搜索算法、标签传播算法或利用知识图谱实现功能调用链的剪枝。本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现本公开实施例的方法。本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现本公开实施例的方法。本公开的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令本文档来自技高网...

【技术保护点】
1.一种基于有向图网络的故障根因分析方法,包括:/n根据故障事件产生的告警信息,定位所述告警信息所属的功能调用链;/n对所述告警信息所属的功能调用链进行剪枝,形成核心功能调用有向图;/n通过所述核心功能调用有向图,结合图神经网络,得到所述故障事件的根因节点推荐。/n

【技术特征摘要】
1.一种基于有向图网络的故障根因分析方法,包括:
根据故障事件产生的告警信息,定位所述告警信息所属的功能调用链;
对所述告警信息所属的功能调用链进行剪枝,形成核心功能调用有向图;
通过所述核心功能调用有向图,结合图神经网络,得到所述故障事件的根因节点推荐。


2.根据权利要求1所述的故障根因分析方法,其中,所述通过所述核心功能调用有向图,结合图神经网络,得到所述故障事件的根因节点推荐包括:
调取所述核心功能调用有向图的各节点的原始特征信息;
将所述原始特征信息传入图神经网络,获取每个节点导致所述告警的概率值;
根据所述概率值,得到故障事件的根因节点推荐。


3.根据权利要求2所述的故障根因分析方法,其中,所述将所述原始特征信息传入图神经网络,获取每个节点导致所述告警的概率值包括:
将所述原始特征信息输入共享参数图神经网络,得到提取后的特征信息;
将所述提取后的所述特征信息输入全连接神经网络进行特征分析,求出每个节点导致所述告警的概率值。


4.根据权利要求3所述的故障根因分析方法,其中,所述将所述原始特征信息输入共享参数图神经网络,得到提取后的特征信息包括:
从共享参数图神经网络的第0层开始,计算节点在下一层的特征信息,直至得到所述节点在第n层的特征信息,作为提取后的特征信息,其中,n为共享参数图神经网络的层数。


5.根据权利要求4所述的故障根因分析方法,其中,计算节点在下一层的特征信息包括:
将核心功能调用有向图的节点的所有邻近节点在第m层的特征信息及邻近节点对应的权重参数相乘进行加权计算,得到邻近节点的加权计算结果,其中,0≤m<n,所述权重参数通过神经网络训练得到;
采用激活函数对所述加权计算结果进行特征激活,得到节点在第m+1层的特征信息。


6.根据权利要求3所述的故障根因分析方法,其中,所述将所述提取后的所述特征信息输入全连接神经网络进行特征分析,求出每个节点导致所述告警的概率值包括:
将全部节点的提取后的特征信息后带入全连接神经网络;
通过全连接神经网络将所述节...

【专利技术属性】
技术研发人员:秦浩军郭晨
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1