故障根因确定方法、装置、服务器和计算机可读介质制造方法及图纸

技术编号:27569493 阅读:17 留言:0更新日期:2021-03-09 22:16
本公开提供一种故障根因确定方法及装置,当业务发生故障时,确定故障特征信息,根据故障特征信息和故障传播图确定故障根因节点,本公开利用故障传播图找到故障根因,可以缩短确定故障根因的周期,提高故障根因定位的效率和准确性;本公开还提供一种服务器和计算机可读介质。介质。介质。

【技术实现步骤摘要】
故障根因确定方法、装置、服务器和计算机可读介质


[0001]本公开涉及计算机网络
,具体涉及一种故障根因确定方法、装置、服务器和计算机可读介质。

技术介绍

[0002]随着承载网络的规模越来越大,网络的结构越来越复杂,当发生故障时,需要投入较大的人力进行故障根因定位,运维成本很高,而且故障根因确定过程较长,效率较低。因此,如何找到一种有效和快速的故障根因确定方法显得非常必要。
[0003]现有的故障根因确定方法主要分为如下几类:
[0004]1)由人工借助工具确定故障根因。这是传统的故障根因确定方法,以人工分析为主,工具收集数据为辅,一般先收集相关数据,再进行人工分析,逐步排查定位,最终给出结论。该类方法的缺点是主要依赖于专家的知识和经验,很难复制,人力成本高,且故障根因定位过程较长,效率低。
[0005]2)基于规则确定故障根因。该类方法主要通过总结运维专家的知识经验,梳理出相应的诊断流程和诊断规则,形成策略库和规则库。根据承载业务和业务故障的不同,制定出相应的故障诊断策略和规则确定故障根因。该类方法的优点是可以很好的将运维专家的知识经验积累下来,体现到具体的故障诊断策略和规则中,实现故障的自动排查定位。缺点是主要依赖于人总结规则,需要逐步排查定位,定位周期较长,且系统自身不具备自学习能力。
[0006]3)基于神经网络确定故障根因。该类方法将确定故障根因问题转换为适合神经网络解决的分类问题,是基于数据驱动的故障根因确定方法。具体是先通过对故障数据进行标注,形成训练数据集,然后,再训练神经网络模型,从而具备确定故障根因的能力。该类方法依赖于大量、高质量、有标注的数据,缺点是对数据要求相对较高。

技术实现思路

[0007]本公开针对现有技术中存在的上述不足,提供一种故障根因确定方法、装置、服务器和计算机可读介质。
[0008]第一方面,本公开实施例提供一种故障根因确定方法,所述方法包括:
[0009]当业务发生故障时,确定故障特征信息;
[0010]根据所述故障特征信息和预设的故障传播图确定故障根因节点,所述故障传播图用于表示不同传播节点之间有向的关联关系以及故障节点、故障传播节点和故障根因节点之间有向的关联关系,所述故障传播图中的节点用于表示所述故障特征信息。
[0011]进一步的,在根据所述故障特征信息和预设的故障传播图确定故障根因节点之后,所述方法还包括:
[0012]根据所述故障根因节点、所述故障特征信息和预设的贝叶斯模型,确定所述故障根因节点的故障根因概率。
[0013]优选的,所述确定故障特征信息,包括:确定故障业务和故障类型,以及确定所述故障业务的路径,并根据所述路径获取与所述故障相关的事件;
[0014]所述根据所述故障特征信息和预设的故障传播图确定故障根因节点,包括:
[0015]从预设的各故障传播图中选择故障节点与所述故障类型相匹配的故障传播图,并根据选择出的故障传播图确定故障根因节点;
[0016]所述根据所述故障根因节点、所述故障特征信息和预设的贝叶斯模型,确定所述故障根因节点的故障根因概率,包括:
[0017]从预设的各贝叶斯模型中选择与所述选择出的故障传播图相对应的贝叶斯模型,并根据所述故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述故障根因节点的故障根因概率。
[0018]优选的,所述根据选择出的故障传播图确定故障根因节点,包括:
[0019]根据选择出的故障传播图中的关联关系,确定与选择出的故障传播图中的故障节点相关联的节点;
[0020]确定所述节点的节点类型,并至少根据所述节点类型确定疑似故障根因节点,所述疑似故障根因节点为选择出的故障传播图中的故障根因节点,且所述疑似故障根因节点的数量小于选择出的故障传播图中故障根因节点的数量;
[0021]所述根据所述故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述故障根因节点的故障根因概率,包括:
[0022]根据所述疑似故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述疑似故障根因节点的故障根因概率。
[0023]优选的,所述至少根据所述节点类型确定疑似故障根因节点,包括:
[0024]若所述节点的节点类型为故障传播节点且所述故障传播节点的可确认性属性为可确认属性,则判断是否满足所述故障传播节点的规则属性,若满足规则属性,则根据选择出的故障传播图确定所述故障传播节点的下一个节点,确定所述下一个节点的节点类型,并根据所述下一个节点的节点类型确定疑似故障根因节点;若不满足规则属性,则不再确定所述故障传播节点的下一个节点;
[0025]若所述节点的节点类型为故障传播节点且所述故障传播节点的可确认性属性为不可确认属性,则根据选择出的故障传播图确定所述故障传播节点的下一个节点,确定所述下一个节点的节点类型,并根据所述下一个节点的节点类型确定疑似故障根因节点。
[0026]优选的,生成所述故障传播图的步骤包括:
[0027]从预设的运维知识经验数据库中获取故障信息,所述故障信息包括:故障类型、故障根因类型、与所述故障类型相关联事件以及故障类型、故障根因类型和与所述故障类型相关联事件之间的关联关系;
[0028]根据所述故障信息,针对每个故障类型分别生成故障传播图,所述故障传播图为故障传播知识图谱。
[0029]优选的,建立所述贝叶斯模型的步骤包括:
[0030]删除所述故障传播图中可确认性属性为不可确认属性的节点以及与所述已删除的节点相关的关联关系,并根据所述已删除的关联关系,在与所述已删除的节点相关联的节点之间建立关联关系,以得到预处理后的故障传播图;
[0031]分别将所述预处理后的故障传播图中的各节点和关联关系转化为贝叶斯模型中的节点和关联关系,以建立所述贝叶斯模型。
[0032]另一方面,本公开实施例还提供一种故障根因确定装置,包括第一确定模块和第二确定模块;
[0033]所述第一确定模块用于,当业务发生故障时,确定故障特征信息;
[0034]所述第二确定模块用于,根据所述故障特征信息和预设的故障传播图确定故障根因节点,所述故障传播图用于表示不同传播节点之间有向的关联关系以及故障节点、故障传播节点和故障根因节点之间有向的关联关系,所述故障传播图中的节点用于表示所述故障特征信息。
[0035]进一步的,所述故障根因确定装置还包括第三确定模块,所述第三确定模块用于,根据所述故障根因节点、所述故障特征信息和预设的贝叶斯模型,确定所述故障根因节点的故障根因概率。
[0036]优选的,所述第一确定模块用于,确定故障业务和故障类型,以及确定所述故障业务的路径,并根据所述路径获取与所述故障相关的事件;
[0037]所述第二确定模块用于,从预设的各故障传播图中选择故障节点与所述故障类型相匹配的故障传播图,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障根因确定方法,所述方法包括:当业务发生故障时,确定故障特征信息;根据所述故障特征信息和预设的故障传播图确定故障根因节点,所述故障传播图用于表示不同传播节点之间有向的关联关系以及故障节点、故障传播节点和故障根因节点之间有向的关联关系,所述故障传播图中的节点用于表示所述故障特征信息。2.如权利要求1所述的方法,其中,在根据所述故障特征信息和预设的故障传播图确定故障根因节点之后,所述方法还包括:根据所述故障根因节点、所述故障特征信息和预设的贝叶斯模型,确定所述故障根因节点的故障根因概率。3.如权利要求2所述的方法,其中,所述确定故障特征信息,包括:确定故障业务和故障类型,以及确定所述故障业务的路径,并根据所述路径获取与所述故障相关的事件;所述根据所述故障特征信息和预设的故障传播图确定故障根因节点,包括:从预设的各故障传播图中选择故障节点与所述故障类型相匹配的故障传播图,并根据选择出的故障传播图确定故障根因节点;所述根据所述故障根因节点、所述故障特征信息和预设的贝叶斯模型,确定所述故障根因节点的故障根因概率,包括:从预设的各贝叶斯模型中选择与所述选择出的故障传播图相对应的贝叶斯模型,并根据所述故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述故障根因节点的故障根因概率。4.如权利要求3所述的方法,其中,所述根据选择出的故障传播图确定故障根因节点,包括:根据选择出的故障传播图中的关联关系,确定与选择出的故障传播图中的故障节点相关联的节点;确定所述节点的节点类型,并至少根据所述节点类型确定疑似故障根因节点,所述疑似故障根因节点为选择出的故障传播图中的故障根因节点,且所述疑似故障根因节点的数量小于选择出的故障传播图中故障根因节点的数量;所述根据所述故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述故障根因节点的故障根因概率,包括:根据所述疑似故障根因节点、所述故障类型、所述与所述故障相关的事件和选择出的贝叶斯模型,确定所述疑似故障根因节点的故障根因概率。5.如权利要求4所述的方法,其中,所述至少根据所述节点类型确定疑似故障根因节点,包括:若所述节点的节点类型为故障传播节点且所述故障传播节点的可确认性属性为可确认属性,则判断是否满足所述故障传播节点的规则属性,若满足规则属性,则根据选择出的故障传播图确定所述故障传播节点的下一个节点,确定所述下一个节点的节点类型,并根据所述下一个节点的节点类型确定疑似故障根因节点;若不满足规则属性,则不再确定所述故障传播节点的下一个节点;若所述节点的节点类型为故障传播节点且所述故障传播节点的可确认性属性为不可确认属性,则根据选择出的故障传播图确定所述故障传播节点的下一个节点,确定所述下
一个节点的节点类型,并根据所述下一个节点的节点类型确定疑似故障根因节点。6.如权利要求1-5任一项所述的方法,其中,生成所述故障传播图的步骤包括:从预设的运维知识经验数据库中获取故障信息,所述故障信息包括:故障类型、故障根因类型、与所述故障类型相关联事件以及故障类型、故障根因类型和与所述故障类型相关联事件之间的关联关系;根据所述故障信息,针对每个故障类型分别生成故障传播图,所述故障传播图为故障传播知识图谱。7.如权利要求2-5任一项所述的方法,其中,建立所述贝叶斯模型的步骤包括:删除所述故障传播图中可确认性属性为不可确认属性的节点以及与所述已删除的节点相关的关联关系,并根据所述已删除的关联关系,在与所述已删除的节点相关联的节点之间建立关联关系,以得到预处理后的故障传播图;分别将所述预处理后的故障传播图中的各节点和关联关系转化为贝叶斯模型中的节点和关联关系,以建立所述贝叶斯模型。8.一种故障根因确定装置,包括第一确定模块和第二确定模块;所述第一确定模块用于,当业务发生故障时,确定...

【专利技术属性】
技术研发人员:韩俊华
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1