故障根因确定方法、装置和云设备制造方法及图纸

技术编号:33500964 阅读:17 留言:0更新日期:2022-05-19 01:11
本申请提供一种故障根因确定方法、装置和云设备,该故障根因确定方法包括:获取拓扑网络发生故障期间的多个日志信息,其中,每个日志信息具有时间戳,日志信息包括:拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;对运行信息和特征属性信息进行扩展,得到扩展特征信息,扩展特征信息是表达发生故障的本质的特征信息;将扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生故障的目标故障根因。本申请通过对日志信息进行扩展,确定表达发生故障的本质的特征信息,然后输入故障根因定位模型,能够实现故障根因的准确定位。障根因的准确定位。障根因的准确定位。

【技术实现步骤摘要】
故障根因确定方法、装置和云设备


[0001]本申请涉及计算机
,尤其涉及一种故障根因确定方法、装置和云设备。

技术介绍

[0002]在拓扑网络中,由于网络结构的复杂,在网络发生故障时,发生故障的原因也比较复杂,导致确定网络故障的根因也较困难。
[0003]目前,通过对网络运行过程中的日志信息的简单分类,来确定导致网络故障的根因,存在准确性低的问题。

技术实现思路

[0004]本申请的多个方面提供一种故障根因确定方法、装置和云设备,以提高故障根因确定的准确率。
[0005]本申请实施例第一方面提供一种故障根因确定方法,应用于服务器,故障根因确定方法包括:获取拓扑网络发生故障期间的多个日志信息,其中,每个日志信息具有时间戳,日志信息包括:拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;对运行信息和特征属性信息进行扩展,得到扩展特征信息,扩展特征信息是表达发生故障的本质的特征信息;将扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生故障的目标故障根因;向终端设备发送目标故障根因,以使终端设备向运维人员显示目标故障根因。
[0006]本申请实施例第二方面提供一种故障根因确定装置,包括:获取模块,用于获取拓扑网络发生故障期间的多个日志信息,其中,每个日志信息具有时间戳,日志信息包括:拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;扩展模块,用于对运行信息和特征属性信息进行扩展,得到扩展特征信息,扩展特征信息是表达发生故障的本质的特征信息;输入模块,用于将扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生故障的目标故障根因;发送模块,用于向终端设备发送目标故障根因,以使终端设备向运维人员显示目标故障根因。
[0007]本申请实施例第三方面提供一种云设备,包括:处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现第一方面的故障根因确定方法。
[0008]本申请实施例应用于拓扑网络中网络发生故障的场景中,提供的故障根因确定方法应用于服务器,包括:获取拓扑网络发生故障期间的多个日志信息,其中,每个日志信息具有时间戳,日志信息包括:拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;对运行信息和特征属性信息进行扩展,得到扩展特征信息,扩展特征信息是表达
发生故障的本质的特征信息;将扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生故障的目标故障根因;向终端设备发送目标故障根因,以使终端设备向运维人员显示目标故障根因。本申请实施例通过对日志信息进行扩展,得到表达发生故障的本质的扩展特征信息,作为故障根因定位模型的输入,能够准确的确定发生故障的目标故障根因,以使运维人员及时获得目标故障根因。
附图说明
[0009]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请示例性实施例提供的一种应用场景的示意图;图2为本申请示例性实施例提供的一种故障根因确定方法的步骤流程图;图3为本申请示例性实施例提供的另一种故障根因确定方法的步骤流程图;图4为本申请示例性实施例提供的一种故障因果图的示意图;图5为本申请示例性实施例提供的一种基站和终端的天线朝向和位置信息的示意图;图6为本申请示例性实施例提供的一种故障根因定位模型的示意图;图7为本申请示例性实施例提供的一种训练故障根因定位模型方法的步骤流程图;图8为本申请示例性实施例提供的一种故障根因确定装置的结构框图;图9为本申请示例性实施例提供的一种云设备的结构示意图。
具体实施方式
[0010]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0011]针对现有拓扑网络中网络发生故障的场景中,存在只对日志信息进行简单的分类,来确定发生网络故障的根因,存在准确率低的问题,本申请实施例提供的故障根因确定方法包括:获取拓扑网络发生故障期间的多个日志信息,其中,每个日志信息具有时间戳,日志信息包括:拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;对运行信息和特征属性信息进行扩展,得到扩展特征信息,扩展特征信息是表达发生故障的本质的特征信息;将扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生故障的目标故障根因;向终端设备发送目标故障根因,以使终端设备向运维人员显示目标故障根因。本申请实施例通过对日志信息进行扩展,得到表达发生故障的本质的扩展特征信息,作为故障根因定位模型的输入,能够准确的确定发生故障的目标故障根因。
[0012]在本实施例中,故障根因确定方法可以是借助云计算系统实现整体的故障根因确定方法。此外,执行故障根因确定方法的服务器可以为云服务器,以便借助于云上资源的优势运行各种神经网络模型;相对于云端,故障根因确定方法也可以应用于常规服务器或服务器阵列等服务端设备,在此不加以限定。
[0013]此外,本申请实施例提供的故障根因确定方法应用于拓扑网络中网络发生故障的场景中,其中,对于第一种方式,是通过对故障发生时刻的单一指标的异常进行检测,然后将该指标与多个异常值关联确定网络故障的根因,无法确定网络发生故障的准确的根因,而本申请实施例通过故障期间的多个日志信息,扩展出扩展特征信息进行故障根因的确定,能够提高确定故障根因的准确率。对于第二种方式,是通过收集实施的网络流量等数据,检测网络传输耗时最多的环节,判断网络发生故障的瓶颈处。这种方式没有考虑网络节点之间存在相互影响,也没有考虑到故障根因到最后发生网络故障时的传播发散,而本申请实施例通过对不同时间戳的运行信息和特征属性信息进行扩展,能够得到发生故障的本质的特征信息,考虑到网络节点之间的相互影响和故障根因的传播发散能够更准确的确定故障根因。综上,本申请实施例能够综合考虑不同时间戳的日志信息之间的相互依赖和相互影响,不会丢失日志信息之间的交叉特征,此外,还考虑到故障根因的传播,因此不会出现根因的漏判和误判,进而能够实现准确的确定故障根因。
[0014]示例性地,参照图1,示出本申请实施例故障根因确定方法的应用场景,其中,图1包括拓扑网络10,该拓扑网络包括多个网络节点,分别是服务器11、基站12、路由器13和终端14。其中,服务器11、基站12、路由器13和终端14均可以是多个。在服务器11和终端14之间进行数据传输时,需要通过基站或者基站和路由器。其中,会存在的网络故障包括:无法传输数据、网络迟缓。出现的网络故障的故障根因包括:服务器11、基站12、路由器13和终端14中的一个或多个网络节点中的某个硬件发生故障,和/或网络节点之间的干扰,和/或大量流量造成的资源堵塞,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障根因确定方法,其特征在于,应用于服务器,所述故障根因确定方法包括:获取拓扑网络发生故障期间的多个日志信息,其中,每个所述日志信息具有时间戳,所述日志信息包括:所述拓扑网络中的各个网络节点在对应时间戳的运行信息和特征属性信息;对所述运行信息和特征属性信息进行扩展,得到扩展特征信息,所述扩展特征信息是表达发生所述故障的本质的特征信息;将所述扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生所述故障的目标故障根因;向终端设备发送所述目标故障根因,以使所述终端设备向运维人员显示所述目标故障根因。2.根据权利要求1所述的故障根因确定方法,其特征在于,所述扩展特征信息包括:统计特征和转化特征,所述对所述运行信息和特征属性信息进行扩展,得到扩展特征信息,包括:确定不同时间戳的所述运行信息的统计特征,统计特征包括:多个所述运行信息的中值、均值、倾斜度和峰值中的至少一项;对所述特征属性信息进行转化,得到所述转化特征,所述转化特征用于表达发生所述故障的隐性特征。3.根据权利要求2所述的故障根因确定方法,其特征在于,所述特征属性信息包括:所述故障对应的目标故障类型,所述转化特征包括:中间特征,所述对所述特征属性信息进行转化,得到所述转化特征,包括:根据预设的故障因果图,确定所述目标故障类型对应中间特征,所述故障因果图包括多个故障类型和每个故障类型对应的多个因素,以及每个所述因素造成对应故障类型的权重,所述中间特征包括所述目标故障类型对应的目标因素和所述目标因素对应的权重。4.根据权利要求3所述的故障根因确定方法,其特征在于,所述特征属性信息还包括:所述拓扑网络中各个网络节点的天线的朝向信息和位置信息,所述转化特征还包括:方向信息和/或距离信息,所述对所述特征属性信息进行转化,得到所述转化特征,还包括:根据所述朝向信息和所述位置信息,确定各个天线之间的方向信息;和/或根据所述位置信息,确定各个天线之间的距离信息。5.根据权利要求4所述的故障根因确定方法,其特征在于,所述转化特征还包括:交叉特征,所述对所述特征属性信息进行转化,得到所述转化特征,还包括:根据不同时间戳对应的所述日志信息的依赖关系,确定所述交叉特征。6.根据权利要求1至5任一项所述的故障根因确定方法,其特征在于,所述故障根因定位模型为一个子模型或者多个子模型的集成模型,所述将所述扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生所述故障的目标故障根因,包括:将所述扩展特征信息输入所述故障根因定位模型的分类子模型中,对所述扩展特征信息对应的故障根因类别进行分析处理,得到第一故障根因为所述目标故障根因。7.根据权利要求6所述的故障根因确定方法,其特征在于,所述将所述扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生所述故障的目标故障根因,包括:将所述扩展特征信息输入所述故障根因定位模型的规则子模型中,对所述扩展特征信
息之间的依赖性进行分析处理,得到第二故障根因为所述目标故障根因。8.根据权利要求7所述的故障根因确定方法,其特征在于,所述将所述扩展特征信息输入故障根因定位模型中进行故障根因分析处理,得到发生所述故障的目标故障根因,包括:将所述扩展特征信息输入所述故障根因定位模型的归因子模型中,对所述扩展特征信息的重要性进行分析处理...

【专利技术属性】
技术研发人员:张超利周志强张颖莹杨林晓何凯文青松孙亮
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1