网络故障处理方法及装置、存储介质及电子设备制造方法及图纸

技术编号:37060774 阅读:16 留言:0更新日期:2023-03-29 19:38
本发明专利技术提供了一种网络故障处理方法及装置、存储介质及电子设备,该方法包括:对每个节点服务器进行主机数据采集和交换机数据采集,获得每个节点服务器的主机数据信息和交换机数据信息;依据节点服务器的主机数据信息和交换机数据信息,判断其是否符合预设的故障隐患条件,将符合条件的节点服务器作为目标节点服务器;确定目标节点服务器对应的故障隐患信息、应用系统信息及网络拓扑信息,并基于上述信息确定目标节点服务器对应的目标故障处置策略;依据目标节点服务器对应的故障隐患信息和目标故障处置策略,生成告警通知;将告警通知发送给用户。应用本发明专利技术的方法,可通过自动识别故障隐患并确定处置策略,无需人工介入,可减少工作量。可减少工作量。可减少工作量。

【技术实现步骤摘要】
网络故障处理方法及装置、存储介质及电子设备


[0001]本专利技术涉及运维
,特别是涉及一种网络故障处理方法及装置、存储介质及电子设备。

技术介绍

[0002]随着计算机技术的发展,计算机网络已经成为各企业机构必不可少的基础设施。各企业机构为保证网络服务质量,在日常运维工作中,在出现网络故障时,需及时定位网络故障并处置,保障网络高可用。
[0003]现有的网络故障处理,通常是在计算机网络出现异常时,人工对设备的相关数据进行排查,逐一进行分析,以定位网络故障,分析故障处置策略,并对其进行处理。
[0004]在实际的应用场景中,企业机构的计算机网络中一般都部署有大型的服务器集群,网络规模和拓扑结构十分复杂。基于现有网络故障处理方式,需人为定位故障、分析故障处置策略,耗时较长,难以保证业务的高连续性和应急处置的效率。其次,现有的网络故障处理仅在发生了显性的故障时触发,难以发现隐性故障,不利于保障网络服务质量。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种网络故障处理方法,以解决人工定位故障,分析处置策略,耗时长、效率低且难以发现隐性故障的问题。
[0006]本专利技术实施例还提供了一种网络故障处理装置,用以保证上述方法实际中的实现及应用。
[0007]为实现上述目的,本专利技术实施例提供如下技术方案:
[0008]一种网络故障处理方法,包括:
[0009]当到达预设检测周期对应的每个检测时间点时,对预设服务器集群中的每个节点服务器进行主机数据采集,获得当前每个所述节点服务器对应的主机数据信息;
[0010]对每个所述节点服务器进行交换机数据采集,获得当前每个所述节点服务器对应的交换机数据信息;
[0011]对于每个所述节点服务器,依据该节点服务器对应的主机数据信息和交换机数据信息,判断该节点服务器是否符合预设的故障隐患条件,若该节点服务器符合所述预设的故障隐患条件,则将该节点服务器作为目标节点服务器;
[0012]确定每个所述目标节点服务器对应的故障隐患信息;
[0013]确定每个所述目标节点服务器对应的应用系统信息及网络拓扑信息;
[0014]对于每个所述目标节点服务器,依据该目标节点服务器对应的故障隐患信息、应用系统信息及网络拓扑信息,在预设的多个故障处置策略中,确定该目标节点服务器对应的目标故障处置策略;
[0015]依据每个所述目标节点服务器对应的故障隐患信息和目标故障处置策略,生成每个所述目标节点服务器对应的告警通知;
[0016]将每个所述告警通知发送给预先指定的用户,完成当前检测时间点的网络故障处理过程。
[0017]上述的方法,可选的,所述对预设服务器集群中的每个节点服务器进行主机数据采集,获得当前每个所述节点服务器对应的主机数据信息,包括:
[0018]对于每个所述节点服务器,采集该节点服务器对应的主机整体数据,所述主机整体数据包括多个预设主机指标的指标值,所述多个预设主机指标包括第一端口状态、设备连接状态、第二端口状态、网卡当前速率、网卡支持的模式及速率以及网卡当前模式;
[0019]对于每个所述节点服务器,采集该节点服务器对应的主机网卡数据,所述主机网卡数据包括多个预设主机网卡指标的指标值,所述多个预设主机网卡指标包括网卡收/发包数、网卡收/发包数据大小、网卡收/发包错包数以及网卡收/发包丢包数;
[0020]对于每个所述节点服务器,采集该节点服务器对应的主机网口数据,所述主机网口数据包括多个预设主机网口指标的指标值,所述多个预设主机网口指标包括网口收/发包计数、网口收/发包数据大小、网口收/发包错误计数、网口收/发包丢包计数以及网口收包校验错误计数;
[0021]将每个所述节点服务器对应的主机整体数据、主机网卡数据以及主机网口数据,作为每个所述节点服务器对应的主机数据信息。
[0022]上述的方法,可选的,所述对每个所述节点服务器进行交换机数据采集,获得当前每个所述节点服务器对应的交换机数据信息,包括:
[0023]对于每个所述节点服务器,采集该节点服务器对应的交换机网口数据,所述交换机网口数据包括多个预设交换机网口指标的指标值,所述多个预设交换机网口指标包括发送和接收的帧数量、循环冗余校验错误的帧数量、预定类型帧的丢包数量、链路错误计数、错误帧计数、端口延时计数以及超时丢包数;
[0024]将每个所述节点服务器对应的交换机网口数据,作为每个所述节点服务器对应的交换机数据信息。
[0025]上述的方法,可选的,所述依据该节点服务器对应的主机数据信息和交换机数据信息,判断该节点服务器是否符合预设的故障隐患条件,包括:
[0026]依据该节点服务器对应的主机数据信息,确定该节点服务器对应的多个主机关键指标值;
[0027]确定每个所述主机关键指标值对应的指标预设值;
[0028]对于每个所述主机关键指标值,判断该主机关键指标值与其对应的指标预设值是否相同,若该主机关键指标值与其对应的指标预设值不同,则将该主机关键指标值作为异常指标值;
[0029]若各个所述主机关键指标值中,存在至少一个异常指标值,则确定该节点服务器符合所述预设的故障隐患条件。
[0030]上述的方法,可选的,还包括:
[0031]若各个所述主机关键指标值中不存在异常指标值,则依据该节点服务器对应的主机数据信息和交换机数据信息,确定该节点服务器对应的多个性能指标计数值;
[0032]确定每个所述性能指标计数值对应的指标阈值;
[0033]对于每个所述性能指标计数值,将该性能指标计数值与其对应的指标阈值进行比
较,若该性能指标计数值大于或等于其对应的指标阈值,则将该性能指标计数值确定为异常计数值;
[0034]若各个所述性能指标计数值中存在异常计数值,则判断各个所述性能指标计数值中的各个异常计数值是否符合预设的异常匹配条件;
[0035]若各个所述异常计数值符合所述预设的异常匹配条件,则确定该节点服务器符合所述预设的故障隐患条件。
[0036]上述的方法,可选的,还包括:
[0037]若各个所述性能指标计数值中不存在异常计数值,则确定该节点服务器不符合所述预设的故障隐患条件。
[0038]上述的方法,可选的,还包括:
[0039]对于每个所述目标节点服务器对应的目标故障处置策略,判断该目标故障处置策略是否符合预设的自动执行条件,若该目标故障处置策略符合所述预设的自动执行条件,则将该目标节点服务器作为待处理节点服务器;
[0040]依据每个所述待处理节点服务器对应的目标故障处置策略,确定每个所述待处理节点服务器对应的处理操作;
[0041]执行每个所述待处理节点服务器对应的处理操作。
[0042]一种网络故障处理装置,包括:
[0043]第一采集单元,用于当到达预设检测周期对应的每个检测时间点时,对预设服务器集群中的每个节点服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络故障处理方法,其特征在于,包括:当到达预设检测周期对应的每个检测时间点时,对预设服务器集群中的每个节点服务器进行主机数据采集,获得当前每个所述节点服务器对应的主机数据信息;对每个所述节点服务器进行交换机数据采集,获得当前每个所述节点服务器对应的交换机数据信息;对于每个所述节点服务器,依据该节点服务器对应的主机数据信息和交换机数据信息,判断该节点服务器是否符合预设的故障隐患条件,若该节点服务器符合所述预设的故障隐患条件,则将该节点服务器作为目标节点服务器;确定每个所述目标节点服务器对应的故障隐患信息;确定每个所述目标节点服务器对应的应用系统信息及网络拓扑信息;对于每个所述目标节点服务器,依据该目标节点服务器对应的故障隐患信息、应用系统信息及网络拓扑信息,在预设的多个故障处置策略中,确定该目标节点服务器对应的目标故障处置策略;依据每个所述目标节点服务器对应的故障隐患信息和目标故障处置策略,生成每个所述目标节点服务器对应的告警通知;将每个所述告警通知发送给预先指定的用户,完成当前检测时间点的网络故障处理过程。2.根据权利要求1所述的方法,其特征在于,所述对预设服务器集群中的每个节点服务器进行主机数据采集,获得当前每个所述节点服务器对应的主机数据信息,包括:对于每个所述节点服务器,采集该节点服务器对应的主机整体数据,所述主机整体数据包括多个预设主机指标的指标值,所述多个预设主机指标包括第一端口状态、设备连接状态、第二端口状态、网卡当前速率、网卡支持的模式及速率以及网卡当前模式;对于每个所述节点服务器,采集该节点服务器对应的主机网卡数据,所述主机网卡数据包括多个预设主机网卡指标的指标值,所述多个预设主机网卡指标包括网卡收/发包数、网卡收/发包数据大小、网卡收/发包错包数以及网卡收/发包丢包数;对于每个所述节点服务器,采集该节点服务器对应的主机网口数据,所述主机网口数据包括多个预设主机网口指标的指标值,所述多个预设主机网口指标包括网口收/发包计数、网口收/发包数据大小、网口收/发包错误计数、网口收/发包丢包计数以及网口收包校验错误计数;将每个所述节点服务器对应的主机整体数据、主机网卡数据以及主机网口数据,作为每个所述节点服务器对应的主机数据信息。3.根据权利要求1所述的方法,其特征在于,所述对每个所述节点服务器进行交换机数据采集,获得当前每个所述节点服务器对应的交换机数据信息,包括:对于每个所述节点服务器,采集该节点服务器对应的交换机网口数据,所述交换机网口数据包括多个预设交换机网口指标的指标值,所述多个预设交换机网口指标包括发送和接收的帧数量、循环冗余校验错误的帧数量、预定类型帧的丢包数量、链路错误计数、错误帧计数、端口延时计数以及超时丢包数;将每个所述节点服务器对应的交换机网口数据,作为每个所述节点服务器对应的交换机数据信息。
4.根据权利要求1所述的方法,其特征在于,所述依据该节点服务器对应的主机数据信息和交换机数据信息,判断该节点服务器是否符合预设的故障隐患条件,包括:依据该节点服务器对应的主机数据信息,确定该节点服务器对应的多个主机关键指标值;确定每个所述主机关键指标值对应的指标预设值;对于每个所述主机关键指标值,判断该主机关键指标值与其对应的指标预设值是否相同,若该...

【专利技术属性】
技术研发人员:彭洁刘谦刘畅屈大伟
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1