故障定位方法、故障修复方法、装置及存储介质制造方法及图纸

技术编号:37502067 阅读:13 留言:0更新日期:2023-05-07 09:38
本申请提供一种故障定位方法、故障修复方法、装置及存储介质,涉及数据中心运维技术领域。该故障定位方法包括:对数据中心的网络信息进行采集和感知,网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。以定位故障原因。以定位故障原因。

【技术实现步骤摘要】
故障定位方法、故障修复方法、装置及存储介质


[0001]本申请涉及数据中心运维
,尤其涉及一种故障定位方法、故障修复方法、装置及存储介质。

技术介绍

[0002]数据中心作为新型数字信息基础设施的核心组成部分,随着业务种类的多样化,网络拓扑的复杂化演进,传统的运维方式难以满足数字化转型要求。现有的数据中心运维方案中大多集中于对数据中心能耗策略的制定,但是当数据中心网络出现故障时缺乏相对应的故障检测定位与修复方法。
[0003]现有的数据中心运维系统中,主要是通过告警信息的定性分析实现网络故障定位,故障检测不全面,且修复主要针对的是逻辑链路的故障。如此,现有方案存在以下问题:检测不全面、没有针对物理链路的故障进行修复。

技术实现思路

[0004]本申请提供一种故障定位方法、故障修复方法、装置及存储介质,能够解决数据中心运维存在故障检测不全面,且没有能够针对物理链路的故障进行修复的问题。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供一种故障定位方法,该方法包括:对数据中心的网络信息进行采集和感知,所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对所述网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。
[0007]基于上述技术方案,本申请实施例提供的故障定位方法,通过采集数据中心更多更典型的网络信息,如网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息,对更多更典型的网络信息进行特征筛选,并基于筛选后的数据来定位故障原因。
[0008]在第一方面的第一种可能的实现方式中,上述对网络信息进行数据存储和特征筛选,包括:对上述网络信息进行监控并对上述网络信息进行记录并存储;对所述网络信息进行安全鉴权,得到安全鉴权结果;基于上述安全鉴权结果,对上述网络信息进行特征筛选。
[0009]在第一方面的第二种可能的实现方式中,上述基于特征筛选后的数据进行网络故障检测,以定位故障原因,包括:采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果;通过上述聚类结果定位所述故障原因,上述聚类结果与上述故障原因存在映射关系;其中,上述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
[0010]在第一方面的第三种可能的实现方式中,上述所述采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果之前,上述方法还包括:对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后上述历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的
情况下,停止模型训练,并将训练得到的模型作为上述BP神经网络模型。
[0011]第二方面,本申请提供一种故障修复方法,该方法包括:基于故障原因,生成对应的修复策略;基于修复策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备修复数据中心的网络故障。
[0012]基于上述技术方案,本申请实施例提供的故障修复方法,故障修复平台根据故障原因生成对应的修复策略并下发给光纤机器人设备,光纤机器人设备根据指令实现对数据中心物理链路常见故障如物理断路、网络阻塞和设备宕机的修复,通过将光纤机器人设备应用于数据中心的故障修复,实现了对数据中心物理链路故障的修复。
[0013]在第二方面的第一种可能的实现方式中,上述基于故障原因,生成对应的修复策略,包括:在故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略;基于修复策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备修复所述数据中心的网络故障,包括:基于路由修复策略,下发修复指令给所述光纤机器人设备,以通过光纤机器人设备对所述数据中心的各个端口进行物理连接。
[0014]在第二方面的第二种可能的实现方式中,基于故障原因,生成对应的修复策略,包括:在故障原因为设备宕机原因的情况下,生成备用设备连接策略;基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复数据中心的网络故障,包括:基于备用设备连接策略,下发修复指令给光纤机器人设备,以通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
[0015]第三方面,本申请提供一种故障定位装置,该装置包括:数据采集模块、网络管理模块和故障定位模块。数据采集模块,用于对数据中心的网络信息进行采集和感知;网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;网络管理模块,用于对数据采集模块采集的网络信息进行特征筛选;故障定位模块,用于基于网络管理模块筛选后的数据进行网络故障检测,以定位故障原因。
[0016]在第三方面的第一种可能的实现方式中,上述网络管理模块包括:系统监控模块、日志记录模块和安全鉴权模块。其中,系统监控模块,具体用于对网络信息进行监控。日志记录模块,具体用于对网络信息进行记录并存储。安全鉴权模块,具体用于对网络信息进行安全鉴权,以基于安全鉴权结果,对所述网络信息进行特征筛选。
[0017]在第三方面的第二种可能的实现方式中,上述故障定位模块,具体用于采用反向传播BP神经网络模型,对网络管理模块筛选后的数据进行聚类计算,得到聚类结果;通过聚类结果定位所述故障原因,聚类结果与故障原因存在映射关系;其中,所述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。
[0018]在第三方面的第三种可能的实现方式中,上述装置还包括:模型训练模块。上述模型训练模块,具体用于对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为所述BP神经网络模型。
[0019]第四方面,本申请提供一种故障修复装置,该装置包括:生成模块、发送模块和修复模块;生成模块,用于基于故障原因,生成对应的修复策略;发送模块,基于修复策略下发修复指令给光纤机器人设备;修复模块,通过光纤机器人设备修复数据中心的网络故障。
[0020]在第四方面的第一种可能的实现方式中,上述修复模块,具体用于在所述故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略。上述发送模块,具体用于基于路由修复策略下发修复指令给光纤机器人设备。上述发送模块,具体用于通过光纤机器人设备对数据中心的各个端口进行物理连接。
[0021]在第四方面的第一种可能的实现方式中,上述修复模块,具体用于在所述故障原因为设备宕机原因的情况下,生成备用设备连接策略。上述发送模块,具体用于基于路由修复策略下发修复指令给光纤机器人设备。上述发送模块,具体用于通过光纤机器人设备对数据中心的备用网元设备进行跳接启用。
[0022]第五方面,本申请提供了一种计算机可读存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障定位方法,其特征在于,所述方法包括:对数据中心的网络信息进行采集和感知,所述网络信息包括以下至少一项:网络设备状态信息、端口的流量统计数据、snmp告警上报信息和协议分析信息;对所述网络信息进行数据特征筛选;基于特征筛选后的数据进行网络故障检测,以定位故障原因。2.根据权利要求1所述的方法,其特征在于,所述对所述网络信息进行数据存储和特征筛选,包括:对所述网络信息进行监控,并对所述网络信息进行记录并存储;对所述网络信息进行安全鉴权,得到安全鉴权结果;基于所述安全鉴权结果,对所述网络信息进行特征筛选。3.根据权利要求1所述的方法,其特征在于,所述基于特征筛选后的数据进行网络故障检测,以定位故障原因,包括:采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果;通过所述聚类结果定位所述故障原因,所述聚类结果与所述故障原因存在映射关系;其中,所述故障原因包括以下至少一项:物理短线原因、网络拥塞原因、设备宕机原因。4.根据权利要求3所述的方法,其特征在于,所述采用反向传播BP神经网络模型,对特征筛选后的数据进行聚类计算,得到聚类结果之前,所述方法还包括:对历史网络信息进行归一化处理;初始化BP神经网络参数,并基于归一化后所述历史网络信息进行模型训练;通过计算损失函数来判断是否找到最优隐藏层参数,以在找到最优隐藏层参数的情况下,停止模型训练,并将训练得到的模型作为所述BP神经网络模型。5.一种故障修复方法,其特征在于,所述方法包括:基于故障原因,生成对应的修复策略;基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复所述数据中心的网络故障。6.根据权利要求5所述的方法,其特征在于,所述基于所述故障原因,生成对应的修复策略,包括:在所述故障原因为物理短路原因或网络阻塞原因的情况下,生成路由修复策略;所述基于所述修复策略,下发修复指令给光纤机器人设备,以通过所述光纤机器人设备修复所述数据中心的网络故障,包括:基于所述路由修复策略,下发修复指令给所述光纤机器人设备,以...

【专利技术属性】
技术研发人员:翟锐李壮志陈亚洲侯广营张瑞磊潘峰王昊吕文琳郑维通刘爱丽王元杰
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1