数据中心网络故障检测方法、装置、设备及存储介质制造方法及图纸

技术编号:31451480 阅读:15 留言:0更新日期:2021-12-18 11:14
本发明专利技术公开了一种数据中心网络故障检测方法、装置、设备及存储介质。其中,该方法包括:确定网络故障为主机侧丢包故障,启动主机侧丢包故障检测流程;获取主机侧丢包故障检测流程中各子服务项的检测信息;对各子服务项的检测信息基于子服务项进行筛选,得到有效的检测信息。本发明专利技术实施例可以仅在出现主机侧丢包故障后启动主机侧丢包故障检测流程,避免在正常业务情况下对系统资源的抢占。此外,通过获取主机侧丢包故障检测流程中各子服务项的检测信息;对各子服务项的检测信息进行筛选,得到有效的检测信息;从而得到用于确定网络故障对应的故障点的检测结果,可以对主机侧丢包故障进行准确定位。行准确定位。行准确定位。

【技术实现步骤摘要】
数据中心网络故障检测方法、装置、设备及存储介质


[0001]本专利技术涉及网络故障检测
,尤其涉及一种数据中心网络故障检测方法、装置、设备及存储介质。

技术介绍

[0002]随着信息技术的发展,各种数据呈现爆炸式增长,数据中心的发展越来越迅速,网络结构也日益复杂。数据中心网络是应用于数据中心内的网络,作为数据中心各主机间信息交互的重要媒介,充当着极其重要的角色。主机间资源的池化,资源的共享,及重要配置的一致性问题,均需要一个稳定、可靠、快速的网络作为承载。数据中心的网络故障各式各样,其中,数据中心网络的丢包问题尤为突出。数据中心网络丢包问题,一旦发生,经过的网络路径上的一切组件都会被称之为故障的怀疑对象,可想而知,故障链路是非常的冗长、笨重的,单说物理硬件,就有好几种,比如路由器、交换机、网卡、光模块等。通过一些主动探测工具及丢包链路故障定位方案,可以有效的区分丢包故障的发生点是位于主机侧还是非主机侧(路由器、交换机)。然而,这往往是不够的,因为主机侧造成网络丢包的怀疑对象仍然是很冗长、很庞大的,无法解决主机侧丢包故障的定位问题。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种数据中心网络故障检测方法、装置、系统及存储介质,旨在实现对主机侧丢包故障进行准确定位。
[0004]本专利技术实施例的技术方案是这样实现的:
[0005]本专利技术实施例提供了一种数据中心网络故障检测方法,包括:
[0006]确定网络故障为主机侧丢包故障,启动主机侧丢包故障检测流程;
[0007]获取主机侧丢包故障检测流程中各子服务项的检测信息;
[0008]对各子服务项的检测信息基于子服务项进行筛选,得到有效的检测信息。
[0009]本专利技术实施例还提供了一种数据中心网络故障检测装置,包括:
[0010]启动模块,用于确定网络故障为主机侧丢包故障,启动主机侧丢包故障检测流程;
[0011]获取模块,用于获取主机侧丢包故障检测流程中各子服务项的检测信息;
[0012]筛选模块,用于对各子服务项的检测信息基于子服务项进行筛选,得到有效的检测信息。
[0013]本专利技术实施例又提供了一种数据中心网络故障检测设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器,用于运行计算机程序时,执行本专利技术实施例所述方法的步骤。
[0014]本专利技术实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现本专利技术实施例所述方法的步骤。
[0015]本专利技术实施例提供的技术方案,确定网络故障为主机侧丢包故障后,启动主机侧丢包故障检测流程,可以仅在出现主机侧丢包故障后启动主机侧丢包故障检测流程,避免
在正常业务情况下对系统资源的抢占。通过获取主机侧丢包故障检测流程中各子服务项的检测信息;对各子服务项的检测信息进行筛选,得到有效的检测信息;从而得到用于确定网络故障对应的故障点的检测结果,可以对主机侧丢包故障进行准确定位。
附图说明
[0016]图1为本专利技术实施例数据中心网络故障检测方法的流程示意图;
[0017]图2为本专利技术应用实施例数据中心网络故障检测方法的流程示意图;
[0018]图3为本专利技术实施例数据中心网络故障检测装置的结构示意图;
[0019]图4为本专利技术实施例数据中心网络故障检测设备的结构示意图。
具体实施方式
[0020]下面结合附图及实施例对本专利技术再作进一步详细的描述。
[0021]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。
[0022]相关技术中,数据中心网络的故障定位工具包括主动探测工具及丢包故障定位算法,虽然可以有效的区分丢包故障的故障点(又称为怀疑对象)是位于主机侧还是非主机侧,但无法满足更详尽的故障定位问题。比如,故障定位工具即使已经将怀疑对象定位到了主机侧,然而,主机侧网络经过的路径仍然很冗长,故障定位工具无法判断丢包发生的阶段。举个例子,针对TCP(Transmission Control Protocol,传输控制协议)OSI(Open System Interconnect,开放系统互联)七层协议(应用层、表示层、会话层、传输层、网络层、链路层、物理层),如何判断丢包故障发生在哪一层成为了当下故障定位的痛点问题。
[0023]此外,当前的故障定位工具,和协议强相关,比如ping只能检测ICMP(Internet Control Message Protocol,Internet控制报文协议)的网络问题,arping只能检测ARP(Address Resolution Protocol,地址解析协议)的网络问题。假设数据中心中丢包的故障,对各协议都有效(比如TCP、UDP、ICMP、ARP等协议均会有丢包现象),则需依赖多个定位工具进行排障,工具依赖性会导致排障的过程非常的繁琐,极大的降低了自动化排障的可能。
[0024]基于此,在本专利技术的各种实施例中,确定网络故障为主机侧丢包故障后,启动主机侧丢包故障检测流程,获取主机侧丢包故障检测流程中各子服务项的检测信息,对各子服务项的检测信息进行筛选,得到有效的检测信息;从而得到用于确定网络故障对应的故障点的检测结果,可以对主机侧丢包故障进行准确定位。此外,本专利技术实施例的主机侧丢包故障检测流程由于牵涉的定位工具种类多,资源消耗(比如cpu、内存、网络流量等)相对于主动探测工具较高,本专利技术实施例基于特定条件(即确定网络故障为主机侧丢包故障)启动主机侧丢包故障检测流程,由于网络问题出现时,对资源的忍让度是比较宽松的,此时定位工具可以利用多一些系统的资源,从而有效的隔离了在正常业务情况下对系统资源的抢占。
[0025]本专利技术实施例提供了一种数据中心网络故障检测方法,应用于数据中心网络故障检测设备,如图1所示,该方法包括:
[0026]步骤101,确定网络故障为主机侧丢包故障,启动主机侧丢包故障检测流程。
[0027]这里,数据中心网络故障检测设备可以基于主动探测工具及丢包故障定位算法,判断网络故障是否为丢包故障及故障现象发生位置是否在主机侧,若确定网络故障为丢包故障且网络故障位于主机侧,则确定存在主机侧丢包故障,启动主机侧丢包故障检测流程。其中,主动探测工具可以携带不同协议的数据包探针,做端到端探测,根据端到端探测的结果确定网络故障是否为丢包故障。丢包故障定位算法可以根据数据包路径定位故障点是否位于交换机、路由器或者主机侧,从而确定网络故障是否位于主机侧。
[0028]步骤102,获取主机侧丢包故障检测流程中各子服务项的检测信息。
[0029]这里,数据中心网络故障检测设备依赖多种定位工具启动主机侧丢包故障检测流程。实际应用中,可以将主机侧丢包故障检测流程依赖的多种定位工具称为工具集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心网络故障检测方法,其特征在于,包括:确定网络故障为主机侧丢包故障,启动主机侧丢包故障检测流程;获取主机侧丢包故障检测流程中各子服务项的检测信息;对各子服务项的检测信息基于子服务项进行筛选,得到有效的检测信息。2.根据权利要求1所述的方法,其特征在于,所述获取主机侧丢包故障检测流程中各子服务项的检测信息,包括以下至少之一:获取主机侧丢包故障检测流程中协议分类排障流程对应的检测信息;获取主机侧丢包故障检测流程中器件级排障流程对应的检测信息;获取主机侧丢包故障检测流程中网络堆栈检测流程对应的检测信息。3.根据权利要求2所述的方法,其特征在于,所述获取主机侧丢包故障检测流程中协议分类排障流程对应的检测信息,包括:基于开源工具和/或厂商工具获取目标协议的子服务项的检测信息,所述目标协议包括以下至少之一:传输控制协议TCP、用户数据报协议UDP、因特网控制报文协议ICMP、地址解析协议ARP及远程直接数据存取RDMA协议。4.根据权利要求2所述的方法,其特征在于,所述获取主机侧丢包故障检测流程中器件级排障流程对应的检测信息,包括:基于开源工具和/或厂商工具获取网卡、网口、光模块中的至少一个的子服务项的检测信息。5.根据权利要求2所述的方法,其特征在于,所述获取主机侧丢包故障检测流程中网络堆栈检测流程对应的检测信息,包括:基于开源工具和/或厂商工具获取开放系统互联OSI参考模型的七层的子服务项的检测信息。6.根据权利要求1所述的方法,其特征在于,所述对各子服务项的检测信息基于子服务项进行筛选,得到有效的检测信息,包括:对各子服务项的检测信息基于级联性分析、同质性过滤、相似性归一、基于规则判定及基于阈值判定中的至少一种进行筛选,得到有效的检测信息;其中,所述级联性分析用于对子服务项属于级联关系的多个检测信息进行筛选;所述同质性过滤用于对子服务项属于同质关系的多个检测信息进行筛选;所述相似性归一用于对子服务项属于相似故障类别的多个检测信息进行筛选;所述基于规则判定用于基于设定的规则对子服务项的...

【专利技术属性】
技术研发人员:曹紫莹李诗逸古亮
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1