System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种带宽故障检测方法、装置、设备及机器可读存储介质制造方法及图纸_技高网

一种带宽故障检测方法、装置、设备及机器可读存储介质制造方法及图纸

技术编号:41392551 阅读:4 留言:0更新日期:2024-05-20 19:15
本公开提供一种带宽故障检测方法、装置、设备及机器可读存储介质,该方法包括:获取包括于服务器的目标设备的当前连接带宽数据,根据预设目标值判断所述当前连接带宽数据是否达到预期;获取目标设备对应的PCIe bus号;按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置;根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置。通过本公开的技术方案,自动化地检测目标设备是否发生降带宽故障及故障可能发生的大致位置,并进一步排查该位置中是否存在异常状态以得到故障检测结果和/或故障发生位置,检测准确且效率高,节约人力并提高用户体验。

【技术实现步骤摘要】

本公开涉及通信,尤其是涉及一种带宽故障检测方法、装置、设备及机器可读存储介质


技术介绍

1、服务器设备在项目验收测试阶段中经常出现各种各样的降带宽现象,一方面是设备运输过程中颠簸导致线缆松动,另一方面是设备组件物理状态出现故障。目前比较常用的排查手段较为传统,过度依赖于现场运维人员的经验,手工验证过程较为机械化。

2、对于大型服务器验收场景,当出现多台设备降带宽且运维人员不足的情况下是十分严重的,会带来运维人员大量的人力时间成本投入以及削弱用户对该服务器体验。


技术实现思路

1、有鉴于此,本公开提供一种带宽故障检测方法、装置及电子设备、机器可读存储介质,以改善上述目标设备降带宽故障检测困难的问题。

2、具体地技术方案如下:

3、本公开提供了一种带宽故障检测方法,应用于服务器,所述方法包括:获取包括于服务器的目标设备的当前连接带宽数据,根据预设目标值判断所述当前连接带宽数据是否达到预期;响应于关联于所述目标设备的连接带宽未达预期的事件,获取目标设备对应的pcie bus号;根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置;根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置。

4、作为一种技术方案,所述根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置,包括:根据预设关键点划分数据链路为若干划分段,逐段获取当前划分段的当前带宽数据,比对获取与理论带宽值的比较关系,根据比较关系确认起始降带宽位置。

5、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是cpu部分的事件,确认待排查的目标cpu,获取目标cpu的出厂检测图,获取标准cpu的ocr识别图,比对所述出厂检测图和所述ocr识别图,排查出厂检测图相较于ocr识别图是否存在异常状态,根据排查结果确认故障位置。

6、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是cpu到switch板的链路的事件,根据预设bus顺序和槽位的映射关系,确认存在异常状态的线缆,排查该线缆并根据排查结果确认故障位置。

7、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是switch到中置背板的链路的事件,根据ocr图像比对switch到中置背板的连接件当前状态与出厂状态,根据比对结果排查连接件当前是否存在异常,根据排查结果确认故障位置。

8、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是中置背板到目标设备模组的链路的事件,根据ocr图像比对中置背板到目标设备模组的连接件当前状态与出厂状态,根据比对结果排查连接件当前是否存在异常,根据排查结果确认故障位置。

9、本公开同时提供了一种带宽故障检测装置,应用于服务器,所述装置包括:第一模块,用于获取包括于服务器的目标设备的当前连接带宽数据,根据预设目标值判断所述当前连接带宽数据是否达到预期;第二模块,用于响应于关联于所述目标设备的连接带宽未达预期的事件,获取目标设备对应的pcie bus号,根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置;第三模块,用于根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置。

10、作为一种技术方案,所述根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置,包括:根据预设关键点划分数据链路为若干划分段,逐段获取当前划分段的当前带宽数据,比对获取与理论带宽值的比较关系,根据比较关系确认起始降带宽位置。

11、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是cpu部分的事件,确认待排查的目标cpu,获取目标cpu的出厂检测图,获取标准cpu的ocr识别图,比对所述出厂检测图和所述ocr识别图,排查出厂检测图相较于ocr识别图是否存在异常状态,根据排查结果确认故障位置。

12、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是cpu到switch板的链路的事件,根据预设bus顺序和槽位的映射关系,确认存在异常状态的线缆,排查该线缆并根据排查结果确认故障位置。

13、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是switch到中置背板的链路的事件,根据ocr图像比对switch到中置背板的连接件当前状态与出厂状态,根据比对结果排查连接件当前是否存在异常,根据排查结果确认故障位置。

14、作为一种技术方案,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:响应于确认起始降带宽位置是中置背板到目标设备模组的链路的事件,根据ocr图像比对中置背板到目标设备模组的连接件当前状态与出厂状态,根据比对结果排查连接件当前是否存在异常,根据排查结果确认故障位置。

15、本公开同时提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的带宽故障检测方法。

16、本公开同时提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的带宽故障检测方法。

17、本公开提供的上述技术方案至少带来了以下有益效果:

18、自动化地检测目标设备是否发生降带宽故障及故障可能发生的大致位置,并进一步排查该位置中是否存在异常状态以得到故障检测结果和/或故障发生位置,检测准确且效率高,节约人力并提高用户体验。

本文档来自技高网...

【技术保护点】

1.一种带宽故障检测方法,其特征在于,应用于服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据PCIe bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

7.一种带宽故障检测装置,其特征在于,应用于服务器,所述装置包括:

8.根据权利要求7所述的装置,其特征在于,所述根据PCIe bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置,包括:

9.根据权利要求7所述的装置,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

10.根据权利要求7所述的装置,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

11.根据权利要求7所述的装置,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

12.根据权利要求7所述的装置,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

13.一种电子设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令,以实现权利要求1-6任一所述的方法。

14.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现权利要求1-6任一所述的方法。

...

【技术特征摘要】

1.一种带宽故障检测方法,其特征在于,应用于服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与理论带宽值的比较关系,根据比较关系确认起始降带宽位置,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据起始降带宽位置,按照预设规则排查异常状态,根据排查结果确认故障位置,包括:

7.一种带宽故障检测装置,其特征在于,应用于服务器,所述装置包括:

8.根据权利要求7所述的装置,其特征在于,所述根据pcie bus号在关联的数据链路上按照预设划分段,逐段获取当前带宽数据与...

【专利技术属性】
技术研发人员:鲍闯邱秀梅李于川
申请(专利权)人:新华三信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1