System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 故障设备的确定方法和装置、存储介质及电子设备制造方法及图纸_技高网

故障设备的确定方法和装置、存储介质及电子设备制造方法及图纸

技术编号:40319234 阅读:12 留言:0更新日期:2024-02-07 21:02
本申请实施例提供了一种故障设备的确定方法和装置、存储介质及电子设备,其中,该故障设备的确定方法包括:获取目标故障设备的目标设备标识;在预设的N+M个链路信息中查找包括目标设备标识的链路信息;在N+M个链路信息中查找到包括目标设备标识的第j个链路信息、且第j个链路信息中的第j个指示信息表示处理器到第j个连接设备所形成的第j条设备链路上存在第一交换机的情况下,确定在第j条设备链路上目标故障设备是否位于处理器与第一交换机之间;在目标故障设备不位于处理器与第一交换机之间的情况下,根据预设的记录项信息和目标设备标识,确定目标故障设备是否是交换机板上的设备。

【技术实现步骤摘要】

本申请实施例涉及计算机领域,具体而言,涉及一种故障设备的确定方法和装置、存储介质及电子设备


技术介绍

1、基本输入输出系统(basic input and output system,简称为bios),它是一组固化到计算机内主板上的一个rom芯片上的程序,它保存着计算机最重要的开机上电自检、硬件初始化程序和系统底层的服务程序等。pcie是一种高速串行总线技术,用于连接计算机主板和其他设备,如显卡、网盘、nvme盘、gpu等。pcie设备通常具有更高的数据传输速度和带宽,相比于传统的pci总线,可以提供更好的性能和扩展能力。在pcie深度优先算法中,secbus(secondary bus)通常被称为“次级总线”,用于标识pcie总线中的交换机的编号或标识。每个交换机都会有一个唯一的secbus编号。subbus(subordinate bus)通常被称为“从属总线”,用于标识pcie总线中的设备的编号或标识。当一个交换机下面连接了多个设备时,每个设备都会有一个唯一的subbus编号。总结起来,secbus用于标识交换机,而subbus用于标识设备。这两个概念在pcie深度优先算法中被用来确定pice总线上各个设备和交换机之间的层次关系,以便实现数据传输和管理。bmc是baseboard managementcontroller(主板管理控制器)的缩写,是一种位于计算机主板上的独立芯片或集成电路,用于监控和管理计算机系统的硬件和软件。

2、现有技术中对普通机型和普通pcie的设备故障定位能做到准确定位,但对带有switch板的ai机型就定位不够准确,往往只能定位到主板上的丝印或者定位不出来,而不能直接定位到switch板上的丝印。对于带有很多个虚拟网口的智能网卡由于bmc存储和处理能力有限,当智能网卡某个虚拟网卡(bdf)发生故障时也经常定位不出来是哪个设备报错。由于不能准确定位导致一些场景下不方便运维人员快速维修。

3、针对相关技术中,现有技术对普通pcie的设备故障定位能够做到准确定位,但对带有switch(交换机)板的ai机型的设备故障定位不够准确的技术问题,尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种故障设备的确定方法和装置、存储介质及电子设备,以至少解决相关技术中,现有技术对普通pcie的设备故障定位能够做到准确定位,但对带有switch板(交换机板)的ai机型的设备故障定位不够准确的问题。

2、根据本申请的一个实施例,提供了一种故障设备的确定方法,包括:获取目标故障设备的目标设备标识;在预设的n+m个链路信息中查找包括所述目标设备标识的链路信息,其中,所述n+m个链路信息与n+m个连接设备具有一一对应的关系,所述n+m个连接设备包括主板上的n个连接设备和交换机板上的m个连接设备,所述m个连接设备中的每个连接设备与所述交换机板上的p个交换机中的一个交换机连接,所述n+m个链路信息中的第i个链路信息包括从所述主板上的处理器到第i个连接设备所形成的第i条设备链路上的多个设备的设备标识,n、m和p均为正整数,i和j为小于或等于n+m的正整数;在所述n+m个链路信息中查找到包括所述目标设备标识的第j个链路信息、且所述第j个链路信息中的第j个指示信息表示所述处理器到第j个连接设备所形成的第j条设备链路上存在第一交换机的情况下,确定在所述第j条设备链路上所述目标故障设备是否位于所述处理器与所述第一交换机之间,其中,所述p个交换机包括所述第一交换机;在所述目标故障设备不位于所述处理器与所述第一交换机之间的情况下,根据预设的记录项信息和所述目标设备标识,确定所述目标故障设备是否是所述交换机板上的设备,其中,所述记录项信息中包括所述p个交换机中的每个交换机的设备标识。

3、在一个示例性实施例中,在所述预设的n+m个链路信息中查找包括所述目标设备标识的链路信息之后,所述方法还包括:在所述n+m个链路信息中查找到包括所述目标设备标识的所述第j个链路信息、且所述第j个指示信息表示所述第j条设备链路上不包括所述第一交换机的情况下,确定所述目标故障设备是所述主板上的设备。

4、在一个示例性实施例中,所述确定在所述第j条设备链路上所述目标故障设备是否位于所述处理器与所述第一交换机之间之后,所述方法还包括:在所述目标故障设备位于所述处理器与所述第一交换机之间的情况下,确定所述目标故障设备是所述主板上的设备。

5、在一个示例性实施例中,所述确定在所述第j条设备链路上所述目标故障设备是否位于所述处理器与所述第一交换机之间,包括:在所述第j个链路信息中所述目标设备标识位于所述处理器的设备标识与所述第一交换机的设备标识之间的情况下,确定在所述第j条设备链路上所述目标故障设备位于所述处理器与所述第一交换机之间。

6、在一个示例性实施例中,所述根据预设的记录项信息和所述目标设备标识,确定所述目标故障设备是否是所述交换机板上的设备,包括:在所述记录项信息中查找包括所述目标设备标识的记录项,其中,所述记录项信息中包括p个记录项,所述p个记录项中的第k个记录项包括所述p个交换机中的第k个交换机的设备标识,k为小于或等于p的正整数;在所述记录项信息中查找到包括所述目标设备标识的第p个记录项的情况下,确定所述目标故障设备是所述交换机板上的设备、且所述目标故障设备是所述p个交换机中的一个交换机,其中,p为小于或等于p的正整数,所述第p个记录项中包括的所述p个交换机中的第p个交换机的设备标识与所述目标设备标识相等。

7、在一个示例性实施例中,所述根据预设的记录项信息和所述目标设备标识,确定所述目标故障设备是否是所述交换机板上的设备,包括:根据所述记录项信息中包括的所述p个交换机对应的p个次级总线编号和p个从属总线编号,确定p个总线编号范围,其中,所述记录项信息中包括p个记录项,所述p个记录项中的第k个记录项包括所述p个交换机中的第k个交换机的设备标识以及所述第k个交换机的次级总线编号和从属总线编号,k为小于或等于p的正整数,所述p个总线编号范围中的第k个总线编号范围的最小值为所述第k个交换机的次级总线编号,所述第k个总线编号范围的最大值为所述第k个交换机的从属总线编号;确定所述目标设备标识是否位于所述p个总线编号范围中;在确定所述目标设备标识位于所述p个总线编号范围中的一个总线编号范围中的情况下,确定所述目标故障设备是所述交换机板上的所述m个连接设备中的连接设备。

8、在一个示例性实施例中,在所述确定所述目标设备标识是否位于所述p个总线编号范围中之后,所述方法包括:在确定所述目标设备标识不位于所述p个总线编号范围中的各个总线编号范围中的情况下,根据所述n+m个链路信息中包括的所述n+m个连接设备对应的n+m个次级总线编号和n+m个从属总线编号,确定n+m个总线编号范围,其中,所述n+m个链路信息中的第i个链路信息还包括所述第i个连接设备所在的根端口的次级总线编号和从属总线编号,所述n+m个总线编号范围中的第i个总线编号范围的最小本文档来自技高网...

【技术保护点】

1.一种故障设备的确定方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求1所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.根据权利要求1所述的方法,其特征在于,

10.根据权利要求1至9中任一项所述的方法,其特征在于,

11.根据权利要求1至9中任一项所述的方法,其特征在于,

12.根据权利要求11所述的方法,其特征在于,

13.根据权利要求2、3、6和7中任一项所述的方法,其特征在于,

14.根据权利要求13所述的方法,其特征在于,

15.根据权利要求1至9中任一项所述的方法,其特征在于,

16.根据权利要求15所述的方法,其特征在于,

17.根据权利要求15所述的方法,其特征在于,

18.根据权利要求1至9中任一项所述的方法,其特征在于,

19.根据权利要求18所述的方法,其特征在于,

20.一种故障设备的确定装置,其特征在于,

21.一种计算机可读存储介质,其特征在于,

22.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,

...

【技术特征摘要】

1.一种故障设备的确定方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求1所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.根据权利要求1所述的方法,其特征在于,

10.根据权利要求1至9中任一项所述的方法,其特征在于,

11.根据权利要求1至9中任一项所述的方法,其特征在于,

12.根据权利要求11所述的方法,其特征在于,<...

【专利技术属性】
技术研发人员:唐建亮陈鹏芦飞孙秀强
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1