故障检测方法及计算机设备技术

技术编号:37434410 阅读:9 留言:0更新日期:2023-05-06 09:06
本申请提供了一种故障检测方法及计算机设备,涉及计算机技术领域。方法包括:获取故障信息表,故障信息表用于指示多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个硬件的故障信息;根据故障信息表,获取第一硬件对应的寄存器反馈的第一硬件的故障信息,第一硬件的故障信息存储于第一硬件对应的寄存器,第一硬件为多个硬件中任意一个硬件。由于故障信息表是根据用户指示生成的,故障信息表中包括了服务器的多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个硬件的故障信息。因此在进行故障检测时,可以根据故障信息表确定硬件对应的寄存器,通过对应的寄存器得到全部故障信息,可以有效提高故障检测的效率。测的效率。测的效率。

【技术实现步骤摘要】
故障检测方法及计算机设备


[0001]本申请涉及计算机
,特别是涉及一种故障检测方法及计算机设备。

技术介绍

[0002]目前,服务器启动过程中自行进行故障检测。例如,基本输入输出系统(basic input output system,BIOS)预先配置寄存器,寄存器存储有服务器中硬件的故障信息。但是,随着用户日益增加的故障诊断需求,在服务器检测到故障时,预先配置的寄存器无法识别出服务器新增的故障,进而导致硬件的部分故障检测失败。因此,如何成功检测服务器的故障是目前亟需解决的问题。

技术实现思路

[0003]本申请提供一种故障检测方法及计算机设备,解决了如何成功检测服务器的故障的问题。
[0004]第一方面,提供了一种故障检测的方法,方法包括:获取故障信息表,故障信息表用于指示多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个硬件的故障信息;根据故障信息表,获取第一硬件对应的寄存器反馈的第一硬件的故障信息,第一硬件的故障信息存储于第一硬件对应的寄存器,第一硬件为多个硬件中任意一个硬件。
[0005]处理器从管理控制器获取的故障信息表是根据用户指示生成的,故障信息表中包括了服务器的多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个硬件的故障信息。因此在进行故障检测时,可以根据故障信息表确定故障的硬件对应的寄存器,并通过对应的寄存器得到故障硬件的全部故障信息,可以有效提高故障检测的效率。换言之,本申请实施例可以通过故障信息表获取用户增加的故障诊断需求,能够保证故障检测的质量,确保需要检测的故障均被检测到,还能有效提高故障检测效率。
[0006]结合第一方面,在一种可能的实现方式中,获取故障信息表和标志位,标志位用于校验故障信息表;当故障信息表校验成功时,获取第一硬件对应的寄存器反馈的第一硬件的故障信息。
[0007]故障信息表的标志位可以用于校验处理器从管理控制器获取的故障信息表是否被篡改,当故障信息表校验成功时,表示获取的故障信息表未被篡改,可以使用该故障信息表获取第一硬件的故障信息。当故障信息表校验失败时,表示获取的故障信息表被篡改,不可以使用改故障信息表获取第一硬件对应的寄存器反馈的第一硬件的故障信息,进而避免使用被篡改的故障信息表检测第一硬件的故障,导致检测结果错误。
[0008]结合第一方面,在另一种可能的实现方式中,判断故障信息表与存储于计算机设备的第一故障信息表是否一致;当不一致时,将故障信息表更新至计算机设备中。
[0009]当故障信息表中第一硬件对应的寄存器反馈的第一硬件的故障信息与存储于第一硬件对应的寄存器的故障信息一致时,无需将故障信息表中第一硬件对应的寄存器反馈的第一硬件的故障信息更新至第一硬件对应的寄存器中,可以简化检测过程,提高检测效
率。
[0010]结合第一方面,在另一种可能的实现方式中,故障信息表还包括寄存器的信息,寄存器的信息包括寄存器类型、寄存器位宽和寄存器参数。
[0011]故障信息表中包括不同的寄存器,不同的寄存器存储有不同硬件的故障信息,在不同的寄存器中存储不同的硬件的故障信息时,需要考虑寄存器的寄存器类型、寄存器位宽、寄存器参数,进而区分不同的寄存器存储不同的故障信息。
[0012]第二方面,提供了一种故障检测的方法,计算机设备包括管理控制器和处理器,方法由管理控制器执行,方法包括:生成多个硬件和寄存器的对应关系,形成故障信息表,每个硬件对应的寄存器关联至少一个硬件的故障信息;将故障信息表发送给处理器。
[0013]由于故障信息表是管理控制器根据用户指示生成的,因此可以根据用户需求动态配置故障信息表,使得故障信息表中包括的寄存器关联了硬件的所有故障信息,进而提升故障检测的效率,缩短故障检测的时间。
[0014]结合第二方面,在一种可能的实现方式中,根据用户指示第一硬件的故障信息,更新第一硬件的对应的寄存器关联故障信息,得到更新后对应关系,第一硬件为多个硬件中任意一个硬件;将更新后对应关系发送给处理器。
[0015]用户可以根据故障诊断需求在管理控制器中配置故障信息表,动态增加寄存器中存储的故障信息。由于管理控制器是完全独立于计算机设备的操作系统,因此在更新管理控制器中的故障信息表时,不会影响计算机设备操作系统的运行,无需重启计算机设备,进而缩短故障检测时间,提高故障检测效率。
[0016]第三方面,提供一种故障检测装置,故障检测装置包括获取模块。
[0017]获取模块用于获取故障信息表,故障信息表用于指示多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个硬件的故障信息。
[0018]获取模块还用于根据故障信息表,获取第一硬件对应的寄存器反馈的第一硬件的故障信息,第一硬件的故障信息存储于第一硬件对应的寄存器,第一硬件为多个硬件中任意一个硬件。
[0019]结合第三方面,在一种可能的实现方式中,获取模块具体用于获取故障信息表和标志位,标志位用于校验故障信息表;当故障信息表校验成功时,获取第一硬件对应的寄存器反馈的第一硬件的故障信息。
[0020]结合第三方面,在另一种可能的实现方式中,获取模块还用于判断故障信息表与存储于计算机设备的第一故障信息表是否一致;当不一致时,将故障信息表更新至计算机设备中。
[0021]第四方面,提供一种故障检测装置,故障检测装置包括生成模块和发送模块。
[0022]配置模块用于生成多个硬件和寄存器的对应关系,形成故障信息表,每个硬件对应的寄存器关联至少一个硬件的故障信息。
[0023]发送模块用于将故障信息表发送给处理器。
[0024]结合第四方面,在一种可能的实现方式中,配置模块还用于根据用户指示第一硬件的故障信息,更新第一硬件的对应的寄存器关联故障信息,得到更新后对应关系,第一硬件为多个硬件中任意一个硬件;将更新后对应关系发送给处理器。
[0025]第五方面,提供一种服务器,服务器包括管理控制器和处理器和存储器。管理控制
器用于生成多个硬件和寄存器的对应关系,形成故障信息表,每个硬件对应的寄存器关联至少一个硬件的故障信息,将多个硬件和寄存器的对应关系配置到处理器;管理控制器执行一组计算机指令时,执行第二方面或第二方面任一种可能实现方式中的方法的各个模块的功能。处理器用于获取故障信息表;根据故障信息表,获取第一硬件对应的寄存器反馈的第一硬件的故障信息,第一硬件的故障信息存储于第一硬件对应的寄存器,第一硬件为多个硬件中任意一个硬件;处理器执行一组计算机指令时,执行第一方面或第一方面任一种可能实现方式中的方法的各个模块的功能。
[0026]第六方面,提供一种计算机可读存储介质,包括计算机软件指令;当计算机软件指令在计算机中运行时,使得计算机执行如第一方面或第一方面可能的实现方式中任一项所述的方法。
[0027]第七方面,提供一种计算机可读存储介质,包括计算机软件指令;当计算机软件指令在计算机中运行时,使得计算机执行如第二方面或第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障检测方法,其特征在于,包括:获取故障信息表,所述故障信息表用于指示多个硬件和寄存器的对应关系,每个硬件对应的寄存器关联至少一个所述硬件的故障信息;根据所述故障信息表,获取第一硬件对应的寄存器反馈的所述第一硬件的故障信息,所述第一硬件的故障信息存储于所述第一硬件对应的寄存器,所述第一硬件为所述多个硬件中任意一个硬件。2.根据权利要求1所述的方法,其特征在于,获取故障信息表,包括:获取所述故障信息表和标志位,所述标志位用于校验所述故障信息表;当所述故障信息表校验成功时,获取第一硬件对应的寄存器反馈的所述第一硬件的故障信息。3.根据权利要求1或2所述的方法,其特征在于,应用于计算机设备,所述方法还包括:判断所述故障信息表与存储于所述计算机设备的第一故障信息表是否一致;当不一致时,将所述故障信息表更新至所述计算机设备中。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述故障信息表还包括所述寄存器的信息,所述寄存器的信息包括寄存器类型、寄存器位宽和寄存器参数。5.一种故障检测方法,其特征在于,计算机设备包括管理控制器和处理器,所述方法由管理控制器执行,所述方法包括:生成多个硬件和寄存器的对应关系,形成故障信息表,每个硬件对应的寄存器关联至少一个所述硬件的故障信息;将所述故障信息表发送给所述处理器。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据用户指示第一硬件的故障信息,更新所述第一硬件...

【专利技术属性】
技术研发人员:陈刚
申请(专利权)人:超聚变数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1