故障处理方法、装置、通信设备及存储介质制造方法及图纸

技术编号:38026090 阅读:7 留言:0更新日期:2023-06-30 10:52
本发明专利技术实施例提供了一种故障处理方法、装置、通信设备及存储介质,该方法包括:通过在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使内存触发SMI,CPU进入SMM;在检测到CPU退出SMM的情况下,标志位置位且在阈值记录模块中记录目标故障内存信息对应的故障次数;在检测到故障次数达到预设阈值,且第二内存状态信息为目标故障内存信息的情况下,向CPU发送SMM退出命令。本发明专利技术实施例中,通过在SMI处理机制中增加标识位和阈值记录内存触发SMI的次数,当超过阈值次数,自动屏蔽内存触发的SMI,不再进入SMM模式,解决了相同内存错误引起的频繁进入SMM模式导致系统性能降低的问题。式导致系统性能降低的问题。式导致系统性能降低的问题。

【技术实现步骤摘要】
故障处理方法、装置、通信设备及存储介质


[0001]本专利技术涉及物料管理领域,特别涉及一种故障处理方法、装置、通信设备及存储介质。

技术介绍

[0002]当前在分布式服务器应用场景中,有大量的资产信息需要时时监控健康状况,及时反馈给BMC或客户交互系统,提示客户及时处理。
[0003]现有技术中,当有内存错误产生时,硬件通过指令触发SMI(System Management Interruption,系统管理中断)中断,触发CPU挂起当前的进程保存当前的状态,使BIOS(Basic Input Output System,基本输入输出系统)进入SMM(System Management Mode,系统管理模式)处理模式,此时CPU处于独立的操作环境系统级别的中断将会被关闭,在BIOS处理完内存错误信息的上报后,退出保护模式,然后恢复CPU进入SMI中断的位置的状态和程序继续执行,然而针对该方案在实际开发和使用过程中,会因为内存错误导致频繁触发SMI中断进入SMM模式处理程序,从而导致CPU会被SMM模式独占,所有软硬件中断处理暂停,系统OS会被挂起,频繁进入SMM模式会导致系统性能降低。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种故障处理方法、装置、通信设备及存储介质,解决当内存错误频繁触发SMI中断进入SMM模式,在SMI处理机制中时间过长导致系统性能降低的问题,具体技术方案如下:
[0005]在本专利技术实施的第一方面,首先提供了一种故障处理方法,应用于基本输入输出系统BIOS,所述BIOS包括阈值记录模块,所述方法包括:
[0006]在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM;
[0007]在检测到所述CPU退出所述SMM的情况下,标志位置位且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数;
[0008]在检测到所述故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,向所述CPU发送SMM退出命令。
[0009]可选地,所述在检测到所述故障次数达到预设阈值的情况下,向所述CPU发送SMM退出命令包括:
[0010]在检测到所述目标故障内存信息对应的故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,记录所述目标故障内存信息,并基于所述目标故障内存信息设置SMI标识寄存器,其中,所述SMI标识寄存器控制所述CPU屏蔽SMM。
[0011]可选地,在所述在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM的步骤之前,所述方法包括:
[0012]对服务器内存状态进行实时检测,获取第一内存状态信息。
[0013]可选地,在所述在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM的步骤之后,所述方法包括:
[0014]向基板管理控制器BMC上报所述目标故障内存信息对应的处理程序,以使BMC记录所述目标故障内存信息。
[0015]可选地,所述在检测到所述CPU退出所述SMM的情况下,标志位置位且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数包括:
[0016]当所述SMI对应的处理程序完成故障处理时,向所述CPU发送执行恢复指令,以使所述CPU退出所述SMM;
[0017]根据预先设置的标志位函数和所述执行恢复指令控制标志位置位,并且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数。
[0018]可选地,所述在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM包括:
[0019]在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发所述SMI,CPU进入所述SMM,所述CPU挂起当前任务进程并且保存当前任务状态。
[0020]可选地,所述第二内存状态信息为所述目标故障内存信息包括:
[0021]根据预先设置的标志位函数判断所述第二内存状态信息是否和所述第一内存状态信息相同;
[0022]若相同,则确定所述第二内存状态信息为所述目标故障内存信息。
[0023]在本专利技术实施的第二方面,还提供了一种故障处理装置,所述装置包括:
[0024]触发模块,用于在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM;
[0025]记录模块,用于在检测到所述CPU退出所述SMM的情况下,标志位置位且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数;
[0026]发送模块,用于在检测到所述故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,向所述CPU发送SMM退出命令。
[0027]可选地,所述发送模块包括:
[0028]第一发送子模块,用于在检测到所述目标故障内存信息对应的故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,记录所述目标故障内存信息,并基于所述目标故障内存信息设置SMI标识寄存器,其中,所述SMI标识寄存器控制所述CPU屏蔽SMM。
[0029]可选地,所述装置还包括:
[0030]获取模块,用于对服务器内存状态进行实时检测,获取第一内存状态信息。
[0031]可选地,所述装置还包括:
[0032]上报模块,用于向基板管理控制器BMC上报所述目标故障内存信息对应的处理程序,以使BMC记录所述目标故障内存信息。
[0033]可选地,所述记录模块包括:
[0034]第一记录子模块,用于当所述SMI对应的处理程序完成故障处理时,向所述CPU发送执行恢复指令,以使所述CPU退出所述SMM;
[0035]第二记录子模块,用于根据预先设置的标志位函数和所述执行恢复指令控制标志位置位,并且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数。
[0036]可选地,所述发送模块包括:
[0037]第二发送子模块,用于在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发所述SMI,CPU进入所述SMM,所述CPU挂起当前任务进程并且保存当前任务状态。
[0038]可选地,所述发送模块包括:
[0039]第三发送子模块,用于根据预先设置的标志位函数判断所述第二内存状态信息是否和所述第一内存状态信息相同;
[0040]第四发送子模块,用于若相同,则确定所述第二内存状态信息为所述目标故障内存信息。
[0041]在本专利技术实施的第三方面,还提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障处理方法,其特征在于,应用于基本输入输出系统BIOS,所述BIOS包括阈值记录模块,所述方法包括:在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM;在检测到所述CPU退出所述SMM的情况下,标志位置位且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数;在检测到所述故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,向所述CPU发送SMM退出命令。2.根据权利要求1所述的方法,其特征在于,所述在检测到所述故障次数达到预设阈值的情况下,向所述CPU发送SMM退出命令包括:在检测到所述目标故障内存信息对应的故障次数达到预设阈值,且第二内存状态信息为所述目标故障内存信息的情况下,记录所述目标故障内存信息,并基于所述目标故障内存信息设置SMI标识寄存器,其中,所述SMI标识寄存器控制所述CPU屏蔽SMM。3.根据权利要求1所述的方法,其特征在于,在所述在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM的步骤之前,所述方法包括:对服务器内存状态进行实时检测,获取第一内存状态信息。4.根据权利要求1所述的方法,其特征在于,在所述在检测到第一内存状态信息为目标故障内存信息的情况下,向内存发送中断指令,以使所述内存触发系统管理中断SMI,CPU进入系统管理模式SMM的步骤之后,所述方法包括:向基板管理控制器BMC上报所述目标故障内存信息对应的处理程序,以使BMC记录所述目标故障内存信息。5.根据权利要求1所述的方法,其特征在于,所述在检测到所述CPU退出所述SMM的情况下,标志位置位且在所述阈值记录模块中记录所述目标故障内存信息对应的故障次数包括:当所述SMI对应的处理程序完成故障处理时,向所...

【专利技术属性】
技术研发人员:王建芦飞陈鹏
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1