【技术实现步骤摘要】
内存异常处理方法、设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种内存异常处理方法、设备及存储介质。
技术介绍
[0002]内存是计算设备的重要组成部分之一。内存异常是硬件系统最常见的异常,极大地影响了系统的可靠性,可用性和可服务性(Reliability,Availability and Serviceability,RAS)。内存控制器可以采用错误校验与校正(Error Checking and Correction,ECC)等纠错算法进行纠错。但是如果频繁纠错将会对系统的性能造成影响。而且当内存故障越来越严重的时候,纠错算法将会不堪重负,无法纠正的概率大幅上升,可能会产生不可纠正的错误,从而导致系统宕机。
[0003]内存的异常修复策略的修复能力是有限的,对于超过该异常修复策略的内存异常将无法修复,异常修复策略失效。例如,对于部分缓存线保留(Partial Cache Line Sparing,PCLS)策略,对于单个内存通道最多支持16次PCLS,当PCLS次数超过16次,PCLS对超过的次数将无法修复。
[0004]异常修复策略一般被硬编码到计算设备的基本输入输出系统(Basic Input Output System,BIOS)中,由BIOS执行相应的内存异常修复策略。BIOS执行内存异常修复策略,无法对发生异常的内存加载的程序的类型进行区分,对所有程序对应的内存异常一视同仁。这就可能导致由于BIOS对计算设备运行影响较低的程序的内存修复,而使得内存的异常修复策略无能力再 ...
【技术保护点】
【技术特征摘要】
1.一种内存异常处理方法,其特征在于,包括:获取计算设备的内存错误信息;根据所述内存错误信息,确定内存异常位置;根据所述计算设备的内存映射关系,确定所述内存异常位置加载的目标程序;在所述目标程序属于设定的程序类型的情况下,触发所述计算设备的基本输入输出系统BIOS对所述内存异常位置执行内存修复策略。2.根据权利要求1所述的方法,其特征在于,还包括:若所述目标程序为内核程序,确定所述目标程序属于设定的程序类型;若所述目标程序为应用程序,确定所述目标程序对应的内存修复优先级;若所述内存修复优先级为设定优先级,确定所述目标程序属于设定的程序类型。3.根据权利要求2所述的方法,其特征在于,所述确定所述目标程序对应的内存修复优先级,包括:根据所述目标程序的服务等级目标SLO,确定所述目标程序对应的内存修复优先级;或者,确定所述目标程序对应的用户类型,确定所述目标程序对应的内存修复优先级。4.根据权利要求1所述的方法,其特征在于,所述根据所述内存错误信息,确定内存异常位置,包括:根据所述内存修改策略支持的修复粒度,从所述内存错误信息中提取符合所述修复粒度的内存异常位置。5.根据权利要求4所述的方法,其特征在于,所述内存修复策略为部分缓存线保留PCLS策略;所述PCLS策略的修复粒度为单比特数据;所述根据所述内存修改策略支持的修复粒度,从所述内存错误信息中提取符合所述修复粒度的内存异常位置,包括:从所述内存错误信息中,提取所述计算设备的内存中发生错误的内存条的标识、发生错误的物理阵列的标识、发生错误的内存颗粒的标识、发生错误的逻辑阵列的标识及发生错误的内存行和列,作为符合所述PCLS策略的修复粒度的内存异常位置。6.根据权利要求4所述的方法,其特征在于,所述内存修复策略为自适应双设备数据校正ADDDC策略;所述ADDDC策略的修复粒度为内存颗粒;所述根据所述内存修改策略支持的修复粒度,从所述内存错误信息中提取符合所述修复粒度的内存异常位置,包括:从所述内存错误信息中,提取所述计算设备的内存中发生错误的内存条的标识、发生错误的物理阵列的标识及发生错误的内存颗粒的标识及发生错误的逻辑阵列的标识,作为符合所述ADDDC策略的修复粒度的内存异常位置。7.根据权利要求4所述的方法,其特征在于,所述内存修复策略为动态封装后修复策略;所述动态封装后修复策略的修复粒度为内存颗粒的逻辑阵列中的内存行;所述根据所述内存修改策略支持的修复粒度,从所述内存错误信息中提取符合所述修复粒度的内存异常位置,包括:从所述内存错误信息中,所述计算设备的内存中提取生错误的内存条的标识、发生错误的物理阵列的标识、发生错误的内存颗粒的标识、发生错误的逻辑阵列的标识及发生错误的行的标识,作为符合所述动态封装后修复策略的修复粒度的内存异常位置。8.根据权利要求4所述的方法,其特征在于,所述内存修复策略为单内存颗粒数据错误
纠正SDDC策略;所述SDDC策略的修复粒度为单内存颗粒错误;所述根据所述内存修改策略支持的修复粒度,从所述内存错误信息中提取符合所述修复粒度的内存异常位置,包括:从所述内存错误信息中,所述计算设备的内存中提取发生错误的内存条的标识、发生错误的物理阵列及发生错误的内存颗粒的标识,作为符合所述SDDC策略的修复粒度的内存异常位置。9.根据权利要求1所述的方法,其特征在于,所述触发所述计算设备的基本输入输出系统BIOS对所述内存异常位置执行内存修复策略,包括:通过所述计算设备的操作系统触发所述BIOS对所述内存异常位置执行内存修复策略;或者,通过所述计算设备的主板管控单元BMC触发所述BIOS对所述内存异常位置执行内存修复策略。10.根据权利要求9所述的方法,其特征在于,所述通过所述计算设备的操作系统触发所述BIOS...
【专利技术属性】
技术研发人员:曾勇,王志强,郑旭东,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。