可从不可校正的存储器错误恢复的虚拟机制造技术

技术编号:35892745 阅读:17 留言:0更新日期:2022-12-10 10:24
所公开技术提供了用于在分布式计算环境中遏制不可校正的存储器错误和从不可校正的存储器错误恢复的技术、系统和装置。所公开技术的一个方面包括接收由主机机器检测到的不可校正的存储器错误的信令的管理程序或虚拟机管理器。虚拟机管理器然后使用经由信令接收的信息来识别与损坏的存储器元件相关联的虚拟存储器地址或存储器页面,以允许遏制错误和从错误恢复。从错误恢复。从错误恢复。

【技术实现步骤摘要】
【国外来华专利技术】可从不可校正的存储器错误恢复的虚拟机
[0001]相关申请的交叉引用
[0002]本申请是于2020年11月17日提交的美国专利申请第16/950,212号的继续,该专利申请的公开内容通过引用并入本文。

技术介绍

[0003]云计算已经影响了企业管理计算需求的方式。它以成本有效的方式提供了可靠性、灵活性、可扩展性和冗余性。它使企业能够管理其信息技术需求,而无需例如传统的资本投资和维护考虑。随着越来越多的计算转移到云系统,这些系统现在以多年前难以想象的规模存储、处理和输出数据。这种转移的影响是,如果不被遏制和/或从中恢复,云中发生的存储器错误可能会以与企业在云上的占用相对应的规模影响顾客或用户体验。例如,并不罕见的是,在主机上检测到不可校正的存储器错误会导致主机关闭,从而导致所有托管虚拟机(VM)突然终止。由于存储器大小达到千兆字节或万亿字节规模,这可能会影响需要较长时间段才能重新建立的数千个VM或应用。

技术实现思路

[0004]所公开技术的各个方面可以包括在云计算环境中实施的方法或系统,所述方法或系统允许遏制不可校正的存储器错误(例如保护DMA访问不受损坏数据的影响)和从不可校正的存储器错误恢复。
[0005]公开技术的各个方面可以包括一种方法。例如,该方法可以是用于云计算环境中的不可校正的存储器错误恢复的方法。该方法可以包括:在虚拟机管理管理器处接收由主机机器检测到的不可校正的存储器错误的信令;在虚拟机管理管理器处,基于接收到的信令确定与损坏的存储器元件相关联的一个或多个虚拟机;基于不可校正的存储器错误仿真与损坏的存储器元件相关联的存储器错误;以及由虚拟机管理管理器,将仿真的存储器错误引入一个或多个虚拟机中的至少一个的操作环境中。
[0006]该方法的附加方面可以包括:引入仿真的存储器错误,包括虚拟机管理管理器注入中断,该中断由一个或多个虚拟机中的每个虚拟机的虚拟中央处理单元(vCPU)接受。进一步地,仿真的存储器错误可以包括使一个或多个虚拟机中的至少一个向客人用户空间发信号通知不可校正的存储器错误的通知。仿真的存储器错误还可以包括使一个或多个虚拟机中的至少一个被重启或终止的通知。仿真的存储器错误可以包括与不可校正的存储器错误相关联的上下文信息,包括位置、类型或严重性中的一个或多个。虚拟机管理管理器可以包括管理程序。
[0007]根据该方法,发信号通知可以包括主机机器的BIOS将与不可校正的存储器错误相关联的信息转发给主机机器的操作系统。更进一步地,该方法可以包括主机机器的操作系统将与不可校正的存储器错误相关联的信息转发给虚拟机管理器。
[0008]附加地,根据该方法,引入可以包括虚拟机管理器将仿真的存储器错误注入至少一个虚拟机的虚拟中央处理单元的过程中。更进一步地,确定与损坏的存储器元件相关联
的一个或多个虚拟机可以包括识别与损坏的存储器元件相关联的至少一个存储器页面。
[0009]所公开技术的各个方面还可以包括一种云计算系统。该系统可以包括能够支持一个或多个虚拟机的主机机器以及被耦合至包含指令的存储器的一个或多个处理设备。该指令可以使一个或多个处理器:从主机机器接收信令,该信令指示不可校正的存储器错误;基于接收到的信令,从一个或多个虚拟机中确定与损坏的存储器元件相关联的虚拟机;以及基于不可校正的存储器错误,仿真与损坏的存储器元件相关联的存储器错误。指令还可以使一个或多个处理设备将仿真的存储器错误注入到与损坏的存储器元件相关联的虚拟机的操作环境中。
[0010]该指令还可以使一个或多个处理设备注入仿真的存储器错误,使一个或多个处理设备注入中断,该中断由与损坏的存储器元件相关联的虚拟机的虚拟中央处理单元(vCPU)接受。
[0011]进一步地,仿真的存储器错误可以包括使与损坏的存储器元件相关联的虚拟机向客人用户空间发信号通知不可校正的存储器错误的通知。仿真的存储器错误可以包括使与损坏的存储器元件相关联的虚拟机被重启或终止的通知。另外,主机机器的BIOS可以被配置为将与不可校正的存储器错误相关联的信息转发给主机机器的操作系统。主机机器的操作系统可以将与不可校正的存储器错误相关联的信息转发给一个或多个处理设备。
[0012]系统的其他方面可以包括包含与不可校正的存储器错误相关联的上下文信息的仿真的存储器错误,包括位置、类型或严重性中的一个或多个。此外,主机机器的操作系统可以将与不可校正的存储器错误相关联的信息转发给一个或多个处理设备。一个或多个处理设备可以包括管理程序。另外,指令可以包括,为了确定指示不可校正的存储器错误的信令,包括识别与损坏的存储器元件相关联的至少一个存储器页面。
[0013]所公开技术的附加方面可以包括在其上存储有指令的一个或多个非瞬态计算机可读介质,该指令使一个或多个处理设备执行用于云计算环境中的不可校正的存储器错误恢复的过程或方法,包括:在虚拟机管理管理器处接收由主机机器检测到的不可校正的存储器错误的信令;在虚拟机管理管理器处,基于接收到的信令确定与损坏的存储器元件相关联的一个或多个虚拟机;基于不可校正的存储器错误仿真与损坏的存储器元件相关联的存储器错误;以及由虚拟机管理管理器,将仿真的存储器错误引入一个或多个虚拟机中的至少一个的操作环境中。该指令可以包括权利要求中列举的所公开技术的一种或多种其他方法或过程步骤。
附图说明
[0014]图1说明性地描绘了根据所公开技术的各个方面的示例系统或环境的框图。
[0015]图2说明性地描绘了根据所公开技术的各个方面的示例系统或环境的框图。
[0016]图3说明性地描绘了根据所公开技术的各个方面的示例过程或方法的流程图或游图。
[0017]图4描绘了根据所公开技术的各个方面的示例过程或方法的流程图。
具体实施方式
[0018]概述
[0019]存储器错误通常被分类为可校正的和不可校正的。可校正的错误通常不会影响云环境中的主机机器的正常操作,因此也不会影响主机计算系统。不可校正的错误通常对整个主机计算系统都是致命的,例如会导致主机机器崩溃或关闭。在基于云的虚拟机环境中,这意味着由主机机器支持的所有虚拟机(VM)都将与主机一起崩溃或关闭,不给VM/用户留下任何线索或留下很少的恢复机会。现代云计算系统中的不可校正的存储器错误的影响通常是显著的,因为这些系统通常会在每个主机上使用相对较大大小的存储器,例如云计算引擎可以使单个VM能够具有多达12万亿字节的存储器。这些较大的主机通常比较小的主机遭遇更高的不可校正存储器错误率,例如更多存储器转变为更多存储器错误。由于存储器错误导致的停机时间通常损失非常严重。
[0020]所公开技术的一个方面包括云计算基础设施,该云计算基础设施允许主机及其关联VM保持在线和/或从存储器错误(包括不可校正的存储器错误)中恢复,以及本地化和遏制存储器错误,使得它们不会影响系统的其他部分,诸如客人VM工作负载。例如,所公开的技术包括配置主机机器BIOS(包括关联的存储器元件)以启用在操作系统(OS)上可恢复的错误信令本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于云计算环境中的不可校正的存储器错误恢复的方法,包括:在虚拟机管理管理器处接收由主机机器检测到的不可校正的存储器错误的信令;在所述虚拟机管理管理器处,基于所接收的信令来确定与损坏的存储器元件相关联的一个或多个虚拟机;基于所述不可校正的存储器错误来仿真与所述损坏的存储器元件相关联的存储器错误;以及由所述虚拟机管理管理器将所仿真的存储器错误引入所述一个或多个虚拟机中的至少一个虚拟机的操作环境中。2.根据权利要求1所述的方法,其中,引入所仿真的存储器错误包括:所述虚拟机管理管理器注入中断,所述中断由所述一个或多个虚拟机中的每个虚拟机的虚拟中央处理单元vCPU接受。3.根据权利要求1所述的方法,其中,所仿真的存储器错误包括通知,所述通知使所述一个或多个虚拟机中的所述至少一个虚拟机向客人用户空间发信号通知所述不可校正的存储器错误。4.根据权利要求1所述的方法,其中,所仿真的存储器错误包括通知,所述通知使所述一个或多个虚拟机中的所述至少一个虚拟机被重启或终止。5.根据权利要求1所述的方法,其中,发信号通知包括:所述主机机器的BIOS将与所述不可校正的存储器错误相关联的信息转发给所述主机机器的操作系统。6.根据权利要求5所述的方法,包括:所述主机机器的所述操作系统将与所述不可校正的存储器错误相关联的所述信息转发给所述虚拟机管理器。7.根据权利要求6所述的方法,其中,引入包括:所述虚拟机管理器将所仿真的存储器错误注入到所述至少一个虚拟机的虚拟中央处理单元的过程中。8.根据权利要求1所述的方法,其中,所仿真的存储器错误包括与所述不可校正的存储器错误相关联的上下文信息,包括位置、类型或严重性中的一个或多个。9.根据权利要求1所述的方法,其中,所述虚拟机管理管理器包括管理程序。10.根据权利要求1所述的方法,其中,确定与所述损坏的存储器元件相关联的所述一个或多个虚拟机包括:识别与所述损坏的存储器元件相关联的至少一个存储器页面。11.一种云计算系统...

【专利技术属性】
技术研发人员:王珏曹逸
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1