【技术实现步骤摘要】
本专利技术一般涉及计算机系统中的数据存储领域,尤其涉及用于处理硬件错误同时避免系统崩溃的技术。
技术介绍
硬件错误例如在计算系统(例如,标准的UNIX系统)中的机器检查将引起系统崩溃。一般地说,其甚至不允许应用程序具有记录任何信息的机会。当信息可被记录时,其仅仅用于在重新启动映像之后识别故障组件。机器检查一直被认为是系统的致命错误。在数据存储设备(其一个例子是IBM pSeries系统)中有可以引起机器检查的许多状态,例如目标异常中断、主(master)异常中断或奇偶错误。在通用UNIX服务器中,为这些状态调用机器检查是合理的。在这种情况下,数据存储设备暂时成为是不可用的。此外,多群集数据存储设备,其中的一个例子是IBM TotalStorage ESS存储服务器,是一个具有其自身的主机适配器和设备适配器以及相应的设备驱动器的封闭环境。如果这些硬件适配器的任何一个引起外围组件互连(PCI)错误例如目标异常中断,则整个群集或计算机-电子设备复合体(CEC)将发生崩溃而被重新启动。在这期间,数据存储设备运行在单群集模式下。然而这是不希望的,因为数据存储设备的功能和性能受到了削弱。因而,需要提供一种过程,用于以允许计算系统继续运行的方式处理计算系统中的硬件错误而不引起系统崩溃。
技术实现思路
为了解决这些和其它问题,本专利技术描述一种用于处理计算系统例如数据存储设备中的硬件错误的过程。本专利技术为应用定义了一种新的接口,用于通知计算系统的操作系统正确地处理了(例如,通过重置或隔开适配器)机器检查(例如,由PCI错误引起的),从而操作系统旁路掉由于机器检查引起的系 ...
【技术保护点】
一种用于部署计算基础设施的方法,包括在具有多个硬件适配器的计算系统中集成计算机可读代码,其中和所述计算系统相结合的代码能够通过执行一种方法来处理所述硬件适配器的硬件错误,所述方法包括:在与所述计算系统的操作系统的接口处检测所述计算系 统中的硬件错误; 响应所述检测,确定可能产生所述硬件错误的至少一个硬件适配器,并隔离所述至少一个硬件适配器,以及在所述隔离之后,完成所述硬件错误的处理而不引起所述计算系统的崩溃。
【技术特征摘要】
US 2004-11-17 10/991,2071.一种用于部署计算基础设施的方法,包括在具有多个硬件适配器的计算系统中集成计算机可读代码,其中和所述计算系统相结合的代码能够通过执行一种方法来处理所述硬件适配器的硬件错误,所述方法包括在与所述计算系统的操作系统的接口处检测所述计算系统中的硬件错误;响应所述检测,确定可能产生所述硬件错误的至少一个硬件适配器,并隔离所述至少一个硬件适配器,以及在所述隔离之后,完成所述硬件错误的处理而不引起所述计算系统的崩溃。2.如权利要求1所述的方法,其中所述隔离包括重置所述至少一个硬件适配器。3.如权利要求1所述的方法,其中所述隔离包括隔开所述至少一个硬件适配器。4.如权利要求1所述的方法,其中由所述接口执行所述隔离;以及由所述操作系统执行所述完成硬件错误的处理。5.如权利要求1所述的方法,还包括从所述接口向所述操作系统提供通知,指出所述至少一个硬件适配器已被隔离;其中所述操作系统响应所述通知执行所述完成硬件错误的处理。6.如权利要求1所述的方法,其中所述接口包括与所述操作系统相关联的设备驱动器的内核扩展。7.如权利要求1所述的方法,还包括响应对硬件错误的检测,调用与所述操作系统相关联的设备驱动器的热启动。8.如权利要求1所述的方法,其中所述硬件错误包括机器检查错误。9.如权利要求1所述的方法,其中所述硬件错误包括输入/输出构造设备错误。10.如权利要求1所述的方法,其中所述计算系统包括数据存储设备。11.如权利要求1所述的方法,还包括向所述操作系统注册所述接口。12.如权利要求1所述的方法,其中所述确定可能产生所述硬件错误的至少一个硬件适配器包括检查错误寄存器。13.至少一个程序存储设备,其有形地包含可由至少一个处理器执行的指令程序,以便执行用于处理具有多个硬件适配器的计算系统中的硬件错误的方法,所述方法包括在与所述计算系统的操作系统的接口处检测所述计算系统中的硬件错误;响应所述检测,确定可能产生所述硬件错误的至少一个硬件适配器,并隔离所述至少一个硬件适配器,以及在所述隔离之后,完成所述硬件错误的处理而不引起所述计算系统的崩溃。14.一种用于部署计算基础设施的方法,包括在具有多个硬件适配器的计算系统中集成计算机可读代码,其中与所述计算系统相结合的代码能够通过执行一种方法来处理所述硬件适配器的硬件错误,所述方法包括向所述计算系统的操作系统注册接口;在所述接口...
【专利技术属性】
技术研发人员:JJ鲁伊斯,许育诚,宋正中,JN麦考利,WG舍曼,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。