计算机系统、故障容许系统及控制方法和程序技术方案

技术编号:2852318 阅读:227 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种高可靠性容许计算机系统,能够构造使用PnP软件的冗余配置。在双工系统中,将与虚拟总线相连并且彼此对应的IO桥的实体(实际IO桥)集成到系统中,作为伪IO桥,因此,如果系统物理上彼此断开,通过在另一个系统中仿真实际IO桥,伪IO桥能够好像在IO桥自身中没有发生所谓的PnP事件一样进行操作。

【技术实现步骤摘要】

本专利技术涉及一种计算机系统、一种使用其的故障容许系统及其操作控制方法和程序,具体地,涉及一种故障容许计算机系统的改进。
技术介绍
近年来,广泛使用的通用CPU的性能明显增强,通过在使用这种通用CPU的工作站或服务器上安装通用操作系统(OS),提供了高性能且廉价的系统。结果,即使是传统上使用非常昂贵大型计算机的应用程序,也可以使用利用高性能和廉价通用CPU的系统。另一方面,系统需要每天24小时持续运行的危急任务应用程序也在增多。在这些应用程序中,重要的是构造系统以防止系统死机。然而,在这种通用CPU和通用OS中,由于缺乏CPU自身的故障检测功能,在通用OS中硬件故障的情况下,当出现故障时,由于缺乏用于响应的故障通知手段和故障处理的限定,硬件故障引起系统崩溃。因此,为了提供高可靠性的系统,需要添加特定外围电路或开发专用OS,这造成在难以在跟随开发普通通用CPU系统的同时来开发高可靠性的系统。因此,普通系统和高可靠性系统之间的成本性能差趋向于增大。因此,为了提供一种与使用通用CPU的计算机具有共性的高可靠性计算机系统,例如故障容许计算机系统,如日本专利待审No.09-034809所述,提出了一种与相同时钟同步地执行相同处理的CPU,一种用于检测CPU的故障并断开故障CPU的设备以及一种用于通过取决于IO故障的CPU指令来断开故障IO路径的系统。然而,在广泛使用的通用OS中,由于没有提供硬件故障通知方法和故障处理功能这一事实,存在系统崩溃的问题。因此,为了使用通用OS,需要能够将硬件故障和OS完全分离的配置。例如,参考国际专利申请的国家公开No.2001-523855,通过一个计算机系统分别配置了计算单元(CE)和IO控制部分(IOP),并且每一个单元多次相连,以便实现冗余。在单元之间执行通信,并且在检测到故障时断开CE或IOP。例如,对于IO控制部分,从OS的角度硬件是可视的。尽管可以暂停其中出现故障的IO控制部分,该故障不会直接影响OS,并且通过检测故障并利用剩余的冗余IO控制部分返回正常响应能够消除故障的出现。然而,在该系统中,CPU和IO分别需要一个计算机,此外,为了构成冗余配置,需要多个计算机来实现冗余。此外,由于每一个计算机运行不同步或不同,需要安装额外的OS许可,系统变得昂贵。存在一种系统,通过利用通用OS上的标准PnP(即插即用),能够动态地改变IO设备或总线上IO桥的连接配置,因此,设想通过采用利用这种PnP软件的冗余配置系统来构成高可靠性故障容许计算机系统。然而,对于IO桥PnP处理,不支持完全动态配置改变。例如,在连接IO桥时,由于不确定与IO桥相连的设备所需的存储器空间分配量以及设备的数目,由于PnP控制软件或OS的限制(通常由固定值限定),不能自由地将存储器空间分配给相连的IO桥,从而限制了设备的数目和类型。例如,在IO桥的PnP连接的情况下,由于OS不能确定IO桥需要多少资源,分配了一定存储器空间并且之后不能改变。因此,当在相连IO桥下连接其它IO桥或设备时,不能连接需要比分配给第一IO桥更多存储器空间的IO桥或设备。此外,如果连接了多个设备,由于所需的存储器空间可能会超出分配给IO桥的存储器空间这一事实,一些设备不能根据相连设备的数目来分配存储器资源。存储器资源分配的这种限制在多级IO桥配置系统中称为严重问题,多个IO桥在PnP连接IO桥下相连。传统上,由于上述限制,为了构造具有使用PnP软件的系统的故障容许计算机系统,需要修改OS标准PnP控制软件和OS自身,以便充分地将资源分配到IO桥。
技术实现思路
本专利技术的目的是提供一种能够构造冗余配置的高可靠性和高可用性计算机系统,而无需修改已有的通用OS功能,还提供了一种使用上述系统的故障容许系统及其操作控制方法和程序。根据本专利技术的一种计算机系统包括CPU、存储器、总线和用于将IO设备与总线相连的IO桥,其中计算机系统包括伪IO总线桥,在另一个系统与总线相连的冗余配置期间,伪IO总线桥从总线断开,并且在其它系统从总线断开的单机配置期间,伪IO总线桥保持IO桥的设置信息,以仿真所述其它系统的IO桥。在根据本专利技术的故障容许系统中,将上述计算机系统配置为冗余配置。一种故障容许系统的操作控制方法,所述故障容许系统包括通过总线互连的第一和第二计算机系统,以形成冗余配置,每一个系统具有CPU、存储器、用于将IO设备与总线相连的IO桥以及仿真另一个系统中IO桥的伪IO总线桥,该操作控制方法包括步骤在单机配置期间,使伪IO总线桥保持另一个系统的IO桥的初始设置信息;形成冗余配置;以及在冗余配置期间,将伪IO总线桥从总线断开,并将伪IO总线桥保持的初始设置信息复制到所述另一个系统的IO桥。根据本专利技术的程序是一种用于执行故障容许系统的操作控制方法的程序,所述故障容许系统包括通过总线互连的第一和第二计算机系统,以形成冗余配置,每一个系统具有CPU、存储器、用于将IO设备与总线相连的IO桥以及仿真另一个系统中IO桥的伪IO总线桥,该程序包括处理在单机配置期间,使伪IO总线桥保持另一个系统的IO桥的初始设置信息;形成冗余配置;以及在冗余配置期间,将伪IO总线桥从总线断开,并将伪IO总线桥保持的初始设置信息复制到所述另一个系统的IO桥。附图说明图1是根据本专利技术的系统配置图;图2是利用图1中配置的故障容许计算机系统的一个示例;图3是说明图2中操作的流程图;图4是利用图1中配置的故障容许计算机系统的另一个示例;以及图5是利用图1中配置的故障容许计算机系统的另一个示例。具体实施例方式下面将参考附图来说明本专利技术的实施例。图1示出了单个计算机系统配置,以配置根据本专利技术的故障容许系统。CPU 11和存储器12与主控制器21相连,主控制器21与总线100相连。与总线100相连的IO桥23可以与支持热插拔的设备相连,或与用于连接热插拔支持设备的其它IO桥40、41相连。将总线(通过单个桥层与CPU 11相连的总线)100被配置为一个桥LSI 20中的虚拟总线,桥LSI 20包括主控制器21和IO桥23。此外,伪IO桥25与虚拟总线100相连。该伪IO桥25是一种在桥LSI 20中设置的逻辑设备,具有保持用于IO桥实体的设置信息的功能。该设置信息至少是配置信息(例如设备标识信息)和存储器空间分配信息。由OS预设该设置信息的初始值。如下参考图2到3所述,通过与另一个系统(图2中的系统B)相连以进行双工操作,当连接了IO桥的对应实体(图2中的IO桥23B)时,该伪IO桥25从总线100断开并且不能被识别。在该双工操作中,与系统(B)共享总线100。传统桥22和伪传统桥24与总线100相连,传统总线资源30与传统桥22相连。边带通信线101使主控制器21能够不通过总线100来访问伪IO桥25或伪传统桥24。因此,主控制器21通过边带通信线101访问由伪IO桥25保持的初始设置信息,并且所述初始设置信息被复制到另一个系统中IO桥的实体。图2是将图1的系统用作系统A、B的一种双工系统。在图2中,与图1相同的系统A中的组件由带“A”的相同数字表示,而系统B中的相同组件由图1中带“B”的相同数字表示。通过将桥LSI 20A与桥LSI 20B相连,每一个系统中的CPU 11A、11B本文档来自技高网
...

【技术保护点】
一种计算机系统包括:CPU、存储器、总线和用于将IO设备与总线相连的IO桥,其中,计算机系统包括伪IO总线桥,在另一个系统与总线相连的冗余配置期间,伪IO总线桥从总线断开,并且在其它系统从总线断开的单机配置期间,伪IO总线桥保持IO桥的设置信息,以仿真所述其它系统的IO桥。

【技术特征摘要】
JP 2004-12-13 2004-3592721.一种计算机系统包括CPU、存储器、总线和用于将IO设备与总线相连的IO桥,其中,计算机系统包括伪IO总线桥,在另一个系统与总线相连的冗余配置期间,伪IO总线桥从总线断开,并且在其它系统从总线断开的单机配置期间,伪IO总线桥保持IO桥的设置信息,以仿真所述其它系统的IO桥。2.根据权利要求1所述的计算机系统,其特征在于还包括分配装置,用于在单机配置期间,响应加电,将存储器空间分配到伪IO桥。3.根据权利要求1所述的计算机系统,其中,伪IO桥保持其它系统的IO桥的初始设置信息。4.根据权利要求3所述的计算机系统,其特征在于还包括复制装置,用于在冗余配置期间,将由伪IO桥保持的初始设备信息复制到所述其它系统的IO桥。5.根据权利要求1所述的计算机系统,其特征在于,伪IO桥保持所述其它系统中IO桥的最近设置信息。6.一种故障容许系统,其特征在于,将根据权利要求1到5之一所述的计算机系统配置为冗余配置。7.一种故障容许系统的操作控制方法,所述故障容许系统包括通过总线互连的第一和第二计算机系统,...

【专利技术属性】
技术研发人员:水谷文俊
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1