当前位置: 首页 > 专利查询>英特尔公司专利>正文

可配置和容错的基板管理控制器安排制造技术

技术编号:17837379 阅读:33 留言:0更新日期:2018-05-03 19:08
本申请公开了可配置和容错的基板管理控制器安排。系统和方法利用多节点系统中的可配置容错基板管理控制器(BMC)安排。在一个示例中,该方法可包括将该多个BMC的第一BMC指定为主BMC的角色、确定该第一BMC可不再充当该主BMC的角色、以及指定除该第一BMC之外的BMC充当该主BMC的角色。

Configurable and fault-tolerant baseboard management controller arrangement

The application discloses a configurable and fault-tolerant substrate management controller arrangement. Systems and methods utilize configurable fault-tolerant substrate management controller (BMC) arrangements in multi node systems. In one example, the method may include specifying the role of the first BMC of the multiple BMC as the primary BMC, determining that the first BMC can no longer act as the role of the main BMC, and specifies the role of the BMC other than the first BMC to act as the main BMC.

【技术实现步骤摘要】
可配置和容错的基板管理控制器安排本申请是PCT国际申请号为PCT/US2012/030958、国际申请日为2012年3月28日、进入中国国家阶段的申请号为201280071730.X,题为“可配置和容错的基板管理控制器安排”的专利技术专利申请的分案申请。
实施例总体上涉及减轻多节点服务器系统中的故障的影响。更具体而言,实施例涉及利用多节点服务器中的基板管理控制器(BMC)安排。
技术介绍
服务器系统可利用包含多个节点的单个机架。这些服务器系统可利用与节点分离的机架管理控制器以便集中地管理系统资源。然而,如果机架管理控制器出故障,整个系统的操作会出故障。因此,实现可配置和容错的服务器系统实施例可以是有益的。附图说明通过阅读以下说明书和所附权利要求书并且通过参考以下附图,本专利技术实施例的各种优点将对本领域普通技术人员变得明显,在附图中:图1是根据本专利技术的实施例的实现可配置和容错的基板管理控制器安排的计算系统的示例的框图;以及图2是根据本专利技术的实施例的利用可配置和容错的基板管理控制器安排的方法的示例的流程图。具体实施方式现在转向图1,示出利用可配置和容错的基板管理控制器安排的计算系统10的框图。计算系统10可包括(除其他事项之外)机架100、第一节点服务器200、第二节点服务器300、第三节点服务器400、输入/输出(I/O)扩展器600。计算系统10可耦合到网络1100。机架100可包括第一节点101、第二节点102、和第三节点103。节点101、102、103可以是包括一个或多个组件的任何可替换单元。这些组件的示例包括(除其他事项之外)硬盘驱动器、基板、侧板、或对接板。机架100还可包括第一风扇105、第二风扇106、和第三风扇107。风扇105、106、107可用于使机架100内的组件冷却。机架还可包括电源104。电源104可用于为机架100内的各组件供电。如在此所使用的,风扇105、106、107和电源104可以是系统资源的示例。其他系统资源可包括硬盘驱动器、传感器、硬盘驱动器和存储背板。第一节点服务器200可以是被配置成用于监控、管理、支持、和控制第一节点101的操作的多个方面的计算机服务器系统。类似地,第二节点服务器300和第三节点服务器400可被配置成用于分别监控、管理、支持、和控制第二节点102和第三节点103的操作的多个方面。第一节点服务器200可包括第一节点存储器组件201、第一节点固件组件202、和第一节点处理组件203。类似地,第二节点服务器300可包括第二节点存储器组件301、第二节点固件组件302、和第二节点处理组件303。同样,第三节点服务器400可包括第三节点存储器组件401、第三节点固件组件402、和第三节点处理组件403。第一节点存储器组件201可包括第一节点服务器应用204,其可被配置成用于(除其他事项之外)监控、管理、支持、和控制第一节点101的操作的多个方面。类似地,第二节点存储器组件301可包括第二节点服务器应用304,可相对于第二节点102类似地利用该第二节点服务器应用。同样,第三节点存储器组件401可包括第三节点服务器应用404,可相对于第三节点103类似地利用该第三节点服务器应用。第一节点服务器200可包括第一节点BMC205,其可被配置成用于监控、管理、支持、和控制多节点系统的操作的多个方面。在本实施例中,除其他事项之外,其可被配置成用于监控、管理、支持、和控制其相关联的节点(第一节点101)的操作的多个方面。例如,第一节点BMC205可被配置成用于(除其他事项之外)传递与第一节点101的操作相关的信息(例如,功率水平、温度读数、和电压电平信息)。附加地,第一节点BMC205还可被配置成用于促进第一节点101与被配置成用于监控、管理、支持、和控制第一节点101的操作的任何实体(例如,第一节点服务器应用204)之间的接口连接。第二节点BMC305可被配置成用于相对于第二节点102类似地操作。同样,第三节点BMC405可被配置成用于相对于第三节点103类似地操作。第一节点BMC205可包括第一节点BMC固件组件206。类似地,第二节点BMC305可包括第二节点BMC固件组件306。同样,第三节点BMC可包括第三节点BMC存储器组件406,其中,第三节点BMC存储器组件406可包括第三节点BMC软件应用407。第一节点BMC固件组件206、第二节点BMC固件组件306、和第三节点BMC软件应用407可被配置成用于(除其他事项之外)通过经由电源管理总线500向电源104传输指令将电源指引到机架100。I/O扩展器600可以是(除其他事项之外)可允许BMC(例如,第一节点BMC205)检测计算系统10内是否存在节点(例如,第一节点101)。I/O扩展器600可通过节点间BMC总线700耦合到第一节点BMC205、第二节点BMC305、和第三节点BMC405。网络1100可通过第一网络接口800、第二网络接口900、和第三网络接口1000分别耦合到第一节点BMC205、第二节点BMC305、和第三节点BMC405。这些网络接口可用于(除其他事项之外)远程地配置计算系统10的各组件。在本专利技术的实施例中,任何耦合BMC可承担多节点系统的“主”BMC的角色。一旦BMC已经被指定为主,所指定的主BMC可充当系统内的所有耦合节点(包括其相关联的节点)的主BMC。换言之,主BMC可相对于多节点系统的操作充当中央接口。当指定了主BMC时,多节点系统内的任何其他BMC可承担“从”的角色。可由主BMC实现的节点的操作的多个方面的示例可包括但不限于监控系统组件的多个方面(例如,温度、功率)、管理(例如,向系统组件传输相关有关数据)系统组件、支持(例如,获得和安装固件和软件更新)、和控制(例如,指引系统资源的配置)系统组件。通过单个主BMC实现这些方面可(除其他事项之外)降低系统拥塞(例如,通信总线上的业务量)以及避免冗余(例如,在安装软件更新时)。在本专利技术的实施例中,算法可被配置成用于指定主BMC。该算法可尤其确定将初始地指定哪个BMC作为主、或者一旦当前主BMC可能不再可用就将哪个BMC指定作为新主。当前的主BMC可能出于各种原因不再可用,各种原因包括系统组件的故障、移除(例如,物理移除)、或指示。实际上,如将更详细地描述的,系统组件诸如固件组件(例如,第一节点BMC固件组件206)或软件应用(例如,第三节点BMC软件应用407)可初始地执行主BMC、从当前主BMC移除主状态、以及指定新的主BMC等等。在某些实施例中,算法可基于节点标识号指定主BMC。例如,一个这种算法可基于最低标识号指定主BMC。这样,在图1中描述的实施例中,这种算法可首先将第一节点BMC206指定为主BMC,然后是第二节点BMC207,以此类推。在本专利技术的实施例中,主BMC可由各种装置指定和配置。例如,主BMC可由BMC固件组件(例如,第一节点固件组件202)或通过执行软件应用(例如,第一节点服务器应用204)来指定和配置。在其他实施例中,可通过由任何耦合节点附属的主机接口使用应用配置BMC。这种应用的示例可以是设置实用程序,如基本输入输出系统(BIOS)。还可通过远程连接配置BMC。例如,网络(诸如网本文档来自技高网...
可配置和容错的基板管理控制器安排

【技术保护点】
一种利用多节点系统中的可配置和容错的基板管理控制器(BMC)安排的方法,所述多节点系统在机架中包括多个服务器节点和多个BMC,所述机架具有一个或多个系统资源,所述方法包括:将所述多个BMC中的第一BMC指定为以主BMC的角色操作;以从BMC的角色操作所述多个BMC中不被指定为所述主BMC的一个或多个BMC;确定所述第一BMC将放弃或已放弃所述主BMC的角色;指定从BMC接管所述主BMC的角色,其中,正以所述主BMC的角色操作的BMC执行包括对所述一个或多个系统资源中的至少一个系统资源进行控制的操作。

【技术特征摘要】
1.一种利用多节点系统中的可配置和容错的基板管理控制器(BMC)安排的方法,所述多节点系统在机架中包括多个服务器节点和多个BMC,所述机架具有一个或多个系统资源,所述方法包括:将所述多个BMC中的第一BMC指定为以主BMC的角色操作;以从BMC的角色操作所述多个BMC中不被指定为所述主BMC的一个或多个BMC;确定所述第一BMC将放弃或已放弃所述主BMC的角色;指定从BMC接管所述主BMC的角色,其中,正以所述主BMC的角色操作的BMC执行包括对所述一个或多个系统资源中的至少一个系统资源进行控制的操作。2.如权利要求1所述的方法,其中,所述多个BMC中的每一个都与来自所述多个服务器节点之中的相应服务器节点相关联。3.如权利要求2所述的方法,其中,所述多个BMC中的每一个都能够以所述主BMC的角色操作。4.如权利要求1所述的方法,其中,对于所述多个BMC,所述第一BMC初始地以所述主BMC角色被操作,并且所述多个BMC中除所述第一BMC之外的每一个BMC初始地以从BMC角色被操作。5.如权利要求1所述的方法,其中,正以所述主BMC的角色操作的BMC执行包括对所述一个或多个系统资源中的至少一个系统资源进行监控的操作。6.如权利要求1所述的方法,其中,所述多个服务器节点中的每一个都包含用于对所述服务器节点的操作进行监控的BMC。7.如权利要求1所述的方法,其中,由BMC执行的操作经由与所述BMC相关联的固件的执行来实现。8.如权利要求1所述的方法,其中,确定所述第一BMC将放弃或已放弃所述主BMC的角色包括:检测所述第一BMC已变得不起作用。9.如权利要求1所述的方法,其中,确定所述第一BMC将放弃或已放弃所述主BMC的角色包括:当所述第一BMC正以所述主BMC角色操作时,检测所述第一BMC在超时周期内还未执行预定义的操作。10.如权利要求1所述的方法,进一步包括:将所述多个BMC中的每一个BMC与唯一标识相关联;以及使用BMC的标识以便使BMC能够标识哪个BMC正以所述主BMC角色操作。11.一种系统,包括:机架,所述机架包含:多个服务器节点;多个基板管理控制器(BMC);以及一个或多个系统资源,可操作地耦合到所述多个服务器节点,其中,所述系统配置成用于:以主BMC的角色操作所述多个BMC中的第一BMC;以从BMC的角色操作所述多个BMC中除所述第一BMC之外的一个或多个BMC;确定所述第一BMC将放弃或已放弃所述主BMC的角色;指定从BMC接管所述主BMC的角色,其中,正以所述主BMC的角色操作的BMC执行包括对所述一个或多个系统资源中的至少一个系统资源进行控制的操作。12.如权利要求11所述的系统,其中,所述多个BMC中的每一个都与来自所述多个服务器节点之中的相应服务器节点相关联。13.如权利要求12所述的系统,其中,所述多个BMC中的每一个都能够以所述主BMC的角色操作。14.如权利要求11所述的系统,其中,对于所述多个BMC,所述第一BMC初始地以所述主BMC角色被操作,并且所述多个BMC中除所述第一BMC之外的每一个BMC初始地以从BMC角色被操作。15.如权利要求11所述的系统,其中,正以所述主BMC的角色操作的BMC执行包括对所述一个或多个系统资源中的...

【专利技术属性】
技术研发人员:D·理查德森B·肯尼迪
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1