服务器系统技术方案

技术编号:7437299 阅读:268 留言:0更新日期:2012-06-15 20:33
本发明专利技术提供了一种服务器系统,包括:至少一个服务器组,每个所述服务器组均包括至少一个服务器;传感器,用于感测每个所述服务器中的至少一个部件并发送感测信息;处理模块,用于接收所述感测信息,根据所述感测信息确定与所述部件的工作状态相对应的标识信息,并发送所述标识信息;以及管理模块,用于接收所述标识信息,以获取所述部件的所述工作状态。利用本发明专利技术的服务器系统,至少一个服务器组通过多条I2C总线主动向管理芯片发送信息,管理模块能够及时响应所发送的信息。同时减小了管理模块获取服务器运行状态信息的复杂性和时间开销,可以及时断开故障的服务器组,从而提高了系统的稳定性。

【技术实现步骤摘要】

本专利技术一般地涉及计算机领域,更具体地来说,涉及一种服务器系统
技术介绍
现在的刀片服务器系统为一种高密度系统,通常可容纳好几片至十几片、二十片计算机刀片,其可靠性直接关系着整个系统的性能。计算刀片作为刀片服务器系统中的关键部件,对刀片服务器系统管理员来说,对计算刀片的运行状态进行有效的监控与报警至关重要。现有技术中提供了一种服务器系统,管理模块通过232/485总线与刀片服务器系统中的所有计算机相连(如附图说明图1所示)。管理模块周期性地轮询刀片服务器系统中的各个计算机刀片的状态,主要包括温度、电压等,如果其中某个状态不正常(如温度过高,电压超出阈值等),则根据管理策略触发相应管理操作(如增加系统风扇速度,关闭出现故障的计算刀片等)。本技术方案可以在一定程度上保证系统正常运行。然而,管理模块采用轮询方式,当系统中刀片数量较多时,会导致管理模块监控单个刀片状态的时间间隔变长。当计算机刀片发生故障时,管理模块需要等到下一次轮询到故障刀片时才能监控到故障状态,从而导致管理模块触发的管理操作不及时,而影响系统的正常运行。此外,由于管理模块通过单一总线与计算机刀片相连,并且通过一个数据信号,管理模块仅仅能获得某个部件的故障指示。当多处故障出现时,由于需要传输多个数据信号,使得用于传输数据的单一总线的负担大大增加,可能会导致整条总线无法正常工作, 从而导致管理模块无法与所有计算机刀片通信,影响刀片服务器系统的正常运行。
技术实现思路
针对现有技术中当多处故障出现时由于需要传输多个数据信号而使得用于传输数据的单一总线的负担大大增加的缺陷,本专利技术提出了能够解决上述缺陷的服务器系统。本专利技术提供了一种服务器系统,包括至少一个服务器组,每个服务器组均包括至少一个服务器;传感器,用于感测每个服务器中的至少一个部件并发送感测信息;处理模块,用于接收感测信息,根据感测信息确定与部件的工作状态相对应的标识信息,并发送标识信息;以及管理模块,用于接收标识信息,以获取部件的工作状态。优选地,在该服务器系统中,感测信息包含部件的部件参数,或者感测信息为部件的故障指示信息。优选地,在该服务器系统中,部件参数包括温度、电压以及电流。优选地,在该服务器系统中,标识信息为具有多个数据位的数据信息。优选地,在该服务器系统中,处理模块被配置为将部件参数与阈值进行比较,当部件参数超过阈值时,改变与相应部件的工作状态相对应的数据位的值。优选地,在该服务器系统中,处理模块被配置为当接收到故障指示信息时,改变与相应部件的工作状态相对应的数据位的值。优选地,在该服务器系统中,处理模块与管理模块通过I2C总线进行信息交互。优选地,在该服务器系统中,管理模块被设置为根据数据位的值来获取相应部件的工作状态。优选地,在该服务器系统中,处理模块向管理模块主动发送标识信息;或者当处理模块接收到来自管理模块的轮询信息时,向管理模块发送标识信息。优选地,在该服务器系统中,在传感器向部件发送信息后的预定时间内,未收到来自部件的响应,则传感器发送故障指示信息。优选地,在该服务器系统中,至少一个部件选自由硬盘、风扇、存储器及其组合所构成的组。利用本专利技术的服务器系统,至少一个服务器组通过多条I2C总线主动向管理芯片发送信息,管理模块能够及时响应所发送的信息。同时减小了管理模块获取服务器运行状态信息的复杂性和时间开销,可以及时断开故障的服务器组,从而提高了系统的稳定性。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。在附图中图1为现有的服务器系统的结构图2为根据本专利技术的实施例的服务器系统的结构图;以及图3为根据本专利技术的实施例的服务器与管理芯片的连接示意图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图2为根据本专利技术的实施例的服务器系统的结构图。服务器系统200包括服务器组1 202至服务器组N 204(其中,N大于或等于1),每个服务器组均包括至少一个服务器,例如,N可以为5,5个服务器组中的每个服务器组均包括至少一个服务器,并且每个服务器组中的服务器数量可以相同或者不同。服务器系统200还包括传感器206,用于感测每个服务器中的至少一个部件并发送感测信息。每个服务器中可以具有多个服务器,每个服务器感测一个部件并将感测到的相应部件的信息发送给处理模块。处理模块208,用于接收感测信息,根据感测信息确定与部件的工作状态相对应的标识信息,并发送标识信息。处理模块从传感器接收到相应部件的信息以后,可以确定与相应部件的相对应的比特位的信息,该比特位信息为标识信息,例如,当比特位置1时,与该比特为相对应的部件故障,并将该标识信息发送至管理模块。管理模块210,用于接收标识信息,以获取部件的工作状态。管理模块210从处理模块接收标识信息,从而管理模块210通过标识信息获取部件的工作状态后,进行进一步的处理,以确保服务器系统的安全稳定运行。该技术方案能够通过服务器中的处理模块主动向管理模块发送运行状态信息,克服了轮询不能及时掌握服务器运行信息和耗时的缺陷,从而管理芯片能够及时掌握服务器运行信息,并进行及时处理,进一步从整体上保服务器的稳定运行。下面,将详细描述该服务器系统。该服务器系统200包括服务器组1 202至服务器组N 204 (其中,N大于或等于1), 每个服务器组均包括至少一个服务器。如图3所示,该示图中示出了两个服务器组,一个服务器组包括3个计算刀片(也称为刀片服务器),另一个服务器组包括2个刀片,每个服务器组通过一条I2C总线连接至管理模块。如图所示,服务器系统还包括其他服务器组,每个服务器组包括至少一个计算刀片。该服务器系统200包括传感器206,用于感测每个服务器中的至少一个部件并且发送感测信息。例如,至少一个部件选自由硬盘、风扇、存储器及其组合所构成的组。例如, 传感器可以为温度传感器、电压传感器、以及电流传感器等,可以分别用于感测硬盘、风扇、 或存储器等的温度、电压、以及电流等。该服务器系统200包括处理模块208,用于接收感测信息,根据感测信息确定与部件的工作状态相对应的标识信息,并发送标识信息。标识信息为具有多个数据位的数据信息。例如,该标识信息可以为8比特位、16比特位、32比特位等。将处理模块208配置为将部件参数与阈值进行比较,当部件参数超过阈值时,改变与相应部件的工作状态相对应的数据位的值。即,将处理模块208配置为当接收到故障指示信息时,改变与相应部件的工作状态相对应的数据位的值。例如,8比特位中的第一位对应于硬盘电压,当硬盘电压运行正常时,该标识信息为“00000000”,但是当硬盘电压大于阈值时,将标识信息的相应比特为置 1,例如,为 “00000001”。该服务器系统200包括管理模块210,用于接收标识信息,以获取部件的工作状态。处理模块208与管理模块210通过I2C总线进行信息交互本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:郑谦
申请(专利权)人:曙光信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术