一种服务器散热控制器的控制方法及系统技术方案

技术编号:22880243 阅读:19 留言:0更新日期:2019-12-21 06:00
本发明专利技术提供一种服务器散热控制器的控制方法及系统,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接控制芯片输入端,所述风扇控制器与控制芯片通过独立链路建立通信连接,所述控制芯片通过I2C连接BMC,所述方法包括:获取BMC更新的散热策略数据;获取温度传感器采集的服务器测温点温度;根据所述温度和散热策略数据生成风扇目标转速;获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控。本发明专利技术采用将服务器的散热控制从BMC剥离出来,充分有效利用备用散热控制器的资源,实现了散热控制器独立进行对各个风扇的单独控制,精准控制散热。

【技术实现步骤摘要】
一种服务器散热控制器的控制方法及系统
本专利技术属于服务器散热
,具体涉及一种服务器散热控制器的控制方法及系统。
技术介绍
在服务器运行过程中,有效地控制散热,是保证服务器稳定运行的关键。在当前的服务器设计中,一般采用BMC(BaseboardManagementController,基板管理控制器)对服务器主板进行管理。BMC可以监控主板的健康信息,实现功耗、温度和风扇转速的检测以及主板风扇的控制。当前的服务器应用中,人们对于服务器在环保静音、功耗以及稳定性方面的要求越来越高,目前现有的BMC散热控制越来越无法满足新形式下的环保静音、精准控制、提能降耗、环保节能等等新需求。现有通过BMC控制风扇转速的方法具有以下缺点:1、当前服务器散热控制都是由BMC直接进行控制,但是BMC系统较为庞大,启动时间较长,BMC启动这段时间,散热风扇处于无人管理的空档期,这样是非常危险的。因此服务器在BMC启动过程中,采用了硬件电路直接控制风扇全速旋转的方案来解决散热的问题。该方案造成的问题是服务器上电时,由于风扇全速运转,风扇噪音超大,多数情况存在不必要的能源浪费。与现在客户要求的静音和节能环保相违背。2、BMC功能越来越丰富,系统越来越复杂,资源占用越来越多,在执行某些特定任务的时候,资源开支比较大,对散热的及时调控影响越来越大。扫描周期变长,风扇的调节响应有时会迟滞。影响散热调节的及时性。3、现在服务器业务越来越复杂,尤其高密度服务器和AI服务器能耗大,功率大热量大,空间有限,散热困难,瞬间业务的攀升造成温度瞬间急剧升高,产生严重的问题。4、现有方案中对服务器的多风扇控制多数都是统一控制,没有分散单独控制。目前AI服务器多GPU,多风道布局,局部温度的过高,都会进行全部风扇的加速运转。不能精准控制,造成一定的资源浪费,不环保节能。5、当服务器采用单BMC控制时,存在由于BMC固件更新失败、被攻击等等情况时BMC失效,整个服务器的散热将处于瘫痪状态,造成客户业务中断,甚至设备烧毁的故障。当服务器采用技术方案三的设计,增加一个控制器时,控制器多数情况下,处于空闲状态,并且还要反复跟BMC进行通讯,不能充分利用控制器的资源。还会增加BMC的负担。
技术实现思路
针对现有技术的上述不足,本专利技术提供一种服务器散热控制器的控制方法及系统。第一方面,本专利技术提供一种服务器散热控制器的控制方法,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接控制芯片输入端,所述风扇控制器与控制芯片通过独立链路建立通信连接,所述控制芯片通过I2C连接BMC,所述方法包括:获取BMC更新的散热策略数据;获取温度传感器采集的服务器测温点温度;根据所述温度和散热策略数据生成风扇目标转速;获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控。进一步的,所述获取BMC更新的散热策略数据,包括:对所述散热策略数据进行CRC校验;将经过校验的散热策略数据保存至非易失存储器;将内存中的散热策略更新为最新的散热策略数据。进一步的,所述获取温度传感器采集的服务器测温点温度,包括:获取温度传感器采集的服务器测温点温度和所述温度传感器的地址;筛选超过预设温度阈值的测温点温度,并将包括所述温度和相应温度传感器地址的报警日志上传至BMC;根据BMC的日志管理指令对本地报警日志进行管理;确认本地日志存储已满,对报警日志采用逐条覆盖策略进行管理。进一步的,所述获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控,包括:采集风扇当前转速和风扇设备码,所述当前转速与所述风扇设备码一一对应;根据温度传感器和风扇的所处区域,建立风扇设备码与温度传感器地址的映射关系;根据风扇设备码与温度传感器地址的映射关系,获取与风扇当前转速对应的目标转速,根据当前转速和对应目标转速生成转速调控信号,将所述转速调控信号根据风扇设备码下发至相应风扇控制器;确认风扇当前转速为0,生成包括风扇设备码的风扇异常报警信息,并将所述风扇异常报警信息上传至BMC。进一步的,所述方法还包括:通过开启2秒的看门狗,实现自身快速复位;通过与BMC定期通信,在通信失败后根据BMC发送的重启信号实现重启。第二方面,本专利技术提供一种服务器散热控制器的控制系统,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接控制芯片输入端,所述风扇控制器与控制芯片通过独立链路建立通信连接,所述控制芯片通过I2C连接BMC,所述系统包括:策略获取单元,配置用于获取BMC更新的散热策略数据;温度获取单元,配置用于获取温度传感器采集的服务器测温点温度;转速计算单元,配置用于根据所述温度和散热策略数据生成风扇目标转速;转速调控单元,配置用于获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控。进一步的,所述策略获取单元包括:数据校验模块,配置用于对所述散热策略数据进行CRC校验;数据缓存模块,配置用于将经过校验的散热策略数据保存至非易失存储器;数据存储模块,配置用于将内存中的散热策略更新为最新的散热策略数据。进一步的,所述温度获取单元包括:温度接收模块,配置用于获取温度传感器采集的服务器测温点温度和所述温度传感器的地址;温度报警模块,配置用于筛选超过预设温度阈值的测温点温度,并将包括所述温度和相应温度传感器地址的报警日志上传至BMC;日志管理模块,配置用于根据BMC的日志管理指令对本地报警日志进行管理;日志覆盖模块,配置用于确认本地日志存储已满,对报警日志采用逐条覆盖策略进行管理。进一步的,所述转速调控单元包括:转速采集模块,配置用于采集风扇当前转速和风扇设备码,所述当前转速与所述风扇设备码一一对应;映射建立模块,配置用于根据温度传感器和风扇的所处区域,建立风扇设备码与温度传感器地址的映射关系;转速调控模块,配置用于根据风扇设备码与温度传感器地址的映射关系,获取与风扇当前转速对应的目标转速,根据当前转速和对应目标转速生成转速调控信号,将所述转速调控信号根据风扇设备码下发至相应风扇控制器;风扇报警模块,配置用于确认风扇当前转速为0,生成包括风扇设备码的风扇异常报警信息,并将所述风扇异常报警信息上传至BMC。进一步的,所述系统还包括:自身复位模块,配置用于通过开启2秒的看门狗,实现自身快速复位;外部复位模块,配置用于通过与BMC定期通信,在通信失败后根据BMC发送的重启信号实现重启。本专利技术的有益效果在于,本专利技术提供的服务器散热控制器的控制方法及系统,采用将服务器的散热控本文档来自技高网
...

【技术保护点】
1.一种服务器散热控制器的控制方法,其特征在于,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接控制芯片输入端,所述风扇控制器与控制芯片通过独立链路建立通信连接,所述控制芯片通过I2C连接BMC,所述方法包括:/n获取BMC更新的散热策略数据;/n获取温度传感器采集的服务器测温点温度;/n根据所述温度和散热策略数据生成风扇目标转速;/n获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控。/n

【技术特征摘要】
1.一种服务器散热控制器的控制方法,其特征在于,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接控制芯片输入端,所述风扇控制器与控制芯片通过独立链路建立通信连接,所述控制芯片通过I2C连接BMC,所述方法包括:
获取BMC更新的散热策略数据;
获取温度传感器采集的服务器测温点温度;
根据所述温度和散热策略数据生成风扇目标转速;
获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控。


2.根据权利要求1所述的方法,其特征在于,所述获取BMC更新的散热策略数据,包括:
对所述散热策略数据进行CRC校验;
将经过校验的散热策略数据保存至非易失存储器;
将内存中的散热策略更新为最新的散热策略数据。


3.根据权利要求1所述的方法,其特征在于,所述获取温度传感器采集的服务器测温点温度,包括:
获取温度传感器采集的服务器测温点温度和所述温度传感器的地址;
筛选超过预设温度阈值的测温点温度,并将包括所述温度和相应温度传感器地址的报警日志上传至BMC;
根据BMC的日志管理指令对本地报警日志进行管理;
确认本地日志存储已满,对报警日志采用逐条覆盖策略进行管理。


4.根据权利要求1所述的方法,其特征在于,所述获取与所述温度传感器对应风扇的当前转速,并根据当前转速和目标转速生成转速调控信号,对所述风扇的转速进行调控,包括:
采集风扇当前转速和风扇设备码,所述当前转速与所述风扇设备码一一对应;
根据温度传感器和风扇的所处区域,建立风扇设备码与温度传感器地址的映射关系;
根据风扇设备码与温度传感器地址的映射关系,获取与风扇当前转速对应的目标转速,根据当前转速和对应目标转速生成转速调控信号,将所述转速调控信号根据风扇设备码下发至相应风扇控制器;
确认风扇当前转速为0,生成包括风扇设备码的风扇异常报警信息,并将所述风扇异常报警信息上传至BMC。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过开启2秒的看门狗,实现自身快速复位;
通过与BMC定期通信,在通信失败后根据BMC发送的重启信号实现重启。


6.一种服务器散热控制器的控制系统,所述散热控制器包括控制芯片、温度传感器和风扇控制器,所述温度传感器连接...

【专利技术属性】
技术研发人员:韩红瑞
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1