System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种浸没式液冷服务器循环散热故障检测系统技术方案_技高网

一种浸没式液冷服务器循环散热故障检测系统技术方案

技术编号:42721164 阅读:12 留言:0更新日期:2024-09-13 12:08
本发明专利技术公开了一种浸没式液冷服务器循环散热故障检测系统,涉及服务器散热故障检测技术领域,现有服务器散热故障检测系统对实时温度监控的依赖性过强而缺乏长期趋势分析和预测能力,无法充分预防潜在故障;冷却系统的响应速度和效率不足,难以及时应对突发的热量增加;系统复杂且集成度不高,导致维护困难和成本上升,本发明专利技术通过实时监测服务器内外部温度并结合负载情况,动态地调整该部件的数据采集优先级,确保及时获取到其性能和温度等相关数据,根据功率消耗的变化情况设定预警机制,触发相应的警报并进行相应的调整,增加该部件的数据采集频率能够及时发现散热系统的异常情况并采取相应措施,保障服务器的稳定运行。

【技术实现步骤摘要】

本专利技术涉及服务器散热故障检测,具体为一种浸没式液冷服务器循环散热故障检测系统


技术介绍

1、服务器循环散热故障检测系统是一种用于监测服务器散热系统状态并检测故障的技术,该系统利用温度传感器监测服务器内部关键部件的温度,如cpu、内存、硬盘等。通过定期采集温度数据,能够及时发现温度异常。

2、对此,公开号cn104424058a的专利文献公开了一种服务器散热检测系统,包括有用户终端、mcu、温度感测模组、若干用以散热的风扇、开关模组及发热模组,用户终端设置有用以输入预设参数的用户界面,发热模组包括有若干呈矩阵分布的发热电阻,开关模组包括有若干用以控制发热电阻通断的开关,mcu根据预设参数打开与发热元件的预设位置处对应的发热电阻的对应开关,以使对应的预设位置处的发热电阻工作而模拟发热元件产生热量,同时控制风扇以一预设的转速工作,温度感测模组用以感测发热电阻处的温度并将该温度传递至mcu,mcu将接收到的温度与预设参数中的一预设温度相比较,并将比较的结果显示在一显示屏上,用以判断发热元件的预设位置及风扇的转速是否达到要求。

3、对此,公开号cn106844155b的专利文献公开了一种服务器散热控制方法,包括:检测当前各个服务器节点的在位情况,并判断是否满足预设在位情况要求;如果是,则继续判断当前各个所述服务器节点所对应的散热器是否均在位,如果是,则按照预设散热调控策略控制各个所述散热器的工作状态;如果否,则提高其中已在位的散热器的散热效率。本专利技术所公开的服务器散热控制方法,通过提高其中已在位的散热器的散热效率,使得与存在散热问题的服务器节点邻近的散热器的散热效果增强,从而遍及到周围的服务器节点,如此使得各散热器对原本不对应的服务器节点也进行散热,从而兼顾所有服务器节点。本专利技术还公开一种服务器散热控制系统,其有益效果如上所述。

4、现有服务器散热故障检测系统对实时温度监控的依赖性过强而缺乏长期趋势分析和预测能力,无法充分预防潜在故障;冷却系统的响应速度和效率不足,难以及时应对突发的热量增加;系统复杂且集成度不高,导致维护困难和成本上升。

5、针对上述问题,为此,提出一种浸没式液冷服务器循环散热故障检测系统。


技术实现思路

1、本专利技术的目的在于提供一种浸没式液冷服务器循环散热故障检测系统,解决了
技术介绍
中监控的依赖性过强而缺乏长期趋势分析和预测能力的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种浸没式液冷服务器循环散热故障检测系统,包括:

3、数据采集模块,部署数据采集节点,确定服务器关键部位,其中包括cpu、gpu、内存,硬盘,电源,在关键部分部位部署温度传感器,确保数据采集节点获取温度信息;

4、初始化数据采集参数,设计数据采集频率1秒/次、采集范围0-160摄氏度、采集精度0.1摄氏度;

5、硬件功率调整采集优先级,监控服务器硬件的功率消耗;

6、数据采集节点采集温度数据,将采集到的温度数据存储在数据库,定期更新温度数据;

7、温度预测模块,将采集到的数据划分为每段100个数据点的重叠小段,初始化一个自编码神经网络,设置自编码神经网络的架构,包括输入层、编码层、解码层和输出层;

8、初始化中100个输入神经元、50个编码神经元和100个输出神经元的自编码神经网络,将每个小段输入到自编码神经网络中,自编码神经网络将学习小段中温度数据的潜在表示,通过解码器层重建小段,并将其与原始小段进行比较;

9、预测误差(原始小段与重建小段之间的差异)用于更新自编码神经网络的权重;

10、自编码神经网络的训练目标是最小化预测误差,原始小段与重建小段之间的均方误差

11、均方误差=(1/n)*σ(x_i-x_i')^2;

12、其中n是小段中数据点的数量;x_i是原始小段中的第i个数据点;

13、x_i'是重建小段中的第i个数据点;自编码神经网络通过反向传播算法更新其权重,以最小化均方误差;

14、散热故障检测模块,从温度预测模块中获取预测温度;

15、从数据采集模块获取实际温度,计算预测温度与实际温度之间的差异,设置阈值,阈值大小3摄氏度,计算公式为:

16、|预测温度-实际温度|>阈值;

17、动态冷却控制模块,监控服务器硬件的功率消耗,根据计算出的发热量,调整冷却系统参数;

18、系统管理模块,实时监控系统状态,包括数据采集节点状态,温度预测模型性能,冷却系统性能,服务器温度;

19、管理数据采集节点,添加、删除或修改数据采集节点,配置数据采集参数(如频率、范围和精度),监控数据采集节点的健康状况,配置预测模型和干预措施;

20、配置温度预测模型,包括训练数据、模型架构、训练超参数;

21、配置干预措施,包括异常情况阈值、触发动作。

22、优选的,数据采集节点定期获取温度传感器的数据,将采集到的温度数据存储在数据库中,定期更新数据,硬件功率变化调整数据采集的优先级,指数加权移动平均算法可表示为:p(t)=(1-α)×p(t-1)+α×p新;

23、其中p(t)是在时刻t的估计功率,p新是新的功率采样值,而α是加权系数。

24、优选的,在实施温度预测模块之前,需要对采集到的数据进行预处理,预处理步骤包括数据清洗、归一化和数据分段;

25、数据清洗:处理数据中的异常值或缺失值;

26、归一化:将数据缩放到相似的范围;

27、数据分段:将连续的数据划分为每段100个数据点的重叠小段,输入到自编码神经网络中。

28、优选的,输入层:包含100个神经元,用于接收原始小段的温度数据;

29、编码层:包含50个神经元,用于将输入数据压缩成潜在表示;

30、解码层:包含100个神经元,用于将潜在表示解码成原始数据;

31、输出层:与输入层相同,包含100个神经元,用于重建小段,初始化自编码神经网络的权重和偏置,权重和偏置使用随机初始化开始训练。

32、优选的,训练过程中,每个小段的温度数据输入到自编码神经网络中,训练的目标是最小化重建数据与原始数据之间的差异,训练过程可以分为以下步骤:

33、s1,正向传播:将原始小段的温度数据输入到网络中,通过编码器层生成潜在表示,通过解码器层重建数据;

34、s2,计算损失:计算重建数据与原始数据之间的均方误差,作为预测误差;

35、s3,反向传播:使用反向传播算法更新网络的权重和偏置,以最小化预测误差;

36、s4,重复训练:重复以上步骤,直到达到预设的训练次数或收敛到满意的误差水平。

37、优选的,正向传播计算公式:h=f(wx+b);

38、x是输入数据;w是权重矩阵;b是偏置向量;f是激活函数;h本文档来自技高网...

【技术保护点】

1.一种浸没式液冷服务器循环散热故障检测系统,其特征在于,包括:

2.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:数据采集节点定期获取温度传感器的数据,将采集到的温度数据存储在数据库中,定期更新数据,硬件功率变化调整数据采集的优先级,指数加权移动平均算法可表示为:P(t)=(1-α)×P(t-1)+α×P新;

3.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:在实施温度预测模块之前,需要对采集到的数据进行预处理,预处理步骤包括数据清洗、归一化和数据分段;

4.根据权利要求3所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:输入层:包含100个神经元,用于接收原始小段的温度数据;

5.根据权利要求4所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:训练过程中,每个小段的温度数据输入到自编码神经网络中,训练的目标是最小化重建数据与原始数据之间的差异,训练过程可以分为以下步骤:

6.根据权利要求5所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:正向传播计算公式:h=f(Wx+b);

7.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:设置阈值,用于确定何时认为散热故障发生,阈值大小为3摄氏度,即如果预测温度与实际温度之间的差异大于3摄氏度,则认为散热故障发生,差异大于阈值,触发散热故障的检测。

8.根据权利要求7所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:根据故障检测的结果,进行反馈和处理,向操作员发出警报,记录故障事件,并采取或手动的措施来调整散热系统。

9.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:功率消耗数据计算服务器产生的发热量,发热量计算公式:

10.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:根据计算得到的发热量,动态调整冷却系统的参数,包括风扇转速和水泵流量;

...

【技术特征摘要】

1.一种浸没式液冷服务器循环散热故障检测系统,其特征在于,包括:

2.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:数据采集节点定期获取温度传感器的数据,将采集到的温度数据存储在数据库中,定期更新数据,硬件功率变化调整数据采集的优先级,指数加权移动平均算法可表示为:p(t)=(1-α)×p(t-1)+α×p新;

3.根据权利要求1所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:在实施温度预测模块之前,需要对采集到的数据进行预处理,预处理步骤包括数据清洗、归一化和数据分段;

4.根据权利要求3所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:输入层:包含100个神经元,用于接收原始小段的温度数据;

5.根据权利要求4所述的一种浸没式液冷服务器循环散热故障检测系统,其特征在于:训练过程中,每个小段的温度数据输入到自编码神经网络中,训练的目标是最小化重建数据与原始数据之间的差异,训练过程可以分为...

【专利技术属性】
技术研发人员:玄利伟杜丽娜马明飞
申请(专利权)人:山西中云智谷数据科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1