当前位置: 首页 > 专利查询>英特尔公司专利>正文

热交换器网络的自我修复、目标温度负载平衡及相关技术制造技术

技术编号:35895298 阅读:22 留言:0更新日期:2022-12-10 10:28
本公开涉及热交换器网络的自我修复、目标温度负载平衡及相关技术。公开了用于热交换器网络的技术。在实施例中,若干个热交换器和要被冷却的若干个组件在网络中连接在一起。可以单独控制流向每个组件和热交换器的液体冷却剂的流量。如果特定组件需要更多或更少的冷却,则可以控制经过该组件的冷却剂的流速。如果第一组件需要更多的冷却并且第二组件可以以更少的冷却进行操作,则可以将冷却剂从第二组件重路由到第一组件。因此,可以为系统的所有组件实现目标温度负载平衡。如果热交换器是有故障的,则可以将其隔离,并且可以让备用热交换器上线,使得系统是自我修复和容错的。然后可以在系统的其余部分在运转的同时修复或更换故障热交换器。更换故障热交换器。更换故障热交换器。

【技术实现步骤摘要】
热交换器网络的自我修复、目标温度负载平衡及相关技术


[0001]本公开总体涉及热交换器网络的自我修复、目标温度负载平衡及相关技术。

技术介绍

[0002]诸如处理器之类的组件会散发出大量的热量,必须将这些热量去除以防止组件过热。通过让空气穿过与组件耦合的散热器的散热片进行空气冷却,可以提供冷却,但空气冷却受到空气的相对较低的热容量的限制。液体冷却可以利用水和其他液体相对于空气的大的热容量。

技术实现思路

[0003]本公开的第一实施例提供了一种系统,包括:一个或多个计算设备的多个组件;多个热交换器;入口歧管,其连接到所述多个组件中的个体组件和所述多个热交换器中的个体热交换器,所述入口歧管用于将液体冷却剂从所述多个热交换器运送到所述多个组件;出口歧管,其连接到所述多个组件中的个体组件和所述多个热交换器中的个体热交换器,所述出口歧管用于将液体冷却剂从所述多个组件运送到所述多个热交换器;多个组件阀门,其中,所述多个组件阀门中的个体组件阀门控制流向所述多个组件中的相应组件的液体冷却剂的流量;多个热交换器阀门,其中,所述多个热交换器阀门中的个体热交换器阀门控制流向所述多个热交换器中的相应热交换器的液体冷却剂的流量;以及控制器设备,用于控制所述多个组件阀门和所述多个热交换器阀门。
[0004]本公开的第二实施例提供了一种控制器设备,包括:处理器;与所述处理器通信地耦合的存储器;一个或多个存储设备,包括存储在其上的多个指令,所述指令在由所述处理器执行时,使得所述控制器设备执行以下操作:为一个或多个计算设备的多个组件中的个体组件确定目标温度;为所述多个组件中的个体组件确定感测温度;以及基于相应组件的感测温度和相应组件的目标温度,来控制从入口歧管到所述多个组件中的个体组件的冷却剂流量。
[0005]本公开的第三实施例提供了一种方法,包括:由控制器设备为系统的一个或多个计算设备的多个组件中的个体组件确定目标温度,所述系统包括所述多个组件、入口歧管、出口歧管、以及一个或多个热交换器;由所述控制器设备为所述多个组件中的个体组件确定感测温度;以及由所述控制器设备基于相应组件的感测温度和相应组件的目标温度来控制从所述入口歧管到所述多个组件中的个体组件的冷却剂流速。
附图说明
[0006]在附图中以示例方式而非限制方式图示了本文描述的构思。为了图示的简单和清晰起见,附图中图示的元素不一定是按比例绘制的。在认为适当时,附图标记在附图之间被重复以指示出对应的或相似的元素。
[0007]图1是具有热交换器的网络的计算系统的液体冷却组件的系统的简化框图。
[0008]图2是图1的系统的控制器设备的至少一个实施例的简化框图。
[0009]图3是可以由图2的控制器设备建立的环境的至少一个实施例的简化框图。
[0010]图4

图7是可以由图2的控制器设备执行的用于控制冷却参数的方法的至少一个实施例的简化流程图。
[0011]图8和图9是可以由图2的控制器设备执行的用于管理热交换器网络的方法的至少一个实施例的简化流程图。
[0012]图10是其中可以实现本文描述的技术的示例性计算系统的框图。
[0013]图11是可以执行指令作为实现本文描述的技术的一部分的示例性处理器单元的框图。
具体实施方式
[0014]液体冷却可以将大量的热量从计算设备(例如,处理器)中的组件中移出。在一些情况下,可以使用热交换器来从液体冷却剂中去除热量,并且将其转移到另一种介质,例如空气或另一种液体。然而,如果计算系统的特定组件要求的冷却比单个热交换器能够提供的更多,那么该组件的性能可能会受到限制。此外,如果热交换器以某种方式变得损坏或效率低下,那么由热交换器提供的冷却可能会受到限制,这进而可能会限制被冷却的组件的性能。
[0015]现在参考图1,在一个实施例中,系统100包括一个或多个计算设备102,它们可以是机架104中的计算设备102。每个计算设备102连接到一个或多个入口管106和一个或多个出口管108。入口管106和出口管108分别通过入口歧管112和出口歧管114连接到几个热交换器110。控制器设备116控制与每个入口管106连接的组件阀门118,该入口管106向计算设备102的一个或多个组件提供冷却剂。控制器设备116还控制与每个热交换器110连接的热交换器阀门120。
[0016]在使用中,在说明性实施例中,控制器设备116通过控制热交换器阀门120来控制流经热交换器110的冷却剂,并且通过控制组件阀门118来控制流到每个计算设备102中的冷却剂。控制器设备116可以监视被冷却的组件的温度,以及进入和离开每个热交换器110的液体冷却剂的温度。控制器设备116可以基于组件的温度以及另一个组件的温度来调整去到每个组件的冷却剂。例如,如果第一组件的操作温度低于最大温度,而第二组件的操作温度达到或超过最大温度,则控制器设备116可以减小流向第一组件的冷却剂流量,并且增大流向第二组件的冷却剂流量。
[0017]附加地或者替换地,在说明性实施例中,控制器设备116可以监视和管理热交换器110。例如,如果控制器设备116确定热交换器110没有正确操作,例如通过确定液体冷却剂进入热交换器110时的温度与从热交换器110出来时的温度大致相同,而该冷却剂出来时的温度应当更低,则控制器设备116可以关闭该热交换器110的热交换器阀门120。为了补偿热交换器110的损耗,控制器设备116可以打开备用(或待机)热交换器110的热交换器阀门120,使得冷却功率没有净损耗。在一些实施例中,备用热交换器110可以在正常操作期间被使用,以增大冷却能力或者提供主动储备冷却供应,并且当故障热交换器110被脱机时,系统100可能不需要显式地激活备用热交换器110。
[0018]在一些实施例中,控制器可以提醒管理员,热交换器110没有正常操作。因为热交
换器阀门120是关闭的,所以管理员可以在系统100(和其他热交换器110)继续操作的同时对故障热交换器110进行热调换。
[0019]在说明性实施例中,每个入口管106具有组件阀门118以及流量传感器122,该流量传感器122用于监视通过入口管106的冷却剂的流速。此外,温度传感器124可以监视计算设备102的组件的温度。类似地,流量传感器126监视通过每个热交换器110的出口管128的冷却剂的流速。每个热交换器110的入口管132中的泵130将冷却剂泵送通过热交换器110。入口温度传感器134感测进入热交换器110中的冷却剂的温度,并且出口温度传感器136感测从热交换器110出来的冷却剂的温度。
[0020]说明性的热交换器110包括热交换器110中的一个或多个风扇138和一个或多个传感器140。传感器140可以例如在一个或多个位置处检测离开热交换器110的空气的温度和/或流速。
[0021]说明性的控制器设备116通过组件总线142连接到与计算设备102相关联的传感器和致动器(例如,阀门118本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,包括:一个或多个计算设备的多个组件;多个热交换器;入口歧管,其连接到所述多个组件中的个体组件和所述多个热交换器中的个体热交换器,所述入口歧管用于将液体冷却剂从所述多个热交换器运送到所述多个组件;出口歧管,其连接到所述多个组件中的个体组件和所述多个热交换器中的个体热交换器,所述出口歧管用于将液体冷却剂从所述多个组件运送到所述多个热交换器;多个组件阀门,其中,所述多个组件阀门中的个体组件阀门控制流向所述多个组件中的相应组件的液体冷却剂的流量;多个热交换器阀门,其中,所述多个热交换器阀门中的个体热交换器阀门控制流向所述多个热交换器中的相应热交换器的液体冷却剂的流量;以及控制器设备,用于控制所述多个组件阀门和所述多个热交换器阀门。2.如权利要求1所述的系统,其中,所述控制器设备用于:为所述多个组件中的个体组件确定目标温度;为所述多个组件中的个体组件确定感测温度;以及基于相应组件的感测温度和相应组件的目标温度,来控制从所述入口歧管到所述多个组件中的个体组件的冷却剂流量。3.如权利要求2所述的系统,其中,控制冷却剂流量包括:确定所述多个组件中的第一组件具有低于所述第一组件的目标温度的感测温度;确定所述多个组件中的第二组件具有高于所述第二组件的目标温度的感测温度;响应于确定所述第一组件具有低于所述第一组件的目标温度的感测温度以及确定所述第二组件具有高于所述第二组件的目标温度的感测温度,减小流向所述第一组件的冷却剂流量;以及响应于确定所述第一组件具有低于所述第一组件的目标温度的感测温度以及确定所述第二组件具有高于所述第二组件的目标温度的感测温度,增大流向所述第二组件的冷却剂流量。4.如权利要求1至3中任一项所述的系统,其中,所述控制器设备用于:监视所述多个热交换器中的个体热交换器的一个或多个性能参数;基于所述多个热交换器中的个体热交换器的一个或多个性能参数,来确定所述多个热交换器中的一热交换器是有故障的;响应于确定该热交换器是有故障的,来关闭控制经过该故障热交换器的冷却剂流量的阀门;以及响应于确定该热交换器是有故障的,来打开控制经过所述多个热交换器中的待机热交换器的冷却剂流量的阀门。5.如权利要求4所述的系统,其中,所述控制器设备进一步用于通知管理员所述故障热交换器是有故障的。6.如权利要求4所述的系统,其中,确定所述热交换器是有故障的包括:将所述热交换器的入口温度与所述热交换器的出口温度进行比较。7.如权利要求4所述的系统,其中,确定所述热交换器是有故障的包括:比较所述热交
换器的多个风扇中的个体风扇处的空气排放温度。8.如权利要求1所述的系统,其中,所述多个热交换器包括一个或多个打开的热交换器和一个或多个关闭的热交换器,其中,所述控制器设备用于:为所述多个组件中的个体组件确定目标温度;为所述多个组件中的个体组件确定感测温度;基于所述多个组件的目标温度和所述多个组件的感测温度,来确定所述关闭的热交换器中的一热交换器应当被打开;以及响应于确定所述关闭的热交换器中的一热交换器应当被打开,来打开所述多个热交换器中的一个热交换器上的阀门。9.如权利要求1所述的系统,其中,所述控制器设备用于:接收所述一个或多个计算设备的工作负载信息;以及基于所述工作负载信息来控制所述多个组件阀门和所述多个热交换器阀门。10.如权利要求9所述的系统,其中,所述工作负载信息包括由所述多个组件中的个体组件使用的功率。11.如权利要求9所述的系统,其中,基于所述工作负载信息来控制所述多个组件阀门和所述多个热交换器阀门包括:基于所述工作负载信息来访问数据库,其中,所述数据库包括与过去工作负载相关联的冷却参数,所述过去工作负载具有与所述工作负载信息相似的过去工作负载信息。12.如权利要求9所述的系统,其中,所述控制器设备用于:在数据库中存储对当前工作负载信息和当前冷却参数的指示。13.一种控制器设备,包括:处理器;与所述处理器通信地耦合的存储器;一个或多个存储设备,包括存储在其上的多个指令,所述指令在由所述处理器执行时,使得所述控制器设备执行以下操作:为一个或多个计算设备的多个组件中的个体组件确定目标温度;为所述多个组件中的个体组件确定感测温度;以及基于相应组件的感测温度和相应组件的目标温度,来控制从入口歧管到所述多个组件中的个体组件的冷却剂流量。14.如权利要求13所述的控制器设备,其中,控制冷却剂流量包括:确定所述多个组件中的第一组件具有低于所述第一...

【专利技术属性】
技术研发人员:普拉巴卡尔
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1