本文将揭示如何通过现代数据中心基础设施中新兴的高效热循环技术来实现这种颠覆性的方法。
随着人工智能和高性能计算(HPC)以惊人的速度重塑行业,驱动这一变革的硬件的热强度也随之飙升。现代数据中心已发展成为密集的产热生态系统,这使得先进的热管理和能源可持续性显得尤为重要。
重新思考数据中心热量:化废为宝
试想一下,如果数据中心产生的大量热量不仅可以无害地散发到大气中,还能发挥更多作用。如果这些热量可以被捕获、重新利用,并转化为宝贵的能源,那又会怎样?这一目标正是热量再利用的希望所在,这一策略从芯片级开始,并贯穿数据中心的整个能源生命周期。
本文将揭示如何通过现代数据中心基础设施中新兴的高效热循环技术来实现这种颠覆性的方法。
源头:高密度芯片的热量
每个人工智能工作负载的核心都是先进的高功率处理器——CPU、GPU和加速器——每个芯片的功耗高达数百瓦。每一瓦的功耗都会直接转化为热量,从而产生巨大的局部热负荷。
传统的冷却解决方案,例如空气冷却,甚至传统的液体冷却,已无法满足这些散热需求。因此,直接接触芯片的两相沸腾冷却技术至关重要。它不仅可以控制最热的芯片,还能提取和聚集热量,用于建设性用途。在百兆瓦“人工智能工厂”时代,这种转变不仅有益,更是全球可持续发展的催化剂。
高效散热:两相冷却
直接作用于芯片的两相池沸腾液体冷却彻底改变了提取过程:
•芯片产生的热量使冷却板内的传热流体直接在芯片上沸腾。
•这种从液体到蒸汽的相变吸收了大量的热能,其效率远远超过了单相流动系统的效率。
这种方法利用了一种称为池沸腾的工艺,该工艺可提供高效的热传递,与传统冷却系统相比,可显著降低能耗。该方法可保持最佳芯片温度,降低热梯度,并在相同的功率范围内实现更高的计算能力。
为了形象地理解池沸腾,请想象一锅沸水:即使能量输入增加,沸水的温度也永远不会超过其沸点。同样,池沸腾使芯片保持在一致、安全的限度内,提供零延迟、自调节的冷却,并可动态适应任何工作负载。
通过保持温度均匀并减轻热冲击,该方法还可以延长硅的使用寿命,这对于承受人工智能应用中快速功率波动的硬件至关重要。
热传输:利用自然蒸汽流
冷却剂蒸发后,蒸汽会自然流向散热装置(HRU),并在那里冷凝回液体。此过程几乎无需泵送,从而降低了能耗和机械复杂性,同时保持了强大的运行可靠性。冷凝后的液体会返回(通过重力或最小泵送)并补充冷却板,从而形成一个闭环系统。
能量回收:从热负债到清洁能源
两相直接芯片冷却技术可实现直接能量回收,而无需耗散捕获的热量。与有机朗肯循环(ORC)微型涡轮机等发电系统集成,蒸发的传热流体带动涡轮机旋转,在数据中心内部产生可用电能。
曾经被视为“废”热的热量由此重生为清洁的可再生能源,将热管理从成本中心提升为运营资产。
发电:构建可持续发展闭环
回收热能产生的电能可用于多种用途:
•直接为服务器供电可降低数据中心的整体能耗。
•抵消冷却能源成本可使系统高效运行。
•为设施的微电网供电,增强备用电源和稳定性。
这些策略共同构成了一个更智能、自我强化的热循环,在提升性能的同时显著减少环境足迹。
开启全新可持续基础设施范式
这种先进的热循环不仅解决了散热难题,还为智能、自主运营的数据中心打开了大门。以下是其主要优势:
•零用水量(WUE=0):传统数据中心每天冷却用水量超过一百万加仑。相比之下,两相冷却系统可以消除用水量,这对于缺水地区至关重要。
•超低功耗效率(PUE<1.05):传统设施的制冷能耗可能高达40%。两相冷却系统可将此能耗降低80%以上,从而将PUE降至最低。
•碳感知架构,助力实现净零排放目标:随着全球致力于到2030年将碳排放量减半,到2050年实现净零排放目标,能源优化的数据中心已成为可持续数字基础设施的基石。
另一个优势:与传统方法不同,传统方法需要设施水环路温度低于室外温度,这需要大量的水蒸发(通过冷却塔)或高能耗的制冷,而池沸两相系统则可在任何环境条件下高效运行。这种兼容性使超高效的干式冷却器能够最大限度地降低能耗,并且不会浪费水。
化挑战为机遇
借助池沸腾、两相直接芯片液冷和集成式ORC能量回收等技术,数据中心的热量可以从挑战转化为战略资源。软银和富士康等富有远见的公司已将这些创新技术应用于其运营,为资源高效的数据中心设计树立了新的全球标杆。
随着能源消耗成为我们这个时代最紧迫的问题之一,将“人工智能工厂”和高性能计算数据中心转变为净能源生产者的能力,将重新定义大规模计算的经济性和可持续性。
编辑:Harris
