咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
设为首页 | 收藏本页
智算,驱动UPS技术与应用——向高密、高容量飞奔
  • 基于智算中心规模的急剧膨胀和IT机柜容量的快速攀升,分析了传统百KW级UPS多机并联方案与MW级UPS相比,存在的诸如容积比、效率、可靠性、电气特性、建设成本等问题,提出了智算中心UPS容量选择应遵循与IT机柜容量等比例增长或基于特定功率密度模型的适配原则。
  • 一、引言
      
      随着人工智能技术日新月异,AI服务器的应用正以前所未有的速度普及开来。尤其是DeepSeek横空出世,宛如为人工智能的发展按下了加速键,极大地推动了人工智能在各行业的广泛应用。越来越多的智算中心拔地而起,为人工智能的持续创新与拓展提供坚实的算力支撑。
      
      相比于单台功率一般几百瓦到一千瓦的通用服务器,以英伟达GPU显卡为代表的智算服务器,单台8GPU(H100)卡的AI服务器动辄功率达到7kW甚至更高,提升了10倍还不止。图1列出了采用英伟达GPU的的功耗(8×GPU),若采用英伟达整柜型服务器,配置36张GPU的NVL36,单机柜的功率达到了67kW,而72张GPU的NVL72,单柜功率甚至达到了120kW。服务器功率的提升,对数据中心的传统电源系统不可避免地带来挑战。
      
      二、高密高功率AI算力服务器带来的智算中心电源系统挑战
      
      1.挑战一:高功率IT机柜带来UPS与IT机柜占地空间比的急剧增加
      
      我们知道,当前采用通算服务器的标准IT机柜,单机柜的功率密度一般为8kW,通过图1,我们看到采用AI服务器的标准IT机柜,单机柜的功率密度高达120kW,单柜的功率密度是前者的15倍。以2000个机柜规模的数据中心来看,单柜功率为8kW时,需要的功率是16MW,单路需求的UPS容量为19.2MW(按GB50174标准,UPS容量为IT负载容量的1.2),以2N架构来配置UPS,则需要38.4MW的UPS容量。而单柜功率提升至120kW时,建设2000个机柜,IT负载需要的功率则是240MW,同理,需要的UPS容量是576MW。
      
      回到UPS配置上来,当前国内数据中心普遍使用的UPS容量为600kW,那么前者需要UPS数量为64台,后者需要的数量则变为960台。详见表1。
      
      IT机柜的占地空间不变,而UPS需要的数量从64台急增到400台,再到960台UPS,再加上UPS配套配电设施等,以UPS为代表的基础设施占地面积将急剧膨胀。如果基础设施不加改变,那就只能压缩IT机柜的数量,将数据中心的大部分面积拿出来,用来放置UPS等关键基础设施,这样我们就没有所谓的得柜率可言,图2很形象地说明了这一点。
      
      再来看一个数据,大约从2014年开始,单台500/600kW容量的UPS开始规模投入使用,到目前(2025年)为止,数据中心普遍使用的UPS容量还是600kW,基本没有变化,而此时服务器机柜的单柜功率密度,已经从最初的8kW/柜提升到120kW/柜(Al服务器),提升15倍,而UPS等基础设施的单机容量却没有相应的变化,这显然是与AI算力中心急剧提升的功率密度变化不相适应。
      
      2.挑战二:当前数据中心普遍采用的多台UPS并联系统带来的诸多问题
      
      (1)超过4台并联带来的母线分段问题
      
      当前绝大多数IDC的UPS供电方案,普遍采用2500kVA的变压器,对应一般采用4台600k并联供电方案来增大UPS系统容量。但有些用户为提高变压器的利用率,UPS的容量一般会适当加大,会配置2700kVA至3000kVA的UPS。还有一种情况是随着智算中心的发展,肯定要突破2500kVA的变压器容量,采用更大容量的如3150KVA变压器,这些都会出现超过4台并联的问题。我们按配置3000kVA UPS来举例,需配置5台600kVA的UPS,而根据GB50174的规定,UPS并联的数量不应超过4台,如果继续采用600KVA UPS,就需要用3+2的方案,即3台600k并联+2台600k并联。就需要将母线分成2段,一段母线1800kVA,一段母线1200kVA,但这样面临负载分配的问题,需平衡哪些负载分配在母线1,哪些负载分配在母线2,分配不好的话,会出现母线1利用率不足,而母线2容量又不够的问题。图3给出了采用分段母线与采用2台1500KVA UPS并联组成的单一母线两种情况。
      
      (2)多台UPS并联带来的配电系统复杂和成本高的问题
      
      4台UPS并联,或5/6台分成2段母线来并联时,整个供电系统的配电柜数量非常多,配电系统的投入增大,配电系统也越来越复杂,故障点也增多,给运维人员带来很大的挑战。图4是UPS并联系统的整体布置图,可以看到,4台UPS需要外配7台配电柜,配电成本不但高,而且占地面积也很大,系统长度超过了15米(以伊顿9395型号UPS为例)。
      
      再来看图5中多台UPS并联的配电系统图,可以看到,节点多,系统复杂,还需考虑多个节点之间的协调保护和操作逻辑,会给运维人员带来更大的难度。
      
      (3)多台UPS并联时,绕不开的旁路均流问题
      
      我们知道,当多台UPS并联供电时,在旁路状态下,UPS是无法均流的,只能靠线缆的阻抗来被动均流,而线缆的阻抗,在实际施工中,是很难去控制的。就像接在同一管路中的同样的水龙头,有的水流很大,有的水流却不足。因此会出现并联系统中的多台UPS,在旁路状态下,有的却输出电流小,有的输出电流大,甚至出现过载的情况,这就会导致很严重的后果,甚至会出现断路器跳闸或负载宕机的情况。图6很详细的说明了此问题。
      
      (4)多台UPS并联,带来系统效率降低的问题
      
      在某互联网头部企业做的测试当中,4台UPS并联之后的系统效率,比单台UPS的效率要低。当系统的并联数量增多,线缆、铜排、环流等,都造成系统效率的降低。以1500kVA举例,单台1500k的UPS,比三台500kVA并联的UPS,能耗节省约29%,一年可节省16.7万kWh电费。如图7所示。
      
      (5)多台UPS并联扩容使用时,带来的系统可靠降低的问题
      
      在实际运行中,多台并联扩容使用时,并联系统的可靠度是低于单台UPS。当然,这种情况在2N供电的系统中,多数情况下是可以避免的,因为单路UPS系统带载是不超过50%的,但是,当A路母线出现故障,所有的负载都由B路负载承担时,此时就会出现上述的并联扩容使用的情况。如图8所示,UPS单机的失效率低于多台扩容并联系统。所以,我们可以得到第二个结论就是:当前数据中心的UPS供电方案并不完美,存在着诸多问题。
      
      三、高密高功率UPS是智算中心UPS电源应用的大势所趋
      
      1.高密高功率UPS解决占地问题
      
      随着AI服务器的功率越来越大,单机柜的功率密度急剧提升,UPS等关键基础设施的容量和功率密度也应该随之增大,才能适应AI算力中心的建设需求。要强调的是,这里说的是2个方面,一个是UPS单机容量,也就是UPS容量颗粒度的增大,才能减少UPS数量,减少相关的配电等设施的复杂度和投入;一个是UPS功率密度的提升,这样才能大大减少占地面积,解决空间不足的问题。
      
      再来看,当前头部厂商的UPS解决方案已经在往这个趋势发展,伊顿于2024年推出的9395XR UPS方案,是其经典机型9395的升级机型,单机容量为1500-2500kW,以9395XR 1500kW为例,宽度仅1.6米,UPS的功率密度高达1042kW/m²,提升到了一个新高度。相比上一代的9395系列,占地面积减少70%,功率密度提升300%,如图9所示。其他厂商,如施耐德也推出了VXL机型,系统容量达到了1250kW,宽度尺寸仅为1.2米。维谛推出的Power9000系列,系统容量也达到了1250kW,宽度尺寸也做到了1.2米,容量和功率密度都很高。
      
      2.高密高功率UPS,解决传统多台UPS并机的诸多痛点
      
      当前的数据中心小容量多台UPS并联方案存在诸多问题,需要提出新的解决方案,以提升可靠度、降低投资、简化运维。如图10所示,以1500kUPS系统为例,列出采用大容量UPS代替多台UPS并联的新方案与传统方案的对比,初步结论是占地面积减少,配电柜减少,系统复杂度降低。
      
      经过细化分析,如表2所示,采用方案二解决了传统多台UPS并联的诸多问题,减少占地面积30%,减少配电投资54%,可靠度提升,系统耗电降低29%等,并且还具有无均流、系统简单易维护等特点,同时,部署难度和工程量也大大降低,优势明显。
      
      3.大容量UPS的应用情况
      
      采用大容量UPS,我们常常会担心是否技术成熟,是否有应用案例,可靠性如何?下面我们来了解一下大容量UPS的国内外的应用情况。
      
      国内来看,某云计算公司在宁夏中卫的数据中心,从2019年开始,已经陆续使用了数十台1000kVA的UPS,为其数据中心提供不间断供电。2022年,某大湾区城际轨交指挥中心,也采用了多台1200kVA的UPS,为大湾区的轨道交通指挥中心提供持续的供电保障。
      
      海外来看,2023年,某国际互联网巨头在东南亚的数据中心,采用了数十套1263kW的UPS,为其在亚洲的数据中心提供云服务。某东南亚的云服务公司,于2024年,在马来西亚的数据中心,采用数十套1500-1800kVA的UPS,为其数据中心供电。
      
      以上案例,未能尽数,但是可以看到,大容量UPS已经在国内外已经有了多年的应用案例,特别是一些海外的数据中心客户,已经在领先应用,相信大容量、高密度UPS的应用会越来越广泛。
      
      四、总结
      
      综上所述,高密、高容量UPS方案的应用展现出一系列无可比拟的显著优势。在空间资源利用维度,该方案凭借其高集成度特性,能够显著缩减占地面积,有效提升机房空间的容积率。从TCO控制视角出发,通过减少设备数量、降低运维复杂度等方式,可大幅降低投资成本,实现CapEx与OpEx的双重优化。在运行效能层面,高密、高容量UPS方案依托先进的功率转换技术,能够极大地提升电能转换效率,降低PUE值,增强数据中心整体能源利用效率。此外,该方案还能切实化解传统数据中心UPS多机并联架构下的诸多棘手难题。例如,有效规避因系统拓扑复杂导致的故障点增多、可靠性降低问题,解决多机并联时的旁路不均衡、环流损耗大等痛点,大幅提升系统的可用性与稳定性。
      
      随着智算中心IT机柜容量因AI算力需求激增而快速攀升,单机UPS容量必须与之协同扩容,遵循等比例增长或基于特定功率密度模型的适配原则,推动智算中心供电系统与IT系统实现精准同步发展,充分满足不断增长的严苛算力需求。
      
      作者简介
      
      刘志华,伊顿关键电源事业部南区技术经理,宁夏大学物理与电气工程系毕业,具有多年行业头部企业工作经历和丰富的相关行业工作经验,擅长数据中心供配电及UPS系统的解决方案设计。
      
      王伟,电力电子学硕士,伊顿关键电源首席专家(历任华东华南区销售总监、中国区销售总监、大中华区应用技术总监),中国勘测设计协会电气分会常务理事,《数智元》杂志编委,CDCC《数据中心备用电源白皮书》主编,参加过多部国家电源相关标准和行业白皮书的编审。在中国最早论证了“零地电压问题的非科学性”,开启了大功率高频机在数据中心的第一例及全面应用;在中国最早提出并实践了“数据中心的交流直供制式”,开启了数据中心供电系统的绿色低碳转型。
      
      编辑:Harris
      
      

  •