咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
设为首页 | 收藏本页
解锁核心枢纽楼机房高密度制冷系统割接新技能
  • 随着公司业务高速发展,机房内单机架功耗不断攀升。机房设备功率密度的增加为机房冷却系统带来了日益严峻的挑战。为消除机房局部热点隐患,河北公司枢纽楼动环维护人员通过CFD技术对核心机房SKSL列机架的高功率密度制冷系统割接的问题进行了详细分析并提出了解决方案,后经模拟推演,现场试验等手段对方案进行论证,在实施全过程零告警的条件下,完成了机房空调系统的割接替换。
  • 一、案例详情
      
      1.基本情况
      
      中国电信河北公司某枢纽楼核心机房始建于2004年,承载省际全网性业务同时还集中为全省提供业务支撑,为集团规模稳定的A类机房。二十年来,随着业务量不断增长,机架功率密度大幅上升,远超机房最初的设计容量,进而出现了气流组织混乱、局部环境温高、供冷能力不足等问题,给通信系统的运行带来不可忽视的安全隐患。
      
      省枢纽楼核心机房SKSL列间通道温度常年处于30℃以上,经封闭冷通道改造后降温效果仍不明显。针对此问题,动环维护人员采用CFD技术对核心机房SKSL列机架局部环境温高的问题进行详细分析并提出了优化方法,通过CFD模拟推演优化路线进行论证,确定空调割接扩容的解决方案,并采取现场试验对方案的实施细节进一步优化,实现了改造过程零告警的机房局部供冷能力升级。
      
      2.详细描述
      
      1)设备散热现状:
      
      对SKSL列间通道周边机柜功耗水平进行逐一勘察,结果如表1所示。
      
      由表1调研结果可以看出,SKSL列间通道周边机柜功耗较大,共计98.7kW。其中SKSL两列机柜中,有近半数机柜的设备功耗已超过原有的设计容量(3kW),最大的单机柜功耗6.1kW。
      
      且经现场勘察,发现SKSL柜列周围的列间通道宽度不足600mm,设备散热所需空间严重不足,易造成空间局部热堆积,详见图1所示。
      
      2)供冷能力:
      
      用于列间通道环境控制的冷源设备为3台某品牌风冷型房间级精密空调,额定制冷量30kW,于2014年投入运行。
      
      空调的气流组织形式为经过风压箱的下送上回。该静压箱自SJ列至SM之间的列间通道均有设置可变开度的百叶送风口,可在一定范围内调节送风量和送风方向。
      
      考虑到空调服役年限较长,维护人员对空调的实际制冷量进行了现场测试,结果表明空调风机风压不足,静压箱出口风速低,室内机箱体内存在"冷堆积"现象,单台空调的实际制冷量约为23kW左右。
      
      3)问题分析:
      
      从冷热供需关系上看,SK、SL、SM三列设备运行时所产生的冷负荷为73.5kW,而周边的主力冷源却仅能提供69kW冷量,明显有"入不敷出"的现象,且已无法满足维护规程要求的设备容量N+1冗余的配置原则,详见图2所示。
      
      采用CFD技术对单台空调停机故障进行非稳态下的模拟推演。计算结果表明,当最近的一台设备停机后,SKSL列间冷通道内的环境温度将在10分钟内由30℃升高至48℃,甚至会给相邻的SISJ冷通道带来温高风险,详见图3所示。
      
      综上,该位置供冷能力严重不足,且缺乏合理冗余,若单台空调故障,极易引发多台空调压缩机过热保护,存在重大的机房温高隐患。
      
      4)确定解决方案:
      
      基于上述分析可以看出,该区域的局部热点不仅是机房气流组织混乱所造成,此前所实施的机柜盲板封堵、冷通道封闭改造均不能从根本上解决此问题。而是应该从冷热供需关系入手,实现设备散热与冷源供冷的匹配与平衡。
      
      因此,解决该隐患有以下两条路线:
      
      其一是降低冷负荷,减少机柜内的设备的功耗,降低散热量,结合前文所述数量关系,SK、SL、SM三列的设备需下电或迁移共计28kW用电负荷以满足冗余供冷目标。
      
      其二是加强该区域的供冷能力,譬如在局部热点附近加装列间空调,对已有空调进行扩容替换,从冗余较多的区域引入冷风。
      
      在对各用电专业的需求进行调研以及对现场空间情况进行测量后,综合权衡各方案的经济成本、时间成本以及改造难度。最终采取对已有空调进行升级替换的解决方案。
      
      根据原有的两台空调替换为维谛LiebertPEX41050房间级变频风冷精密空调,标称制冷能力50kW,辅以氟泵系统实现寒冷季节高效制冷,满足该区域设备冷却能力N+1冗余要求。经CFD模拟分析,空调替换后冷通道最高温度不超过26℃,详见图4所示。
      
      此外,根据其他机房的实测数据,该系列空调在同工况下,功耗相较于原有空调减少30%,详见图5所示。
      
      5)空调替换方案实施过程:
      
      为尽可能避免方案实施带来的机房温高风险,最大限度的缩短割接过程中的停机时间,保证割接停机时有较为充足的冷量供应,前期准备工作以及施工共历时9个工作日,具体过程如下:
      
      (1)屋面室外机安装(1天)
      
      将两台新空调室外机吊装在屋面预设位置,并将底座焊接牢固。
      
      (2)冷媒管路敷设焊接(2天)
      
      将冷媒管自新空调室外机设计路线敷设并焊接至室内机位置。
      
      (3)新空调拆解(1天)
      
      由于新空调体积较大,无法整机移动至指定位置,需要厂家技术人员对成品空调拆解,后在指定位置重新组装。
      
      (4)机房空调巡检、温度下调、临时补冷方案试验(2天)
      
      拆除空调前一天,维护人员对机房区域周边空调设备进行精细维护,确保空调稳定运行在最佳状态,并把机房的整体设定温度调整至22℃,将整个机房作为"冷池"储备割接停机所需冷量。
      
      此外,参考机房应急补冷预案对空调停机状态下临时供冷方案的有效性进行试验。临时供冷方案采用软风管自机房其他空调出风口引风,后经20000m³/h工业冷风扇送入SKSL冷通道,同时在冷通道内铺满装有冰块的矿泉水瓶以实现冷通道的降温。此外还辅以三台便携式轴流风机对相邻热通道进行排热,每隔10min对冷通道及周边环境进行巡视。试验结果表明,临时供冷方案实施全过程可将环境温度控制在31摄氏度以下,方案实施20min后能够有效控制冷通道环境29℃/50%RH,冷通道内冰块需3小时更换一次,融冰期间产生的冷凝水较少,不会对机柜设备造成威胁,详见图6所示。
      
      (5)第一台空调替换(1天)
      
      拆除西侧29#旧空调,安装调试新空调并投入运行。
      
      (6)原空调利用替换(0.5天)
      
      东侧的30#旧空调在前期检查时发现翅片有"慢漏"的现象,将前一天的替换下的旧空调进行利用替换。
      
      (7)更换中间28#空调(1天)
      
      (8)新空调运行观察48h,测试确认运行无异常后将机房环境温度调至24℃,拆除旧空调室外机,割接完成。
      
      测试观察期间,在仅有两台新空调满负荷运转时,SKSL冷通道内的最高温度可降至24℃以下,空调扩容改造方案取得圆满成功,详见图7所示。
      
      二、总结与思考
      
      1.案例总结
      
      本案例围绕河北公司省枢纽楼A类核心机房SKSL列间通道"局部温高、供冷不足、冗余缺失"的核心问题,通过"问题精准诊断—方案科学论证—风险闭环防控—分步稳妥实施"的全流程管理,成功完成制冷系统升级改造,实现了三大核心目标:
      
      1)彻底消除温高隐患,改造后机房标称冷量从原90kW提升至130kW,SKSL列间冷通道最高温度从30℃以上降至24℃以下,满足设备运行环境要求;
      
      2)恢复供冷冗余能力,新系统冷量不仅覆盖当前73.5kW冷负荷,还满足集团规模"N+1冗余"配置原则,即使单台空调故障也可避免温度骤升风险;
      
      3)实现零风险改造,全程未触发任何温高告警,核心业务无中断,验证了改造方案的安全性与可行性。
      
      在实践过程中,三大关键举措为改造成功提供了保障:
      
      1)技术赋能精准诊断:
      
      CFD技术的应用突破了传统"经验判断"的局限,即通过热力仿真明确了"冷热供需缺口"和"通道宽度不足600mm导致热堆积"的核心矛盾,又通过非稳态模拟预判了"单台空调停机10分钟内温度升至48℃"的故障风险,为"空调扩容替换"方案的确定提供了数据支撑,避免盲目改造。
      
      2)风险防控贯穿全程:
      
      前期投入2天开展临时补冷试验,通过"软风管引风+工业冷风扇+冰块降温+轴流风机排热"的组合方案,验证停机期间环境温度可控制在31℃以下;实施阶段采用"单台替换+48h运行观察"的分步策略,同时将机房整体温度下调至22℃构建"冷池"储备冷量,最大限度降低割接风险。
      
      3)资源优化降本增效:
      
      针对东侧30#旧空调"翅片慢漏"问题,将前一天替换的旧空调利用复用,减少设备采购成本;新空调选型精准匹配冷负荷需求,既避免"大马拉小车"的能耗浪费,又确保供冷能力冗余,实现"效能成本"平衡。
      
      2.案例思考
      
      本案例作为老旧核心机房应对"功率密度攀升"的典型实践,其经验可进一步延伸至通信行业机房运维与升级工作,同时也为未来工作提供了三大方向的启发:
      
      1)老旧机房改造需坚持"标本兼治",摒弃"头痛医头"思维
      
      当前多数2000年后建成的A类机房均面临"设计容量滞后于业务发展"的问题,仅通过"冷通道封闭、机柜盲板封堵"等气流优化手段,无法从根本上解决"供冷能力与冷负荷不匹配"的核心矛盾。本案例的"先核算冷热平衡、再针对性扩容"思路表明:老旧机房改造需先通过"现场功耗测算+CFD热力分析"明确核心矛盾,再选择"降负荷"或"补供冷"的解决方案,避免无效投入。
      
      2)技术工具需从"应急使用"转向"常态运维"
      
      CFD技术在本案例中展现了"故障预判、方案验证"的双重价值,但目前多数机房仅在出现温高隐患后才启用该技术。未来可将CFD纳入机房"全生命周期管理":
      
      (1)新设备上架前,通过CFD仿真预判单柜功耗增加对周边环境的影响。
      
      (2)每年度开展一次机房热力环境全面仿真,提前发现"潜在热点"(如某列机柜功耗逐年上升导致供冷余量不足)。
      
      (3)扩容改造前,用CFD对比"空调替换"、"列间空调加装"等多方案的效果与成本,提升决策科学性。
      
      3)推动"被动抢修"向"主动预警+智能调控"升级
      
      本案例通过"48h运行观察"验证改造效果,但后续仍需依赖人工巡检监测温度变化。未来可结合机房动环监控系统,构建"智能温控体系":
      
      (1)加装冷通道内"多点温度传感器",实时采集各机柜进风温度,一旦超28℃立即触发预警。
      
      (2)引入AI动态调节算法,根据设备实时功耗(通过动环系统获取)自动调整空调送风量、送风温度,避免"满负荷运行"造成的能耗浪费。
      
      (3)建立"冷负荷预测模型",结合业务发展规划,提前612个月规划供冷扩容,避免"隐患积累后紧急改造"的被动局面。
      
      综上,本案例不仅为老旧核心机房局部供冷升级提供了可复制的实践模板,更揭示了"技术驱动、风险前置、智能赋能"是未来通信机房运维的核心方向——唯有以"数据为依据、预案为保障、迭代为目标",才能持续应对业务发展带来的能耗挑战,保障核心通信系统安全稳定运行。
      
      作者简介
      
      李庆玉,中国电信河北分公司ICNOC动环主管。
      
      王宇宸,中国电信河北分公司ICNOC动环专家。
      
      编辑:Harris
      
      

  •