咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
设为首页 | 收藏本页
如何利用专业知识和解决方案塑造数据中心的未来
  •  数据中心正在经历前所未有的变革。随着人工智能应用的普及,对GPU和CPU的需求激增,推动了云计算的进一步扩展。

    数据中心正在经历前所未有的变革。随着人工智能应用的普及,对GPU和CPU的需求激增,推动了云计算的进一步扩展。这种趋势不仅改变了数据中心的设备配置,还对其支持基础设施提出了新的要求。例如,设备机柜的尺寸越来越大,以容纳更多的硬件设备。然而,推动这些变化的不仅仅是设备数量的增加,还包括对设备质量和功能管理的更高要求。随着数据中心对GPU和CPU的高强度使用,液体冷却技术变得至关重要,它能够将冷却剂直接引导至芯片附近,有效管理热量排放。
      
      液体冷却技术的重要性
      
      Wesco公司数据中心解决方案副总裁Alan Farrimond强调了定制化工程液冷解决方案的重要性,以满足每个系统的特定需求。他指出:“每个解决方案都是针对特定应用设计和定制的,因为环境条件会因地理位置和现有冷却方式的不同而有所变化。”Farrimond还提到,这些定制化解决方案不仅涉及液体冷却,还包括机柜设计、基础设施、布线、负载管理和地板改造等多个方面。
      
      数据中心设计的全面变革
      
      数据中心的变革不仅仅局限于液体冷却技术的应用。Farrimond进一步解释道:“这是一系列连锁反应——人工智能正在改变芯片架构,进而改变机柜设计、布线基础设施,甚至数据中心的整体布局和地板设计。”这种全面的变革正在重塑数据中心的未来。
      
      互联网3.0时代的挑战
      
      随着数据中心不断演进以满足AI驱动的工作负载需求,与功耗和冷却相关的工程挑战变得越来越复杂。Wesco数据中心解决方案技术销售高级总监Andrew Jimenez从工程角度补充了Farrimond的观点。他指出,基于CPU的服务器通常最大功耗在200瓦左右,而基于GPU的服务器功耗则高达700瓦。Jimenez解释道:“每台服务器配备8个GPU,其功耗可达5600瓦至6千瓦。考虑到GPU通常占服务器总功耗的75-80%,其余20-25%由其他组件消耗,总功耗可能接近10千瓦。当四到五台这样的高功率服务器堆叠在一个机柜中时,它们产生的总功率和热量带来了巨大的工程挑战。”
      
      传统数据中心与现代需求的对比
      
      Jimenez指出,早期互联网时代设计的传统数据中心与当今的需求形成了鲜明对比。他提到:“第一波数据中心专注于基本服务,第二波则侧重于云迁移,这些数据中心主要依赖空气冷却,足以满足当时的工作负载需求。然而,在当今AI驱动的互联网3.0环境中,电力需求急剧增加,每个机柜需要50至100千瓦的电力供应。”Jimenez强调,如此巨大的电力需求需要非传统的冷却方法,空气冷却已不再可行。取而代之的是,直接到芯片冷却、后门热交换器和完全浸入式冷却等方法成为现代数据中心的基本工程挑战。
      
      实施先进冷却系统的挑战
      
      决定将数据中心的冷却系统升级到更先进的系统是一回事,但考虑实际部署中的挑战同样重要。尽管大规模的全液体冷却在行业中仍相对较新,且成功实施的案例不多,但Jimenez认为Wesco在这一转型中处于领先地位。他表示:“我们正在调整商业模式,并与合适的公司合作安装这些系统——它们非常复杂,需要机械、电气和管道工程方面的专业知识。”Jimenez指出,承包公司可能精通建筑物的冷却系统,但他们往往缺乏在数据中心内部署这些系统所需的经验。因此,部署的挑战与散热的工程挑战同样重要。
      
      合作与全球部署的重要性
      
      Farrimond进一步强调了合作的重要性。他指出,由于解决方案的复杂性,即使在相同的设计中也可能需要多个制造商的参与,这使得合作关系变得至关重要。Farrimond表示:“那些理解并能够部署端到端解决方案的公司将会取得成功。这就是大型组织投资的地方——建立设计方面的专业知识,并与基础设施、布线、机柜、电力和液冷供应商建立牢固的合作伙伴关系。”他补充道:“这不仅需要端到端完成,而且需要大规模完成。随着数据中心在全球范围内建设,组织需要全球能力来满足需求。”例如,Farrimond强调,无论是在葡萄牙、马来西亚还是巴西,Wesco的全球工程团队都可以跨地区无缝地部署液冷。通过这种一体化的运营模式,Wesco的目标是作为一个统一的组织为客户提供一致的服务,无论他们是在意大利、日本还是其他地方购买。
      
      优化数据中心生产力
      
      提高数据中心效率以推动生产力和扩展的关键挑战之一是使系统能够相互通信以实现最佳性能和预防性维护。这涵盖了整个数据中心的各个方面,从电气和暖通空调到温度控制、安全、监控、生产力等等。客户和所有者从中发现了特殊的价值,因为它允许他们管理并超越已建立的SLA(服务级别协议)。
      
      中央智能管理器(entroCIM)
      
      为了满足这些需求,Wesco公司提供了中央智能管理器(entroCIM),这是一个智能设施平台,可以聚合来自IT和OT系统、子系统、传感器和第三方应用程序的数据。通过分析数据中心内的所有监控系统,该工具使操作人员能够在问题出现之前通过调度工程任务来提高生产力并防止意外故障。根据Farrimond的说法,entroCIM跟踪智能计量、访问控制、建筑管理、智能照明、AV、电气开关设备、工业控制、智能电源、视频监控等。
      
      可持续性:头号用例
      
      随着集成到数据中心的液体冷却系统的出现,可持续性指标反映这些进步是适当的。虽然电力使用效率(PUE)曾经是可持续运营的主要指标,但现在应将用水等其他因素视为整体可持续性方法的一部分。Jimenez认为,entroCIM是一个强大的工具,可以根据其设定的KPI监控数据中心的实际性能,为这些信息提供一个集中的点。
      
      软件的关键作用
      
      Jimenez指出,软件是弥合这一差距的关键,尤其是通过自动化:“这可以让你找出效率低下的地方,这可以通过软件调整或增加员工来填补这些空白来解决。它是一个强大的工具,可以发现你甚至没有意识到的问题,为你的运营提供有价值的见解。”entroCIM连接并集成到数据中心或建筑物内的各种系统中,作为数据收集的基础。通过从传感器收集数据,它可以编译信息并做出明智的决策,在多个平台上进行协调。在人工智能和机器学习的基础上,该工具可以自主决策,优化数据中心的运营。
      
      数据中心的物理变化与可持续性
      
      数据中心的物理形状正在发生变化,维护设备所需的空白空间越来越密集,灰空间越来越多。随着这些变化的展开,管理设备的周转和回收成为数据中心发展全循环方法的重要组成部分,以确保可持续性和长期效率。
      
      技能短缺与需求
      
      介绍了entroCIM及其在优化数据中心生产力和可持续性方面的主要用途后,Farrimond进一步解释了这项技术如何影响基本技能的规划和预配置:“通过将所有这些数据汇集在一起,您可以有效地管理数据中心不同区域所需的技能。这使您能够预先计划和解决技能短缺问题,特别是在需求很高的时候。从生产效率的角度来看,这些数据使您能够确保随时随地在全球范围内做好准备。”
      
      技能短缺的挑战
      
      为了说明这个问题,Jimenez强调说:“今天60%的数据中心的任务是为他们的数据中心运营填补人手。没有足够的熟练劳动力来填补数据中心运营和数据中心建设的巨大增长和需求。”很明显,使用entroCIM来识别操作差距是一项关键能力。Jimenez提出了一个关键点:这不仅仅是关于获取技能和劳动力,还与留存率有关。随着数据中心的能源足迹不断增加,我们如何在当今的环境中有效地运营,同时应对技能短缺的挑战?
      
      人工智能的角色
      
      在这里,谈话转向了使用人工智能来解决技能短缺的哲学问题。一方面,人工智能和机器学习在劳动力短缺的关键时期满足了需求。另一方面,有人担心人工智能驱动的软件系统可能最终会减少对人类参与的需求,特别是在生产力任务中。Jimenez分享了他的观点:“我相信会有某种程度的共存——这只是平衡的问题。人工智能当然可以处理重复性的任务,但对于体力任务,比如在数据中心打补丁,我认为它不会很快取代人类。”
      
      人工智能与人类工作的共存
      
      Farrimond进一步阐述:“数据中心总是会有物理任务。虽然软件可以分析数据并预测什么时候需要注意——无论是修复问题还是预防问题——但它不能自己执行物理工作。数据中心就像一个存储数据的房子;软件可以协助完成某些任务,但手工、动手的工作仍然需要人们来完成。”
      
      结论
      
      最终,在不断适应新需求的软件的帮助下,Wesco似乎在管理数据中心的物理演进方面处于有利地位。Farrimond总结道:“这是一个端到端解决方案,有一个随着功能增长而发展的路线图。数据中心的未来将发生变化,预测这些变化至关重要。”
      
      通过专业知识和创新解决方案,Wesco正在引领数据中心向更高效、更可持续的方向发展。随着技术的不断进步,数据中心将继续演变,以满足日益增长的计算需求和环境责任。 

     
      编译:Harris
      
        
      

     

     数据中心正在经历前所未有的变革。随着人工智能应用的普及,对GPU和CPU的需求激增,推动了云计算的进一步扩展。