1 能效逻辑简介
2007年,能效逻辑1.0推出的时候,数据中心能耗问题已经到了非常严峻的程度。数据中心密度和容量的不断增加,使其对能源的需求量越来越大,数据中心能源成本不断攀升;同时,美国国家环境保护局(EPA)基于对全球变暖的担忧,对数据中心的能源消耗进行了调查,并发布了相关报告。在此背景下,尽管数据中心行业针对能耗问题也提出了一系列的解决方法,但就效率优化而言,却始终没有一套综合有效的办法和策略。
能效逻辑1.0的推出,填补了这一空白。它推翻了行业内的传统观念,即重点考虑如制冷等数据中心基础设施支持系统的能效,而忽略了实际上消耗50%以上数据中心能源的IT负载的能效——IT负载的节能可推动制冷等基础设施各环节的节能。
2007年推出的能效逻辑1.0的能源节省主要通过构建一个基于5000平方英尺(即464.5m2)数据中心(该数据中心中配备210台平均机架密度为2.8kW的服务器机架)的精密统计模型进行计算。通过将各项能效逻辑策略应用于该模型,来计算各项策略对能源消耗的影响。
分析结果表明,通过能效逻辑1.0中的级联效应,服务器微处理器层面每节省1W功率可推动设施层面节省2.84W功率;协同执行能效逻辑中的10项策略,总体可节省数据中心52%的能耗及65%的空间。
2 对能效逻辑的更新
自能效逻辑1.0推出以来,数据中心技术发展迅速,为提高数据中心效率及容量创造了很多新的机遇。正因为如此,艾默生网络能源公司推出了能效逻辑2.0,在最初能效逻辑1.0的基础上融入了最近5年来最新的技术进展及最佳的实践。
在对能效逻辑1.0进行更新的基础上,能效逻辑2.0的核心原理仍保持不变。
(1)占一半以上能效节省的最主要部分还在于数据中心的核心IT系统,并基于此运用级联效应实现数据中心各个层面的节能。
(2)数据中心只有在能耗随负载需求变化而变化的情形下才能高效运行,如果不能在低负载率情况下高效运行的系统将会消耗更多能源。
(3)在不使用未经测试并且可能损害数据中心性能/可用性的设计或技术时,同样也可以显著降低数据中心的能耗。
更高机架密度的服务器当然可带来更多更高效的处理能力。然而,大多数数据中心未能配备最高效率的组件,而且由于很多数据中心缺乏性能实时可见性,而难于优化现有数据中心。
服务器处理能力的改进预计将使在最初能效逻辑1.0基础上建立的5000平方英尺(即464.5m2)数据中心模型的总功耗从1127W上升至1543W。在最初能效逻辑1.0中,PUE值为1.92,IT设备能耗约占总能耗的一半多一点(见图1)。
图1 在典型的5000平方英尺(即464.5m2)的数据中心模型中,IT系统的能耗占52%
如今,虚拟化这一市场已超越了原初能效逻辑1.0所描述的愿景。2007年,能效逻辑1.0预计经过优化的数据中心实现20%服务器的虚拟化。现今,服务器虚拟化的平均水平已达到30%以上。
能效逻辑2.0中的各项策略已进行了更新,以反映最新的技术和最佳实践。此外,能效逻辑2.0还对两项策略进行了修订,以反映能效逻辑1.0最初推出时尚未出现的新技术和新的最佳实践。
(1)ICT架构
能效逻辑1.0策略4重点考量了刀片服务器及其通过共享公共配件,包括风扇、网卡等节约能源的能力,而在能效逻辑2.0中,刀片服务器不再列为一项单独的策略。另外,能效逻辑2.0中关于虚拟化的建议融合了服务器整合,从而更好地反映了通常情况下整合与虚拟化的一致性。能效逻辑2.0中的策略4主要侧重于信息和通信技术(ICT)架构,该架构作为一种新兴的最佳实践,主要通过优化数据中心的IP连接来实现节能。
(2)数据中心基础设施管理
能效逻辑2.0的另一个重大变化是充分利用了数据中心基础设施管理(DCIM)。这看起来似乎只是一个微不足道的发展——将能效逻辑1.0的最后一项策略从监控更新为DCIM,但与监控相比,DCIM具有更为重大的意义。事实上,数据中心基础设施管理(DCIM)所提供的可见性与控制对能效逻辑2.0而言是一个整体方案,DCIM能够实现多个能效逻辑策略,因此不能靠叠加一些相互孤立的节能管理变成DCIM,而DCIM却可以实施多个能效逻辑策略。
3 节能因数的估算
优化数据中心性能时,大多数企业所面临的一大挑战就是对看似相互冲突的目标进行平衡:管理成本、满足日益增长的计算能力需求及确保持续的可用性。能效逻辑可在不影响数据中心可用性的前提下,通过提高效率来降低成本、提升容量,从而使数据中心经理能够有效地应对相互冲突的目标。
(1)级联效应
级联效应是能效逻辑策略的关键,它为数据中心效率方案提供了明确的方向。在一个PUE值为1.9的数据中心中,服务器组件层面每节省1W的功率可推动设施层面节省2.84W功率(见图2)。原PUE值越大,节省的能源也越多。
图2 服务器组件层面的节能级联效应
(2)能源效率
能效逻辑2.0的策略可使一个5000平方英尺的典型数据中心最多降低73.6%的能耗。假设一台设备的负载为1543kW,每千瓦时的能源成本为0.08美元,则每年的能源成本将从1081334美元降低至285926美元。若每千瓦时的能源成本为0.15美元,则每年的能源成本将从2027502美元降低到536112美元,节省金额更为可观(见图3)。
图3 采用能效逻辑前、后的年度能源成本对比
(3)容量
空间、制冷和供电是数据中心容量增长的三大常见制约因素。能效逻辑可将提高的效率转变为额外的容量,从而减弱数据中心增长时制约因素的影响。IT效率的提高等同于增加额外的UPS容量,而机房空调的改进可提高机架密度、节省物理空间。将机架的平均密度从5kW增加到12kW,加上采用能效逻辑2.0策略所获得的其他方面的效率的提升,可使服务器机架的数量从161个大幅度减少至27个,从而能够节省83%的数据中心空间。
(4)可用性
能效逻辑中的策略均为精心制定,目的在于不影响数据中心可用性的前提下提高效率。在某些情况下,为了确保数据中心的可用性,就只能运用某些措施实现节能,而设施类型的选用则可能决定在哪些环节可以实现最大的节能效果。全天候高利用率运行的IT设备设施需要配置低功率处理器及高效电源,选择电源管理技术获得最大益处,并选择如冷热通道封闭等高效制冷方法可以应对可预测IT负载峰值时间负荷突然增加。而这些方法除了其效率优势之外,还可延长IT设备耐热时间,并能实现更精确的容量控制。能效逻辑2.0所设计的一切策略均适用于所有的数据中心,并且在实施过程中不会增加宕机风险。
4 能效逻辑2.0节能策略
(1)低功率服务器组件
级联效应主要通过服务器组件层面节能来实现级联节能,这也是能效逻辑2.0将低功率服务器组件列为第一个节能步骤的原因。能效逻辑1.0强调通过提高服务器的效率以实现节能,实际上除此之外还有其他能够实现节能的方面。
热设计功耗(TDP)是目前用于衡量处理器效率的最佳标准。虽然在过去5年中服务器的效率得到了很大改善,但随着计算能力的平稳增长和功率不断增加,这些改善均被抵消。因此,服务器所消耗的功率仍与最初能效逻辑推出时所消耗的功率相同——估计为91W。
近年来,随着尖端技术的不断发展,服务器制造商不断推出功率比标准服务器低40~60W的高效服务器。经研究表明,该类低功率服务器与高功率模型所提供的性能相同。
若服务器的平均功率从91W降低至54W,则数据中心的能源消耗可降低11.2%(即172kW)。
此外,DDR3和DDR4 RAM(低功率双倍速率同步随机存储器)是针对传统服务存储器的低功率替代方案,不过该类组件的能耗节省可能会由于增大的服务器存储容量而抵消。另外,运用固态硬盘替代机械硬盘也可提高服务器效率。
(2)高效服务器电源
与其他服务器组件一样,现今所使用的电源效率仍然很低。虽然最初的能效逻辑1.0已使电源效率提高到79%,但电源能耗仍然比较高。现在的电源平均效率预计为86.6%,远低于93%的目标效率。如果效率可从86.6%提高至93%,则数据中心总功耗可减少7.1%。从理论上讲,在5000平方英尺的数据中心里,该数额相当于110kW,即节省总能耗的7%。
和其他数据中心系统一样,服务器电源效率取决于负载(见图4)。某些电源带部分负载情况下的效率明显优于其他电源,这在电源平均利用率低于30%的双输入电源设备中尤为重要。图4显示了不同负载下两种电源模型的效率。在20%负载下,模型A的电源效率约为88%,而模型B则接近82%。很明显,模型A的电源效率优于模型B的电源效率。
图4 不同负载率下的电源效率
(3)服务器电源管理
尽管大多数数据中心都不会在满负载下运行,但几乎没有人利用服务器电源管理策略来减少使用数据中心能源。同样的设备在20%或100%容量下运行时,均需消耗80%的能源,所以这就成了一个问题。
服务器电源管理可大幅度降低空闲服务器的能耗,但考虑到在运用该电源管理过程中,“唤醒”空闲服务器时需响应时间,因此未将其运用于典型数据中心。
此外,新的研究表明,老式服务器对数据中心性能指标的贡献较低,因此将电源管理应用于该类服务器的风险很小。
对于长期服役的老式服务器而言,它们对数据中心性能没有多大帮助,因此必须对其进行鉴定并将其合并到新式服务器中;然而,电源管理是一种很有效降低服务器功耗的过渡解决方案,它无需额外的技术投资,例如在夜间开启电源管理,可使不工作的CPU处理器处于空闲状态。降低功率到CPU峰值的45%功能消耗。同时,它也是一项理想的长期策略,可使服务器功耗随数据中心负载的变化进行动态调整。
数据中心基础设施管理系统可从机架配电系统收集实时运行数据,并将该数据与服务器利用率数据合并比对,从而能够提供可视化数据进行验证,同时还能确保安全、有效使用服务器电源管理。
执行电源管理可降低数据中心总能耗的10%,即执行策略1和策略2后,从剩余的1261kW负载中再节省146kW。
(4)ICT架构
随着数据中心的日趋成熟,现今的数据中心多为竖井式架构,且依照业务范围要求,将虚拟化限于个别应用层。未经优化的网络架构通常为重叠架构,缺乏资产跟踪,且网络交换/路由设施间欠缺协调性。这样的脱节信息通信技术架构与硬盘碎片相似,并对数据中心效率和性能均有影响。
新的结构化布线技术可通过提高信息传输速率降低热负载,从而提高效率,如图5所示。
图5 老式通信电缆可产生更多的热量,会降低数据中心效率
在执行综合性ICT架构时,须制订一个统一的相关政策及规则,以指导网络基础设施的设计和部署,从而确保所有的数据中心系统均遵照相同的规则和管理政策来实施。网络应设计为一个从服务器端到客户端的端对端系统,由IT部门负责和管理,然后作为一项服务提供给各业务部门。服务器和存储器从业务部门转到IT部门管理,这不包括内部高性能计算(HPC)型应用程序需求或法律之外需求。此外,IT资产的总体部署均依照统一的总体规划,以确保系统能随需扩展,实现网络规模 (例如带宽)和建设成本的最小化,同时可以充分利用DCIM集中监控的优势。
该方法有可能额外节省53kW的能源(节省总额的3.5%)。
(5)服务器虚拟化及整合
虚拟化可使老式服务器安全整合到体型较小的硬件中。同时,虚拟服务器也能提高IT人员对不断变化的业务需求和计算要求的反应能力。而物理服务器的固定硬件很难响应多种IT负载的业务需求和计算要求;同时物理服务器硬件须超额配置才能满足偶尔有高峰计算用户的需求。通过允许在同一服务器运行多个应用,IT容量能够更准确地适应实际需求,从而大幅度减少所需的服务器数量。每台虚拟化服务器每年可节省7000kWh电能,少排放4吨二氧化碳。
DCIM在帮助各大企业提高虚拟化水平及管理虚拟环境方面发挥着巨大的作用。同时,DCIM还实现了部署虚拟服务器的方式及支持该虚拟服务器的基础设施容量的可见性。通过DCIM,基础设施容量能够获得充分利用并且不会出现过度配置的问题。 (未完待续)
(御风) "));