摘要:无论是设计的方案,还是建成的实体,对于一个数据中心,怎样评估其是否达到了需求和要求?尤其是在规划阶段,怎样评估规划方案是否满足要求?是否需要对方案进行进一步的优化?本文作者:中国太平洋保险(集团)股份有限公司后援中心建设办公室 肖建一 项元伟
数据中心基础环境规划的评估指标体系
摘要:无论是设计的方案,还是建成的实体,对于一个数据中心,怎样评估其是否达到了需求和要求?尤其是在规划阶段,怎样评估规划方案是否满足要求?是否需要对方案进行进一步的优化?本文作者:中国太平洋保险(集团)股份有限公司后援中心建设办公室 肖建一 项元伟
一、概述
随着数据中心重要性越来越突出,而承载数据中心运行稳定运行的前提是可靠的基础环境,如何规划数据中心的基础环境已成为越来越多的人关心的话题,这些人包括数据中心的建设者、运维者,以及规划和设计者。
数据中心的基础环境主要包括建筑、电气、暖通、弱电及智能化等一系列基础设施系统,它们是数据中心中所有计算机软、硬件系统的物理载体。数据中心基础环境的架构图如图1所示。
无论是设计的方案,还是建成的实体,对于一个数据中心,怎样评估其是否达到了需求和要求?尤其是在规划阶段,怎样评估规划方案是否满足要求?是否需要对方案进行进一步的优化?
如果有一套完整的指标体系对数据中心基础环境进行全面的评估,不仅可以最大限度地发挥投资的效能,得到更多的可用性,更能确保数据中心在日后的运行中保持安全性和稳定性。
二、数据中心的生命周期
每一个数据中心都存在生命周期,且具有二意性,即设计理念的生命周期和生产运行的生命周期。设计理念的生命周期是指一个设计理念从产生到被新的理念取代所经历的时间周期。生产运行的生命周期是指数据中心从建成投入使用到被翻新重建所经历的时间周期,该周期通常会比设计理念的生命周期更长。
数据中心基础环境大致可分为建筑、装修、基础设施、IT设备等四大类,而每一类载体都具有不同的生命周期。通常情况下,我国相关设施的使用年限为:机房建筑的生命周期是50~70年;机房装修的生命周期是10~15年;基础设施的生命周期是8~10年;IT设备的生命周期是3~5年。也就是说,在一个数据中心建筑的完整生命周期里,装修需要经历3~5次,基础设施需要更新5~8次,IT系统更新的次数可能超过10次。
如何将这些不同生命周期有机地嵌套在一起是大型数据中心基础环境规划的关键点,也是管理数据中心的要点,一个数据中心可管理性的高与低很大程度上受此因素的影响,这是评估数据中心规划方案好坏的重要指标。
三、基础环境评估的指标体系
评估一个数据中心,可从“可靠性”、“效率性”、“经济性”和“可管理性”四方面入手。基础环境评估的指标体系如图2所示。
1.可靠性指标
可靠性指标就是指数据中心的建设标准,例如国家标准的A/B/C,或者国际标准的Ⅰ/Ⅱ/Ⅲ/Ⅳ等,设定合理的可靠性指标是一个好的规划方案的基础,它直接关系到效率性和经济性。一般来讲,可靠性越高,灾难发生时,系统宕机的时间越短,业务恢复的时间越快。但越高的可靠性就意味着更高的冗余性设计,这不仅会降低整体效率,还需要投入更多的建设资金。
因此,设置合适的可靠性指标要求在规划前期显得特别重要,其核心是正确评估所承载应用对业务连续性和数据完整性的要求,所有基础环境的可靠性指标(主要包括建筑、电器、暖通、通信等)都要贴紧应用对业务连续性和数据完整性的要求来设定,过低的可靠性指标无法满足业务的需要,而过高的可靠性指标将造成效率的降低和投资的浪费。可靠性指标的核心是分析业务需要什么,而不是简单地评估技术能做什么。
2.效率性指标
效率性指标是指数据中心输出的生产能力与投入资源的比例,包括空间效率、能源效率和设备效率。
(1)空间效率。空间效率是综合建筑面积、机房面积和配电密度的效率指标。该指标与平面得房率的最大区别是除了考虑建筑面积、机房面积外,还综合了配电密度(单位机房面积配电量)。空间效率更关注数据中心基础环境能提供的计算机装机能力,而不是仅仅关注计算机房的面积。例如:两个数据中心有相同的建筑面积、相同的机房面积,基础环境提供的计算机装机能力不同(即配电密度不同),虽然两个数据中心的平面得房率相同,但两个数据中心的空间效率是不同的,配电密度更大,数据中心的空间效率更高。空间效率的另一个衡量指标是单位建筑供电能力(PowerIntensityofBuilding,PIoB),它的单位是kW/m²(千瓦每平方米),该指标能够直观地反映单位建筑面积(含机房建筑及相关配套建筑)能输出IT负载的能力。
(2)能源效率。能源效率是能源使用的效率指标,它是PUE的倒数。从效率的角度看,该值更能直观地反应出能源的使用效率,该值越高,说明能源利用率越高。随着数据中心的能耗问题越来越突出,越来越多的大型数据中心的投资者、建设者和运维者关注基础环境的能源使用效率,目前数据中心的设计和技术发展方向都紧紧围绕着绿色节能这个主题,数据中心规划时要了解节能技术的发展方向。
(3)设备效率。设备效率是允许负载容量与额定容量的比。它和配置的冗余度成反比,降低冗余配置,设备效率提高,但可靠性随之降低。设备效率和能源效率是两个不同的概念,设备效率高的方案并不意味着能源效率也一定高。例如,N+X的直膨式风冷方案和2N的水冷方案都能达到T4的要求,N+X直膨式风冷方案(以6+2为例)的设备效率是75%,而2N水冷方案的设备效率是50%,但在满载情况下,2N水冷方案的能源效率显然会更高,那么研究设备效率的意义是什么呢?
任何一台机械设备都有一个最佳效率的负载区间,例如:空调机组高效运行状态的负载区间可能是40%~90%,在N+X直膨式风冷方案(以6+2为例)中,设备非常容易地进入高效的运行状态,而在2N水冷方案中,尤其是在项目建成的初期,设备可能会长期处于低负荷、低效率的运行状态,有时甚至会由于负载过低而无法开启。
数据中心的规划者在规划数据中心时要充分关注设备效率,当发现某方案的设备效率较低时,要对其可实施性和经济性进行充分评估,并提出在低负荷情况下提高设备运行效率的可行方案,关注设备效率的意义就在于此。
3.经济性指标
主要从建设成本、投资周期等多方面对数据中心基础设施规划方案进行分析和评估,主要的经济性指标包括专项投资占比和单位造价两项指标。
(1)专项投资占比。用来评估每个专项子系统在整个数据中心基础投资中的比例,包含按照土建、电气、暖通、设备、消防等不同的系统,分析投资的构成,评估各个子系统投资的平衡性。此项指标判断各子系统配置是否是正常的、合理的、均衡的。如果专项投资占比异常(与行业平均水平相比较),则说明存在单项短板或单项投入过度。
(2)单位造价。通常按建筑面积、电力等来计算,用来评估投资的整体合理性。单位成本的衡量单位有很多(机房面积、建筑面积、配电容量等),由于制约数据中心容量的最关键要素是电力,目前国际上通常更加重视计算机设备可用电力的单位造价(万元/kVA)。单位成本可以反映总体投入的合理性(与行业平均水平相比较)。
4.可管理性指标
数据中心的可管理性是指其可管理性的量化指标,该指标越高,可管理性越强。可管理性由基础环境的可管理性和运维管理能力两部分组成。规划时,可以先就基础环境部分进行定性和定量的分析。基础环境的可管理性主要包括环境及设施的模块化程度、核心系统方案的简单程度、环境系统监控的精细化程度,以及维护的方便程度等指标。可管理指标要素见表1。
在评估数据中心规划方案时,不仅要评估其安全性、效率性和经济性的指标,更要结合这些指标,评估其运行管理的复杂度要求,同时还要评估企业自身管理团队的能力,权衡数据中心基础环境系统对管理能力的要求是否与自身实际能力相匹配,从而得出其可管理性的评估结论。
四、数据中心基础环境评估的误区
在数据中心的实际案例中,典型评估误区主要包括“简单套用国际标准”、“滥用新技术”和“盲目追求PUE”。
1.简单套用国际标准
数据中心可靠性指标的核心是分析业务需要什么,而不是简单地评估技术能做什么。然而,实际案例中,一些数据中心建设方或规划方,在规划前期,直接用国际标准取代需求分析,提出一个建设T3或T4的建设要求或承诺,他们忽略了对不同需求进行业务连续性和数据完整性的分析,错误地认为按照国际高标准规划的方案就是好方案。
T3或T4的建设标准有非常高的可靠性要求,其评级要求是所有指标都达到规定的配置等级,且目前国际上没有对应的验收标准,所以很难有规划设计单位可以在不聘请第三方评级机构进行专业评级的情况下保证高等级数据机房设计方案可以达标。加上高等级机房的建设成本非常高昂,许多数据中心的投资人在数据中心的建设过程中都有“被设计”或“骑虎难下”的感受。
不同的业务有不同的可靠性要求,设置过高或者过低的建设标准都是不恰当的。应当通过深入的业务需求分析,找到与标准对应的点,实际需求不一定会出现按照某个标准等级一刀切的要求,许多用户的需求往往是一些指标的可靠性需求较高,而另一些指标的可靠性要求较低。一味追求国际标准,盲目贯标,最终会导致过度投入。
2.滥用新技术
新技术的应用往往会提升某个方面的性能,因此,数据中心的建设者往往会收到大量通过采用新技术来达到提升性能的建议。然而,新技术提升性能一般都会有假设的前提。例如自然冷却技术,对当地气候条件有明确的要求,凡是不在要求范围内的地区,应该不适用这一技术,或者说不会产生良好的节能效果(至少表明无法在短期内通过节能收回投资)。要规划、评估一个方案,应该是首先分析出业务目标,制定出明确的规划目标,在此基础上客观地评判什么样的技术对实现业务目标和设计目标有利。好的规划方案应该是一组最合适技术方案(包括新技术和成熟技术)的综合体,而绝不是所有新技术的堆叠体。
3.盲目追求PUE
随着数据中心建设规模的不断扩大,其能耗也越来越大,逐渐成为全球高能耗群体的重要成员,数据中心的能源消耗费用也成为数据中心运行成本的主要组成部分之一,加上全球控制炭排放体系的逐渐成熟,降低数据中心的能耗不仅有经济效益的要求,还有社会效益的要求,因此,数据中心的拥有者越来越关注数据中心的能耗问题,尤其是关注如何降低数据中心的核心能耗指标PUE。
PUE越接近于1,说明能源效率越高。PUE有两重性:一是设计值,是指数据中心规划时推算的值,是理论值,该值一般为数据中心可能实现的最高效率;二是运行值,是指在实际使用过程中,数据中心能够达到的值,运行值一般不会超过设计值,但一个好的运维团队可以把实际能耗指标控制在接近于设计值的水平。
制约PUE的因素很多,包括气候、架构方案、产品选型、工程质量,以及运维水平等。数据中心的规划、设计和建设主要是完成架构方案、产品选型和工程施工,难以对气候和运维水平这两个对实际能耗影响最大的因素产生决定性的影响。一般来说,降低能耗的方案都会伴随更多的前期投入,并对运维管理能力提出更高的要求,只有在两项都符合的前提下,实际能耗才会被降低。因此,规划阶段要正确评估选址、技术和运维管理能力,设定合理的能耗指标。把PUE的设计值和预期要求控制在合理内是数据中心规划过程中需要考虑的众多效率指标要素中的一项,节能措施选择应以不对可靠性和经济性产生大的影响为前提,并与运维团队的管理能力相配套。
综上所述,评估数据中心的好坏不能仅仅看它的建设标准和能耗指标,数据中心的评估是一项全方位的工作,需要综合考虑安全性、效率性、经济性以及可管理性,尤其要重点评估它与用户需求的符合度,通过有效的评估让用户选择最合适的建设方案才是评估工作的最终目标。【红尘有你】
摘要:无论是设计的方案,还是建成的实体,对于一个数据中心,怎样评估其是否达到了需求和要求?尤其是在规划阶段,怎样评估规划方案是否满足要求?是否需要对方案进行进一步的优化?本文作者:中国太平洋保险(集团)股份有限公司后援中心建设办公室 肖建一 项元伟