一、机房建设应遵循的原则及UPS发展趋势
当前数据中心建设如火如荼,数据中心直接为IT设备供电的电源几乎都是UPS,一般中心用电量少至几十千伏安,多至几兆瓦,国务院国有资产监督管理委员会研究局早在“2009年绿色通信与节能创新研讨会”上就已经指出:中央通信企业在采购中要实施“三优先”:
•优先采购节能的通信设备和产品;
•优先采购低排放的设备和产品;
•优先采购复合循环经济理念的设备和产品。
当然在其它领域也应该遵照这个原则。这就是节能的“双碳”达标方向。所以在数据机房的建设中也应该有一个相应的节能措施。
1.机房建设应遵循的“五性”“三原则”
1)五性:
•先进性:目的是延长机器的服务寿命,比如当前UPS正处在高频机型逐步代替工频机型的时代,如果把将要退出和正在退出历史舞台的机器盲目购进,就有一旦故障而找不到备件的风险,到时会导致无奈换机,使机器提前报废。
•稳妥性:主要是可靠性与可用性。可靠性是指硬件的平均无故障时间,一旦设备出现故障,没有应急保障措施(比如维修)指标。而可用性则指的是在指定运行时间内,可靠供电时间所占整个运行时间的百分比。比如一年8760h,如果可用性指标是A=99.999%,那么允许故障维修时间t:
t=365天×24h×(1-A)=8760h×(1-0.99999)=0.0876h≈5.3min
•灵活性:指的是不停电在线增减容量、便于移动和更换等。
•可管理性:指的是监控、维修和保养。
•经济性:指的是最好的性价比。
2)三原则:
•节能的原则:选择什么设备就必须了解这种设备的发展趋势。机房中主要的供电设备就是UPS,那么就必须了解UPS的发展趋势,即高频(数字)化、小型化、智能化、模块化和环保化。
以负载为0.8的100kVAUPS为例:工频机UPS的效率一般<90%,而高频机UPS的效率一般在95%以上,现在已有的供电方案使效率高于97.5%,以二者效率相差5%相比,高频机UPS每年比工频机UPS节约50000度电,即工频机UPS每年比高频机UPS多消耗50000度电能。
•环保的原则:可闻噪声污染、电噪声污染和大气污染。由于高频机UPS的输入功率因子几乎为1,所以可闻噪声污染和电噪声污染已被消除。不过由于目前大功率高频机UPS的工作频率还不能达到和超过20kHz,所以可闻噪声暂时不能消除,除此之外的其它指标已远远走在工频机的前面。
•节省占地面积的原则:节约原材料、减轻重量、节约成本和能量。一个机房建成或改造后未进设备前显得特别空旷,但不久就显得特别拥挤了,所以一开始就得选择综合性强的设备,比如在条件许可的情况下可选供配电一起的UPS设备。
二、n+x模块化结构UPS的发展
1.UPS是计算机家族的孪生兄弟
早期的计算机输入都是将数字元或文字题目分解成0和1的基本布尔代数形式,然后将排列好的数字穿成8孔纸带,再通过光电机输入计算机,一旦市电停电,计算机内的计算结果就全部丢失。因此当时的计算机就希望在市电断电时能给计算机一个信号,而后有一个供电设备再继续供电5s,使计算机把现场的计算结果存起来,等市电恢复供电后,计算机就可以根据存储的结果继续计算了,于是就出现了第一代飞轮储能式UPS。二者相依为命,形成了孪生兄弟,也就是说UPS几乎是和计算机同时出现的,并且UPS就是为了保护计算安全而诞生的。
2.以往IT机房对供电容量要求的困难
在早期的计算机房对供电容量的要求并不精确,再加之当时的UPS都是所谓塔式单机,所以一般都是单机供电。后来由于对可靠性的要求越来越高,就出现了并机供电方式。那时也只是大容量的单机并联。实际上一般最终使用量比最初的设计小的多。这就是为什么以往的计算机机房“大马拉小车”者居多。比如图1所示的估计近5年的用电容量可能达到图中最上面的虚线值,于是就购买这么大容量的UPS,而几年下来实际用量远远小于估算值。比如某金融单位元按1600kVA容量配备的UPS,3年后才用了不到300kVA,造成了很大的浪费。
3.n+x模块化冗余UPS满足了所有IT设备对供电可靠性的要求
n+x并联式模块化UPS的出现就解决了这个困难,如图1中的阶梯线所示,模块可以随着机房机器容量的增加而方便地增容。达到了边增容边投资的要求,节约了长期占用资金的矛盾。同时也解决了小功率UPS不能并联的矛盾。

当时一般服务器的用电量小于5kVA,对供电的可靠性要求同样很高,但这种容量的UPS无法并联,原因是UPS的并机板比主机还贵,导致了相当一部分小型机房的供电可靠性无法提高,影响了工作的顺利进行。第一代n+x并联式模块化UPS的出现也使这个问题迎刃而解。
4.模块化UPS的含义
n+x冗余并联式模块化UPS的最大特点就是可以“热插拔”,即在不妨碍正常供电的前提下可以带电插拔UPS模块,或进行更换,或增容。这一方面提高了供电的可靠性,另一方面也给机房的值机人员带来了方便。如图2所示,目前UPS模块小至几百伏安,如图2(a)所示,就是4kVA一个单元的小摸块,如图2(b)所示的就是10kVA一个单元的模块,图2(c)所示的就是275kVA一个单元的大摸块。

应该指出的是,没有热插拔功能的所谓“模块化”结构不能纳入这个范畴。因为它没有为人们提供不停电操作的方便。当然,有的可以外加一些断路器或开关也可实现不停电更换或增容的功能,但需另外投资,那就不是模块化n+x冗余并联的概念了。
总之n+x冗余并联UPS有如下一些优点和功能:
1)解决了小容量UPS不可并联的问题,冗余并联比单机经济具有了使MTTR=0的可能性。
2)可以热插拔,现场维修性好。类似于整机的更换,延长了机器的服务寿命。
3)全部采用了高频化数字化技术,使可靠性大幅度提高;取消了输出隔离变压器,又使可靠性进一步提高;有的采用了无线并联技术,消除了瓶颈效应,使可靠性再度提高。
4)容易实现高可靠性的分区供电。
5)可靠性随机提高。比如一个容量为100kVA的机房,用了单个模块为20kVA的模块采用了5+1供电结构模式,即100kVA+20kVA,允许一个模块故障时供电不中断;但当负载小于80kVA时,就可以允许两个模块同时故障而供电正常。
5.模块化电路及其优点
由于模块化电路采用了半桥逆变器结构,省去了输出变压器,这就带来了许多好处。首先是提高了系统的效率;再就是提高了系统的可靠性,原因是变压器是和逆变器串联连接的;尤其是当多个UPS输出并联时,消除了环流。图3(a)示出了工频机结构UPS无输出变压器情况,这种结构对于单相而言如果输出不接地,可以正常使用,一旦接地就会损坏逆变器。而高频机结构UPS就没有这种弊病,如图3(b)所示。

这里以单相电路为例,而且只讨论主电路。首先讨论二极管整流和IGBT逆变的情况,并且假设该电路的输出电压已跟踪输入电压并在锁相范围内。这样假设的目的是说在此情况下逆变器功率管开启与截止是正确的,如图4(a)所示。从该图中可以看出,当L线为正半波时,电流从L出发沿箭头所示的路径经过两个整流器管和两个逆变器管后回到负极N。这是一个正确的途径,即UPS的作用在此种情况下是正常工作的。但由于有的IT厂家要求UPS输出(即IT设备)电压负极接地,否则就拒绝开机。无奈只好将输出N端接地,图4(b)示出了这种情况(由于输入电源的N端在变电站已经接地,实际上零线N和地势连接的),在这种情况下电流的路径开始沿箭头方向流动,但经过负载后尽管原来的逆变器功率管已经开启,但由于接地线的电阻远小于逆变管的内阻,因此电流再也不走向实心箭头所指的方向流经逆变管,而是拐入短路线。从该图上可以看出电流值流经一半整流器和一半逆变器,即UPS此时的工作就不正常了。但也不至于出问题,原因是负载给限流了。

然而在UPS输出电压相位没有完全跟踪好输入电压时就有隐患了。如图5所示。以上的讨论都是理想的同步情况,实际上启动的时机几乎都不是同步的,几乎在100%的场合都是爆炸。为什么会爆炸呢?这是因为当时的UPS在电源起动瞬间,由于辅助电压还没有建立完善,控制电路的工作还不正常,功率管的开通顺序几乎都不是按照设定的顺序工作,这时的开通顺序是随机的,如图5所示,不但不同步还不同相位,几乎100%情况下的功率管导通是图5(a)的样子,即当N为正L为负时电流的路径应该是:
N→VD1→VT2→R→VT3→VD4→L
但由于接地线的加入改变了电流的路径:电流由N出发就直接到了负载R的下端,又由于逆变器功率管VT3的开启,使电流不能经过负载R,而是直接经过整流管VD4回到L。这样一来,电流没有经过任何负载,两个管子的导通形成了短路状态,如图5(b)的等效电路所示,即使管子的内阻和导线电阻不为零,但已远远小于1,而且管子的功率越大则内阻也越小,加粗后的导线电阻也越小。比如一台1kVA的UPS,逆变器的效率为90%,即消耗100W,取五倍的功率管,即500W/50A,设短路电阻为0.1(实际上比这个值小得多),这时的短路电流就是2200A,强大的电流在管子的PN结上会产生强烈的焦耳热量,一方面会使截面积不相称的引线起火甚至烧断,一方面在PN结上的剧烈高度焦耳热也会使管子像炸弹那样炸裂。

无奈只好在UPS输出端外加变压器,如图6所示。从图中就可以看出,全桥电路后面加了隔离变压器后,UPS内部电流的恢复了正常,即电流通过变压器的初级绕组就流经了全部的整流管和逆变管。而变压器次级绕组接地则对电路不产生丝毫影响。至于三相UPS在全桥逆变器的情况下就更应该在输出加隔离变压器,其原因是除了上述理由外,另一个根本的原因就是它的三条(而且也只能是3条)输出线也都是火线。而用户的要求是带有零线的三相四线制供电模式,因此变压器是肯定要加的。如图7所示。

三、现代n+x模块化UPS采用的电路结构
现代n+x模块化UPS采用的就是最新的高频调制半桥电路。那为什么板桥电路就可取消输出变压器呢?难道它的两条输出线(对单相而言)就不是两条火线吗?为了说明这个问题,就用图8来进行讨论,图8示出了单相半桥逆变器的电路结构。从图中可以看出,原来全桥时一个桥臂的两个功率管换成了两个直流电源GB1和GB2,而且在两个电源之间的一条引线就是零线,这时电路的工作也和全桥时不同了,再也不是对角在线的两个管子输出半波。下面就来介绍他的工作原理。

1.产生正半波的过程:
变换器在脉宽调制信号PWM的控制下,功率管按照上述频率开通和在测量信号的监视下关断。比如VT1在某一时刻t=t1被控制信号打开,电流的路径如图8(a)所示,电流从GB1+出发→V1→L→C和与其并联的负载的上端→回到GB1-,在这个过程中,电池除了向负载提供能量外,对于电感L也是一个储能过程。V1的导通时间到在每一次导通结束时,储存了能量的电感L在V1快速关断的激励下产生高压反电势来阻止电流的突然变化,其反电势的正极方向就是原来电流的方向,但此时的泄放回路如图8(c)所示:电流由L+出发→C和与其并联的负载的上端→GB2+→GB2-→VD2→回到L-,在这个过程中L将储存的能量回授给了GB2。V1的每一次导通结束后都要伴随着一个回授过程,这就出现了图8(d)中第二个象线阴影中的波形。这时的电流方向仍然是由电路指向负载。到此,一个建立正半波的全部过程已经完成,由于PWM波输出的后面是LC滤波器,所以正半波的包络就被显现出来了,如图8(d)第一象线的阴影部分所示。
2.产生负半波的过程
产生正半波的过程结束后,就进入产生负半波过程。PWM控制信号开始触发V2,第一个控制脉冲使V2导通,电流Iout的路径如图9(a)所时,即:电流Iout从GB2+出发→C和与其并联负载的下端→L→V2→回到GB2-。可以看出,此时的电流方向与产生正半波时相反,是由负载指向电路;这时在电感L上是一个储能过程。和产生正半波时一样,在每一次PWM的导通结束时,储存了能量的电感L在V2快速关断的激励下产生高压反电势来阻止电流的突然变化,其反电势的正极方向就是原来电流的方向,但此时的泄放回路如图9(c)所示:电流由L+(靠近电路的一端)出发:VD1→GB1+→GB1-→C和与其并联的负载的下端回到L-(靠近负载的一端),在这个过程中,L将储存的能量回授给了GB1。V2的每一次导通结束后都要伴随着一个回授过程,这就出现了图9(d)中第四象限阴影中的波形。这时的电流方向仍然是由电路指向负载。到此,一个建立负半波的全部过程已经完成,由于PWM波输出的后面是LC滤波器,所以正半波的包络就被显现出来了,如图9(d)第三象线的阴影部分所示。

从此看出,半桥逆变桥臂上面的管子输出正半波,下面的管子输出负半波。对于三相半桥电路也是这样,如图10所示。大的功率模块就用这种三相半桥电路,三相半桥电路还有一个最大的好处,那就是对三相负载的均衡度没有任何要求,原因是三相输出电压是分别单独调整的,所以没有零点漂移问题。

3.半桥电路消除了并联环流
图11(a)所示为三相全桥输出并联时的电路原理图。由于这种电路的输出必须加隔离变压器,其输出并联实际上就是变压器次级绕组的并联。由于变压器绕制的不一致性,就必然导致其次级电压的差异,于是就形成了环流,如图11(a)中的虚线所示。而图11(b)所示的半桥电路输出并联就没有变压器。有的说半桥电路输出并联也应当有环流,即只要并联就会有环流。这几上这是一种误解,原因是作为并联的UPS诸输出电压相差一般不会超过0.5V,如果差值超过了这个限制值就说明这几台机器没有调整好,必须重新调整,以前是这样今后也应该是这样。有了这个量的概念,再回过头来看图11(b),如果有环流,其路径如图中箭头的走向,可以看出,路经上有两只二极管整流器是必须经过的,一般硅二极管整流器正向压降至少在0.6至1.0V之间。换言之如果并联电压差小于1V就完全整流器势垒阻挡了,它不像变压器绕组并联时,即使有0.1V的压差,其环流也会畅通无阻地流动。不过即使是全桥电路有并联环流由于其变压器压差很小也构不成威胁,因环流而导致电源故障的情况几乎没听说过。更何况环流最大值仅出现在空载状态,加负载后,由于线路上的压降有自动调节作用,也就自然消失了。

所以,无环流生成就给多个模块并联提供了可靠保证。当前的模块柜机已可以将容量做得很大,图12将市场上的多种模块组合柜机其中几种的外形表示出来,就可以看出其外貌一斑。

四、总结
鉴于以上这些优点,当前数据中心都大量使用了模块式UPS供电,并且收到了良好的效果,其前景无疑是光明的。
编辑:Harris
