提高UPS系统给服务器等重要负载供电的可靠性

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1如何提高网络服务器等重要负载供电的可靠性HOWTOIMPROVETHERELIABILITYOFTHEPOWERSUPPLYOFTHEIMPORTANCELOADSSUCHASTHENETWORKSERVER翟玉杰中国联通沈阳分公司邮编11002113332410320关键词:UPS网络服务器冗余设计可靠性分析摘要:网络服务器等重要负载供电的可靠性不仅取决于UPS、配电线路、服务器设备电源的可靠性,而且还取决于冗余设计的可靠性。因此科学地选择UPS设备的类型、容量、冗余方式对于提高供电的可靠性具有非常重要的意义。文章通过图表分析、公式计算等通俗易懂方式详细阐述了单套UPS系统n+1、1+n、n+m冗余电路的可靠性;两套1+1并机冗余UPS系统输出双路总线、双路零切换全冗余电路的可靠性,深入浅出地给出了各种设计方案的可靠度分析和计算方法,可供电源设计时参考使用。众所周知,当今社会和经济生活对信息网络的准确度和时效性的要求越来越高,从某种意义上讲,信息就是效率和财富。所以对于电信、金融、证券等行业的网络服务器等重要负载而言,一旦出现电源中断故障,就可能造成巨大的经济损失,所以网络服务器等重要负载供电的可靠性已经成为信息网络安全的首要问题。一、可靠性概述可靠性的指标之一是可靠度R(t),它是指产品在规定的条件下,在规定的时间内、产品完成规定功能的概率。它是时间的函数,记作R(t)。显而易见,可靠度R(t)是时间的概率分布函数,表示产品在时刻0处于完好状态时,从0时刻到时刻t的时间间隔内正常工作的概率。{R(t)=P(Tt)}(公式1)可靠度R(t)的时间分布曲线如图1。图1众所周知,产品的可靠性随着工作时间的延长而越来越小。由图1可见:当t=0时,R(0)=1;当t=∞时,R(∞)=0。我们把t时刻尚未失效的产品,在该时刻后的单位时间内发生失效的概率与t时刻尚未失效的产品数之比称为瞬时失效率(FailureRate),用(t)表示,简称失效率。它反映电源系统或设备在t时刻失效的速率,也称为瞬时失效率。电源系统或设备的失效率)t(遵循下面的浴盆曲线:2图2电源系统或设备在运行初期的故障失效率λ(t)较高,如图2,主要是由于设计缺陷、元器件质量、制造技术、安装调试问题等方面产生的系统故障,一般成批出现,称为早期失效期。设备出厂前进行整机检验和环境老化处理是预防早期失效的主要方法。早期失效的问题全部发现和解决后,电源系统或设备失效率λ(t)迅速下降,趋于稳定,一直到寿命后期的故障高发阶段为止,很少发生失效,故障的产生原因具有随机性,这个期间叫做偶然失效期。在偶然失效期内,失效率λ(t)近似为常数λ,这一阶段是电源系统或设备的可靠工作期,也是最佳状态期,电源系统或设备的使用寿命主要取决于这一阶段的时间。电源系统或设备在偶然失效期内的失效服从指数分布,其可靠度:tetR)((公式2)•偶然失效期也决定着产品的寿命。对可维修产品而言,其平均寿命是指两次故障间的时间平均值,称平均故障间隔时间,用MTBF表示(MeanTimeBetweenFailures)。它代表的物理含义是电源系统或设备无故障工作时间的平均值。1dte)(0t0dttRMTBF(公式3)从公式5我们可以得出,电源系统或设备的平均无故障工作时间与瞬时失效率成倒数关系。称平均故障间隔时间长,瞬时失效率就低。二、UPS主机的选型对于网络服务器等重要负载而言,只要出现瞬间的供电中断故障,就可能会导致网络瘫痪,那时无论釆用什么措施来缩短UPS的维修时间,也无法弥补长达几十分钟到几小时的网络恢复时间所造成的危害。因此给网络服务器等重要负载供电的设备必须选用MTBF指标高的、性能先进的名牌产品。MTBF参数是电源系统或设备选型最重要的指标之一。YD/T1051-2000《通信局(站)电源系统总技术要求》对交流不间断电源设备的可靠性规定如下:在使用寿命期间内,MTBF应≥1×105h,即11.4年,现在进入中国市场UPS的MTBF一般都在10万小时以上,有的UPS标明MTBF是330万小时,不同品牌UPS的可靠性指标是有明显差别的。大量的UPS运行实践表明:额定输出功率大于15KVA的大容量UPS,其MTBF值较大,可靠性也较高。因此,当我们在规划、设计给IDC机房/电信机房网络服务器等重要负载供电的UPS时,应尽可能地选用大容量的UPS主机和釆用集中供电设计方案。选择UPS的额定容量的基本原则是总视在功率、总有功功率P、总无功功率都必须满足负载要求。选择UPS的额定容量时还必须考虑冲击电流、峰值电流、过载能力、负载突变等因素,必要时进行补偿。瞬时失效率λ(t)偶然失效期早期失效期损耗失效期规定的失效率使用寿命时间t3另外UPS的额定容量不宜接近负载功率。因为UPS长期处于重载运行状态,逆变器输出波形将发生畸变,输出电压会大幅度波动,造成UPS的性能和可靠性下降,所以极易造成网络服务器等重要负载损坏和UPS逆变器损坏;UPS额定容量也不宜较负载过大,UPS过度轻载运行虽有利于降低逆变器的损坏概率,但可能造成大量的空载损耗和蓄电池的深度放电。所以UPS负载量不宜长期超过其额定容量的70%,也不应低于其额定容量的20%。双变换在线式UPS电源能够确保负载与市电处于真正“隔离”状态,十分有利于避免来自市电的各种“干扰”串入到用户的负载上,其处理电网干扰的能力最强。为确保网络服务器等重要负载的正常工作,尽可能创造优良的电源运行环境,所以应首选双变换在线式UPS。在线式UPS有高频机和工频机两种机型。高频机输出一般不带隔离变压器,输出零线一般存在高频电流,主要来自UPS高频逆变器的脉动电流、负载的谐波干扰等,其干扰电压不仅数值高而且难以消除,容易提高输出端的零-地电压。工频机一般带隔离变压器,其输出端的零地电压较低,而且高频分量较少。大量运行实践证明,如果UPS输出端中线对地线的“干扰”电位大于1V,容易导致计算机网络数据通讯的误码率增高。所以对于计算机网络的通信安全来讲,降低零-地电压非常重要。还有一些负载要求输入与输出全隔离,所以UPS必须配置输出隔离变压器。但需要注意的是,工频UPS虽然标准配置输出变压器,但其隔离效果不一定完善,主要是由于一些工频UPS的旁路电源连接到UPS的市电输入,所以UPS的输出隔离变压器的中性线与UPS输入市电的零线也连通,所以只有带双隔离变压器才能将逆变输出与UPS市电输入和旁路输入完全隔离。工频机在抗干扰方面优于高频机,所以对于给网络服务器等重要负载供电的UPS还应以工频机为首选。选择UPS除了根据各种UPS的抗干扰性能以外,还应参考UPS的设计、制造、配套、服务等综合质量,应选择全数字化、高标准的常规指标、高效率低噪声的UPS。大型UPS应具有蓄电池智能化管理功能,以延长电池的寿命。必须选用高质量的蓄电池才能保证UPS主机的可靠性。鉴于市场上的密封免维护蓄电池质量良莠不齐,蓄电池的品牌的选择顺序应该是:国际的名牌厂家、国内的合资企业、引进技术生产的大型国内企业、一般国内企业。就蓄电池的选型方面来说:阀控吸附式蓄电池比阀控式胶体蓄电池寿命短,12V蓄电池比2V蓄电池的寿命短。综上所述,选购UPS应遵循以下基本原则:1)选择抗干扰性能较好的在线双变换式工频UPS主机。2)选择旁路输出带隔离变压器的UPS。3)输入功率因素大于0.9的UPS,具有恒压限流功能的UPS。4)选择优秀品牌和负载量在20%~70%的UPS主机。5)选择优秀品牌和总容量≥2h的≥2组的蓄电池组。6)选择电磁兼容性好、电池自动管理功强的UPS。7)选择操作简便,能够避免误操作的UPS。8)选择并机冗余性能较好的UPS。9)选择操作简便,能够避免误操作的UPS。三、UPS并机系统的可靠性随着Internet网络、电子商务、IDC机房的飞速发展,用户对UPS电源系统的可靠性提出了更高的要求,但是,如果从UPS单机的角度来看,无论其技术如何发展,仍然摆脱不了容量和可靠性的限制。这是因为对于可靠性为99.999%的UPS产品来说,它在一年中可能4造成的互联网的停机时间长达315s,即使将UPS产品的可靠性提高到99.999999%,在一年中可能造成的停机时间仍有320ms之长。对于IDC机房而言,如果真的发生长达320ms的停机故障,它会带来巨大的损失。这是因为当前多数计算机所允许的瞬间供电中断时间为10~18ms,否则就会造成网络服务器的重新启动或硬盘损坏。因此,要想保证网络服务器等重要负载连续不间断的运行,单纯靠提高UPS单机的可靠性是没有出路的。我们只能制备出故障率越来越低的UPS产品,还制造不出故障率为零的UPS产品。1.解决UPS输出单点瓶颈的措施那么如何实现UPS的容量和可靠性的提高呢?在单机的基础上,我们可以通过增加一定的冗余来提高UPS电源系统的可靠性。当使用1台UPS向网络电源系统供电,一旦这台UPS出现故障而断电,整个网络就会瘫痪,这就形成了单点瓶颈。解决UPS输出单点瓶颈的主要措施有以下三种:1)双机主从式热备份。将作为从机的UPS输出接到主机的旁路输入,平时由主机供电,从机处于备份。当主机故障时,负载切换至主机旁路,由从机承担供电任务。此电源系统结构和控制比较简单,但存在两机的元件老化程度不均匀、电源系统负载不能超过单机容量而且以后无法扩容的缺点。2)并机式热备份。两台或多台UPS并联运行,同时向负载均分供电,当其中一台故障时,该UPS从电源系统中脱离,由剩余UPS均分负载。此方案的优点是易于扩容,通过冗余备份能够提高供电的可靠性,但也存在各UPS在向负载供电同时,还在UPS内部的逆变器间形成环流缺点,当环流过大,将直接危及逆变器安全。一般来说,供电电源系统中并机数量越多,UPS电源系统发生故障的概率也越大。3)选择式热备份。两台UPS同时工作,通过静态开关选择其中一台UPS的输出向负载供电,UPS分别互为备用,只有当两台UPS同时故障时,电源系统将负载切至两台UPS共同的静态旁路,由市电继续向负载供电。该方案没有上述故障点,任何一台UPS局部或整体发生故障,电源系统仍能继续向负载供电,由于只有一台逆变器真正输出,故也不存在逆变器间的环流,但是静态开关成了单点瓶颈,此模式类似单机运行模式,带载能力相对差且不易扩容。以上三种冗余方式中,并机式热备份可靠性最高。即由2台以上的UPS并联向网络电源系统供电,至少冗余一台UPS的容量,那末即使1台UPS出了故障,其他的UPS仍可正常向网络电源系统供电,没有单路瓶颈问题,这样UPS电源系统可靠性就大大提高了。2.并联系统结构的可靠性2台或2台以上UPS并机工作,只要有一台UPS不失效就能保证整个系统正常工作的并机系统叫做并联冗余系统,其可靠性结构如图3。5图3根据图3,我们得出并联电源系统的各组成部分必须同时发生故障才能引起电源系统的失效,所以并联电源系统的总可靠度R(t)为:RS(t)=1-〔1-R1(t)〕·〔1-R2(t)〕···〔1-Rn(t)〕}(公式4)从公式18可见并联的电源子系统越多,电源系统的总可靠度越大。并联电源系统的总可靠度大于任何一个子系统的可靠度。所以当一台UPS组成的电源系统的可靠性指标无法满足网络服务器等重要负载要求时,我们可以采取增加并联UPS的数量来增加电源系统的可靠性。UPS并联组成的电源系统不仅能够提高UPS的可靠性,而且还能增加UPS电源系统的容量。3.两台UPS并机冗余UPS主机可以通过外加并机柜方式并联,并机柜提供同步和均流控制,同时提供并联电源系统的总静态旁路;也可以在每台UPS内安装一套逻辑控制板,控制各台机器的同步及均流输出,UPS输出直接.并联。UPS并联必须满足以下条件:1)相位和幅值相同,以保证UPS之间无破坏性的环流产生。2)负载均分。两台UPS并联后,每台UPS输出电流均为负载电流的一半。3)统一切换。当并联UPS电源系统中任何一台的逆变器出现故障(包括过载、短路和电池过放电而停止工作等)时,均不能将本身的负载单独转到旁路通道,而

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功