不间断电源可靠性和可维护性的探究
2017-03-14李明祥
李明祥
【摘 要】不间断电源(UPS)供电系统是能够提供持续、稳定、可靠电源供应的重要外部设备。其作为民航空中交通管制的附属设备,其稳定性、可靠性决定着民航业的发展。随着民航空管数据处理量以及主体设备的增多,UPS供电系统也日渐形成大的规模,其影响面已经扩大至整个民航空中交通管制系统,一旦出现故障就会导致不可估量的损失。目前市面上的不间断电源供电系统品种繁多、供电方案多样,如何衡量不间断电源在供电系统的关键指标。本文通过对不间断电源可用性的探究,分析不间断电源的可靠性与可维护性,为不间断电源的合理应用提供借鉴与参考。
【关键词】不间断电源;可靠性;可维护性;可用性
1 可靠性的基本概念
在这个迅速发展的科技时代,任何企业或个人都不希望自己所使用的设备出现故障。但那时绝不可能的,设备也有其寿命,故障的出现只是时间长短的问题,如何去规避设备出现故障,减少损失。因此我们就得掌握设备出故障的概率到底有多少。于是人们提出了“可靠性” 的概念,并逐步用一些计算量来表示。
1.1 可靠性
我们把元器件或系统在设定的时间段t内无损坏的概率定为该元件或系统的“可靠性”。可靠性我们用函数P(t)表示[1],则可靠函数与时间t的关系如图1所示。由图可见,当时间为0时,系统的可靠性很高,随着时间的推移,系统的可靠性呈指数函数下降,直至最后有可能出現故障。
图1 可靠性随时间变化曲线
1.1.1 平均无故障时间(MTBF,Mean Time Between Failures)
不间断电源“平均无故障时间”描述的是不间断电源供电系统能够正常运行多长时间才发生一次故障。这是衡量UPS可靠性的重要参数,平均无故障时间越长,则可靠性越高。因为可靠性函数P(t)是时间的概率分布,所以平均无故障时间T为:
由此可见,平均无故障时间在数值上等于可靠性曲线与横坐标轴所限定的面积,如图2阴影部分所示。
1.1.2 故障率
在单位时间内(一般以年为单位),产品的故障总数与运行的产品总量之比叫“故障率”(Failure rate),常用λ表示[2]。例如某单位运行了100台不间断电源系统,一年之内出了2次故障,则该不间断电源系统的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(MTBF),即:
T=MTBF=1 ?姿(2)
例如某寿命服从指数分布的不间断电源的MTBF时间约为9万小时,9万小时约为10年,并不是说该不间断电源系统能工作10年不出故障。而是由T=MTBF=1 ?姿可知,?姿=1 T=1 10=0.1,即该不间断电源系统平均年故障率约为10%,也就是说一年内,平均100台该不间断电源有10台会出故障。
1.1.3 不同供电方案的可靠性的分析
随着科技的发展,不间断电源供电方案也得到稳步的发展。如:单机供电方案、热备份串联供电、N+1并联供电等。不同的供电方案,其系统可靠性也不一样,如表1所示(假设每台不间断电源的可靠性P为0.99)。
表1 不同供电方案的可靠性分析
2 可维护性的基本概念
在电源供电系统中,设备出现故障时,需要维护。而维护时间的长短同时也决定着供电设备的可用性。因此就引入了平均维护时间(MTTR,Mean Time To Repair)和维修率μ的感念。此二者的关系为:
?滋=1 MTTR(3)
据统计不间断电源系统维护过程中出现故障的概率占总故障概率的10%,也就是说一个不间断电源系统的维护性同时影响着可靠性。很多用户在选择不间断电源系统的时候只考虑可靠性与经济条件,而忽略了可维护性。可维护性越高,说明UPS在维护过程中不间断时间越短。
2.1 不间断电源供电系统可维护性的分析
第一代动态UPS。其利用机械惯性储能以及电动机、发电机的能量传输机制以提供短时间的不间断供电,使用起来噪声大。
第二代工频UPS。有任何故障或者异常都只能依靠原厂家维修,运维人员操作性差,耽误大量正常运行时间,对业务影响大。
第三代高频UPS。高频机从功能模块上提升了维护性,缩短了MTTR时间,可在数小时内完成修复。但是,随着科技的发展,各种先进元器件推陈出新:故障修复时间是否可以更大的去缩短?是否可以达到简便的自行维护?
第四代模块化高频UPS。模块化高频UPS在可维护性方面揭开了历史新篇章,维护技术门槛也大幅下降。对于单模块容量50KVA以下的小系统模块化UPS,采用模块热插拔技术运维人员可以自行在线维护和扩容,故障修复时间和扩容时间也缩短至分钟级,对于单模块容量200KVA以上的模块化UPS,采用模块隔离技术,虽然重量较重无法热插拔,但运维人员可以自行在线分、合模块来维护和查找故障,大幅度缩短修复时间,同时剩余模块自行保证用户的容量可用性[3]。
3 可用性概述
不间断电源系统在供电方案选择、机型选择时,用户都需要根据其重要性提出一个类似可靠性的一个概率值要求,即在规定时间内系统被有效利用的百分比,叫系统的可用性A。比如要求为99.99%或99.999%等。可用性的计算公式为:
A=MTBF (MTBF+MTTR)=?滋 (?滋 + ?姿 )(4)
也就是说系统的可用性与系统的可靠性与可维护性有关。目前比较重要的数据中心要求可用性A不能低于0.9999,也就是说,一年中机器的不可用时间S不能大于规定时间。S的计算式如下:
3.1 可用性的分析
随着UPS技术的越来越成熟,UPS高可用性的供电方案从单机系统逐渐演变成单机双总线系统、单机三总线系统、并机双总线系统等。为了研究方便,这里假设一些标准模块,应用这些标准模块可以建立各种供电系统的模型。标准模块数据如表2所示。
3.1.1 UPS并联冗余单路输出可用性
图3示出了并联冗余单路输出的供电模型。该模型中只有UPS并联在电路中,其它模块串联在电路中。就利用创建的这个模型的故障和维修率数据来估算可用性。
根据这个要求分配的各模块的故障率、维修率和可用性如表2所示,然后计算出该系统的总可用性为:
每年可能的故障时间为:T=365*24*(1-0.9936)=56.064小时。
3.1.2 UPS双总线输出可用性
图4示出了UPS双总线输出的供电模型。该模型源于在实际数据中心有的负载需要双路输入电源接口,因此要求双路供电。当一路电源故障时,传输电路会自动的将另一路接通。
如依旧利用上述的数据,则此时整个供电系统的可用性为:
每年可能的故障时间为:T=365*24*(1-0.99993)=36.729分钟。可见增加了一些设备后,宕机时间从56小时降低到37分钟。
4 结语
我国民航业与大数据中心的迅猛发展,在航班流量大幅增加的同时,空管基础设施设备尤其是电力系统越发重要,电力系统的不间断决定着民航的安全。本文通过对不间断电源的可靠性和可维护性的探究。得出了这样一个结论:并联是提高可靠性的有效途径,模块化是提升可维护性的有利因素。因此,在实际数据中心建设的工作中,一定要根据数据中心特点与要求,采用合理的不间断电源供电方案与型号,提升数据中心整体的可用性。
【参考文献】
[1]王其英,何春华.新型UPS工作原理与实用技术及选购指南[M].人民邮电出版社,2006(7).
[2]http://wenku.baidu.com/view/fe35c10d6c65ec3a87c2c500.html[DB/OL].
[3]王其英.高健.构建高可用UPS供电系统[J].应用实践,2014(10).
[责任编辑:田吉捷]