APP下载

UPS并机系统的一种共因失效分析与处置建议

2019-02-15

网络安全和信息化 2019年1期
关键词:机系统零线旁路

背景描述

笔者所在的B级数据中心采用目前主流的“2+2”双路供电模式,在2018年的某天当完成UPS放电测试项目后,在恢复UPS主路运行模式时,发现并机运行的1#2#UPS产生焦糊气味且有异常噪音。

运维人员将1#2#UPS回退至电池供电状态,稍后将其切换到静态旁路运行,等待厂家工程师前来排查故障。等待期间发现1#2#UPS主机内的旁路滤波板ETON烧红,运维人员立即操作将两台故障设备旁路隔离关机下电。

经排查,在机房内共有两台UPS的旁路滤波板烧坏,一台精密空调压缩机保险管烧坏,一台有源滤波器的谐波治理模块保险管烧坏,以及IT设备中有两个电源模块损坏。

图1 市电输入配电柜零线电流曲线

故障分析

在本次故障中,精密空调和有源滤波器接入点与UPS并机系统接入点在同一配电柜中,因电路中零线电流汇集了三相电流所有的异常波动,故本文中根据零线电流曲线进行故障分析。

查询各故障设备运行事件记录,可以发现有源滤波器谐波治理模块先于精密空调压缩机保险管烧坏,有源滤波器故障后即出现零线电流的巨幅振荡现象(时间:21时12分)。而有源滤波器并联接入电路治理电流谐波,它的原理是通过实时监视电路中的谐波电流变化,向电路注入与谐波电流幅值相等、极性相反的补偿电流,对谐波电流进行补偿抵消来消除电力谐波的。

观察图1零线电流变化曲线,我们可以推断零线电流的振荡现象实际在17时40分时就已经出现,而有源滤波器的补偿抵消使得17时40分至21时12分之间的电流振荡未显现出来,长时间的大电流补偿最终导致有源滤波器过载保护,之后振荡电流使得精密空调压缩机保险管和IT设备电源模块损坏。再观察两台UPS设备是同时发生的旁路滤波板烧坏,而在21:55分两台UPS隔离下电后振荡电流消失等现象,可以看出本次机房配电系统故障的根源就是1#2#UPS并机系统发生某种共因失效并引起了电路震荡。

共因失效是指在冗余系统中由于某种共同原因而引起冗余单元同时失效的故障现象,共因失效的存在显著地降低了冗余系统的可靠性,是冗余系统失效的主要根源,它的存在使得部件之间相互独立的假设不再存在,目前是工程应用领域亟待研究的课题之一。根据部件失效的来源,一般可将其分为来自系统外部环境的影响和来自系统内部部件的失效传播两大类。

在背景事件中,结合图1零线电流曲线可以看到故障前后,UPS前端市电呈现的“冲击(合闸)——周期振荡(静态旁路)——恢复(维修旁路)”三个阶段波形,以及旁路滤波板的过载烧坏,可以推断出本次为来自外部环境影响造成的共因失效。

外部环境引起UPS并机系统共因失效进而产生电路振荡的原因可以从并机系统的频率控制原理来说起。在并机系统中每台UPS的输出频率是由各自本机逆变器控制板上的振荡器决定的,本机振荡器频率同步于并机板主振荡器频率,而主振荡器频率则由同步源选择器来选择,一般有3种选择对象,即旁路频率、并机总线频率、强制基波频率等,其选择依据是旁路电源是否正常和并机UPS的启动方式,UPS并机系统以此种方式实现输出电流频率相同。

以两台UPS并机为例,当市电突然中断或者大幅振荡时,UPS监测到旁路频率越限后同步源选择器立即指向基波频率,并机板的主振荡器以基波频率运行,通过并机总线通讯使两台UPS的振荡器与主振荡器同步,并机系统则以电池供电模式运行,输出频率为基波正弦波。而当两台UPS采用断开Q1开关的方式运行在电池供电模式时,并机系统监测到的旁路电源是正常,并机板的同步源选择器是指向旁路频率的,并机UPS的输出频率与旁路频率同步。当其中一台或者两台UPS闭合Q1输入开关后,它的振荡器输出频率也是与旁路频率同步的。

在实际操作过程中,当运维人员完成放电测试闭合UPS输入开关Q1时,此时UPS的实际带载除了输出端电子计算机设备外,还增加了给容性负载蓄电池组充电的负荷,Q1合闸时的瞬时电流达到了输出电流与充电电流之和的4至7倍,观察图1中17:00在Q1闭合时零线电流瞬间值达到了200A,可见启动冲击是很大的。

如此巨大的冲击电流极易造成UPS设备的电力电子器件损坏,同时冲击电流会引起包括旁路的整个电路振荡,正常情况下并机系统应能监测到频率越限,然后同步源选择器指令并机系统以基波频率运行,但在并机系统连续闭合两台设备的Q1开关,连续两次大电流冲击之下同步源选择器的这种逻辑机制很有可能被冲破,之后并机系统为了保持与旁路频率同步,主振荡器在修正信号指引下跟随旁路频率,两台UPS各自的振荡器再与旁路频率同步即产生电路振荡。这种并机系统内部产生的振荡电流通过零线漫延泄放,在反馈回主路方向的零线电流与主路振荡电流一旦形成谐振就会造成整条电路电流振荡难以自行平复,即是产生了图1中17:40至21:12之间的振荡电流。当振荡电流很剧烈时电路中的谐波治理设备就会误判断为电路中电流谐波含量很多幅值很大,进而持续产生同值反向的抵消电流,最终造成滤波器类设备过载损坏。

观察图2中本次UPS设备烧坏的ETON板,它是一种电子滤波器,其中的三极管VT1起到滤波管作用,另有三个基极滤波电容和六个基极滤波电阻构成三组RC滤波电路。而一般情况下谐波电流值很小且含量不大,观察图2可看到烧灼最严重的是六个滤波电阻,我们可以判断出故障当时滤波电路将电路中的的谐振电流当做了电流值很大的谐波电流,而导致严重过载直至烧毁。

再查询环境监控系统市电输入配电柜零线电流历史数据,系统正常运行时零线电流15A左右,观察图1在并机系统切换到静态旁路后,剔除滤波设备影响可以发现零线电流周期波动,其幅值达到在35至180A左右,以上数据加强了电路中发生了叠加振荡的推断。

图2 UPS设备烧坏的旁路滤波板ETON

本次故障中,维护人员发现异常声音和焦糊气味后将设备回退到电池供电模式,然后采用长按灰键(MGE Galaxy 5000机型),将设备切换到静态旁路等待维修的处置方式。而长按灰键只是关闭了逆变器,设备中的很多部件还是在运行的,比如为了保证向静态旁路切换正常,静态开关前端的旁路滤波板会对旁路震荡电流进行滤波稳压。我们知道静态旁路只是UPS设备切往维修旁路的一个过渡路径,将UPS设备长时间置于静态旁路的暂态环境下,并不能消除并机系统的共因失效故障,而在UPS的内部复杂电路已经产生紊乱电流的情况下,这种方式更会导致一些设备损坏事件的发生。

处置建议

UPS并机冗余系统提高了配电系统的可靠性,但其基于电流电压波形同步的并机模式控制原理,使得并机系统可能因电网冲击而导致并机失败,或者引发整个电路的谐振,而单台UPS由于结构简单反而不容易出现上述故障。

外部环境造成的并机系统共因失效常出现于设备开机操作、有电网冲击时,外观现象是并机系统中每台设备都出现了相同的异常现象或故障告警信息。我们可以通过测量并机系统的环流情况,听运行声音、嗅异常气味等方式初步判断,也可以通过查看运行事件记录,检查输出电能变化情况等方式最终确定并机系统运行状况。

在确认异常状况后,对于并机系统可以采用先关闭一台UPS,断开输入输出将其从电路隔离,使配电网络从冗余复杂系统退出,简化为单机简单模式以提高配电网络的抗扰能力,观察配电网络运行参数再做进一步的处置操作,甚至直接将并机系统全部隔离下电,再重新逐台启动并机。

猜你喜欢

机系统零线旁路
UPS 2N系统改造割接中的零线处理方法
浅谈变电站旁路代供10 kV线路的两种方式
聊聊电动车
旁路放风效果理论计算
一种三相智能电表掉零线检测算法研究
冠状动脉旁路移植术治疗围手术期难治性冠状动脉痉挛临床分析
低压电气施工中的零线的连续性敷设核心思路分析
超超临界二次再热机组旁路控制策略设计及应用
车机≈手机 ?
调频广播发射机的N+1备机系统