开关电源多起火灾故障案例的分析和探讨
2020-08-26
1 引言
在2017、2018年两年中,某运营商省分公司多个机房内的某著名品牌3套开关电源设备相继发生自燃烧故障(非明火),产生大量烟雾而触发了消防火灾告警系统,后经该运营商的技术研究和维护人员与该品牌开关电源厂家研发专家对故障原因进行了深入的分析和探讨,以期引起通信机房维护人员和电源设备制造商的重视和产品质量的提高。
2 三个机楼开关电源设备燃烧故障情况
某运营商在甲、乙、丙3个机楼里于2016年4月、6月和8月份分别上电投产运行。这3套电源系统自投产以来,均无异常告警。但近两年来,甲、乙、丙3个机楼里的开关电源设备分别发生自燃烧而引起烟雾告警故障信息,这些故障均为开关电源内部发生燃烧,因为开关电源模块均采用阻燃材料制造,因此3个机楼里尽管开关电源内部均发生燃烧(非明火)故障,但最终未造成机房内明火燃烧,避免了更大范围的火灾事故。
甲机楼为C级机楼,上电日期为2016年6月8日,负载率为20%,负载率比较低,开关电源系统自上电以来未有异常告警信息发生。但从2018年3月至12月间,共发生故障告警信息达26次之多,故障信息多为交流停电或模块退服,其中10月12日16:34:38发生多个开关电源整流模块故障告警信息,并发生自燃烧而引起消防系统的烟雾告警故障,整流模块燃烧故障情况如图1所示。
图1 甲机房楼电源模块燃烧情况
乙机楼为C级机楼,上电日期为2016年8月8日,电源负载率为18%,负载率比较低,但从2018年4月至12月间,共发生故障告警信息达9次之多,故障信息多为交流停电或模块掉电退服,其中12月9日10:22:54发生了多个整流模块故障告警信息,并发生了消防系统的烟雾告警信息,整流模块燃烧故障情况如图2所示。
丙机楼为A级机楼,上电投产为2016年4月份,机房配置:交流柜*1+整流柜*2+直流柜*2,整流柜共配置30个R48100G电源模块,总负载约178 A,单电源模块带载率约为5.4%,负载率比较低。2018年7月7日16:16:29该机楼机房二层直流电源房产生烟感告警,现场排查发现为机房内其中一套开关电源7号及8号电源模块自燃烧冒烟故障,如图3所示。
图2 乙机房楼电源模块燃烧情况
图3 丙机房楼电源模块燃烧情况
3 三个机楼现场勘查情况
3.1 甲机楼电源
电源模块外观良好,无损伤、磕碰、划痕等异常情况,AC交流输入侧网孔有熏黑的痕迹;该机房采用空调散热,温度为22℃,在规范要求之内;灰尘也不大,面板干净无灰尘,在规范要求之内;但该机房在沿海附近,气候比较潮湿,该机房相对湿度RH为80%左右,湿度较高,如图4所示。
图4 甲机房楼温湿度表
3.2 乙机楼电源
乙机楼模块外观良好,无损伤、磕碰、划痕等异常情况,AC输入侧网孔有熏黑的痕迹;该机房则采用空调加排风扇进行散热,温度为21℃,在规范要求之内;灰尘也不大,面板干净无灰尘,符合规范要求;但该机房在沿海附近,气候比较潮湿,该机房相对湿度RH为80%左右,湿度较高,如图5所示。
图5 乙机房楼温湿度表
3.3 丙机房电源
丙机房电源模块外观良好,无损伤、磕碰、划痕等异常情况,外壳无过火的现象。该机房环境现场较为干净,无明显灰尘,机房温控方式为空调。机房墙上温湿度传感器显示环境温度为22℃,相对湿度RH为72%,如图6所示。故障发生后,现场已将这两个故障模块从槽位移除,电源系统工作正常。通过拆解模块核实,现场抽出的两个模块中只有一个电源模块故障,另一个电源模块为误判,故障模块燃烧情况如图3所示。
换油周期的延长,对润滑油的剪切稳定性提出了挑战。此次展会,阿朗新科还将介绍其针对这一市场变化推出的Keltan OCP极强稳定性的牌号K0500R。该牌号是无定形OCP黏指剂,具有优异的低温性能,其剪切稳定指数(SSI)为18,符合当前市场的最新技术发展要求。目前,阿朗新科正在积极与润滑油行业内的标杆企业选用K0500R开展长寿命柴油机油行车实验。
4 模块故障原因分析
4.1 三个机楼环境及负载情况
甲机楼该开关电源电源负载率为20%;乙机楼该开关电源电源负载率为18%;丙机房配置:交流柜*1+整流柜*2+直流柜*2,整流柜共配置30个R48100 G电源模块,总负载约178 A,单电源模块带载率约为5.4%。3个机楼整流模块负载都比较低;3个故障电源模块均外观良好,无损伤、磕碰、划痕等异常情况,面板干净无灰尘;机房墙上温湿度传感器显示环境温度为22~23℃,温度完全正常;但3个机楼里的相对湿度RH为72%~81%,2018《通信局站机房环境条件要求与检测方法》中5.1的要求,A、B类机房相对湿度为30%~70%,C级机房的相对湿度为20%~80%,虽然丙机楼超过上限,但未明显超过本机房环境规范标准允许的最大值。
图6 丙机楼内空调温湿度表按照行标YD/T1821-
4.2 损坏整流模块情况
3个机楼开关电源的整流模块AC输入侧网孔均有熏黑的痕迹,拆开电源模块发现都是交流AC输入侧的安规电容C126电容失效和起火,其他元器件正常。安规C126电容为薄膜电源,在电源模块中的位置为交流输入口两相火线之间,如图7所示,用于滤除电路中的高频噪声,且这3个机楼的电源模块故障都是市电引入口的安规X电容C126表面电晕或烧毁,且这些安规X电容C126都是某知名品牌生产,具有条码编号和认证。
图7 失效C126电容电路
4.3 厂家给出的整流模块故障原因分析
为何这3个机楼里电源模块均发生安规电容C126烧毁现象呢?该厂家给出的理由是:由环境条件所致,机房相对湿度比较高,超过了行标YDT/ 1821-2018《通信局站机房环境条件要求与测试方法》中规定的要求,厂家研发技术人员认为该整流模块中的安规电容C126都有认证和制造厂家的条码和认证,是合规产品,因此厂家研发工程师认为是由于机房的相对湿度造成的,并分析认为:
当机房内相对湿度很高时,潮湿的空气就会对电容参数产生影响,空气中的水汽容易凝聚在电容器外壳表面形成水膜,可使电容器的表面绝缘电阻下降。此外,由于整流模块本身带载比较低,产生的热量比较小,当湿度过高时,水分子还可渗透到电容器介质内部,当水汽进入芯包后,导致金属化膜发生电晕氧化现象,进而使电容容值衰减、电容器介质的绝缘电阻绝缘能力下降,极限情况下,会导致电容金属膜绝缘击穿失效后发热冒烟。
在薄膜电容器构造上,在薄膜层间是存在空气层的,施加电压时,电介质会带电,电场强度增大,在一定电压下,电子会一起移动(空气层绝缘破坏),从而发生放电形象,这种放电形象称之为电晕放电。空气的起晕电压与湿度有关,湿度增加,表面电阻率降低,起晕电压下降。
根据以上分析结果,3个机楼里电源模块故障的原是因为该电源模块交流输入电源安规X电容126失效引起,而电源模块安规X电容126失效的原因为机房湿度较高,该薄膜电容长期工作在高湿环境中受潮,水汽侵入电容器件内部,引起电容性能下降、绝缘阻抗降低,内部绝缘膜击穿导致失效。
但我们认为厂家研发人员这一说法还有待进一步探讨和分析必要性。
5 有关问题进一步探讨
针对厂家给出的故障原因分析,我们认为还不够严谨和全面,这是因为:
5.1 关于机房环境问题
虽说这些安规X电容C126都是某知名品牌生产的产品,当湿度在70%~80%左右时,这3个机楼的电源整流模块中的X电容C126就会出现电晕或烧毁的情况,而在行标中,通信机房的相对湿度标准规范最高值也为80%,就是说,这3个通信机房的环境只是达到了行标规范标准要求的上线值附近,并没有超过规范标准要求太多,其实在南方很多地方,空气中的相对湿度都比较高,一般都达到95%的天气也非常多,在环境条件差一点的机房里,相对湿度很容易超过机房标准值80%上限,因此若电子元器件在这个相对湿度的环境里就频繁出现燃烧故障时,开关电源整流模块的燃烧故障概率就会太高了,然而其他厂家和品牌的同类产品为何没有发生过此类故障?这个问题很值得分析和探讨。
5.2 三相不平衡市电引入的影响
由上述电源模块的燃烧故障分析可以知道,开关电源的整流模块基本都是三相电源引入,若三相电源不平衡时则会轻者降低线路和配电及用电设备的供电效率,重者则会因重负荷相而超越过多电流时会导致中性线有大量电流流过,中性线产生阻抗压降,从而导致中性点飘移,致使各相相电压发生变化,出现正序、负序、零序3个电压分量,从而造成负载重的某相电压降低,而负载轻的某相电压升高。当开关电源某一个相的整流模块安规X电容C126长期处在高压下时,也极易导致击穿,因此为了耐较高的三相不平衡输入的影响,耐负载重的某相需要耐更大电流的冲击,也需要增加安规X电容C126的耐压指标和额定容量技术指标。
5.3 关于安规X电容C126耐压和容量问题
上述3个自然故障案例厂家分析是仅仅因为受到机房的相对湿度稍高的性能指标影响就发生自燃现象,但在机房的实际工况可能还有比这还严重的情况存在的,比如环境温度及洁净度等环境因素问题也会严重影响电子元器件的各项性能指标,当然还包括了电子元器件的绝缘性能指标的。而上述自燃烧故障案例中,仅仅只有机房的相对湿度刚刚接近机房环境规范要求的上限附近,且并未超过规范要求多少,而当机房环境灰尘较大、温度较高时,更容易会造成这些整流模块电子元器件性能指标的劣化和降低,更容易发生自燃烧故障。
因此我们认为厂家更应该考虑提高这些开关电源整流模块的安规X电容C126元器件的绝缘性能和容量指标以适应机房实际更严酷的环境工况才是解决问题的根本,否则此类故障还会继续不断发生,一旦不幸引起整个机房发生火灾事故,则造成的损失和影响可就大了。
6 结论
根据以上分析和探讨,造成上述3个机楼开关电源故障的根本原因是整流模块输入口附近的安规X电容C126电晕、烧毁失效所致,而安规X电容C126电晕、烧毁失效的故障原因则是机房环境的相对湿度所引起,这只是造成整流模块燃烧原因之一,而最主要的则是应该提升该安规X电容C126的耐压性能和额定容量技术指标才是根本原因和问题的关键所在。
7 解决方案和建议
7.1 从制造商的角度建议
建议电源制造厂家进一步提高电源整流模块的耐压和额定容量的性能指标,这是由于:①在沿海地区,空气相对湿度较大,空气中盐分较多,大气绝缘强度较低,容易造成电子元器件损坏故障,故建议提高有关电子元器件的耐压性能和额定容量性能指标,尤其是靠近市电输入口附近的安规X电容C126的耐压值和额定容量技术性能指;②由于开关电源基本都是三相电源,因此在一些地区由于三相不平衡,而导致负载较轻的某相电压变高,需要较高的耐压元器件,而在负载较重的某相则会电流变大,因此更需要具有更大的耐流能力的元器件;③提高电源耐高温性能指标,这几个机房内的环境温度都比较理想,然而由于国家不断推进节能减排工作,运营商在一些机房内环境温度都比较高,为此由于高温导致开关电源停机断电的故障也不少,为此建议设备制造商还应该考虑设备本身耐环境温度的性能;④在一些小型机房内,由于本身环境较差,机房内灰尘较大,这些灰尘遇到空气相对湿度较大时,也会在电子电路板上也会发生自动短路、瞬断等故障现象。上述3个整流模块燃烧故障仅仅只是机房环境相对湿度较大就已经引起安规X电容C126电晕、烧毁失效的故障,而在很多机房内往往灰尘比较大、相对湿度也比较高或比较低、温度也比较高等恶劣环境,尤其是在一些D类机房内,环境条件更差,因此建议电源设备厂家更应该把恶劣环境条件设置得更加严格一些才会避免通信电源故障的发生。
7.2 从运营商的角度建议
①加大模块的带载量,建议让模块带载量在30%以上,模块转换效率高,模块内部自身热量能阻止器件受潮;例如关掉部分电源模块或将其抽出,提高在线模块带载率;
②严格按照行标中对通信机房环境条件的要求严格执行。一定要非常重视通信机房的环境条件并达标,严格按照相关规范标准的要求保障通信机房内“三度达标” (温度、湿度、洁净度)。才能保障通信机房里所有设备正常安全可靠地运行。
7 YDT 1821-2018《 通信局(站)机房环境条件要求与检测方法》