浅谈机房电源故障与处理
2016-12-31董智
董智
浅谈机房电源故障与处理
董智
新疆专用通信局工程技术中心,新疆 乌鲁木齐 830002
随着网络和信息技术的不断进步,各种不同用途的机房逐渐增多,机房承担着相对重要的工作,是系统的灵魂。一旦机房出现问题,将直接影响到正常的生产及生活。基于此,详细讨论了机房电源的常见故障和处理方法,旨在为相关人员在机房的电源故障处理方面提供一定的理论依据。
机房;电源故障;处理
结合国内外机房的相关工作经验,我国在吸取不同经验的同时进行了极大改进。机房的故障中最常发生的就是电源故障。一旦出现故障,就会导致大面积的网络停止工作,给人们的生产和生活造成了极大的不便。为了尽量避免机房出现电源故障,应在日常的工作中注重对供电系统的实时监测与维护,以保证外部供电停止的时候,机房的供电状况依然正常,能够继续为人们的生产和生活服务。
1 机房外接供电系统发生中断
在常规状态下,机房的电源为普通城市供电,其供电如果发生中断,通常是由于城市的供电系统出现问题或者进行检修时造成的供电间断。在城市供电终止的时候,为了保证机房的正常工作,通常需要采取其他的供电手段,常用的代替普通城市供电的手段有油机供电系统和蓄电池供电系统。供电的切换,要通过制定的设备进行,通常采用不间断电源设备。一旦正常的城市供电终止,不间断电源设备能够实现自动的对供电系统切换电源。
对于有机供电系统和蓄电池供电系统,其工作的原理及供电时间的长短各不相同。蓄电池供电系统的供电时间较短,但是使用较多。一旦城市供电终止,通常机房首选的供电方式为蓄电池供电。
在供电一段时间以后,需要进行供电的切换。如果城市供电恢复,则切换为正常的城市供电系统。如果城市供电没有恢复,则需要切换为油机供电系统,以避免蓄电池电能用完,不能对机房正常供电而导致的机房停止工作、网络全面暂停的现象发生。机房维护人员需要对其供电系统进行定期的检修和维护,维护的对象包括不间断电源设备、油机供电系统和蓄电池供电系统。工作人员还需要准确了解不同供电系统的供电持续时间,由于蓄电池等设备随着使用年限的延长,供电时间将不断缩短,维护人员应对这些设备有及时、详细的了解,保证在一种供电系统电能耗尽之前,合理地对其进行切换,避免机房的正常运行受到影响。另外,也可以在蓄电池电量不充足的时候,及时关闭一些作用不是很主要的设备,以节约能源,延长蓄电池的使用时间。
2 不间断电源设备空开切断电源
2.1 故障现象
不间断电源设备的空开现象在机房的运行过程中较为多见,其主要分为两种:一种是机房的全部设备的空开;一种是部分设备的空开。不间断电源设备的空开将会导致电源供电失败,主要包括:第一,部分设备空开引起的机房内部部分电路的中断;第二,机房全部设备空开引起的全部设备的电路中断,供电系统失灵。
2.2 故障原因
导致不间断电源设备空开的因素有很多,可以从先排查可能性大的因素开始,逐一进行。空开可能性最大的因素是机房的电源承受的负载超出允许范围,导致其无法正常运行,进而引起空开。其次,是机房中的设备在运行中出现故障,导致空开。
2.3 解决办法
当机房由于不明原因而停止工作时,技术人员应对整个系统进行检查,首先查看不间断供电系统,看起是否出现了空开现象,电源是否停止供电。如果电源停止供电,且停止运行的所有设备都是由统一个不间断电源设备所控制,则应对不间断电源设备进行检查,并停止对其供电。之后,再分别断开有其控制的所有设备与电源连接,技术人员对设备进行全面排查,看设备是否存在故障,比如是否出现超转或者内部线路老化等问题。如果确实有某个设备出现了故障,则表明机房电源的中断是由于设备的异常而引起的,应对出现故障的设备及时进行维修或者更换,确保其正常运行,不影响线路中的其他设备。之后再打开不间断供电系统的空开,恢复整个供电线路工作。如果所有设备经过仔细的排查,均没有发生故障,则检查后也应打开不间断供电系统的空开,继续供电,再逐渐接入不用的设备。开始可以先接入一个对系统贡献不大、耗电较少的设备,之后再逐一接入其他设备。接入的顺序按照耗电量有小到大,功能有次要到主要的顺序。在设备接入的同时,严密监测设备的运行情况和不间断供电系统的工作状况。一旦出现异常现象,马上采取紧急措施,切断电源及所有设备的连接,如果发现不间断控制系统的负载过大,则及时对设备进行切换。如果运行中没有异常,则系统可以继续工作,当初的故障是由于暂时性的设备异常而引起的,不会产生较大的影响。所以,在机房的正常工作时,也应注意对设备进行严密的监测与维护,以确保其能够稳定的运行。
3 设备供电稳定性不足
设备运行时供电稳定性不足通常是因为设备所供给的电压不够稳定。机房的维护人员可以通过现代化的技术手段对其进行实时监测,将设备接入远程控制系统,通过局域网和计算机监测和控制供电系统。某些机房的条件有限,也可以采用万用表与不同的设备相连接,通过检测设备的电压是否波动,来查看供电系统的稳定情况。供电系统的电压不稳定,容易造成设备在运行过程中出现巨大的波动,影响其使用寿命,对运行效果极为不利。一旦发现供电不稳,通过计算机切换或者手动操作,及时停止设备的运行,直到电压恢复正常,再将设备接入系统。
综上所述,机房的正常运行对生产和人们的生活有着重要的意义,是网络正常工作的前提和保障。相关工作人员应做好机房运行中的供电监测工作。一旦外部供电停止,能够保证机房在使用备用电源供给的情况下正常运行。
[1]丁桂萍.浅谈计算机的维护与故障的维修[J].新课程,2011(1):115.
[2]田育新,孙立萌,孟颖悟,但星亭.热插拔技术在机载计算机电源系统 中的研究[J].航空计算技术,2009,39(5):104-106.
[3]姚信安,宋飞,胡世平.高性能计算机系统电源设计[J].计算机应用,2012(4):24-25.
TN86
A
1009-6434(2016)05-0029-01