银行数据中心供配电系统备投切换模式探讨
2015-07-04胡杰戴爱民
胡杰 戴爱民
摘 要:随着数据大集中系统建设,银行数据中心对供配电系统的可靠性要求越来越高,目前,业内普遍采用配置后备柴油发电机的双电源不间断供电体系架构,在失电情况下为保证电源的快速恢复,高低压及后备柴油发电机均设置具有手自动功能的备投切换装置。笔者基于一种电力系统设计架构,结合多年大中型数据中心供配电系统维护管理的工作实践,从实际运维的角度上,对高低压备投以及后备柴油发电机切换模式的选择进行分析和探讨,提出了实现优化资源配置,安全高效运维的现实思考。
关键词:银行数据中心;双电源;备投切换;安全高效运维
随着银行数据大集中系统建设以及虚拟化、云计算技术的快速发展,省级及全国性的大型数据中心建设需求急剧增长,银行系统的集中运行要求基础设施特别是电力系统具备相当高的安全性、稳定性及可靠性。近几年,随着《电子信息系统机房设计规范》机房建設标准的不断完善,TIA942以及Uptime国外标准先进理念的不断借鉴,新建的数据中心在电力系统的建设形成了一套相对成熟并被广泛认可的体系架构,总体来说就是从两个不同的变电站取2路高压进线,根据用电负荷等级的要求,组成不同类型的双电源系统,同时设计有具备手/自动切换功能的高低压备投装置以及后备柴油发电机,可在线维护的同时提高供配电系统的可用性。笔者基于银行数据中心一种电力系统设计架构,结合多年大型数据中心供配电系统维护管理的工作实践,从实际运维的角度上,对高低压备投装置以及后备柴油发电机切换模式的选择进行分析和探讨,从而达到优化资源配置,最终实现安全高效运维。
一、双电源供电模式
(一)、用电负荷等级划分
众所周知,银行数据中心的特点是7×24小时不间断运行,需要电力、空调及网络系统的支持,一旦失电,将造成大量数据丢失,需要较长时间才能恢复,同时要求供电具有在线维护性及容错性,因此对于银行数据中心来说,除正常照明、普通动力为三级负荷外,其余负荷均为一级负荷, IT负荷及持续制冷空调负荷则为一级负荷中特别重要负荷,市电失电时,由柴油发电机作为后备电源供应全部负荷。其中,对于一级负荷供电,要求由双电源供电,当一路电源发生故障时,另一路电源不应同时受到损坏;对于一级负荷中特别重要负荷,要求除双路电源供电外,应增设UPS不间断电源,且设备供电电源的切换时间,应满足设备允许中断供电的要求。
(二)、高低压供电系统接线及运行方式
对于10KV双路市电接入,目前业界普遍采用单母线分段的接线方式,分为“双活”,“热备”以及“冷备”等方式运行,400V低压同为单母线分段接线,高低压联络开关设计具备手/自动备投功能的切换装置。以某省级银行系统主数据中心为例,电气系统的总体设计思路为:10KV市电采用单母线分段接线,“双活”的运行方式,正常情况下,联络开关处于断开状态,配备10KV后备柴油发电机,在保证市电优先的原则下向两段对应的母排提供应急电源,同时根据不同设备类型的用电负荷以及区域的模块化,选择采用1250KVA的变压器模块化供电,其中,冷源系统在变压器前端设两路高压进线,通过电气连锁方式作为对应变压器的主备进线电源,其他一级负荷均在变压器的后端设低压母联装置。对于供配电系统的设计方案尤其是高压部分,须结合当地供电部门的运行方式,由相关责任部门审批才能得以最终敲定,由于此银行系统当地供电部门单母线分段运行方式为“主备”运行方式,即单母线分段联络开关常闭,这无法实现“双活”以及冷源系统高压侧切换的设计思路,最终,经研究讨论,设计方案的简图演化为如图1所示:10KV采用两个单母线分段,两段母线同时运行,两路市电通过室外环网柜分支为4路进线接入,同时,两段母线又采用“热备”方式,通过设置手自动备投装置,实现了冷源系统在变压器前端进行双电源接入的设计思路,提高了数据中心供电的安全可靠性。
图1 一种双路供电模式的正常工作状态
注:不同颜色代表不同线路,黑色表示没有供电或失电。下同。
二、高低压备投及后备柴油发电机切换方案
如上所述,银行数据中心一级负荷要求双电源系统供电,还要有后备柴油发电机组作为后备电源,同时高低压以及后备柴油发电机均设置具有手自动切换功能的备投装置,在日常运维过程中,对于这些切换模式组合,应该如何有效的进行选择,保证供电系统可靠性的前提下,最大程度优化资源配置,下面,基于图1供电系统的简图,结合实际运维工作,模拟一路及两路市电失电的情况,对各种切换模式组合方案的优缺点进行比较和分析。
(一)、一路市电失电
1.方案一:高压自动切换,低压自动切换
如图2所示,由于高压及低压备自投装置均处于自动状态,按照“高压切换优先”的原则,当一路市电失电时,互为备用的另一路市电自动进行高压的自动备投,如因故障导致切换失败时,自动进行低压切换,保证机房IT设备电源的正常供给。其优点:一是解决了人的问题。整个备投切换过程自动进行,切换快速有效,无需人员干预,避免了情急之下因操作失误导致事故的发生;二是解决了物的问题。通过采用定制化的预先编程,采用PLC自动控制,解决了系统架构复杂、故障情况多样、空间条件限制造成操作难以实现等问题,留有了充足的时间进行市电的恢复及故障的排除;三是从电气系统上保证了一级负荷的双电源供电模式,与设计完全吻合。缺点:如果采用先进的高低压自动控制系统,从应急预案的设计、编制、施工工艺还是测试验证等环节,其专业化、精细化水平要求极高,同时要求高低压断路器均具备电操装置并预留远程控制节点,大大增加了投入成本以及系统的部署难度,如果采用传统的综保及继电器搭接方式,要求实际切换过程中,高低压在上下级切换时间的配合上要严丝合缝,如图2所示,高压进线断路器GJX1-1与GJX1-2的高压备投切换过程为:正常情况下GJX1-2向对侧发出本侧市电正常且处于分闸位置,当1#市电主用线路失电时,延时500MS后GJX1-1跳闸,然后延时500MS向对侧发出合闸指令,GJX1-2收到合闸指令后进行合闸操作,考虑断路器电操装置的动作时间、动静触头接触以及灭弧时间,整个备投过程约为2S,而对于低压备投而言,在高压备投过程中,DJX1处于执行延时跳闸过程,如图3所示,1#市电失电,DJX1及DJX2的电压继电器1KV发生欠压脱扣,断电延时继电器1KT1执行4S延时,当高压在2S内成功备投切换时,电压继电器1KV得电吸合,1KT1瞬间复位,延时跳闸动作由此中断,但是,在实际的运行过程中,笔者发现,切换时间理论值与实际值还是存在一定的误差,同时,备投切换过程由电压继电器、时间继电器以及分合闸线圈配合完成,继电器本身属于易损件且正常工作状态的继电器线圈均为常带电,时间久了故障率就会大大增加,导致切换事故的发生。
最后,电源的自动切换中还不得不考虑频繁启停对设备的损害问题。对于变压器,变压器是典型的电感设备,启动时存在较大励磁涌流,在很短的时间内频繁启停很容易损坏绝缘或引起变形,另外,一套冷源通常包括冷冻机组、一次泵、冷却水泵等大型设备,其启动要求比较严格,通常由BA(建筑设备管理系统)按设定的程序进行启动,如果掉电同时又瞬间启动无疑对设备造成极大的损害,大大降低设备的使用寿命。
图2 1#市电失电,高压自动切换后的状态
2.方案二:高压自动切换,低压手动切换
此方案依然遵守了“高压切换优先”的原则,状态如图2所示,与方案一不同的是,其从根本上解决了高压切换与低压切换在时间上的配合问题,只要高压备用线路正常,优先考虑高压的切换,此模式除仍未解决高压自动切换造成设备频繁启动操作,影响设备的使用寿命外,其缺点还有:低压配电柜一般分布与各个楼层配电室,物理隔离且有一定的距离要求,如遇断路器拒动、偷跳或瞬间冲击电流过大跳闸等偶然因素导致高压切换失败,须在UPS电池后备15分钟时间内断开本段母线下所有变压器的进线断路器,同时闭合本段及备用线路的母联开关,如图2所示,1#市电失电,低压手动切换需断开DJX1、DJX2,闭合DML1、DML2、DML3、DML4,这对场地及操作流程熟悉程度以及运维人员的配置,自身的水平,经验,身体均有较高的要求,同时,为防止人为操作失误导致事故发生,对于电气系统机械及电气联锁装置均要进行的严格测试验证。
图3 低压备投切换控制原理图
3.方案三:高压手动切换,低压自动切换
如图4所示,此方案避免了运维人员在有限的后备时间内奔波于各个楼层配电室,于各式各样的配电柜中进行断路器分合闸操作,一定程度上降低了慌乱中因操作失误导致安全事故的概率,同时解决高压自动切换导致设备频繁启停,另外,在高压备用电源的切换时,可以留有足够的时间逐个对变压器进行从负荷侧到供电侧的逐级操作,防止冲击电流过大导致断路器跳闸,严格按照既定操作票制度,变更及审批流程进行倒闸操作,进一步降低操作失误的概率。其缺点:一是高压操作须具备高压操作上岗证及操作证,岗位的特殊性决定了人员的流动性较大,同时由于银行数据中心供配电系统较民用配电系统不管从复杂程度上还是可靠性要求上都要高很多,这就要求高压操作人员在具备一定素质的前提下,需对数据中心供配电系统有一定的了解,同时对于控制线路故障排查,直流屏均要较为熟悉;二是需定期与不定期进行两进线两母联的低压自动切换可靠性验证工作,通常关于两进线两母联的控制方式有两种,一种是PLC控制方式,一种是继电器搭接方式,通过笔者的实际经验,更倾向于采用继电器搭接方式,原因是逻辑清晰,比较直观,可能建设期间由于线路过多导致建设周期加长,施工难度加大,但是一旦调试完成后,关键点配备备品备件,再出现故障比较容易进行排查,而采用PLC控制程序控制逻辑比较抽象,一旦出现故障,需要厂家专业工程师进行现场修改,在问题排查周期及协调难度上明显加大。
最后,作为一级负荷的冷冻机组等冷源设备,掉电后需要启动备用机组,这与原高压自动切换到双电源供电模式的设计思路存在背离,但是正如笔者所述,在实际运行过程中的摸索发现,在保证冷源双电源接入的前提下,当一路市电失电时,可通过借助BA系统的监测和控制功能进行备用冷源的快速切换,既避免了频繁启停对设备造成的损害,同时又保证了15分钟持续制冷期间备用冷源的顺利投入。
图4 1#市电失电,低压自动切换后的状态
4.方案四:高压手动切换,低压手动切换
此方案坚持“以人为本”的运维管理理念,使得一切风险都处于人的掌控之中,由于切换过程除远程监控外无采用自动化控制手段,运维人员时刻处于“待命状态”,无形中提高了其紧迫感,也迫使其不得不提高自己的专业化水平,有利于不断提高团队的实际操作能力,其缺点也是显而易见的,对运维团队的专业水平、稳定性要求高,依赖性强,由于人为操作失误造成事故的概率也大大增加。
從以上分析可以看出,各种模式组合的适用情况如表一所示:
表一 切换模式适用情况 低压切换
高压切换 自动 手动
自动 (1)运维团队专业性水平很高,但人数较少,高低压配电室很分散(2)投入大,自动化水平要求很高,测试验证严格缜密 (1)运维团队人数配置合理、稳定且具备一定的专业素质(2)低压配电室相对集中,距离不远(3)投产初期,负载率相对不高
手动 (1)运维团队人员不多,但专业水平较高(2)低压配电室很分散,距离远(3)投产初期及中后期 (1)运维团队人员配置充足且稳定,且具备较高的专业素质(2)投产初期及中期,负载率不高
对于银行数据中心,自建及外包综合管理模式为最常见的数据中心运维模式,在各大型及中小型银行机构运维模式中占比达到了80%以上。如前所述,在此类数据中心管理模式中,信息管理部门作为运维工作的主体,需针对根据自身情况,分时期、分阶段制定合理的切换模式原则,确保高低压切换做到安全、高效、有序。
(二)、双路市电全部失电
1.方案一:手动启动后备柴油发电机,手动并机,手动输出
此方案优点就是避免了自启动信号错误导致柴油发电机的误动作,给运维人员造成不必要的麻烦,同时缺点也是显而易见的,众所周知,银行数据中心为7×24小时不间断运行,两路市电同时失电对于银行数据中心来说属于重大安全事项,在UPS电池及持续制冷后备时间要求范围内,要进行柴油发电机的自动启机、并机以及电源输出操作,这不仅对机器的可靠性及性能有较高的要求,同时对操作人员临场反应能力,抗压能力以及操作熟练程度都有较高的要求,对于大中型银行数据中心,柴油发电机的手动操作,一般作为定期的运维演练科目,不作为系统正常运行时的模式选择。
2.方案二:自动启动后备柴油发电机,自动并机,自动输出
此方案有效解决了手动操作的各项弊端,能够在双路市电均失电的紧急情况下进行后备柴油发电机的快速投入,确保供电的持续性。缺点:一是在失电原因不明情况下盲目进行发电机自动投切可能导致更大事故的发生,如1#市电及2#市电高压母排故障、变压器故障或双电源设备引起越级跳闸,在故障尚未排除情况下,后备发电机即进行自动投切,无疑会将故障扩大到发电机设备,引起更大的事故;二是没有考虑高低压自动切换状态,自动切换可能会导致不必要的动作。如高低压备自投装置状态为高压手动切换、低压自动切换,当1#、2#市电先后相继失电,各断路器状态维持1#市电失电的状态不变,如图4所示。如柴油发电机先后自动闭合YKX1与YKX2,低压断路器需进行两次动作,分别是动作一:DJX3与DJX4断开, DJX1与DJX2闭合;动作二:DML1与DML4断开,DML2与DML3断开,DJX3与DJX4闭合。
3.方案三:自动启动后备柴油发电机,自动并机,确认后手动输出
此方案解决了在故障不明情况下盲目进行发电机投切带来的弊端,同时又根据实际情况进行有选择性的进行电源输出,安全可靠性高。此时,在运维人员赶到发电机房前,后备柴油发电机已自动完成启机及并机操作,待确认各项指标正常,同时在确认高压配电室准备就绪后,手动闭合ZCX1和ZCX2,同时由高压操作人员确认下游无故障并且了解高低压备投装置及断路器的状态情况下,有选择的先后闭合YJX1和YJX2。如方案二所述情形,应先闭合YJX2,后闭合YJX1,此时低压断路器仅执行一次动作:DML1与DML4断开,DML2与DML3断开,DJX1与DJX2闭合。
从上述分析可以看出,在前期负载率较低,UPS电池及持续制冷后备时间充裕的情况下,可选择方案一和方案三,考虑投产初期为提高运维团队应变能力,完善操作流程,可优先选择采用方案一;当投产中后期,数据中心负载率较大时,应优先选择方案三;除非电池及持续制冷后备时间较短,运维人员在有限时间内完成倒闸操作确有一定的困难,同时下游设备维护保养很好几乎不可能出现大电流短路故障,否则不建议采用方案二。
综上所述,银行数据中心对于持续性的运行要求,要求供电系统须具备相当高可靠性,同时要求出现失电等故障情况下,能够进行快速的恢复,因此对于高低压双电源系统的手自动切换功能,须考慮选择一种最优模式组合,同时,这种组合也不是一成不变的,须根据自身数据中心的运维人员配置、规划建设以及系统完善情况,同时结合数据中心投产情况,分阶段、有计划的进行动态调整,在确保供电系统高可靠性的基础上,能够最大程度的优化资源配置,最终实现安全高效运维。
参考文献:
[1]刘灿文.浅谈10KV母联备自投与400V母联备自投及设备晃电自启动之间的时间配合问题[J].动力与电气工程,2013,8(23).
[2]陈硕,魏华,杨青. 10KV配电系统自动运行控制在数据中心的应用[J]. 通信电源技术,2014,31(6).
[3]陈杰甫.某数据中心配电系统10KV自投控制流程分析[J].建筑电气 ,2012,31(9).
[4]夏建强,沙鹏.银行数据中心配电运维可视化管理研究[J].中国金融电脑, 2015(5).