西门子SPPA T3000控制系统的应用及故障处理
2013-06-19王立文
王立文
(神华浙江国华浙能发电有限公司,浙江宁波315612)
西门子SPPA T3000控制系统的应用及故障处理
王立文
(神华浙江国华浙能发电有限公司,浙江宁波315612)
介绍西门子SPPA T3000控制系统的网络结构及硬件组成,重点分析了该系统在浙江国华宁海B厂2×1 000 MW机组的应用中出现的问题,并提出解决方法和防范措施。
SPPA T3000;自动控制;故障分析;可靠性;措施
国华宁海发电B厂自动控制系统主要包括单元机组DCS、公用系统DCS、脱硫DCS、电气控制系统(NCS),采用了DCS,DEH,FGD-DCS系统一体化控制方案。单元机组DCS包括常规DCS和DEH两部分,均采用西门子SPPA T3000控制系统,系统之间通过高性能的中心路由器(交换机)相互连接,在操作员站网络这一层实现信息共享。单元机组网络分为应用网络、控制网络和过程接口层,其中控制站与IO单元构成下层网络,通信采用工业以太网ISO协议,工程师站、操作员站和打印机等组成上层网络,通信采用以太网TCP/IP协议。各层网络由工业以太网模块(OSM)组成环形网络结构,上、下层网络间通过服务器进行数据交换。冗余服务器实现系统控制器管理、调试和数据采集、传输以及给水焓值计算等功能。操作员站、工程师站在实际生产中通过访问机组服务器进行画面数据显示和指令传达。DCS系统网络结构如图1所示。
1 SPPA T3000系统的主要故障现象及分析
宁海发电B厂自机组投产至今,西门子SPPA T3000控制系统(以下简称T3000系统)出现了诸多的问题和故障,本文从设备硬件故障、软件故障、通信故障等方面进行分析。
1.1 硬件故障
T3000系统硬件结构主要包括服务器、交换机、控制器、IO卡件、预制电缆及FIM卡件。其中控制器由电源模块(PS405)、CPU模块(S7-417)和网络模块(CP443)组成,通过ProfiBus总线与下层卡件(IM153-2)进行通信和数据采集。网络模件与CPU的通信通过背板总线进行并通过ProfiDP总线连接到下层网OSM通信模块,以实现服务器数据采集和传输的实时性。
1.1.1 故障现象
(1)预制电缆故障。
在机组正常运行的过程中,经常出现整个卡件模拟量测点中断、波动、部分信号跳变等现象,如:5A汽泵壳体顶部温度、下部温度,5A前置泵马达U相温度,驱动端、非驱动端轴承温度瞬间出现断点;60CBA19控制柜AD006卡件所有信号跳变;60CBA21柜AB005卡件所有信号跳变;5C给煤机指令与反馈偏差5%,检查DCS输出偏小,指令12 mA时实际电流小于11.2 mA;5号炉A侧2号再热器微量减温水调节门开度波动较大,AO输出异常。
(2)服务器故障。
宁海B厂T3000系统服务器采用的是ft Server W系列4300系统,在机组正常运行过程中,曾经出现硬盘不同步、服务器内存故障等问题。
2010-12-17,巡检发现6号DEH服务器硬盘冗余丧失。利用春节临修时进行检查,发现是由下层冗余服务器磁盘控制器故障造成,更换下层服务器后恢复正常。
2011-5-9,5号DCS服务器底层单元模件故障,更换底层服务器后恢复正常。
2012-5-28,5号机组DCS系统服务器冗余故障报警,原因是UPS电源故障造成下层服务器停运,电源恢复、服务器重启后,数据硬盘同步显示故障。经西门子和服务器厂家专家确认,故障为硬盘坏道引起。
(3)卡件故障。
卡件故障主要分为IO卡件故障和控制器电源PS405卡件故障。
2010-1-21,DEH系统60CKC05柜AD05槽DO卡件第4通道故障,指令无法发出,造成主汽门前疏水门无法开启。2010-2-18,60CBA22控制柜AD05槽DO卡件第9通道指令误发,二级过热器减温水调门前电动门打开。2010-11-12,50CBA28柜AD010卡件AO指令信号中断,导致现场1B高加事故疏水,2B高加正常疏水和事故疏水,3B高加正常疏水,3A高加事故疏水等多个气动执行器全开。
CPU电源模块PS405卡件故障,导致备用CPU停运,DCS故障报警。到目前已经多次发生,但未对运行造成严重影响。2009-10-31,5号机组AP547控制柜(MEH)PS405卡件故障;2010-01-25,5号机组AP548控制柜(MEH)PS405卡件故障;2011-08-10,5号机组AP526控制柜PS405卡件故障;2011-10-06,6号机组AP601控制柜PS405卡件故障;2012-06-27,5号机组AP539控制柜PS405卡件故障;2012-7-31,5号机组AP502控制柜(MFT)PS405卡件故障。
1.1.2 故障原因分析及处理
(1)由于预制电缆问题导致信号异常的情况,经西门子公司进行检测,发现系该批次预制电缆的针脚制作封装工艺存在问题。对该批次中大部分预制电缆进行更换后,目前此类原因引起的故障已较少出现。
(2)西门子T3000系统服务器采用冗余设计,硬盘之间采用镜像技术,所以对硬件的要求较为严格,服务器长时间运行后会导致服务器硬盘产生坏道,坏道部分的数据将无法与另外的硬盘进行冗余,服务器在这个过程中进行反复的检测,产生故障报警。而实际服务器硬盘数据正常,切换正常。针对此种情况,将服务器故障分为3种类型,编制了B1,B2和B3三级应急预案,防止因事故的进一步扩大而导致机组跳闸,减小了对电网的影响。
图1 宁海B厂2×1 000 MW机组DCS系统网络
(3)IO卡件故障的主要原因是电子产品使用时间过长后出现老化。停运的PS405卡件重新上电后,可以工作但电流偏大。这一情况已经联系西门子公司将故障卡件寄回德国检测。所有故障现象均为PS405卡件停止工作,导致相应侧AP控制器停运。如果控制器存在切换异常,则可能导致相应控制器控制设备异常。为此组织编写了DCS系统所有AP控制器单侧故障抢修预案。
1.2 软件故障
T3000系统软件是将所有的任务放置在同一个综合系统软件中实现,包括工程设计、调试运行和系统诊断。这种理念简化了T3000系统的结构,使得HMI、控制系统组态、诊断、历史数据存储等多个功能被包含在T3000的嵌入式组件服务程序中。在宁海发电厂调试及运行期间,T3000系统在算法模块、趋势组件、时钟同步等方面也存在着问题。
1.2.1 故障现象
(1)算法模块不运算。
2008-11-16,顺控停6大风机时,1个“与”门前的2个条件都为“1”,结果输出为“0”。2009-05-04,5号机组凝汽器水幕喷水阀A的所有反馈、指令信号正常,但是CCTRL算法模块无法判断阀门状态,导致画面报警。2010-11-12,6号机组启动磨煤机B的允许启动条件显示被强制成“0”,但前一级却输出为“1”。2011-1-14,6号机组DCS系统A磨煤机允许启动条件信号为“1”,但A磨煤机却不允许启动。
出现类似上述情况后,将逻辑重新激活即可恢复正常。
(2)报警系统异常。
2009-02-15,报警系统不能识别抑制报警点,造成大量抑制报警点无法恢复报警和无历史存档,将服务器重新启动后,报警系统恢复正常。2011-12-1,5号DCS主控画面中部分信号测点“U”报警,检查逻辑运算正常,监视块输出端口无显示,重新激活监视块后正常。2011-6-5,5号机组DEH系统画面“U”报警,将PDS进程内存由135 MB改为187 MB,将OPC文件由8 000点配置成9 500点后正常。
(3)趋势图组件无法使用。
2008-12-19,5号机组DEH系统打开趋势图无数据。2009-04-10,6号机组DCS系统无法调出历史趋线。2009-04-16,6号机组DCS系统趋势图打不开。2009-04-25,5号机DEH系统趋势图内数据全为坏点。
(4)GPS系统时间出错。
2008-11-11,5号DCS及DEH系统报警时间出错,11月11日的报警显示日期为11月12日,11月12日的报警显示11月13日。2012-06-30,5号、6号机组DCS及DEH系统趋势点“U”报警。检查发现2个GPS相差1 s,重启时钟后恢复正常。2012-07-27,5号、6号机组DCS系统和DEH系统相继出现记录曲线断点现象,经查实为GPS时钟不同步造成。
1.2.2 故障原因分析及处理
(1)T3000系统中连接点或者个别算法模块未激活,其主要原因是该点或者该算法模块应用到多个方案页中,当某个方案页逻辑变动后进行激活时,未对关联的方案页进行激活,可能导致算法模块无法正常运行。
(2)DEH系统内存较小、配置点较少。将PDS进程内存由135 MB改为187 MB,OPC文件由8 000点配置成9 500点,重新启动服务器后即可恢复正常。
(3)历史趋势曲线变为虚线和GPS系统时间出错的原因是服务器的GPS校时程序不同步,重启GPS时钟即可恢复正常运行。
目前西门子厂家已对系统进行版本升级,有效解决了上述问题。
1.3 通信系统故障
T3000系统的网络架构主要由3部分组成:应用层网络、控制层网络、过程接口层。每层之间的通信协议有所不同,在调试及运行过程中,通信系统曾出现过各类问题。
1.3.1 故障现象及处理
(1)网络瘫痪。
2009-12-18,5号机组AP503所有测点画面显示坏点,光字牌显示一次风机RB,同时所有模拟量测点显示为零,持续3 min后自动恢复,分析为网络数据阻塞导致。
2010-7-4,5号机组DCS系统响应缓慢,打开一幅画面约需2 min,同时ASD报警无法复位,后经重启AC进程后恢复正常。西门子系统管理员远方登陆确认为OP53操作员站电脑“空格”或“ENTER”键一直处于按下未弹起状态,ASD报警复位功能一直在激活状态,占用大量内存,导致DCS系统运行速度缓慢。
(2)网络通信滞后。
2008-10-27,启动顶轴油泵时,发现5号机组DCS系统画面状态曲线显示比DEH系统的画面显示慢5 s。2008-11-24,6号机组闭式泵B跳闸,电流为零,延时20 s后状态显示才由运行变为停止。经查是由于数据通信迟滞导致。
(3)CM通信中断。
T3000系统与发电机、锅炉壁温等IDAS系统、TSI系统、除灰系统等其他系统采用CM通信方式。
2012-01-10,锅炉壁温测点不能显示,数据刷新慢,所有操作员站均有部分画面死机,持续1.5 min后恢复正常。2012-01-17,因打开2个壁温画面,操作员站DCS多个画面死机,关闭壁温画面约5 min后恢复正常。
(4)交换机故障导致网络堵塞。
2010-3-30,6号机组DCS系统OM画面刷新变慢,调用新画面时间较长,特别是打开DEH系统画面时间更长并出现大量坏点。检查操作员站,DCS和DEH服务器负荷正常,检查T3000系统各进程内存占用情况正常。检查发现网络中心交换机B在间歇式重启,大约5 min 1次,在中心交换机重启的过程读取DEH系统画面信息,导致卡涩现象。
1.3.2 故障原因分析
T3000系统采用西门子特有的环网冗余技术,使用1对OSM(光网交换机),主站、从站互为备用。所有信息通过服务器进行数据交换,所以当网络交换机出现异常或者故障时,会导致DCS系统数据阻塞或者中断。
2 提高系统可靠性的措施
DCS系统可靠性直接关系到机组的安全稳定运行,如何提高DCS系统可靠性、降低DCS系统故障率非常重要。
2.1 提高系统接地和信号屏蔽可靠性
T3000系统接地包括2个部分:一是安全接地,使保护人员不受电气伤害;二是信号接地,消除高频干扰。接地点的电阻应不大于5 Ω,接地导体使用绝缘的铜导线,其规格应不小于最大的供电相线尺寸。要求接触良好,每年需对接地进行检测以确保满足系统的要求。
外部接线可能引入无线电和电磁干扰,使用双绞线可以降低这些干扰的影响。屏蔽线可以有效消除高频干扰和外部引起的干扰。屏蔽线应该单端接地,尽量接在DCS机柜侧接地铜排上。
DCS系统接地良好和外部信号屏蔽良好,可以有效避免系统内部和外部的干扰,为DCS系统安全提供保障。
2.2 加强人员培训,开展定期巡检工作
编写T3000系统典型故障快速查找表,对典型故障进行分类,包括故障现象分析、检查处理步骤及注意事项、采取的安全措施、故障涉及设备及联锁保护等。所有相关人员参与编写AP控制器和主/重要设备异常、故障抢修预案,并按照抢修预案进行反事故演习,提高应对DCS系统异常事件的处理水平和能力。
结合DCS系统所有卡件故障报警指示灯、异常现象,对DCS系统定期巡检、定期维护,确保及时发现问题及时处理,有效避免DCS系统异常、故障事件扩大化。
2.3 强化管理、完善设备优化
(1)对机组的主保护信号进行全面梳理,编写保护投退操作卡和逻辑、信号强制标准表单,有效防止故障处理时人为误操作。
(2)针对所有DCS系统操作编写标准操作卡,如远程登陆诊断操作卡、CPU卡件更换操作卡、项目数据导出备份操作卡、AP数据与工程数据同步操作卡、T3000进程重启操作卡等。要求所有热控人员熟练掌握,并规范操作,有利于专业管理和风险分散。
(3)软件组态时,模拟量采集模块的滤波功能要打开,还应设置上/下限和死区,避免因数据的微小变化而影响控制器的通信进程。
(4)优化和删除控制器中没有用途的逻辑或者垃圾逻辑,减轻控制器负荷率,减少不必要的数据交换,提高AP控制器和服务器性能。
3 结语
宁海发电B厂在机组调试及运行过程中,对T3000系统的软/硬件、通信及系统配置等进行优化,并对机组运行过程中出现的问题进行总结,寻求解决办法,同时编写DCS系统控制失灵应急处理预案,为机组安全稳定运行提供了保障。
[1]张澎涛,周鹏,张秉权,等.西门子SPPA T3000 DCS系统的应用与优化[J].内蒙古电力技术,2008,26(4)∶70-73.
[2]电力行业热工自动化技术委员会.火力发电厂分散控制系统典型故障应急处理预案西门子T3000和TXP系统[M].北京:中国电力出版社,2012.
(本文编辑:徐晗)
Application of Siemens SPPA T3000 Control System and the Fault Handling
WANG Li-wen
(Shenhua Zhejiang Guohua Zheneng Power Generation Co.,Ltd.,Ningbo Zhejiang 315612,China)
The paper introduces network structure and hardware composition of Siemens SPPA T3000 control system;it mainly analyzes problems in the application of the system in 2×1 000 MW units of Zhejiang Guohua Ninghai B Power Plant and presents the solution and countermeasures.
SPPA T3000;automatic control;fault analysis;reliability;measure
TK38
:B
:1007-1881(2013)07-0052-04
2012-11-21
王立文(1973-),男,河北张家口人,工程师,从事热工自动化控制方面研究和管理。