DCS系统升级改造引发的通信故障分析与处理
2015-10-21刘乃辉孟祥梅
刘乃辉 孟祥梅
【摘要】随着现代控制技术的逐步发展,火力发电厂DCS系统控制也在不断更新,一些旧DCS系统由于硬件不断老化,需要进行软硬件升级改造。本文介绍了邹县发电厂某机组在DCS升级改造中出现的一些问题,并进行了探讨,希望为其他控制系统改造提供一些参考。
【关键词】控制系统;升级改造;通信故障
ABSTRACT: With the development of modern control technology, DCS control system of power plant are constantly updated. Due to the aging of equipment in old DCS, it is necessary that the upgrades of hardware and software. Some problems about DCS upgrades of Zouxian plant were discussed, and solutions were put forwared. It provide a reference for similar units.
KEY WORD: control system;upgrades;communication failure
1、引言
華电国际邹县电厂某机组锅炉为自然循环单炉膛仓储式燃煤锅炉,采用倒U型布置、切向燃烧、固态排渣、平衡通风、燃料为烟煤。汽轮机组为335MW亚临界、中间再热、四缸、四排汽、冲动凝汽式机组。DCS控制系统为FOXBORO公司生产的I/A'S,硬件型号为CP40B,软件版本为6.3,工作站采用SUN公司的ULTRA 5系列。工程师站共有3台,同时做为历史站,其中AW5101为管理首站,AW5102站装有与MIS网通信的接口程序,AW5103站为DEH系统管理站,另设5台操作员站WP,整个网络管理15对DPU,测点总数约6500点,整个系统网络由DPU间通信的Nodebus网和与I/O柜通信的FIEDBUS网组成。整个DCS系统包含DAS、CCS、FSSS、SCS、MEH、DEH、BPC、ECS及与其他系统的接口(MIS系统、与脱硫系统、供热系统等)。控制系统投产于2002年,运行一直安全稳定。
随着时间不断推移,DCS系统关键部件CP和工作站等都已无法购买备品,系统升级迫在眉睫。整个系统升级分两阶段进行,首先在2010年搭建了基于光纤通信的MESH网络,并增加一台P92管理工程师站,此工程师站采用XP系统,仅管理MESH网和做为历史站备用功能。第二阶段在2011年,升级了1对CP,将其中一对CP由CP40B升级为FCP270,同时将此CP下I/O卡件由FBM100系列升级为FBM200系列,这两次改造分别用时一周左右时间,但系统改造完成后,先后出现了系统时间跳变和通信反应缓慢的现象,类似只对部分硬件进行升级改造的电厂山东省内有5家,其中出现故障的现象在滕州、菏泽电厂等也出现过,可以说这种故障具有一定的代表性。
2、升级过程介绍
原控制系统为同轴电缆传输的Nodebus网和双绞线传输的FIEDBUS网组成,其中工作站基于UNIX平台,控制内容包含了除ETS、TSI外的所有热控控制,系统网络图见图1:
第一次升级在2010年6月份,利用停机时间,增加了MESH网络和基于XP系统的P92工作站,MESH网络通过2块ATS卡与原系统进行通信,改造后为系统升级打下了基础,系统网络图见图2:
第一次改造后,P92工作站做为MESH网的管理站,同时做为3台工程师站中历史数据站的备用站,运行一段时间后,运行人员反应调用历史数据时,系统反应时间变慢,通过分析为P92站由于历史数据过多,占用了网络资源,导致系统通信慢,便将P92工作站停用。
第二次升级在2011年9月份,利用机组小修时间,将15对CP中的其中1对更换为FCP270型号,通过MESH网与原网络进行通信,同时P92站做为新CP的管理站,系统网络图见图3:
第二次改造用时1周左右时间,将原I/O柜内卡件全部更换为新型卡件,并对原CP文件转换为新CP文件,改造过程比较顺利,系统未出现异常。
3、升级改造后出现的异常现象
第二次改造结束1个月后,在1个多月的时间内系统出现了时间跳变、画面曲线跑直线、系统反应慢、新CP测点不刷新、Nodebus离线等一系列问题,表1为DCS系统所引发的故障列表:
4、原因分析
通过查阅工作站事件先后的故障记录文件。分析为以上事件是由于网络负荷过高,造成网络阻塞,使DCS通信变慢。经过检查、分析,造成网络阻塞原因主要有以下四方面:
1)工作站由于长时间的工作,老化现象严重,技术性能落后,老的节点总线系统通讯速率较低,只有10Mbps;
2)DCS由于老系统和新系统混用,历史库配置不够优化;
3)AW5102通信负荷率由于安装了PI系统接口和全工况监视接口导致整个网络通信负荷过高,通过停运AW5102站上的PI的接口程序发现网络的负荷率大幅度降低,网络流量平均值从800多个数据包降低到450多个数据包;
4)工作站与网络连接用的DNBT卡存在老化现象,致使工作站在某些时间、某些工况时与系统通信过程中出现占用大量网络资源的现象。
以上几个方面因素叠加,是引发一系列故障现象的主要原因。
5、处理方案
5.1临时处理方案:
鉴于机组已经进入冬季供热阶段,不便对系统进行大的改造和更新,在此情况下,采用以下临时处理手段,降低网络负荷,避免类似故障再现。
1)重点监视工作站AW5102的负荷状况,并且查看/opt路径的空间情况;在负荷上升到一定阶段时,可以考虑人工重启AW5102,以便释放其内存和硬盘空间,降低网络负荷。
2)对现有历史数据系统进行优化:目前机组有AW5101、AW5102、AW5103和P92四台工作站同时在进行历史数据记录和存储工作。为了降低网络负担,历史数据记录工作将分Nodebus和Mesh网络两部分,分别记录在51系列工作站和P92工作站上。经过优化后,网络通讯较为流畅。
3)增加巡视内容,检查系统信息(信息文件存放在/opt/fox/sysmgm/sysmon/smon_log文件中)和AW5102的负荷情况,密切监视系统故障信息,一旦发现有同类故障隐患,可人工启动AW5102;
4)定期(每月一次)清理系统垃圾文件(垃圾文件为所有目录下的core文件)。
5)对于其他工作站,出现类似故障时也可能会导致网络堵塞,在巡检时同样注意上述事项。
6)运行人员及时关闭不用的应用程序(如DM画面,不再需要查看的历史趋势等),减轻机器和网络负荷。
5.2彻底解决隐患方案:
利用机组检修机会,对新旧不同版本搭配的硬件和软件进行全面升级改造。
1)由于机组采用的51D工作站已经服役多年,严重老化,技术落后。在條件允许的情况下,采用目前福克斯波罗公司主流的P92平台工作站逐步更换现有的51D工作站。在已经搭建好Mesh平台的情况下,升级到P92平台是非常便捷的。
2)对DNBT卡逐步进行更换,以判断是哪一块DNBT卡存在老化现象。由于网络阻塞现象不是一直存在,查找老化的DNBT卡非常困难,经过逐步更换,发现WP5101站DNBT卡工作不稳定,更换此站DNBT卡后网络上线正常。
3)更换P92工作站,对系统软件进行离线重装,离线试验48小时后未发现问题,将92工作站在线运行。
经过以上方案处理,现DCS系统正常运行一年半,未出现反应慢、死机、数据跑直线等异常情况,说明问题已经解决。
6、结束语
DCS控制系统是机组控制的核心部件,在搭建和对系统进行改造时,需要严格按照《DLT 659-2006火力发电厂分散控制系统验收测试规程》要求,对系统进行各项试验,检查网络系统通信负荷率符合如下要求:操作员站CPU负荷率不大于40%,过程控制站CPU负荷率不大于60%,通讯负荷率的配置不能保证在负荷运行时不出现瓶颈现象,数据通讯总线的负荷率在繁忙工况下不超过30%,对于以太网则不超过20%。
加强DCS系统维护工程师培训,采用规范的方法来进行日常的检查和维护:对系统软件根据要求进行每季度1次备份,严格执行《DCS系统防病毒管理规定》,不使用U盘、移动硬盘等手段进行软件备份;做好系统应用软件管理,各种系统软件及版本号标识清晰,严格根据要求进行系统安装;不得随意安装未经DCS厂家授权的第三方软件。
DCS控制技术发展日新月异,现在形势要求我们需要不断对控制系统进行升级或改造才能满足现场设备需求,但由于维护人员对新技术掌握需要一定时间,新技术应用也需要经过时间来验证,所以设备升级改造会对控制带来或多或少的影响,只有我们不断学习,领会其中的精髓,才能将新技术的优势完全体现出来。
参考文献
[1]上海福克斯波罗有限公司《I/A Series系统及应用》
[2]《I/A Series控制系统检修规程》
[3]《DLT 659-2006火力发电厂分散控制系统验收测试规程》
收稿日期:2013年8月5日
作者简介
刘乃辉(1975年),男,山东省潍坊市,本科,工程师,热工控制。