基于减少DEH 与DCS 通信故障次数的研究
2021-11-03陈德林
陈德林
(海南核电有限公司,海南昌江 572733)
0 引言
昌江核电厂集散控制系统(DCS,Distributed Control System)采用的FOX-BORO 公司的I/A 系统,为电厂过程控制层,其他控制系统通过网络与DCS 进行信息传送,并将其他系统控制、监视参数通过DCS 传送至主控室。汽轮机数字电液调节系统(DEH,Digital Electronic Hydraulic Control)采用艾默生公司的Ovation 系统,主要用于汽轮机的控制、保护及监测。DEH 与DCS 通信正常与否对汽轮机正常运行有直接影响,在机组安全稳定运行过程中具有重要意义。
DEH 与DCS 之间的通信故障频繁发生,直接影响操作员对汽轮机相关系统的监视及控制,进而影响机组安全稳定运行。为满足操作员能实时、准确、可靠地对汽轮发电机的监测、控制和操作,DEH 与DCS 之间存在大量的数据通信。因此,确保DEH 和DCS 之间网络通信、数据收发畅通尤为重要。基于昌江核电厂DEH 与DCS 系统之间存在的通信故障问题,研究如何准确定位DEH 与DCS 通信故障症结及制定相应的处理方案。
1 DCS 通信机制
DCS 通信部件主要包括FBM233(DCS 的通信卡件)和G427UC(DCS 通信控制器)。DCS 内部通信采用容错机制实现,I/A Series 系统Mesh 网络采用冗余机制,通过冗余线连接实现数据同步。当控制指令下达时,由服务器发给主控制站,主控制站通过冗余线将指令传送给从控制站,主从控制站进行数据同步、同时分别输出。接收第三方数据时,只有主站数据上传进行运算,从站数据不上传、不参与逻辑运算(仅作内部主从站之间的数据同步、运算)。两个控制站一个为主站时,另一个默认为从站。
2 DEH 与DCS 之间的通信原理
DEH 通信部分主要包括DROP(DEH 的控制器,相当于DEH 的大脑)、ELC(以太网连接控制器,DEH 的通信卡,通过该卡件对通信数据进行解析及传输)。DEH 与DCS 通信建立是通过以太网连接实现,DEH 与DCS 通信原理如图1 所示。
图1 DEH 与DCS 通信原理
根据TCP/IP 网络协议,通过以太数据网实现DCS 侧控制站与Ovation 系统服务端被控侧之间的通信,两者相互进行数据收发。由于DCS 侧控制站与Ovation 系统服务端被控侧都使用固定的端口号,因此每一个TCP 地址由一个IP 地址和一个端口号组成,确保数据传送的正确性、可靠性、唯一性。
3 DEH 与DCS 通信故障原因分析及处理
3.1 现场故障描述
昌江核电厂1#、2#机组DEH 与DCS 通信故障频繁发生,故障出现时主控画面汽轮机相关的参数全部显示为0 或是保持某一数值不变,严重影响操纵员对汽轮机实时状态的监视、控制,仪控人员经常被主控On Call 去现场紧急处理通信故障问题。
3.2 故障症结定位
收集某年5—10 月昌江核电厂1#、2#机组DEH 与DCS 通信故障总次数31 次,平均每月故障次数5.2 次。
为了找出通信故障根源所在,对收集数据采用分层法进一步分析。分别从电源波动、通信设备离线、控制器死机等方面进行分析。结果表明DEH 与DCS 之间通信故障主要出现在通信设备离线上,占比高达87.1%,因此认为DEH 与DCS 通信故障次数高的症结在于通信设备离线。
3.3 症结原因分析
针对DEH 与DCS 通信故障症结在于通信设备离线,从人、机、料、法、环等方面进行剖析,采用头脑风暴法,找到影响症结的12 个末端因素,并绘制出因果分析图,因果分析如图2 所示。
图2 因果分析
3.4 要因确定
根据因果分析图,通过现场测量、试验、论证对比及调查分析等方式,针对影响通信设备离线的12 个末端因素进行逐条验证和确认。
(1)安装人员不按图纸安装。根据设计图纸的安装要求对现场DCS 机柜内安装情况进行检查,发现柜内的卡件、接线端口、布线要求等与设计图纸一致,安装正确。因此,判断该因素为非要因。
(2)通信点名设置不正确。组织仪控人员对DCS 所有通信点名进行检查,核实确认现场所有的通信点名不存在设置不正确的情况。因此,判断该因素为非要因。
(3)FBM233 软件版本低。现场检查,FBM233 当前软件版本为1.32/0304 版本,而最新版本为1.36.4/0420 版本。对FBM233两个软件版本进行试验发现最新版本软件在通信性能优势更明显、通信设备离线次数更少。试验结果表明,软件版本的高低对症结影响大,因此,判断该因素为要因。
(4)扫描周期设置错误。授权人员进入ICC 组态软件中,检查通信扫描周期的参数值为0.5 s,同步对比其他第三方通信正常的系统其扫描周期均为0.5 s、同时厂家答复扫描周期设置
0.5 s 是合理且扫描周期设置对通信设备离线无影响。因此,判断该因素为非要因。
(5)超时时间短。授权人员检查通信故障系统超时时间参数(T0)设置为默认值0.5 s,并检查其他三方通信正常的系统其超时时间参数值在2~3 s。因此怀疑通信设备离线与超时时间短有关。通过查阅资料、调研同行电厂、选取仅超时时间设置不同的通信设备进行试验。试验结果表明,超时时间设置长短对通信设备离线次数有影响,当超时时间设置越短时,通信设备离线次数越多。因此,判断该因素为要因。
(6)FBM233 故障。通过总结已往通信故障现象、经验反馈,发现当FBM233 出现故障时通信故障次数明显增多。FBM233是DCS 侧通信卡件,冗余配置。根据现象猜想:FBM233 故障对通信设备离线有影响。通过试验发现当其中一个FBM233 出现故障时,通信设备离线次数高达6.7 次/月,明显高于两个FBM233 无故障时的1.5 次/月。因此,判断该因素为要因。
(7)FBM233 使用年限超期。经检查发现目前现场使用于DEH 与DCS 通信卡件FBM233 出厂时间分别2016 年10 月15日和2017 年01 月15 日,而该设备使用寿命一般为10 年,不存在FBM233 使用年限超期问题。因此,判断该因素为非要因。
(8)FBM233 插针断裂。对目前现场使用于DEH 与DCS 通信的两块FBM233 卡件进行检查,经工作负责人、监护人、QC 人员三方共同确认。FBM233 插针未有断裂现象,所有插针均完好无损。因此,判断该因素为非要因。
(9)文件要求的FBM233 版本错误。FBM233 厂家(FOXBORO)提供的用户指南中要求FBM233 版本为最新版本,满足技术规格书要求。因此,判断该因素为非要因。
(10)DCS 通信机柜图纸错误。经核实,DCS 通信机柜图纸均为最新版本D 版。同时对比电厂RGL(棒控棒位系统)、其他第三方与DCS 通信的DCS 机柜图纸,未发现DEH 与DCS 通信机柜图纸错误的情况,且其他第三方设备与DCS 通信未出现通信故障的情况。因此,判断该因素为非要因。
(11)DCS 通信机柜温度高。对现场DCS 通信机柜温度实时测量,对一年内通信机柜温度测量数据进行统计分析。结果表明,DCS 通信机柜环境温度平均值、最高值、最低值均在5~35 ℃,均满足通信机柜所要求的温度(正常温度范围内(5~35 ℃)规定。因此,判断该因素为非要因。
(12)DCS 通信机柜湿度高。对现场DCS 通信机柜湿度实时测量,对一年内通信机柜湿度测量数据进行统计分析。结果表明,DCS 通信机柜环境湿度平均值、最高值、最低值均在45%~65%,均满足通湿机柜所要求的湿度(正常湿度范围内(45%~65%)规定。因此,判断该因素为非要因。
通过逐条要因验证确认,最终确定影响DCS 与DEH 通信设备离线故障要因有3 个:①FBM233 软件版本低;②超时时间短;③FBM233 故障报警。
4 制定处理方案
(1)针对FBM233 软件版本低:①先跟厂家沟通明确FBM233软件对版本规定,做好版本升级前的工作准备;②现场实施FBM233 软件升级操作;③确认已将FBM233 软件升级到目标版本;③跟踪观察软件升级后通信故障次数是否减少。
(2)针对超时时间短。根据要求:超时时间设置需兼顾灵敏度(指通信出现故障时,系统判断故障的快速性、准确性、稳定性)。①通过试验发现灵敏度、超时时间、通信故障次数三者之间的内在联系;②综合评估超时时间、灵敏度、通信故障次数三者关系,选择最优值超时时间数值;③现场实施超时时间参数修正;④跟踪观察超时时间参数修正后通信故障次数是否减少。
(3)针对FBM233 故障报警。通常消除FBM233 故障报警的方法有:①硬件重启;②软件重启;③卡件更换。通过对三个要因的对策实施,昌江核电1#、2#机组DEH 与DCS 通信故障次数大幅度降低,达到≤1 次/月。提高设备运行的可靠性,避免操纵员监视画面频繁出现故障报警,减轻操纵员的压力,为机组安全稳定运行提供有力支持。
5 结束语
为满足操纵员能实时、准确、可靠地对汽轮发电机的监测、控制和操作,保障DEH 与DCS 之间大量的数据通信,因此,确保DEH 和DCS 之间网络通信、数据收发畅通,就显得尤为重要。基于昌江核电项目,就Ovation 汽轮机保护控制系统与DCS系统通信故障次数高问题开展研究,对影响通信故障因素进行要因验证及确认,根据要因症结制定处理方案。