APP下载

浅析DCS网络故障原因及防范措施

2020-06-02常向阳张志彬

装备维修技术 2020年23期
关键词:网络故障信息网

常向阳 张志彬

摘 要:随着DCS系统在国内大型电厂的广泛应用,其网络的安全性和稳定性变得越来越重要。文章通过某电厂机组在调试期间发生的DCS网络故障事件进行了深入细致的分析,并提出了相应的解决措施,减少了突发事件对机组状态的影响,同时对该DCS系统在其他电厂的应用也具有较好的参考价值。

关键词:DCS;网络风暴;网络故障;信息网

1 DCS网络结构

1.1网络组成

非安全级DCS网络包括信息网(MNET)和系统网(SNET),如图1所示。

信息网(MNET)采用冗余快速以太网链路,采用TCP/IP通讯协议,介质主要使用五类屏蔽双绞线或光纤,主要通讯节点包括操作员站、工程师站和服务器等;系统网(SNET)采用光纤介质组成交换机环路的快速以太网,基于TCP/IP协议;控制站、实时服务器、通讯站和工程师站通过采用五类屏蔽双绞线或光纤与交换机连接,主要通讯节点包括实时服务器、现场控制站、通讯站和工程师站等。

2 事件经过

2020年3月19日10点45分,某电厂机组SNET A网发生网络风暴,一层控制器及通讯站的SNET A网开始出现大面积的网络故障,在短时间内所有控制器的SNET A网故障,大部分通讯站的SNET A网故障,并且部分控制器出现SNET A和SNET B同时故障的情况。

随着时间的延长,新增较多控制器同时出现SNET A和SNET B网故障的情况,其中主、从控制器同时出现SNET A 和SNET B的情况新增了较多。

为了尽快恢复DCS一层网络,现场对SNET A网交换机进行了断电重启,发现较多的控制器网络已经恢复正常,但仍有部分控制器显示SNET A网和SNET B网故障,后在机柜侧通过对控制器进行复位后,控制器及网络恢复正常。

该网络风暴造成SNET A网失效8小时,整个故障过程中,DCS系统控制器逻辑处理功能正常,未对现场设备造成扰动;SNET A网故障的控制器成功切换到SNET B网,二层可对其正常操作和显示;8小时内共有16个控制器出现双网故障,其中有2个控制器互为冗余,该控制柜孤岛运行,二层无法显示和操作。

3故障原因分析

造成网络故障的直接原因为SNET A网发生网络故障。当SNET A网发生网络故障时,数据帧在网络内大量复制、传播,造成SNET A网交换机超负荷,从而导致整个SNET A网络瘫痪;造成网络故障的根本原因是交换机电路板交换芯片外围电路晶振相连的滤波电容一端焊锡少,造成晶振频率偏差,MAC芯片由于滤波电容焊锡少出现功能异常,形成物理环路并造成网络故障影响交换芯片功能。

为了防止网络故障造成控制器超负荷,导致控制器复位,控制器具有网络故障检测功能。该功能的处理机制如下:

3.1当控制器检测到网口超负荷时,关闭该网口;

3.2关闭网口后,控制器会不停重试该网口,检测网络故障是否消失,重试间隔为1分钟。如果消失,则恢复网口;如果没有消失,则继续关闭网口;由于控制器处理能力有限,重试次数过多会造成控制器软件错误,导致双网故障。

4防范网络故障措施

4.1设置RSTP 协议

非安全级DCS系统使用的交换机支持防范网络故障的功能,在所有连接其它交换机的端口(以下简称互联端口)设置了RSTP协议。该协议可应用于环路网络,通过一定的算法实现路径冗余,同时将环路网络修剪成无环路的树型网络,从而避免报文在环路网络中的增生和无限循环。环形网络中所有站点组成环形连接,具有自愈特性。当环网上所有部件均正常工作时,交换机会通过RSTP协议自动设置断点;当环网上一部件工作不正常形成开路时,网络容错机制能够检测到网络故障,并连接自动设置的断点,瞬时激活备用链路,使传输介质发生。

4.2开启环路检测功能

为了防止业务终端接入式故障影响整个网络,交换机连接业务终端(如控制器、主机)的端口(以下简称业务端口)开启了环路检测功能。

端口环路检测:为了能够及时发现网络中的环路,以避免对整个网络造成严重影响,需要提供一种检测机制,使网络出现环路时能够自动关闭出问题的端口以消除环路,这种机制就是端口环路检测机制。当链路上存在环路情况时,最后会发现整个网络中的所有的MAC地址都移动到了存在环路的端口上了(大多的情况是MAC地址频繁在不同端口间切换),导致网络瘫痪。在网络中进行端口环路检测非常必要。

4.3增加端口速率违背功能

为了防止RSTP协议失效,对特定交换机的互联端口增加端口速率违背功能,辅助于RSTP协议,减少网络中因故障引起的网络震荡和不稳定。如图2所示的交换机端口上配置端口速率违背功能。

5结语

随着我国工业化的快速发展,对DCS系统的要求要越来越高,DCS系统的应用使自动化仪表装置向系统化,分散化,多样化和高性能化的方向产生了一个质的飞跃,也大大促进了自动控制技术的发展。但在实际应用过程中,仍旧存在着一些问题,这些问题的存在对系统的整体运行的安全性、稳定性、可靠性产生了一定的影响,因此需加大对这些问题的重视和研究力度。本文通过介绍某品牌DCS系统的实际应用过程中发生的问题,提出了详细的解决方法,经过验证,效果改善明显,有效避免了故障范围的进一步扩大,对其他电厂的应用也具有非常实用的经验价值。

参考文献:

[1]魏东明 宋瑞莲 王鲁 浅谈和利时DCS系统“域”的概念和应用,科技創新导报,2013,NO.04

[2] 蒋波 和利时DCS常见故障分析及解决措施,中国高新技术企业,NO.27.2016

[3] 刘一福 DCS通信网络故障的分析及防范措施,华北电力技术,NO.9.2005

(中国核电工程有限公司华东分公司,浙江 海盐 314300)

猜你喜欢

网络故障信息网
基于RS485通讯协议的ACS模块网络问题解决思路
计算机网络几种典型故障的处理及维护方法