集散控制系统网络故障分析与解决
2018-12-07王彬
王 彬
(扬州石化有限责任公司,江苏扬州 225200)
0 前言
炼油分厂所使用计算机集散控制系统DCS(Distributed Control System)是Honeywell公司的全厂一体化解决方案系统TPS(Total Plant Solutions System),于 2000年投用。2011年仪表控制系统升级改造,为兼顾新旧2套不同催化装置的需求,采用升级扩容的方式,即继续保留为老催化装置服务的2对控制器,增加为新建催化装置服务的2对控制器,增加2台全方位用户工作站GUS(Global User Station)操作站,并对原来5台工作站升级,以满足炼油工艺生产过程的自动化过程控制方案的实现。但从2016年下半年开始,TPS系统网络通信频频出现故障(UCN电缆fail),给炼油分厂的生产装置生产带来重大安全隐患。为确保DCS系统安全运行,对TPS通信故障问题进行攻关。
1 故障现象及危害
1.1 UCN电缆故障现象(出现红色fail信息)
2016年10月30日炼油分厂DCS出现系统报警信息,仪表技术人员到现场检查了网络接口模件NIM(Network Interface Module)、高性能过程管理器HPM(High Performance Process Manager)、历史模件 HM(History Module)和各输入、输出 I/O 卡件,各台GUS操作站暂时不受影响操作。通过进入系统诊断画面,检查发现为UCN的A缆fail报警,进入系统内UCN(Universal Control Network,通用控制网络)电缆通信统计信息画面,发现HPM05的噪声值比其他HPM的噪声值大很多,帧碎片也多,更换HPM05的HPM MODEM卡件,故障消除。2017年4月5 日,MCP(Maximizing Catalytic Propylene,最大化生产丙烯的催化剂工艺)装置DCS系统出现系统报警信息,检查发现UCN B缆报警,更换了一个终端电阻后,UCN电缆当时显示正常,但是故障却未彻底消除,此后陆续出现UCN B缆报警的情况,也采取了更换TAP(通信电缆连接器)、互换UCN电缆等方式,但未根本解决问题。由此分析出外部干扰是引起UCN B电缆报警的主要原因。图1。
1.2 UCN电缆故障危害
UCN通信承载着控制器与现场测量仪表设备的数据读取以及下达执行机构控制数据的任务,如果不及时解决UCN电缆报警问题,一旦UCN两根电缆同时故障则会造成整个炼油分厂DCS系统瘫痪,不仅会影响整个炼油分厂的工艺过程生产,还会引发恶性安全事故。
2 故障原因分析及解决方案
2.1 故障原因分析
(1)当UCN的B缆频繁出现故障问题后,先将焦点集中在该缆和与之相连的DCS部件上,由于该缆由很多段的支电缆组成,同时又有很多的部件与之相连,很难判断是里的问题,只能采用现有备件一一更换和相互更换的办法来试误,又由于故障不是一直存在而是偶发的,所以换一个部件要等很长时间才能判断该部件有无问题,需花费很长时间。
(2)将焦点放到DCS的电源、接地、屏蔽层的敷设等,对每个柜子逐一进行排查。同时对与之相邻的4分降的所有的信号连接进行清理,去掉不必要的连接(必需的连接加双向隔离),采取上述措施后UCN的B缆还会出现故障。经分析这些故障发现,故障首次发生的点集中在3#和4#控制器上,观察2个控制器周围环境,发现其正对着一个门,门过去就是4分降,门一关上故障就消失。这说明是4分降产生的随机性干扰,经过2道墙后得到有效衰减,门开时3#和4#控制器少了一层保护,受到干扰较大,易导致UCN B缆故障。4分降改造后产生的干扰比改造前强,这是导致UCN的B缆出现故障的主要原因。
图1 UCN网络上节点电缆报警图
2.2 解决方案和措施
(1)来自空间的辐射干扰。空间辐射电磁场是由电力线缆、雷电、无线电广播、变频设备等产生,称为辐射干扰。若控制系统置于射频场内,就会受到辐射干扰,主要通过2条路径影响:①直接对控制系统内部的辐射,由电路感应产生干扰;②对系统通信网络的辐射,由通信线路感应引入干扰。
DCS机房是由紧靠四分降的值班室改造而成,处在一个相对较差的电磁环境中,机房也未作防电磁干扰处理。为此,攻关小组对紧靠DCS机房的电气四分降墙面加装了屏蔽网,关闭机房正对四分降的门以增加防护层次,并将木门换成了金属门以增强屏蔽效果。
(2)来自DCS系统外连接线的干扰,主要有3类:①电源干扰。控制系统的正常供电电源均由电网供电,由于电网覆盖范围广,它将受到的空间电磁干扰均在线路上感应成电压和电流,尤其是电网内部的变化、开关操作浪涌、变频装置引起的谐波等,都通过输电线路传到电源原边;②信号线引入干扰。与控制系统连接的各类信号传输线,除了传输有效的各类信息外,还有外部干扰信号侵入;③接地系统干扰。地线包括系统地、屏蔽地、交流地和保护地等,接地系统混乱对控制系统的干扰是各个接地点电位分布不均,不同接地点间存在电位差引起环路电流,影响系统正常工作。
针对引线干扰,攻关小组为了彻底检查接地系统,首先根据实际情况绘制出DCS机房接地示意图,并在整改后请电气人员对机房分别摇测接地电阻,在保证接地可靠安全的情况下及时更改资料以备日后维护查询。控制系统的信号地与控制柜的安全接地完全隔离分开,同种信号集中在一点接地,避免多点接地电位差同造成干扰。对停用的仪表接线进行拆除并从系统中删除;对仪表和电气设备之间联系的信号进行隔离,特别是模拟信号增加向双隔离。
(3)加强管理,进一步细化DCS系统巡检制度,每天详细记录UCN通信数据并比对,有效监控DCS系统通信状态。图2。
图2 良好的UCN网络运行图
3 存在问题和下一步措施
(1)干扰问题。虽然已经知道干扰来自何方并通过屏蔽和增加防护层次阻止对DCS的影响,但对四分降内的间歇性干扰的产生机理和诱发因素还一无所知。期间DCS的UCN电缆由于四分降变频风机启动引起短时间报警,这就需要从根本上消除干扰。下一步对DCS机房的墙面和天花进行屏蔽改造,进一步加强DCS机房的抗干扰能力。在DCS改造中,机房和控制室的电磁环境应作为一个重要指标加以控制。
(2)DCS老化问题。这套Honeywell公司的TPS系统,从2000年投用到现在,期间经过多次扩容升级,新旧设备在一个系统中共同运行,旧设备的老化短板危及整个系统的安全。进行全面的系统更新是解决问题的最好办法,经过技术攻关延长了系统使用寿命,缓解了系统更新的紧迫性。
4 结语
攻关小组通过努力发现了导致催化DCS的核心通信电缆UCN电缆频繁出现故障的原因,通过加装隔离网等一系列的措施,已初步解决了通信电缆存在的重大安全隐患,在无投入和无外援的情况下,依靠自身的技术力量完成了该科研项目。解决了机房外部环境干扰问题,提高了DCS系统可靠性和安全性,保障了生产装置的安全与平稳运行。而且整理绘制的UCN电缆结构图和DCS机房接地示意图,便于今后的DCS维护工作,积累的DCS维护经验可有助于设备长周期平稳运行。