APP下载

降低EMS系统动力/水服务器故障率的设计

2018-03-01林继承

冶金动力 2018年3期
关键词:站点趋势报警

赵 晖,林继承

(马鞍山钢铁股份有限公司能源管控中心,安徽马鞍山 243000)

1 背景概述

马钢新区能源中心是一个集过程监控、能源管理、能源调度为一体的管控中心,监控管理的能源介质主要有:供配电系统、焦炉煤气、高炉煤气、转炉煤气、混合煤气、压缩空气、氧气、氮气、氩、蒸汽、生产水等。作为新区能源的生产指挥控制中心,调度人员借助EMS系统实现集中的能源生产调度,对无人值守的能源公辅设施实现集中监视和控制,保证新区主作业线正常有序的生产。

EMS系统的5#、6#服务器是动力和水调度台远程操作监视的重要基础平台,硬件采用2台IBM服务器,软件采用CiTECT6.0 SCADA,形成互相冗余的热备系统,以保证在某一台服务器出现故障时,能够及时的切换到备用服务器上,依然保证调度的实时操作和监控。

但在后续运行中5#、6#服务器运行一直不是很稳定,期间发生过数次同时中断的故障,导致系统不能正常运行,使相关设备处在失控状态,给调度的操作带来了不便和风险。

2 降低动力/水服务器故障率的设计

2.1 故障分析

经过分析,我们发现5#、6#I/O服务器不但承担了7881点动力/水系统数据的读取,写入功能之外,还承担了动力/水系统3921点报警显示、1313点趋势显示的功能。其中趋势及报警以秒为时间单位将数据写入系统形成趋势文件,占用系统资源较大,5#、6#服务器本身还承担着与基础自动化站点及EMS子站40个站点7289信息点的通讯及数据交换、操作功能,连接数较多。

和一直很稳定的电力服务器相比,电力服务器点数和动力/水服务器大致相等,占用资源较大的趋势报警是单独放在电力报警趋势服务器上运行,且电力服务器的连接数分别为5个和3个,远远小于动力/水服务器的40个连接数。因此我们判定5#、6#服务器同时离线的故障应该在负载过大方面。

2.2 方案设计

针对5#、6#服务器负载过大的问题,我们设想新增一套冗余服务器,对5#、6#服务器负载进行分担,设计了负载分担的方案:

按照站点的重要性分开,即有远程操作的站点放在另一套服务器运行,采集及监视的站点及动力/水报警趋势放在一套服务器中运行。

负载进行了优化,站点数分别为监视24和远控16(连接数较为均衡),点数分别为监视1291和远控5998,报警为监视3921和远控0,趋势为监视1313和远控0,总点数为监视6525和远控5998。其中采集和监视站集中一套服务器,远程控制集中一套服务器,可以将系统风险分散,采集系统故障不会影响远程操作系统的正常运行。

(1)5#/6#服务器将原有的动力水采集站点的I/O服务和所有的报警趋势服务拆分到新增的冗余服务器,仅保留动力水控制站点的I/O服务。

(2)5#/6#服务器:分担高焦煤气储配站、转炉煤气储配站、制氢站、空压站、制水厂等共计16个站点共计5998个远控点的I/O服务。

(3)新增冗余服务器:承担料场、烧结、焦化、炼铁、炼钢、连铸、热轧、冷轧、石灰窑、制氧、雨排泵房等区域共计24个站点共计6525个采集点(含报警、趋势)的I/O服务。

具体数据流程图如图1、图2所示

图1 通讯连接负载均衡数据流程图

图2 信号负载均衡数据流程图

2.3 实施步骤

EMS系统是在线系统,为不影响正常生产,将对系统采用分步骤分离的方法,在分离过程中,始终保证原有5#、6#服务器上运行的所有功能在分离过程中始终处于冗余状态下,保证生产操作可靠稳定。具体分离步骤过程如下:

(1)CITECT项目分离

将5#、6#服务器最新的CITECT项目按照采集监视和远控经行IO设备、标签点、画面、报警、趋势、CICODE脚本等进行分离,在原有项目中删除远控的相关内容,形成一个独立的采集监视项目,用于新增的冗余服务器;在原有项目中删除采集监视的相关内容,形成一个独立的远控项目,用于原有的5#、6#服务器;分离完成后进行编译和运行测试,保证其正确、一致、完整。

(2)对分离出的采集监视项目进行式运行

在保持原有5#、6#冗余系统不变的情况下,在新增的冗余服务器中运行分离出的采集监视项目,形成冗余系统,利用调度台多个终端中的某一台终端进行新增服务的采集监视功能测试,顺序从动力开始,最后到水台结束,调度台的操作均使用测试终端进行,验证新增服务器的所有功能是否完整、可靠,测试完毕且正确无误后,对系统地冗余性能进行测试,在系统具有冗余功能后,将新增的两台服务器投入运行。

(3)对6#服务器进行分离

5#服务器依然运行原有项目,同时用另外一台服务器(临时)也运行原有项目,和5#服务器形成冗余系统,保证整个系统的正常运行;将停止运行原有项目的6#服务器运行分离出来的远控项目,利用另一台终端对其所有监视和控制等功能按照从动力到水的顺序进行测试,验证新增服务器的所有功能是否完整、可靠,测试完毕且正确无误后,将6#服务器上的远控项目正式投入系统中运行。

(4)对5#服务器进行分离

在6#服务器上的远控项目正式投入系统中运行后,同时保证临时服务器运行原有项目,这样在6#和临时服务器上都具有远控功能,这时将5#服务器从原有项目上退出运行,将分离出的远控项目在5#服务上运行,利用一台终端对其所有监视和控制等功能按照从动力到水的顺序进行测试,验证新增服务器的所有功能是否完整、可靠,测试完毕且正确无误后,将5#服务器上的远控项目正式投入系统中运行,这时5#、6#服务器重新形成远控项目冗余系统,对5#、6#服务器进行冗余功能的测试,测试正确后,5#、6#服务器通入远控项目的正常运行,此时11#服务器可以完全退出运行,至此这个分离过程完成。

在整个分离过程中,利用临时服务器始终保证系统处于冗余状态,不会影响系统的正常操作和监视。由于5#、6#服务器相对其它系统是一套独立系统,所以在分离过程中也不会对其它系统产生任何影响,其它系统不需作任何改动。

3 结束语

通过对我单位新区EMS系统动力/水服务器的设计、实施。完成后,动力/水服务器未发生过同时中断的故障,顺利解决了困扰多年的服务器故障,保障了系统的安全稳定运行。

猜你喜欢

站点趋势报警
趋势
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
LKD2-HS型列控中心驱采不一致报警处理
初秋唇妆趋势
首届欧洲自行车共享站点协商会召开
怕被人认出
2015款奔驰E180车安全气囊报警
SPINEXPO™2017春夏流行趋势
死于密室的租住者