APP下载

报警事件闭环管理系统在石西油田的应用

2021-11-17王如涛郭宝灵李国荣

计算机仿真 2021年3期
关键词:阈值报警监控

王如涛,郭宝灵,李国荣,张 莉

(新疆油田公司,新疆 克拉玛依 834000)

1 引言

石西油田作业区SCADA系统自建成以来已运行20年,实现了油区井站3万多点工况数据的集中监控与管理,在生产监控管理方面积累了丰富的经验,并有效总结了传统报警管理存在的不足。目前生产监控系统采用以数据点为基础的阈值报警机制,利用系统采集的实时数据与设置的阈值进行实时比对,超出阈值范围即时推出相应类型的报警信息并基于相应提醒。然而,同一个数据点在数据未恢复到阈值正常范围内时会根据持续进行重复报警,大幅增加报警数量、提高报警处理工作量及复杂度,且有效报警、重要报警容易被冗余报警淹没,生产异常处理及时率大幅降低。而随着监控参数点位的日益增加,硬件系统老化以及软件系统限制,不断出现系统运行缓慢、运行错误、服务器频繁死机、阈值推荐算法读取速度慢、写入报警限值长等问题,导致报警处理效率较低,影响生产监控及预警判断,已不能满足监控报警需求。

2 报警管理机制设计

报警管理是一个过程,通过这一过程实现报警的监测、管理和工程化,从而保证安全、可靠的操作。科学合理的报警管理可以确保报警系统发挥应有的保护功能,防止严重事件的发生,提高生产安全性。工程设备与材料用户协会(EEMUA)与1999年发布了EEMUA191关于报警管理的行业指南,美国仪表自动化协会(ISA)和国际电工协会(IEC)先后与2009年和2014年发布了ANSI/ISA18.2和IEC62682关于流程工业的报警系统管理标准。国内很多工业行业已经重视报警管理策略和实施方法,并在实际中取得了一定的经验和成效。在油气生产行业,目前主流的报警管理模式是以数据点为基础的阈值报警模式(设置低低报、低报、高报、高高报四个界限值),生产监控系统采集的实时数据与设置阈值进行对比,超出阈值范围推出相应的报警提醒。由于同一参数(点位)在连续采集周期内会形成的多条重复报警,监控人员需定时反复分析确认,同时大量合理工况由于阈值设置不合理存在误报现象,导致报警处理效率较低,影响生产安全。报警杂多的几种情况如表现所示。

表1 杂多报警分类统计

石西油田基于多年的生产监控经验,不断探索报警合理性管理方法,提出“报警事件闭环管理”模式,核心是为了通过降低误报警和重复报警数量来不断提升报警管理可用性,以达到如下预期:

● 在工艺过程波动时帮助监控操作员操作,让监控操作员有更多的精力关注生产过程;

● 减少生产工艺过程故障停工,有效延长生产运行时长,提高生产潜力,降低生产运维成本;

● 在工艺过程波动时避免生产监控系统超载运行,确保生产监控系统能够长期稳定运行、不宕机;

● 帮助及时发现问题,准确定位生产异常;

● 识别出可以改进的工艺,为下步工艺改造及技术措施调整指引方向;

● 及时发现需要维护的仪表,提高仪表健康度,延长仪表寿命,提升数据质量;

● 识别出在工艺过程、控制和操作方面需要改进的地方。

“报警事件闭环管理”模式主要包括如下内容:

1)报警的解析与归档。以“事件”为核心的报警规则,“事件”是指对应的现场工艺生产上出现异常而产生的提示信息。这种异常信息的全生命周期包括产生、发展、处理、关闭四个阶段,最终回归正常。提出以“事件”为核心的理念,就是对报警进行解析归类,将所有与该事件有关的报警全部进行汇聚,系统不再反复弹出报警信息,用户可以集中处理一个问题。这样的归类方法,将上百条报警汇总成一条报警事件,有利于监控人员进行查看与处理有利于事后记录,进行复盘总结。

表2 接续归类原则描述

2)实时报警管理。报警管理与报警解析规则紧密相关,以往报警量特别大的时候,监控人员无法从大量的报警中快速定位有效报警,从而导致报警管理功能不可用。而为了避免生产现场出现严重异常情况,只能花费极大的精力对重点对象的重要参数进行定时曲线翻阅,试图通过分析重点参数的变化趋势分析生产异常,但收效甚微。而提出以“事件”为核心的报警管理机制后,报警必须满足消警条件(数据回归到正常范围内)才会消除,避免监控人员单纯为了降低报警量而随意关闭、删除报警信息导致有效报警的漏报问题。同时,为了区分报警的重要性及处理状态,对报警进行了多维度的分类管理:一方面,按报警生命周期划分为活动报警、确认报警、已消报警三种状态,不同的状态采用不同的页面进行分类管理;另一方面,根据生产工艺特征划分参数重要性级别,通过紧急、重要、一般三个层级实现活动报警重要性的划分,能够及时区分报警的重要性,提高报警处理及时性,降低生产风险。例如,监控人员对于仪表异常导致的数据偏差(如落零问题),可以通过“已确认”的方式进行分类,方便将核心问题展示在“活动的报警”窗口,提醒监控与管理人员进行关注;而在“活动的报警”窗口,利用不同颜色区分报警的严重级别进行标注提醒,针对不同参数进行分类和优先级别处理。

表3 实时报警管理机制

3)报警事件闭环管理系统处理流程(图1)。将同一参数(点位)在连续采集周期内形成的多条阈值报警记录进行分析归并成一条报警事件在活动报警中提示处理,监控人员根据“活动报警”提醒逐一对事件进行分析,判断报警原因(现场工艺异常、阈值设置不合理、误报),当工艺异常时及时通知相关人员现场处理,阈值设置不合理通过报警阈值智能推荐功能设置合理阈值,误报时通过人工确认将报警信息归入“已确认报警”界面,若出现报警类型(低低报、低报、高报、高高报)变更后重新触发至“活动报警”界面,再次按报警处理流程进行分析处理,整个流程遵循自动关闭报警机制,在流程中的任一环节,实时监控采集数据一旦符合报警关闭规则,自动关闭报警。(“活动报警”和“已确认报警”界面中的事件恢复正常后自动跳转至“已关闭报警”界面中,方便后期查询。)

图1 报警事件闭环管理系统处理流程

3 效果分析

石西油田将“以数据点为基础的报警机制”改进为“以事件为基础的报警机制”,迈出了油田报警管理的新步伐,极大地提高了报警处理工作的效率。主要效果体现在如下几个方面:

1)报警数量指数级下降,减少行动决策花费的时间。报警的解析归类,杜绝了事件重复报警,使监控人员由“不断处理阈值报警”转变为“集中处理事件报警”的模式,工作量得到大幅度下降,漏报严重生产异常的概率进一步降低。据统计,每天的报警数量由以前每天的1万多条下降在100-300条之间,分区块处理之后,每个监控人员面对的报警数量不超过50条/天。通过大幅降低报警数量,以保证监控操作员集中注意力在有效的、重要的报警,及时作出正确的响应。

图2 报警信息管理

2)误报警数量得到有效控制。事件报警机制在活动报警中引入逻辑判断,当报警事件通过人工落实确认为误报时,将其归入确认报警中,在当前报警类型下不再出现报警提示。同时,标记的误报警信息会推送至相关技术人员,督促其尽快修改阈值,确保报警及时恢复正常。而通过误报警信息的逐渐积累,能够成为报警阈值修正改进的有力参考,为下步阈值自动推荐模型的近一步优化提供数据服务。

3)引入自动消警机制,能够利用实时采集的数据自动甄别监测对象实时状态,当数据恢复至合理运行范围内时可实现已产生报警的自动处置,大幅降低监控人员处置因为生产波动产生的偶发性异常问题处置时间,提升报警管理效率。同时基于自动消警机制,可有效识别出频繁抖动的报警,对于频繁抖动的报警需要多加注意,分析报警抖动是属于工艺运行不稳定还是阈值设置不合理造成导致的数据频繁抖动报警,针对不同的原因要及时采取相应的管理措施。

4)阈值设置快速准确。报警阈值智能推荐功能,模仿专家对故障的判断过程,依据历史数据的波动规律推荐报警值,让规则的设置与调整有据可依,更加符合实际生产工艺规律。截止到目前为止,石西油田建议与优化了50%以上的参数报警范围,成功地将以往注水压力、注水流量、油井载荷等参数设定了合理的报警值,将原来挂起的参数重新进入报警流程,提高了监控的全面性、有效性与安全性。

表4 传统报警与事件报警处理效果对比

4 结论

1)建立了以事件为中心的闭环报警管理机制,监控报警数量与质量得到有效控制,同时报警事件是基于关闭规则进行消警,避免了人为干预和误操作,提高了整体的安全系数,监控操作员的报警管理满意度大幅提升。报警管理的核心就是通过报警提醒监控操作员响应,在第一时间将问题进行处置,避免处理不及时带来的生产潜在隐患,但如果监控操作员对现行的报警管理机制不敏感,则所有的设计将毫无意义。

2)通过生产过程实时监测经验积累与归纳总结,进一步探索生产监控运行模式,优化监控岗位操作规程,大幅提高分析判断问题准确率,有效辅助决策下达到位,动态指挥,使油田精细化管理水平进一步提高。

3)报警事件闭环管理机制在石西油田已进行推广深化应用,并取得了良好的实际效果,在行业内具有广泛的推广价值,为后续基于参数趋势、联动分析等复杂模型分析相关的智能报警管理机制的发展奠定良好基础。同时,随着近年来大数据挖掘、分布式计算、云平台等技术的快速提升,顺应两化融合的发展趋势,积极探索智能理论和技术在石油行业的应用潜力,逐步实现智能化报警管理,实现报警信息的自动智能全生命周期管理,做到更高层级的无人化值守。

猜你喜欢

阈值报警监控
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
冬奥项目训练监控方法的研究——TRIMP、sRPE在短道速滑训练监控中的应用
基于小波变换阈值去噪算法的改进
改进小波阈值对热泵电机振动信号的去噪研究
小心,墙纸在报警
通信电源监控系统在电力通信中的应用
鞋子摆放透露的信息
GPS/DR/GIS技术在基于GSM—R列车监控系统中应用
死于密室的租住者