APP下载

基于数据的流程工业关联报警的识别

2014-08-03张益农何自凭吴奕男

计算机工程与科学 2014年7期
关键词:拓扑图报警信号关联度

张益农,周 进,杨 帆,何自凭,吴奕男

(1. 北京联合大学自动化学院,北京 100101;2. 清华大学自动化系,北京 100084)

1 引言

随着工业企业的日益大型化和复杂化,越来越多的故障不仅影响了企业效益,更带来了很多的安全问题。在工业应用中,单回路、串级等经典控制方法的应用已经很成熟,单点报警和局部系统的故障诊断也被大量应用。然而随着系统规模的不断加大,报警数量的众多和无序逐渐降低了操作员的操作效率,如何对众多报警信号进行科学管理,以达到过滤无效报警信号、凸显关键报警信号、提供帮助信息的目的,从而提高操作效率、降低安全事故的发生概率,成为保证企业效益的关键问题[1,2]。

对于一个智能报警管理系统,十分关键的组成部分是对多变量报警的管理。在流程工业中,系统发生故障时会涌现大量的报警信号,称为报警泛滥(Alarm Flood)现象[1]。这是因为一方面对于系统的关键物理量,往往会设置多个报警信号以保证可靠性,由此带来重复报警现象;另一方面由于系统内部的相互关联,故障情况会从故障源向相关联的环节传播,引发多处报警,称为关联报警现象。

对于重复报警,可以利用设置死区、延迟报警时间、报警搁置以及报警自动抑制的方法来处理[3]。但是对于多变量报警,情况就更为复杂[4],特别是对于关联报警,利用上述处理方式就无法消除负面影响。文献[5,6]中针对二值数据的相似度识别方法和文献[7~9]中基于相关性概念的方法可供报警数据分析使用,但由于报警数据的稀疏性,这些方法往往不能得到有效的分辨,且计算较为复杂。

为克服已有技术的不足之处,本文提出一种基于数据提取的关联报警识别方法,这种方法能够利用报警二值时间序列进行分析,提取多个报警之间的因果关联。在多个报警之间存在关联报警的情况时能够正确识别,帮助操作员判断故障源头,降低安全事故发生概率。这种关联报警的识别方法还能够研究系统内部变量之间的关系,有助于达到系统优化的目的。

2 关联报警识别方法

2.1 两个报警之间的关联关系识别

针对该系统中的两个报警变量A与B,选取一段时间,在该段时间内,设报警变量A的所有报警为a1,a2,…,an,其中n为报警变量A在该段时间内的报警总数,分别发生在时刻ta1,ta2,…,tan;报警变量B的所有报警为b1,b2,…,bm,其中m为报警变量B在该段时间内的报警总数,分别发生在时刻tb1,tb2,…,tbm。

首先找到报警变量A的第i次报警ai发生之后的报警变量B的首次报警bj,两者的时间间隔为ΔtA→B,i,即:

ΔtA→B,i=tbj-tai,i=1,2,…,n

将A、B互换之后作同样的处理,即找到报警变量B的第k次报警发生之后报警变量A的首次报警al,两者的时间间隔为ΔtB→A,k,即:

ΔtB→A,k=tal-tbk,k=1,2,…,m

直观上看,如果在一个报警发生后,另一个报警很快发生,并且这种现象经常出现,则说明这两个报警是相关的可能性较高。定义该时间段内报警变量A、B的单次关联度,分别为pA→B,i和qB→A,k:

其中,TR和TMAX为两个时间阈值,TR表示最小时间间隔,若Δti或Δtk小于此阈值,则认为两个报警信号是强相关的,单次关联度为1/TR;这样做的目的是避免取值过大,而且当两个报警出现时间十分接近时,其间的时间差受采样的影响较大,不宜过于看重;TMAX表示最大时间间隔,若Δti或Δtk大于此阈值,则认为两个报警信号之间没有关联,单次关联度为0,从操作上看,当一个报警的发生以后很长时间内,另一个报警都未发生,就不必继续等待下去。

根据单次关联度的结果,计算统计结果,定义关联度PA→B和PB→A如下:

无论从A到B,还是从B到A,关联度都是非负的。但两个报警之间往往存在着因果关系,即谁先谁后,因此定义顺序因果强度IAB,以确定A与B之间的关联方向:

IAB以相对定量的方式描述了双向关联度之间的顺序关系。若报警变量A和报警变量B的关联度PA→B或PB→A中任意一者大于关联度阈值P0,则表示二者相关。进一步,当确定节点A、B之间相关的情况下,假若顺序因果强度的绝对值|IAB|超过阈值I0,则表示这两个报警之间存在因果关系,即方向,若IAB>I0,则方向为A→B;若IAB<-I0,则方向为B→A。至此完成一对报警变量A、B的关联关系判断。

2.2 多个报警之间的关联关系与因果拓扑

针对系统中的多个报警变量,采用因果拓扑的形式来描述其间的关联关系。

首先将每个报警变量作为一个节点(Node),然后针对其中的两个节点A和B,根据关联度PA→B、PB→A和顺序因果强度IAB确定其间的连接关系。如果PA→B或PB→A中任意一者大于关联度阈值P0,即A和B相关,则在A节点与B节点之间建立支路(Arc)。进一步,若顺序因果强度绝对值|IAB|超过阈值I0,即可以确定方向,则在该实线的对应端绘制箭头表示该方向——若IAB>I0,则箭头方向为A→B;若IAB<-I0,则箭头方向为B→A。

总结本方法的全过程,包括以下步骤:

步骤1确定被监测系统中报警变量的数目x,对每个报警变量的报警时间进行监测和记录;建立没有连接关系的拓扑图,以独立的报警变量为节点。

步骤2对于该系统中的两个报警变量A与B,首先选取一段时间,根据报警变量A和B的发生时间,计算关联度PA→B、PB→A和顺序因果强度IAB,确定报警变量A与B之间是否相互关联以及因果关系方向,在拓扑图中增加连接支路。

步骤3对于被监测系统中所有未计算的报警变量对,遵循步骤2进行处理,逐步将拓扑图补充完整。

本方法的流程图如图1所示。

Figure 1 Flow chart of the relationship topology modeling of alarms图1 报警关联关系拓扑建立方法流程图

3 实施方法

上述算法中涉及到四个阈值——时间阈值TR和TMAX、关联度阈值P0和顺序因果强度阈值I0,这在实际应用中需要确定。这些取值均为可调参数,供用户根据生产经验自行调整,实际取值的时候需要结合系统对象特性,特别是时延特性,用实验整定的方法取值。一般在系统正常运行足够长时间,得到足量数据之后再结合数据和经验进行整定。

关联度阈值P0值具有一定的特殊性,可根据统计方法进行计算,因为在实际情况下,任意两个报警序列之间都可得到一定的“相关性”,如果将两个互不相关的报警序列之间的关联度在统计意义下求出来,就可以用作这个阈值。具体方法如下:

对于A序列,计算每两个报警之间的时间间隔,即:

4 案例分析

下面以一个简单的数值例子实施上述方法。

首先确定被监测系统中报警变量的数目x=3,分别为A、B、C。对每个报警变量的报警时间进行监测和记录。绘制有三个节点的拓扑图,如图2a所示。

已知在某段时间内,A、B、C的报警序列如表1所示。

取A和B的报警序列进行计算,选定一段时间,用第2到第8个报警点之间这段时间,共7个点进行计算。

Table 1 Alarm time series of A, B and C表1 A、B和C的报警时间序列

Figure 2 Example of building the relationship topology图2 拓扑图建立过程示例

找到报警变量A在该段时间内的报警ai发生之后报警变量B的第一次报警bj,计算两者的时间间隔Δti,如表2所示。

Table 2 Time interval of alarm A and the relation with alarm B表2 报警A的时间间隔和与报警B的关联度

将A、B互换之后作同样的处理,也即找到报警变量B在该段时间内的报警bk发生之后报警变量A的第一次报警al,计算两者的时间间隔Δtk,如表3所示。

Table 3 Time interval of alarm B and the relation with alarm A表3 报警B的时间间隔和与报警A的关联度

计算单次关联度pi和qk,分别见表2和表3。由系统特性,根据经验,定义TR=1 min,TMAX=10 min,即报警延迟小于1分钟,认为关联度为1,报警延迟大于10分钟,认为没有关联。

对全部报警进行计算后,统计得到关联度PA→B和PB→A:

然后计算顺序因果强度IAB,以确定A与B之间的关联关系:

为了判断A、B序列是否关联,以及关联方向如何,需要计算P0值。对于A序列,计算每两个报警之间的时间间隔,即:

对于报警变量A和B,由于PAB>P0,因此在拓扑图中A、B两节点之间绘制实线表示二者相关。进一步,在确定A、B相关的情况下,因顺序因果强度绝对值|IAB|=0.734>I0=0.15,故在实线的对应端绘制A→B方向箭头表示因果方向,如图2b所示。

再取A、C这一对变量,重复前述步骤,结果为:PA→C=0.6839,PC→A=0.1553,P0=0.1975,IAC=0.6299。由于PA→C>P0且IAC>0.15,故拓扑图扩充如2c所示。

最后取B、C序列,结果为:PB→C=0.5933,PC→B= 0.5022,P0= 0.2334,IBC= 0.0832。由于PB→C,PC→B>P0,且-0.15

下面以TEP(Tennessee Eastman Process)为例,生成仿真数据,使用本文方法计算报警变量之间的关联度。

采用文献[1]中提出的一种受控的TEP模型,该模型包含了41个可观测变量,其中有22个连续测量的变量,包括反应器压力、温度、液面、汽提塔温度等等。

在无外界扰动情况下,TEP可以平稳地运行。然而在故障模式下,模型存在一定的输入扰动,报警变量就会给出报警信号。下面选取三个报警变量,分别是反应器压力RP(Reactor Pressure)、汽提塔液面SL(Stripper Level)和汽提塔压力SP(Stripper Pressure)。所选故障模式为反应器进料口成分随机扰动。

首先,由故障模式下选定报警变量的输出波形(图3),记录报警时间,如表4所示。然后,用关联度识别方法,对三对报警变量对进行计算,结果见表5。

Figure 3 Process values of selected alarm variables of TEP under certain fault mode图3 故障模式下TEP所选报警变量的过程值

Table 5 Results of related alarms for all alarm pairs表5 报警变量对的关联报警计算结果

根据上述结果和判断准则,可得拓扑关系见图4。从图4中可以看到RP和SP为关联报警,SL则由于P值太小,无法确定是否存在关联关系。由于所加扰动为进料口的成分扰动,所以先是反应器处出现报警,随后引起汽提塔出现报警,结果较为合理。

Figure 4 Topology obtained图4 计算所得的拓扑关系图

5 结束语

本文提出了基于数据提取的关联报警识别方法,可根据报警信号出现的先后关系及时间间隔,判断两个报警序列是否为关联报警。在给出报警变量的关联拓扑图之后,报警变量之间的关联关系一目了然,对于操作员寻找故障源、及时给出消除故障的措施,有很大的指导作用。通过这种识别方法,实现了智能报警管理系统对报警的简洁性和实用性的要求,对提高系统的安全性能和操作效率,保证企业效益,均有着重要意义。本文方法的基本思路已申请专利。

值得注意的是,本文中所述的因果关系只反映了表面上的时间顺序,并不代表报警所对应的过程变量和过程单元之间的本质上的因果关系[10~13]。进一步的报警设计还需要充分利用过程知识和过程数据来进行分析[14,15]。

[1] Yang F, Xiao D. Research topics of intelligent alarm management [J]. Computers and Applied Chemistry, 2011, 28(12):1485-1491.(in Chinese)

[2] Izadi I, Shah S L, Shook D S, et al. An introduction to alarm analysis and design [C] ∥Proc of the 7th IFAC Symposium on Fault Detection, Supervision and Safety of Technical Processes, 2009:645-650.

[3] Izadi I, Shah S L, Shook D S, et al. A framework for optimal design of alarm systems [C] ∥Proc of the 7th IFAC Fault Detection, Supervision and Safety of Technical Processes, 2009:651-656.

[4] Kondaveeti SR, Shah SL, Izadi I. Application of multivariate statistics for efficient alarm generation [C] ∥Proc of the 7th IFAC Symposium on Fault Detection, Supervision and Safety of Technical Processes, 2009:657-662.

[5] Lesot M J, Rifqi M, Benhadda H. Similarity measures for binary and numerical data:a survey [J]. International Journal of Knowledge Engineering and Soft Data Paradigms, 2009, 1(1):63-94.

[6] Choi S, Cha S, Tappert C C. A survey of binary similarity and distance measures [J]. Journal of Systemics, Cybernetics and Informatics, 2010, 8(1):43-48.

[7] Yang F,Shah S L,Xiao D-Y.Correlation analysis of alarm data and alarm limit design for industrial processes[C]∥Proc of 2010 American Control Conference, 2010:5850-5855.

[8] Nishiguchi J, Takai T. IPL2 and 3 performance improvement method for process safety using event correlation analysis [J]. Computers and Chemical Engineering, 2010, 34(12):2007-2013.

[9] Yang F, Shah S L, Xiao D, et al. Improved correlation analysis and visualization of industrial alarm data [J]. ISA Transactions, 2012, 51(4):499-506.

[10] Smith S M, Miller K L, Salimi-Khorshidi, et al. Network modeling methods for FMRI [J]. NeuroImage, 2011, 54:875-891.

[11] Bauer M, Thornhill N F. A practical method for identifying the propagation path of plant-wide disturbances [J]. Journal of Process Control, 2008, 18(7-8):707-719.

[12] Bauer M, Cox J W, Caveness M H, et al. Finding the direction of disturbance propagation in a chemical process using transfer entropy [J]. IEEE Transactions on Control Systems Technology, 2007, 15(1):12-21.

[13] Duan P, Yang F, Shah S L, Chen T. Direct Causality Detection via the Transfer Entropy Approach [J]. IEEE Transactions on Control Systems Technology, 2013, 21(6):2052-2066.

[14] Izadi I, Shah S L, Chen T. Effective resource utilization for alarm management [C]∥Proc of the 49th IEEE Conference on Decision and Control, 2010:6803-6808.

[15] Yang F, Shah S L, Xiao D-Y. Signed directed graph modeling and validation of industrial processes by process knowledge and process data [J]. International Journal of Applied Mathematics and Computer Science, 2011, 22 (1):41-53.

附中文参考文献:

[1] 杨帆,萧德云.智能报警管理若干研究问题[J].计算机与应用化学,2011,28(12):1485-1491.

猜你喜欢

拓扑图报警信号关联度
低压配网拓扑图自动成图关键技术的研究与设计
简单拓扑图及几乎交错链环补中的闭曲面
基于含圈非连通图优美性的拓扑图密码
YY0709-2009医用报警系统标准难点分析与解读
一起典型的站内电码化故障处理
基于灰色关联度的水质评价分析
蜜蜂语音报警信号被破译
基于灰关联度的锂电池组SOH评价方法研究
医用电气设备听觉报警信号声压级的风险分析与控制
基于灰色关联度的公交线网模糊评价