一种基于可预测元分析的故障诊断方法
2015-01-13林圣才杨煜普屈卫东
林圣才 杨煜普 屈卫东
(上海交通大学电子信息与电气工程学院自动化系系统控制与信息处理教育部重点实验室,上海 200240)
近二十年来,随着现代化工及冶金等工业过程的日益大规模化和复杂化,工业过程的安全问题越来越受到人们的关注。复杂的工业过程往往难以用精确的物理模型去描述[1],因此基于多元统计分析的故障诊断方法应运而生,并在工业过程中获得了成功的应用[2~5]。Wise B M等将主元分析方法(PCA)引入了过程监控[6],Lee J M等在PCA的基础上提出了核PCA方法并将其用于故障诊断[7]。PCA方法是从观测数据中提取与统计无关的主元,通过构造统计量对过程状况进行监控统计,判断过程是否出现故障,它要求数据服从高斯分布。但是实际工业过程往往并不满足这个条件,同时PCA方法无法反映过程的动态时序特性,这在一定程度上影响了它的故障检测准确率。可预测元分析(Forecastable Component Analysis,ForeCA)作为一种新的统计信号处理方法[8],克服了这个不足。它是一种全新的用于多变量时序相关信号的降维与特征提取方法,它能从已有的数据中捕捉到系统的动态特性,并以此来预测系统运行变化的趋势,因此所提取的特征更能从本质的上描述工业过程。
笔者将可预测元分析方法引入到故障检测中,通过所挖掘的可预测元提取出观测信号中的可预测分量,构造两种统计量对其进行统计监控。该方法克服了主元分析方法需要数据服从高斯分布且无法反映过程时序特性的不足,能够预测系统运行变化的趋势,反映出系统的动态特性,提升故障检测的效果。在TE过程上的仿真结果表明了该方法的可行性和有效性。
设矩阵X∈Rn×m,可预测元分析的基本思想是寻找到一个线性变换WT∈Rk×n,使得:
(1)
W为负荷矩阵,它的列向量表示负荷向量,彼此相互正交。
γy(k)=E(yt-μy)(yt-k-μy)T,k∈R
(2)
其中k表示时延。
定义单变量平稳过程的谱密度为对其自协方差函数的傅里叶变换:
(3)
(4)
熵越大则平稳过程的后续变化越难被预测,且白噪声无法被预测,因此可得:
(5)
根据式(5)定义平稳过程的可预测度为:
(6)
对于多变量二阶平稳过程Xt,考虑线性变换yt=wTXt,其中w(w∈Rn)是W的列向量,即可预测元,此时yt就可以看成是一个单变量的二阶平稳过程。Goerg G给出了ForeCA的最优化问题[8]:
(7)
s.t.wTΣXw=1
在求解式(7)问题时,首先使用加权交叠平均(WOSA)谱估计法对随机过程进行谱密度估计[9],然后使用EM-Like算法求取可预测元[10]。通过文献[8]给出的算法可以计算出一组按照可预测度由高到低顺序排列的可预测元(可预测元个数可以指定,一般不大于平稳过程的变量个数),进而得到线性变换矩阵WT。
2 基于可预测元分析的故障检测
首先选取一段正常工况生产下的观测数据Yn×m,其中n为变量个数,m为采样点数(时间序列),由于变量使用的量纲不同,因此需要对观测数据进行标准化处理,处理后的数据记为Xn×m。对Xn×m运用ForeCA算法,选取可预测元的个数等于观测数据中变量的个数n,使用算法后得负荷向量wi∈Rn,i=1,2,…,n,每个负荷向量wi对应的可预测度为Ωi,进而得到线性变换矩阵:
WT=[w1,w2,…,wn]T∈Rn×n
WTW=In∈Rn×n
(8)
定义累积可预测度贡献率为:
(9)
根据式(9)的定义,一般取Ψ(Ω)≥85%,由此可求得k值。定义前k个可预测元对应的负荷向量wi(wi∈Rn,i=1,2,…,k)为可预测主元负荷向量,并令:
(10)
定义WdT为可预测主元负荷矩阵。通过从可预测元矩阵中选取可预测主元一方面可降低矩阵的维数和计算量,另一方面可构造新的用于故障检测的统计量。式(9)给出了一种选取可预测主元的方法,除此之外,还可以使用交叉验证的方式。
当用于在线数据时,设某次采样得到的数据为x,x∈Rn,可得:
(11)
(12)
(13)
式(12)表示数据x在可预测主元子空间的投影,式(13)表示数据x在残差子空间的投影。
根据式(11)、(13)定义两种统计指标:L2统计量与SPE统计量。L2统计量与SPE统计量定义分别为:
通常,我们都会不自觉地将一张摄影作品归入某个特定的时代框架里。然而荒诞的是,这张照片似乎想要从一切短暂的年代归属之中退出去。一方面,观众感觉这张照片反映的是一个诡异而险恶的“旧世界”。它以某种方式将这种痕迹留在照片上:斑点、划痕,诸如此类来自玻璃负片时代的特征。威特金常常采用一种高度直觉化的方式来完成照片制作的物理过程,比如刮擦负片、漂白或是调节画面颜色。
L2=xTWdΛ-1WdTx
(14)
(15)
其中Λ表示由前k个可预测主元对应的可预测度组成的对角阵。L2统计量是通过可预测模型内部的可预测元模的波动来反映系统的变化情况,SPE统计量则表示一个观测数据到可预测模型空间的距离,反映了测量值对模型的偏离程度。
由于所构造的统计量并不一定严格服从正态分布,因此可以采用核密度估计法[11,12]对统计量进行密度估计,选取合适的置信水平进而确定统计量的控制限。
当使用ForeCA算法提取出可预测系统运行变化趋势的特征,并构造出上述两种统计量后,将此可预测模型运用于在线数据,对其进行检验:如果检验结果在相应统计量的控制限以下,则说明目前系统工作在可预测模型所预测的变化范围之内,即系统工作正常;反之,则说明目前系统的工作状态已经偏离可预测模型所预测的变化范围,因此有理由判断系统已经出现了故障。
当使用L2统计量与SPE统计量检测到过程系统出现故障后,需要定位出系统发生异常的位置,这里采用贡献图法[13]来处理这个问题。对于L2统计量与SPE统计量,对每个变量定义如下的贡献值:
(16)
(17)
利用贡献图法可以知道过程变量对当前状态的贡献,贡献值最大的变量很可能是这次故障发生的位置所在,因此可以及时给予报警。
3 TE平台仿真实验
TE实验平台是Downs J J和Vogel E F于1993年提出的[14]。TE实验平台在Eastman化学公司的世界工艺流程上做了少许改动,可以很好地模拟现实中的复杂工况,其流程如图1所示。
图1 TE过程流程
选取正常的样本数据500个,每个样本点包含33个变量,分别为22个连续变量XMEAS(1)~XMEAS(22)和前11个控制变量XMV(1)~XMV(11),变量的具体含义参见文献[14]。首先对数据进行标准化处理,使用ForeCA算法对数据进行处理,之后对测试数据进行检测,测试数据集包含960个样本点,每个样本点包含33个变量。前160个样本点为正常数据,后800个样本点为故障数据。
将ForeCA法和传统PCA法进行对比,在PCA法中,选取T2统计量与SPE统计量,表1列出了8个故障的检测准确率。
表1 ForeCA和PCA方法故障检测准确率比较 %
从表1中可以看出,L2统计量的检测准确率要高于T2统计量,ForeCA算法的SPE统计量和PCA算法的SPE统计量相比各有优势。图2给出了IDV(10)和IDV(20)的故障检测准确率对比图。仿真实验表明了ForeCA方法在故障检测中的可行性与有效性。
a. IDV(10) b. IDV(20)
选取IDV(10)作为典型故障进行详细分析。IDV(10)的发生是由于TE过程中供料C的温度产生了随机变化。当系统某时刻出现此变化后,控制回路会补偿这个变化,进而导致过程的总体特征产生变化。图3显示的是一个可预测元提取的IDV(10)特征,虚线表示前160个正常数据的均值,点划线为后800个故障数据的均值,两者的均值几乎相同,但是故障数据的方差产生了非常大的变化,这说明提取的特征很好地抓住了过程变化的总体方差特征,同时显示出一定的周期性,因此可对过程下一次的状态做出合理预测,这两点都为ForeCA用于故障检测提供了保证。图3提取的IDV(10)特征也正好符合L2与SPE统计量所显示的IDV(10)检测图的两个波峰的特点。
图3 可预测元提取的IDV(10)特征
仍然以IDV(10)为例。假设在检测出系统发生故障后,使用贡献图法确定故障变量(图4),图中变量18的贡献值最大,由此可以推断故障很可能是变量18异常导致的,即解吸塔温度异常。综合考虑TE过程的所有故障,只有IDV(10)能直接导致解吸塔温度发生变化,因此在很大程度上可以认为系统发生了IDV(10)。
图4 IDV(10)发生时贡献图法的诊断结果
4 结束语
针对传统PCA算法具有的需要数据服从高斯分布且丢失过程动态特性的缺点,将ForeCA应用于过程监控领域,选取可预测主元,构造新的统计量,建立了完整的基于ForeCA的故障诊断方法。ForeCA方法可以从观测数据中提取过程的动态特性,预测过程以后的运行变化趋势,这在一定程度上提高了建模精度,因而具有较好的故障检测能力。最后在TE过程上的仿真结果表明了ForeCA方法的可行性和有效性。在后续工作中,可以通过改进监控统计量和ForeCA算法来进一步提高故障检测能力。
[1] 李晗,萧德云.基于数据驱动的故障诊断方法综述[J].控制与决策,2011,26(1):1~9.
[2] Kimura D,Nii M,Yamaguchi T,et al.Fuzzy Nonlinear Regression Analysis Using Fuzzified Neural Networks for Fault Diagnosis of Chemical Plants[J]. JACIII, 2011, 15(3): 336~344.
[3] Kano M, Nakagawa Y. Data-based Process Monitoring, Process Control, and Quality Improvement: Recent Developments and Applications in Steel Industry[J]. Computers & Chemical Engineering, 2008, 32(1): 12~24.
[4] 陈玉东,施颂椒.动态系统的故障诊断方法综述[J].化工自动化及仪表, 2001, 28(3): 1~14.
[5] Zhang Y,Zhang Y.Fault Detection of Non-Gaussian Processes Based on Modified Independent Component Analysis[J]. Chemical Engineering Science, 2010, 65(16): 4630~4639.
[6] Wise B M, Ricker N L, Veltkamp D F, et al. A Theoretical Basis for the Use of Principal Component Models for Monitoring Multivariate Processes[J]. Process Control and Quality,1990,1(1): 41~51.
[7] Lee J M, Yoo C K, Choi S W, et al. Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004, 59(1): 223~234.
[8] Goerg G.Forecastable Component Analysis[C].Proceedings of the 30th International Conference on Machine Learning. Atlanta,GA,USA:ICML,2013: 64~72.
[9] Nuttall A H,Carter G C.Spectral Estimation Using Combined Time and Lag Weighting[J].Proceedings of the IEEE,1982, 70(9): 1115~1125.
[10] Dempster A P, Laird N M, Rubin D B. Maximum Likelihood from Incomplete Data via the EM Algorithm[J].Journal of the Royal Statistical Society, 1977, 39(1): 1~38.
[11] Botev Z I, Grotowski J F, Kroese D P. Kernel Density Estimation via Diffusion[J]. The Annals of Statistics, 2010, 38(5): 2916~2957.
[12] Wand M P, Jones M C. Kernel Smoothing[M]. Boca Raton: Crc Press,1994.
[13] Yoon S, MacGregor J F. Fault Diagnosis with Multivariate Statistical Models Part I: Using Steady State Fault Signatures[J]. Journal of Process Control, 2001, 11(4): 387~400.
[14] Downs J J, Vogel E F. A Plant-wide Industrial Process Control Problem[J]. Computers & Chemical Engineering, 1993, 17(3): 245~255.