APP下载

基于动态稀疏保局投影的故障检测方法

2016-05-11郑鑫田学民张汉元中国石油大学华东信息与控制工程学院山东青岛266580

化工学报 2016年3期
关键词:稀疏表示故障检测特征提取

郑鑫,田学民,张汉元(中国石油大学(华东)信息与控制工程学院,山东 青岛 266580)



基于动态稀疏保局投影的故障检测方法

郑鑫,田学民,张汉元
(中国石油大学(华东)信息与控制工程学院,山东 青岛 266580)

摘要:针对保局投影(locality preserving projections,LPP)没有考虑过程数据的全局信息和动态性的问题,提出一种新的基于动态稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障检测方法。该方法首先将原始数据矩阵扩展为考虑时序相关的增广矩阵,然后通过求解最优稀疏表示(sparse representation,SR)问题,得到能够表示数据全局稀疏重构关系的稀疏系数矩阵,并将其与LPP算法结合,构建综合考虑数据局部和全局关系的目标函数进行数据降维,最后分别在特征空间和残差空间构造T2统计量和Q统计量进行故障检测。TEP的仿真结果表明,与LPP方法相比,新方法能更迅速检测故障发生并降低过程监控漏报率。

关键词:故障检测;保局投影;稀疏表示;特征提取;过程监控

2015-11-26收到初稿,2015-12-07收到修改稿。

联系人:田学民。第一作者:郑鑫(1990—),男,硕士研究生。

引 言

现代化工生产过程日益趋于大型化、集成化、复杂化,设备运行过程中产生了大量高维复杂数据,为了更好地监控过程的运行状态,需要使用有效的降维技术以及相应的过程监控方法[1]。传统的主元分析(PCA)和偏最小二乘(PLS)已经在工业过程中应用广泛[2-4]。针对数据的非线性问题,文献[5]提出了基于PCA的非线性算法KPCA,取得了良好的效果。近年来的研究表明,流形学习能够有效地发现隐含在高维数据集中的低维特征[6-8],该方法假设所处理的数据采样于一个潜在的低维流形上,通过学习和发现嵌入在高维空间中的低维流形特性,可以有效地揭示数据的结构特征。保局投影(locality preserving projections,LPP)是一种经典的流形学习算法[9],在降维时能够较好地保持数据的局部结构信息,Hu等[10]将其应用于间歇过程的故障检测,取得了较好的效果,但是LPP方法忽略了数据的全局信息[11],可能导致原始样本空间中距离较远的样本点的低维投影发生重叠,从而破坏数据的本质结构特征。

近年来,稀疏表示(sparse representation,SR)理论成为信号处理、统计学分析和模式识别领域的研究热点[12-14]。稀疏表示采用一个称之为字典的超完备冗余基本信号系统,对原始信号进行稀疏线性表示,得到能够表示原始数据全局稀疏重构关系的稀疏系数矩阵。稀疏系数矩阵可以反映数据的本质几何特性,并包含自然的鉴别信息,稀疏规则化可自动学习去掉对输出没有贡献的变量,完成特征选择。

本文针对保局投影应用于故障检测时没有考虑过程数据的全局信息和动态性的问题,结合保局投影和稀疏表示,并进一步考虑过程数据的动态性,提出了一种基于动态稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障检测方法。该方法首先考虑过程数据时序相关的特点,将原始数据矩阵扩展为时滞增广矩阵形式,然后通过求解L1范数最优值问题,得到能够表示数据全局稀疏重构关系的稀疏系数矩阵,并将其融入到LPP的目标函数中,构建综合考虑数据局部和全局关系的目标函数进行数据降维,最后分别构造T2统计量和Q统计量进行故障检测。TEP的仿真结果验证了新方法的有效性。

1 保局投影

LPP算法通过优化如下目标函数获得投影矩阵,保证低维嵌入坐标yi与yj之间的距离最小。

并引入约束

其中,n是样本数,a为投影向量,L= D− W, D是n× n的对角阵,对角线元素,W是关系矩阵,可通过k近邻法求得。

则投影向量可通过求解式(4)的广义特征值问题获得

最小的d个广义特征值所对应的特征向量构成了投影矩阵ALPP。

2 动态稀疏保局投影

2.1 稀疏表示

其中,ε为误差容忍度。该目标函数通过线性规划求解每一个xi对应的稀疏系数向量si,得到稀疏系数矩阵。

2.2 稀疏保局投影

LPP 算法使原始数据之间的近邻关系在降维后得以保持,但是该算法没有考虑原始数据的全局信息,从而可能出现降维后低维空间的整体结构特征与原始数据空间不一致,影响故障检测的效果。为此,在LPP算法的基础上,通过加入全局稀疏重构信息,提出了稀疏保局投影(sparse locality preserving projections,SLPP)降维算法。新算法在高维数据降维过程中不仅能够保持原始数据的局部近邻结构,而且能够保持数据间的全局稀疏重构关系,更有利于提取过程数据的特征,SLPP的目标函数构建如式(7)所示。当i= j时,目标函数保证原样本与其对应重构样本在投影后的低维空间依然保持重构误差最小;当xi与xj为k近邻时,目标函数保证投影后的低维空间具有和原始数据空间相似的局部结构。

简化式(7)所示目标函数

上述最优化问题的求解可以最终由以下广义特征值问题求解

2.3 动态稀疏保局投影

其中,l为滞后步长,根据经验一般取l =1或2。可见,矩阵扩展后样本数据减少到n l−,变量维数扩展为m( l + 1)。由于把过去时刻的变量测量值也作为当前时刻监控数据,考虑了不同时刻采样点之间的关系,应用SLPP算法对上述增广矩阵降维,便可以提取原始数据的动态特征,更有利于过程的故障检测。是归一化后的数据矩阵,考虑时序相关的特点将原始数据矩阵扩展为如下时滞增广矩阵形式[16]

3 故障检测算法

3.1 构造监控统计量

应用DSLPP算法进行数据降维后,分别对特征空间和残差空间建立基于DSLPP的T2统计量和Q统计量[17]用于过程监控。将DSLPP算法求得的投影矩阵记为(其中m为变量数,d为低维空间维数),则有

其中,ynew是待检测样本xnew在特征空间的投影,Λ是正常工况数据特征空间的协方差矩阵。其中,为xnew的重构向量,

由于T2和Q统计量的分布未知,本文通过核密度估计[18]分别获得两监控统计量的控制限。

3.2 故障检测算法实现

基于DSLPP算法的故障检测过程包括离线建模和在线监控两个阶段,具体实现步骤描述如下。

离线建模阶段:

与此同时,医院创新性地将重要的无菌包的使用纳入智能耗材柜的管理,无菌包的领取与医嘱相关联,规范了无菌包的领取行为,实现无菌包使用的全程可追溯。

(1)采集过程正常运行数据并进行归一化处理后,构造扩展矩阵,得到数据集∗X;(2)使用DSLPP算法对数据集∗X进行特征提取,得到投影矩阵A;

(3)分别计算特征空间的T2统计量和残差空间的Q统计量的控制限。

在线监控阶段:

(1)采集新的监控样本数据并进行归一化处理后,构造扩展矩阵,得到数据集;

(3)计算扩展样本的T2统计量和Q统计量,并判断是否超过相应控制限,若超过控制限,表明监控过程发生故障。

算法流程图如图1所示。

图1 DSLPP算法流程图Fig.1 Flow chart of DSLPP

4 仿真研究

田纳西-伊斯曼过程(Tennessee Eastman process,TEP)[19]包含22个连续测量变量,19个组分测量变量和12个操纵变量,本文中的研究只选取其中的22个连续测量变量和11个操纵变量用于故障监控,由于组分测量变量在实际中很难测量,在这里不予考虑[20]。TEP有21种预设定的故障,这些故障中16个是已知的,5个是未知的。

采集正常工况下的960个数据作为训练集,同样采集960个故障工况下的数据作为测试集,故障于第161个样本处加入。选取低维空间维数d =14,近邻参数k =15,t =1,滞后步长l =1,所有置信限都设置为95%。为了降低误报率,本文定义故障检测时间为:第一次连续6个监控样本超过统计量控制限的时间。故障漏报率指故障发生后未报警样本与实际故障样本数目的比值。本文以故障10和故障19为例,分别运用LPP、SLPP和DSLPP方法对其建立统计量监控模型,通过分析相应监控图和仿真结果数据,比较3种方法的故障检测性能。图2和图3分别为故障10和故障19的统计量监控图,定量的故障检测结果见表1。

表1 3种方法TEP故障检测结果Table 1 Fault detection results of TEP with 3 methods

故障10是由流2的C进料温度发生随机变化引起的,图2为故障10的统计量监控图比较结果。结合表1的故障检测结果可以发现,LPP的T2统计量在第210个样本处发现故障,但是却不能持续检测故障,整个监控过程的漏报率很高;而SLPP的T2统计量在第182个样本处发现故障,漏报率仅为10.25%;进一步考虑过程数据的动态性,DSLPP的T2统计量在第180个样本处发现故障,漏报率降低为6.62%。另外,LPP、SLPP和DSLPP 3种方法的Q统计量分别在第195、185和176个样本处检测出故障,同样表明了SLPP和DSLPP方法的优越性。以上结果表明了SLPP方法可以提取原始数据更全面的信息,有助于提高过程监控方法的故障检测速度并降低其故障漏报率,而考虑过程数据动态性的DSLPP算法能进一步提高故障检测性能。

图2 故障10的监控图Fig.2 Monitoring charts of fault 10

图3 故障19的监控图Fig.3 Monitoring charts of fault 19

故障19是一种未知故障,图3是其统计量监控图。从T2统计量的结果来看,LPP在第343个样本处检测出故障,漏报率高达72.12%;SLPP的故障检测效果要好很多,在第238个样本处就检测出故障,漏报率为51.12%;DSLPP效果最好,在第171个样本处发现故障,漏报率进一步降低为41.62%。由此亦可以看出新算法检测故障的有效性。

表1分别是3种故障检测方法在一些典型故障发生时的故障检测时间和故障漏报率。由表中数据可知,对于大多数故障情况,相比于LPP,SLPP无论在故障检测时间方面还是故障漏报率方面都有着更出色的表现,而进一步考虑过程数据动态性的DSLPP更有助于提高过程监控方法的故障检测速度并降低其故障漏报率。尤其对于故障10、16、19 和20,新方法可以大幅提高故障检测性能。

5 结 论

本文在LPP算法的基础上,通过加入全局稀疏重构信息,并进一步考虑过程数据的动态性,提出了一种基于动态稀疏保局投影的故障检测方法。新方法在高维数据降维过程中不仅能够保持原始数据的局部近邻结构,而且能够保持数据间的全局稀疏重构关系,更有利于对原始过程数据的特征提取,提高过程监控方法的性能。TEP的仿真结果表明,与LPP方法相比,新方法能更迅速检测故障发生并降低过程监控漏报率。

References

[1] CHIANG L H, BRAATZ R D, RUSSELL E L. Fault Detection and Diagnosis in Industrial Systems [M]. Springer Science & Business Media, 2001.

[2] QIN S J. Survey on data-driven industrial process monitoring and diagnosis [J]. Annual Reviews in Control, 2012, 36 (2): 220-234.

[3] 王海清, 宋执环, 王慧. PCA 过程监测方法的故障检测行为分析[J]. 化工学报, 2002, 53 (3): 297-301.

WANG H Q, SONG Z H, WANG H. Fault detection behavior analysis of PCA-based process monitoring approach [J]. Journal of Chemical Industry and Engineering (China), 2002, 53 (3): 297-301.

[4] LI G, QIN S J, ZHOU D. Geometric properties of partial least squares for process monitoring [J]. Automatica, 2010, 46 (1): 204-210.

[5] SCHÖLKOPF B, SMOLA A, MÜLLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10 (5): 1299-1319.

[6] TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290 (5500): 2319-2323.

[7] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding [J]. Science, 2000, 290 (5500): 2323-2326.

[8] BELKIN M, NIYOGI P. Laplacian eigenmaps for dimensionality reduction and data representation [J]. Neural Computation, 2003, 15 (6): 1373-1396.

[9] HE X F, NIYOGI P. Locality preserving projections[C] //Proceedings of Advances in Neural Information Processing Systems. MIT Press, 2004: 153-160.

[10] HU K, YUAN J. Multivariate statistical process control based on multiway locality preserving projections [J]. Journal of Process Control, 2008, 18 (7): 797-807.

[11] ZHANG M G, GE Z Q, SONG Z H, et al. Global–local structure analysis model and its application for fault detection and identification [J]. Industrial & Engineering Chemistry Research, 2011, 50 (11): 6837-6848.

[12] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54 (11): 4311-4322.

[13] 马小虎, 谭延琪. 基于鉴别稀疏保持嵌入的人脸识别算法 [J]. 自动化学报, 2014, 40 (1): 73-82.

MA X H, TAN Y Q. Face recognition based on discriminant sparsity preserving embedding [J]. Acta Automatica Sinica, 2014, 40 (1): 73-82.

[14] QIAO L, CHEN S, TAN X. Sparsity preserving projections with applications to face recognition [J]. Pattern Recognition, 2010, 43 (1): 331-341.

[15] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31 (2): 210-227.

[16] KU W, STORER R H, GEORGAKIS C. Disturbance detection and isolation by dynamic principal component analysis [J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30 (1): 179-196.

[17] QIN S J. Statistical process monitoring: basics and beyond [J]. Journal of Chemometrics, 2003, 17 (8/9): 480-502.

[18] CHEN Q, WYNNE R J, GOULDING P, et al. The application of principal component analysis and kernel density estimation to enhance process monitoring [J]. Control Engineering Practice, 2000, 8 (5): 531-543.

[19] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem [J]. Computers & Chemical Engineering, 1993, 17 (3): 245-255.

[20] LEE J M, QIN S J, LEE I B. Fault detection and diagnosis based on modified independent component analysis [J]. AIChE Journal, 2006, 52 (10): 3501-3514.

研究论文

Received date: 2015-11-26.

Foundation item: supported by the National Natural Science Foundation of China (61273160), and the Fundamental Research Funds for the Central Universities (14CX06132A).

Fault detection method based on dynamic sparse locality preserving projections

ZHENG Xin, TIAN Xuemin, ZHANG Hanyuan
(College of Information and Control Engineering, China University of Petroleum (East China), Qingdao 266580, Shandong, China)

Abstract:In order to deal with the problem that locality preserving projections (LPP) does not take into account the global structure and dynamic characteristic of process data, a new fault detection method based on dynamic sparse locality preserving projections (DSLPP) is proposed. In the study, the original data matrix is firstly extended to a time-delay augmented matrix. Then, a sparse coefficient matrix which can represent global sparse reconstructive relationship of data is gotten by solving an optimal problem of sparse representation (SR). The sparse coefficient matrix combines with the objective function of LPP to form a new objective function for dimensionality reduction. The new dimensionality reduction algorithm can not only preserve the local neighbor structure of the original data space, but also have better effect in preserving the global sparse reconstructive relationship. At last, DSLPP-based T2and Q statistics are constructed respectively in the feature space and residual space for fault detection.The simulation results of Tennessee Eastman process demonstrate that the proposed method detects faults more quickly and achieves lower fault missing alarm rate than the LPP method.

Key words:fault detection; locality preserving projections; sparse representation; feature extraction; process monitoring

DOI:10.11949/j.issn.0438-1157.20151769

中图分类号:TP 277

文献标志码:A

文章编号:0438—1157(2016)03—0833—06

基金项目:国家自然科学基金项目(61273160);中央高校基本科研业务费专项资金(14CX06132A)。

Corresponding author:Prof. TIAN Xuemin, tianxm@upc.edu.cn

猜你喜欢

稀疏表示故障检测特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
Grouplet变换原理及技术综述
新型探测线圈浅析
暖通空调系统故障检测与诊断技术探讨
基于字典学习和结构聚类的图像去噪算法研究
分块子空间追踪算法
基于MED和循环域解调的多故障特征提取