APP下载

基于DPCA-KD的污水处理过程故障诊断

2023-10-05徐宝昌庄朋李巨峰唐智和栾辉何为

化工自动化及仪表 2023年5期
关键词:误报率主元漏报

徐宝昌 庄朋 李巨峰 唐智和 栾辉 何为

摘 要 污水生化处理过程是一类强非线性、变量耦合、工况复杂的过程。由于环境恶劣,污水生化处理过程传感器故障频发,导致传统基于动态主元分析的故障检测方法漏报率较高、检测率较低。提出了一种基于Kantorovich距离的动态主元分析故障检测方法。首先,通过动态主元分析构建增广矩阵,对多维数据进行降维,降低数据的自相关性。其次,通过Kantorovich距离对过程的数据进行故障检测。最后,基于国际水协会的基准仿真模型BSM1对所提方法进行验证。结果表明,所提出的方法相较于传统的动态主元分析方法,降低了故障误报率、提高了检测率。

关键词 污水处理 故障诊断 动态主元分析 Kantorovich距离 BSM1

中图分类号 TP206+.3   文献标志码 A   文章编号 1000-3932(2023)05-0700-08

污水生化处理过程是一类变量众多、滞后性强、参数时变的非线性处理过程。由于所处环境恶劣,会使得传感器、风机等设备受到腐蚀而发生损坏,传感器漂移、偏置、间歇故障时有发生,使数据的可靠性降低,影响污水处理系统的控制与决策,因此,需要对故障做出及时诊断,保证生化处理过程的有效性。

生化处理过程故障诊断主要分为基于模型的方法、基于知识的方法和基于历史数据的方法。笔者采用的动态主元分析(Dynamic Principal Component Analysis,DPCA)属于基于历史数据的统计学方法,该方法不需要建立准确的数学模型和贮备大量的先验知识[1~6]。

基于DPCA的故障诊断策略是增加原始PCA矩阵中的时滞变量,捕捉过程变量中的自相关特性,通过最大化投影的方差,将观测值从大维空间转换到小维线性子空间[7]。MIRIN S N S和WAHAB N A通过多尺度主元分析策略,对污水处理厂数据进行多尺度分解,增强故障检测的准确性[8]。ZHOU J等针对污水反应过程中的序批式反应器,提出采用多路主元分析来对多变量同时进行诊断[9]。

DPCA故障指标通常使用Hotelling T2和平方预测误差(Square Prediction Error,SPE)统计指标,T2指标捕获潜在子空间中的变化,而SPE指标捕获模型剩余子空间中的变化,它们在微小偏差下会出现漏报误报情形[10,11]。使用替代统计指标来加强故障检测有很大的提升空间。近年来,人们提出了用于寻找两个概率分布之间距离的KLD(Kullback Divergence)[12~14]和HD(Hellinger Distance)[15]指标来加强故障检测任务。基于Kantorovich距离(KD)的指标已被用于故障检测问题[16,17]。KD指标表示将大量数据从源分布转移到目标分布的最低成本,可以检测到小量级的故障,并对噪声损坏的数据提供了良好的监控[18~20]。KD度量涉及固定长度的移动窗口中两个分布之间的逐段比较,这使得KD指标能够捕获过程数据中的敏感细节,从而增强对微小故障的检测。

综上所述,笔者提出了一种DPCA-KD生化处理过程故障检测方案。通过DPCA对生化处理过程的数据进行降维,并划分为主元子空间和残差子空间,然后对残差使用KD指标完成检测,并且与传统T2指标和SPE指标进行比较,通过在仿真平台BSM1上进行实验证明了所提方法的有效性。

运用SPE进行故障诊断的原则与T2类似。

1.2 Kantorovich距离

Kantorovich距离是由最优质量传输理论进化而来的,在最优传输问题中,目标是找到相对于给定成本函数将一种质量分布转换为另一种质量分布的耗费最优的方法。这个概念首先被引入來处理不同的组织和规划问题,以最大化利润或最小化成本。VERSHIK A M描述了连续时间系统Kantorovich距离的不同变体[22]。Kantorovich距离是一种量化在两个分布之间重新分配概率质量所需的最小成本的度量。Kantorovich距离计算仅基于数据,因此不受数据本身分布的限制[23],也不受独立同分布随机变量假设的限制。

对于两个相似的分布,两者的Kantorovich距离非常低或者接近于零,而对于不相似的分布,两者的Kantorovich距离会非常高,这样就表明了两者之间的不同程度[24],而过程检测问题是通过比较故障数据与正常数据的差异性,因此,Kantorovich距离可应用在故障诊断方面。KD度量是相对于给定成本函数在两个概率度量之间定义的距离函数,定义成本函数的常用方法是基于范数:

RIPPL T提出Kantorovich距离不限于任何特定的分布[26],这使得KD度量可以灵活地应用于遵循任何统计分布的数据。两个分布之间的KD度量是使用分段过程计算的。由于比较源分布和目标分布中的各个观测值是一个耗时的过程,因此两个分布中的数据都被分为多个部分,对Kantorovich距离涉及的数据堆叠成段,然后对源分布中的每个片段进行比较,从而提供KD度量的平滑表示。

2 基于DPCA-KD的生化处理过程诊断方法

生化处理过程中出现的故障主要分为两类:一类是过程故障[27,28],例如污泥膨胀、污泥发黑、污泥块状上浮、气味异常等;另一类是设备故障[29~31],主要为传感器故障和执行器故障,例如在长时间恶劣环境下,传感器发生偏置、漂移、间歇故障。文中针对的故障是设备故障,在生化处理过程传感器发生故障时,系统能够及时准确地判断出故障的发生,能够有更高的故障检测率和更低的故障误报率。

笔者将KD指标与DPCA故障检测策略相结合,以提高污水生化处理的检测性能。

在基于历史数据的故障诊断方法中,模型生成的残差携带丰富的信息,必须使用良好的统计工具对其进行评估,才能使用这些信息进行过程监控。因此,所提出的方法使用KD指标评估生化处理过程训练残差和测试数据之间的差异。残差采用以下表达式计算:

其中,μKD為KD的均值,σKD为KD的标准差。

DPCA-KD的步骤分为离线开发和在线检测阶段。

离线开发阶段的具体步骤如下:

a. 将生化过程正常运行数据分成S1、S2两部分,分别进行零均值和单位方差处理;

b. 计算滞后数,获得增广矩阵,形成DPCA;

c. 由式(16)分别计算两组残差E1、E2;

d. 设其中一组为X,分别计算均值μx和协方差阵Σx;

e. 另外一组设为Y,应用移动窗口数M,计算均值μy和协方差阵Σy,对X、Y通过封闭公式分布计算KD值,通过式(17)计算控制限H。

3 实验

生化处理过程是一个复杂的非线性过程,含有大量的生物处理过程[32],因此,对其建立准确的模型进行数据检测和状态监控非常必要。欧洲科学技术研究领域合作组织(COST)针对污水处理过程建立了BSM1模型[33],用来仿真真实污水处理厂处理污水的过程。

BSM1采用一种比较简单常见的布局,将硝化反硝化作用结合在一起,该工厂设计处理平均流量为20 000 m3/d,平均可生物降解化学需氧量COD(Chemical Oxygen Demand)浓度为300 mg/L。该工厂由一个5室生物反应器和一个二级沉降器组成。生物反应器的前2个隔室不通气,为缺氧池,硝态氮通过反硝化转变为氮气,含氮有机物通过氨化作用转化成氨氮,而后3个隔室通气,为好氧池,氨氮通过自养菌的硝化作用变为硝态氮。所有隔间都被认为是完全混合的,二次沉降器被建模为10层,存在内回流和外回流两种回流方式。该装置的主要目的是通过控制氧传递系数来控制反应器最后一个隔室中的溶解氧水平,并通过控制内部循环流量来控制最后一个缺氧池中的硝酸盐水平,具体如图1所示。

文中数据采样间隔为15 min,使用两周的干燥天气数据,共计1 344个样本作为参考数据集,T2和SPE的统计控制限的置信度均为95%,保留2个主元,窗口大小设为70,将数据分为测试组和训练组,每组共有14个变量(表1)。

对两组数据用平行分析法计算滞后长度,考虑滞后数为1构建DPCA增广矩阵,对变量SNH使用故障数据引入小的偏差数据,模拟SNH传感器发生故障,分别用DPCA-T2、DPCA-SPE、DPCA-KD检测故障是否发生以及误报率和故障检测率。

首先在采样数130~320、410~600中加入3.5的小偏差,分别用DPCA-SPE、DPCA-T2、DPCA-KD检测故障,当观测值对应的统计量超出所对应的控制限时,记为故障,DPCA-SPE、DPCA-T2、DPCA-KD统计量如图2所示。

从图2可以看到对于间歇故障,DPCA-SPE可以检测出部分故障,但是故障遗漏率较高;而对于DPCA-T2,故障检测率更低,误报率也更高;当采用DPCA-KD故障检测的时候,故障检测率大幅提升,误报率也得到了降低。

对于偏置故障,在采样数300时引入3.5的微小偏差,DPCA-SPE、DPCA-T2、DPCA-KD统计量如图3所示。

从图3中可以看到,对于微小偏差的偏置故障,DPCA-SPE可以检测出部分故障,但是存在少量的漏报和误报;DPCA-T2漏报率和误报率则比较大;而DPCA-KD在误报与漏报方面表现远超过传统的T2和SPE指标,说明DPCA-KD在偏置故障方面有较好的应用效果。

对于漂移故障,在采样数200到结束的时候引入斜率0.03的微小偏差,DPCA-SPE、DPCA-T2、DPCA-KD统计量如图4所示。

从图4中可以看到,DPCA-SPE可以检测到数据的漂移,但是在采样数500的时候才能完全检测出漂移,对于采样数200~500时仍存在误报和漏报;而对于DPCA-T2,几乎没有检测出数据的漂移,漏报和误报现象严重;而DPCA-KD在采样数232时可以检测出故障,相比于DPCA-T2和DPCA-SPE,DPCA-KD检测在误报和漏报方面有很大的提升。

3种方法在生化处理过程的故障检测误报率(False Alarm Rate,FAR)见表2。

从表2可以看出,对于3种故障,DPCA-T2和DPCA-SPE都存在误报率,而DPCA-KD的误报率大幅降低,在间歇故障与偏置故障中虽然存在误报率,但也很小,在漂移故障中的误报率则为0。

3种方法在生化处理过程的故障检测率(Fault Detection Rate,FDR)见表3。

从表3可以看出,对于污水生化处理过程中最常见的3种故障,DPCA-KD方法的故障检测率接近100%,显著高于传统的DPCA-SPE和DPCA-T2方法。

4 结束语

提出采用DPCA-KD检测方法对污水生化处理过程进行故障检测和诊断,利用KD度量计算训练数据和测试数据残差之间的差异,并根据差异做出决策。在没有故障的情况下,KD值很小,而在故障时,KD值很大。所提出的方法在基准生化处理仿真平台上进行了验证,通过对3种传感器故障进行诊断,结果显示相对于传统的DPCA-T2、DPCA-SPE故障检测,DPCA-KD在微小偏差情况下能够更准确地诊断出故障,具有更小的误报率和更高的故障检测率,降低了过程动态特征和数据自相关性对故障检测的影响。

参 考 文 献

[1] LI W,PENG M J,WANG Q Z.Fault identification in PCA method during sensor condition monitoring in a nuclear power plant[J].Annals of Nuclear Energy,2018,121:135-145.

[2] KUMAR A,BHATTACHARYA A,FLORES-CERRILLO J.Data-driven process monitoring and fault analysis of reformer units in hydrogen plants: Industrial application and perspectives[J].Computers & Chemical Engineering,2020,136(7):106756.

[3] WEI X,GUO Y.Fault diagnosis of rail vehicle suspension system based on distributed DPCA[C]//The 27th Chinese Control and Decision Conference(2015 CCDC).Piscataway,NJ:IEEE,2015:2758-2763.

[4] SEERA M,LIM C P,LOO C K,et al.A modified fuzzy min-max neural network for data clustering and its application to power quality monitoring[J].Applied Soft Computing,2015,28:19-29.

[5] RODR?魱GUEZ-RAMOS A,DA SILVA NETO A J,LLANES-SANTIAGO O.An approach to fault diagnosis with online detection of novel faults using fuzzy clustering tools[J].Expert Systems with Applications,2018,113:200-212.

[6] JIANG Q,YAN X,HUANG B.Review and perspectives of data-driven distributed monitoring for industrial plant-wide processes[J].Industrial & Engineering Chemistry Research,2019,58(29):12899-12912.

[7] BAKDI A,BOUNOUA W,MEKHILEF S,et al.Nonparametric Kullback-divergence-PCA for intelligent mismatch detection and power quality monitoring in grid-connected rooftop PV[J].Energy,2019,189:116366.

[8] MIRIN S N S,WAHAB N A.Fault detection and monitoring using multiscale principal component analysis at a sewage treatment plant[J].Jurnal Teknologi,2014,70(3):87-92.

[9] ZHOU J,HUANG F,SHEN W,et al.Sub-period division strategies combined with multiway principle component analysis for fault diagnosis on sequence batch reactor of wastewater treatment process in paper mill[J].Process Safety and Environmental Protection,2021,146:9-19.

[10] WANG S,CHEN Y.Sensor validation and reconstruction for building central chilling systems based on principal component analysis[J].Energy Conversion and management,2004,45(5):673-695.

[11] CHEN H,JIANG B,DING S X,et al.Data-driven fault diagnosis for traction systems in high-speed trains:A survey,challenges,and perspectives[J].IEEE Transactions on Intelligent Transportation Systems,2020,23(3):1700-1716.

[12] CHEN H,JIANG B,LU N,et al.Incipient fault detection method using Kullback-Leibler divergence for CRH5 and some remarks[C]//2018 Chinese Automation Congress (CAC).Piscataway,NJ:IEEE,2018:881-885.

[13] ZENG J,KRUGER U,GELUK J,et al.Detecting abnormal situations using the Kullback-Leibler divergence[J].Automatica,2014,50(11):2777-2786.

[14] PONTI M,KITTLER J,RIVA M,et al.A decision cognizant Kullback-Leibler divergence[J].Pattern Recognition,2017,61:470-478.

[15] CHEN H,JIANG B,LU N.A newly robust fault detection and diagnosis method for high-speed trains[J].IEEE Transactions on Intelligent Transportation Systems,2018,20(6):2198-2208.

[16] LI D,MARTNEZ S.High-confidence attack detection via wasserstein-metric computations[J].IEEE Control Systems Letters,2020,5(2):379-384.

[17] ASSA A,PLATANIOTIS K N.Wasserstein-distance-b-ased Gaussian mixture reduction[J].IEEE Signal Processing Letters,2018,25(10):1465-1469.

[18] KAMMAMMETTU S,LI Z.Change point and fault detection using Kantorovich distance[J].Journal of Process Control,2019,80:41-59.

[19] ARIFIN B M S,LI Z,SHAH S L.Change point detection using the Kantorovich distance algorithm[J].IFAC-PapersOnLine,2018,51(18):708-713.

[20] KINI K R,MADAKYARU M.Improved process monitoring strategy using Kantorovich distance-independent component analysis:An application to Tennessee Eastman process[J].IEEE Access,2020,8:205863-205877.

[21] YU D,YU J,SUN F,et al.Research on the PCA-based intelligent fault detection methodology for sewage source heat pump system[J].Procedia Engineering,2017,205:1064-1071.

[22] VERSHIK A M.Kantorovich metric:Initial history and little-known applications[J].Journal of Mathematical Sciences,2006,133:1410-1417.

[23] LIU Z,TIAN W,LIU B,et al.A novel dynamic distance coding identification method for oil-gas gathering and transportation process[J].Engineering Applications of Artificial Intelligence,2023,121:106010.

[24] KAMMAMMETTU S, LI Z.Change point and fault detection using Kantorovich distance[J].Journal of Process Control,2019,80:41-59.

[25] ASUKA T.Wasserstein geometry of Gaussian measures[J].Osaka Journal of Mathematics,2011,48(4):1005-1026.

[26] RIPPL T,MUNK A,STURM A.Limit laws of the empir-ical Wasserstein distance:Gaussian distributions[J].Journal of Multivariate Analysis,2016,151:90-109.

[27] LIU Y Q,RAMIN P,FLORES-ALSINA X,et al.Tran- sfo- rming data into actionable knowledge for fault detection, diagnosis and prognosis in urban wastewater systems with AI techniques:A mini-review[J].Process Safety and Environmental Protection,2023,172:501-512.

[28] GARCIA-ALVAREZ D,FUENTE M J,VEGA P,et al.Fault Detection and Diagnosis using Multivariate Statistical Techniques in a Wastewater Treatment Plant[J].IFAC Proceedings Volumes,2009,42(11):952-957.

[29] 刘乙奇,李艳,孙宗海,等.面向污水处理过程因子分析故障诊断方法的研究[J].控制工程,2015,22(3):447-451.

[30] LI T,WINNEL M,LIN H,et al.A reliable sewage quality  abnormal event monitoring system[J].Water Research,2017,121:248-257.

[31] MCKEE K,FORBES G,MAZHAR M I,et al.A review of major centrifugal pump failure modes with application to the water supply and sewerage industries[C]//ICOMS Asset Management Conference Proceedings.Asset Management Council,2011.

[32] CHEN W,YAO C,LU X.Optimal design activated slu?鄄 dge process by means of multi?鄄objective optimization:case study in Benchmark Simulation Model 1 (BSM1)[J].Water Science and Technology,2014,69(10):2052-2058.

[33] ALEX J,BETEAU J F,COPP J B,et al.Benchmark for evaluating control strategies in wastewater treatment plants[C]//1999 European Control Conference(ECC).Piscataway,NJ:IEEE,1999:3746-3751.

(收稿日期:2023-03-01,修回日期:2023-08-07)

Fault Diagnosis in the Wastewater Treatment Process

Based on DPCA-KD

XU Bao-chang1, ZHUANG Peng1, LI Ju-feng2, TANG Zhi-he2,  LUAN Hui2, HE Wei2

(1. College of Information Science and Engineering, China University of Petroleum (Beijing);

2. CNPC Safety and Environmental Protection Technology Research Institute)

Abstract   The biochemical process of wastewater treatment is a process with strong nonlinearity, variable coupling and complex working conditions. The bad environment, frequent sensor failure in the biochemical process can result in  high false positive rate and false positive rate of the traditional fault detection methods based on dynamic principal component analysis. In this paper, a fault detection method based on Kantorovich

基金項目:中国石油天然气股份有限公司科学研究与技术开发项目(2022DJ6904)。

作者简介:徐宝昌(1974-),副教授,从事基于深度神经网络的复杂系统建模、油气集输过程的智能控制与优化、控压钻井技术、钻井过程智能控制与协同优化的研究,xbcyl@cup.edu.cn。

引用本文:徐宝昌,庄朋,李巨峰,等.基于DPCA-KD的污水处理过程故障诊断[J].化工自动化及仪表,2023,50(5):700-706;719.

猜你喜欢

误报率主元漏报
基于GRU-LSTM算法的物联网数据入侵检测分析
基于SSA-SVM的网络入侵检测研究
家用燃气报警器误报原因及降低误报率的方法
多元并行 谁主沉浮
应用主元变换法分解因式
运用结构的齐次化,选换主元解题
各类气体报警器防误报漏报管理系统的应用
神经网络技术在网络入侵检测模型及系统中的应用
传染病漏报原因分析及对策
日本厂商在美漏报事故千余起被指管理疏漏