基于EEMD样本熵和SRC的自确认气体传感器故障诊断方法
2016-11-02陈寅生姜守达刘晓东杨京礼
陈寅生,姜守达,刘晓东,杨京礼,王 祁
(哈尔滨工业大学电气工程与自动化学院,黑龙江 哈尔滨 150001)
基于EEMD样本熵和SRC的自确认气体传感器故障诊断方法
陈寅生,姜守达,刘晓东,杨京礼,王祁
(哈尔滨工业大学电气工程与自动化学院,黑龙江哈尔滨 150001)
针对非线性、非平稳情况下自确认气体传感器的故障诊断问题,提出了对传感器不同故障模式信号进行特征提取和智能识别的在线故障诊断方法。首先,该方法根据传感器信号的变化进行集合经验模态分解(ensemble empirical mode decomposition,EEMD),自适应地获得一组固有模态函数(intrinsic mode functions,IMFs),对每个IMF及残余分量进行样本熵分析,提取传感器输出信号的完备特征;然后,利用稀疏表示分类(sparse representationbased classification,SRC)将各故障模式下训练样本的特征向量构成超完备字典。为了提高故障诊断方法的自适应能力,对SRC分类器进行在线更新。通过求解最小e1范数约束问题,获得测试样本的稀疏表示系数,再由不同故障类型的重构误差确定测试样本归属,进行传感器故障类型识别。实验结果表明,与目前其他传感器故障诊断方法比较,本文提出的方法能够更显著地提取传感器故障信号特征,故障识别率提高4%以上,达到97.14%。
自确认气体传感器;故障诊断;集合经验模态分解;样本熵;稀疏表示分类
网址:www.sys-ele.com
0 引 言
气体传感器广泛应用于空气质量检验、危险可燃性气体监测等领域,其输出信号的准确性和可靠性直接影响监控系统的运行状态和性能。气体传感器的工作环境一般较为复杂,敏感元件容易受到烟尘污染及温湿度干扰,导致传感器故障概率增大。将失效的传感器信息用于系统控制,会导致系统无法正常工作,甚至产生灾难性后果[13]。鉴于此,相关学者提出了自确认气体传感器[46],以提高传感器输出的可靠性。较传统的传感器,自确认传感器在输出原始测量值的同时,还能够进行在线故障诊断,指示传感器的运行状态[7]。作为自确认传感器的关键技术,对故障诊断方法的研究至关重要。
传感器故障特征的有效提取和正确识别,是根据故障类型进行设备维护的前提。由于气体传感器输出信号具有非线性、非平稳的特点,时-频分析法被广泛应用于传感器故障特征提取。文献[8]提出一种基于小波变换与神经网络的故障诊断方法,通过小波变换来实现传感器的故障检测,根据神经网络预测输出与传感器实际输出的残差在固定时间窗内大于阈值的频率,进行故障类型识别。文献[9]通过对经验模态分解(empirical mode decomposition,EMD)出的每个固有模态函数(intrinsic mode function,IMF)和残余分量进行削减,以IMF和残余分量的能量及信号削减比组成特征向量,建立支持向量机(support vector machine,SVM)多分类器,进行故障诊断。文献[10]将EMD分解出的IMFs分量组成初始特征向量矩阵,再对此矩阵进行奇异值分解,提取奇异值作为特征向量,通过SVM进行故障诊断。以上方法虽然一定程度上解决了传感器故障诊断问题,但也存在局限性。小波变换一旦选定基函数,转换特性固定,自适应能力弱,神经网络存在易陷入局部最小点和过学习等问题,基于残差的故障识别方法缺乏客观性。由于EMD存在模态混淆现象,使分解的稳定性降低,一定程度上影响了后续特征提取效果。能量特征提取在故障造成的信号变化与过程本身变化接近时,提取的信号特征可分程度低。奇异值特征提取在背景噪声较强时,难以有效提取信号的特征。SVM分类器需要多个二分类器组合实现多分类,且需要优化合适的核参数与惩罚因子才能获得满意效果。
集合经验模态分解(ensemble EMD,EEMD)是一种自适应的数据处理方法,无需预先设定基函数。通过噪声辅助方法有效抑制了EMD的模态混淆现象,适用于分析处理非平稳、非线性信号,分解出的IMF分量突出了信号的局部特征,有利于特征提取[11]。样本熵(sample entropy,SampEn)的物理意义表示信号产生新信息的速率[12],这与传感器故障信号的产生形式一致,适合对分解出的IMFs分量进行特征提取。同时,样本熵适用于确定性过程和随机过程分析,具有良好的稳健性、一致性和抗噪能力。
稀疏表示分类(sparse representation-based classification,SRC)是由文献[13]于2009年提出的一种高性能的多分类方法。相比于SVM分类器,SRC分类器仅通过对测试样本在超完备字典下的稀疏解的重构,就可实现理想的多分类效果,不需要多个二分类器组合与参数调整[14]。
本文针对上述故障诊断方法在自确认传感器应用中的问题,提出了EEMD样本熵特征提取和SRC分类器相结合的自确认气体传感器故障诊断方法。该方法通过EEMD样本熵分析更显著地提取信号的故障特征,将各故障模式下的特征构成超完备字典,通过SRC分类器进行故障识别,同时对SRC分类器进行在线更新,加强分类器的自适应性,提高故障诊断的识别率。
1 传感器信号特征提取
1.1集合经验模态分解
EEMD方法是一种噪声辅助数据分析(noise-assisted data analysis,NADA)方法,适用于分析处理非平稳、非线性信号。EEMD算法步骤如下:
步骤1将一定幅度的高斯白噪声ni(t)叠加到原始信号x(t)上,生成新信号
式中,xi(t)表示第i次叠加白噪声的待处理信号;ni(t)表示第i次叠加的白噪声;M表示总体平均次数。
步骤2对信号xi(t)进行EMD分解,得到式中,ci,j(t)表示第i次叠加白噪声经EMD分解得到的第j个IMF分量;ri,j(t)表示残余分量,表示信号xi(t)的中心趋势;J表示分解出IMF分量的数量。
步骤3重复以上两个步骤M次,得到IMF的集合为[{c1,j(t)},{c2,j(t)},…,{cM,j(t)}],其中,j=1,2,…,J。
步骤4对步骤3中的IMFs分量集合进行总体平均,获得EEMD分解到的IMF分量
式中,cj(t)为第j个EEMD分解到的IMF分量。
步骤5原始信号x(t)经过EEMD分解后的结果表示为
式中,固有模态函数c1(t),c2(t),…,cJ(t)包含了信号频率由高到低的频段成分;r(t)为残余分量。
由上述EEMD算法可知,其分解结果取决于总体平均次数M与加入白噪声幅值大小。本文采用总体平均次数选择方法和加入高斯白噪声准则[15],以增强EEMD对传感器输出信号分解的性能,减少人为设定EEMD参数对分解结果的干扰。
1.2样本熵特征提取
样本熵是由文献[12]提出的时间序列复杂性测度方法,信号越复杂,样本熵值越大。样本熵的物理意义表示时间序列产生新信息的速率,这与传感器故障信号的产生形式一致。其计算步骤如下:
步骤1将N点时间序列x(n)按序号组成一组m维矢量
式中,i=1,2,…,N-m+1。
步骤2定义矢量X(i)和X(j)之间的距离为最大坐标差[16]:
式中,k=1,2,…,m-1;i,j=1,2,…,N-m+1。
步骤3对于给定相似容限r,统计第i个向量与其他N-m个向量之间的距离小于r的数目,并计算其与N-m的比值,记作
式中,Θ为Heaviside函数,表达式为
步骤5增加矢量维数为m+1,通过重复上述计算步骤,得到Cm+1(r)。
步骤6时间序列x(n)的样本熵表示为
步骤4计算所有Cmi(r)的平均值,记作
当时间序列的长度N为有限值时,式(10)转换为
可以看出,时间序列样本熵值取决于嵌入维数m和相似容限r的取值。参考近似熵,m取1或2,r取0.1~0.25倍std(std为时间序列的标准差)就能使样本熵具有较好的统计特性。
1.3特征评估方法
为了评估所提取的特征向量对各故障类型的可分性,采用特征向量之间的距离对特征敏感度进行评估。计算第j类的第i个特征的类内距离的平均值:
式中,pi,j(m)和pi,j(n)表示第j类的第m和第n个样本的第i个特征值;N表示样本的个数;K表示特征个数;M表示类别个数。M个类的第i个特征值的类内距离的平均值表示为
计算第j类N个样本的第i个特征值的平均值:
通过式(14)可获得第i个特征M个类的类间距离平均值:
式中,αi表示第i个特征对M个类别分类的难易程度,αi越大,反映了此特征的分类能力越强,反之则越弱。
第i个特征的评估因子定义为
2稀疏表示分类器
假设存在k种类别,第i类包括ni个训练样本。所有第i类的训练样本可以形成样本集矩阵:式中,v表示m维的特征向量,v=[d1,d2,…,dm]T∈Rm。
所有k类样本集矩阵可以组成超完备字典矩阵:式中,A∈Rm×n;m表示样本维数;n表示所有训练样本的数量。
对于任意一个测试样本y可以用矩阵A线性组合进行表示
式中,x=[α1,1,…,α1,n1,…,αk,1,…,αk,nk]T∈Rn为线性表示系数向量。
但是,由于式(19)所示的线性方程组m<n,此线性方程组是欠定的,因此,x存在无穷多解。故求解该线性问题需要寻找到一个最稀疏的x向量(非零元素最少)。这样,式(19)可以转化为式(20)进行求解:
式中,‖·‖0表示e0范数,其表示计算向量中非零元素的个数,该式的求解是NP-hard问题。
在线性表示系数向量x足够稀疏的情况下,最小e0范数约束问题的最优解等价于最小e1范数约束问题的最优解[13],式(20)可以转化为凸优化问题:
任意一个与第i类样本属于同一类的测试样本y,可以由此类训练样本进行线性表示,而无法由不同类的训练样本线性表示。在理想情况下,式(19)的解应为x=[0,…,0,αi,1,…,αi,ni,0,…0],即x中与第i类训练样本相关的系数存在非零值,而与第i类训练样本无关的系数全部为零。为了解决分类问题,测试样本y可以通过第i类测试样本集线性表示:
式中,y~(i)为根据第i类重构的测试样本;δi为特征函数,可将中第i类所对应的系数选择出来。
测试样本y与y?(i)的重构误差记作:
ri(y)的值最小的一类就对应测试样本所属的类别。
3 传感器故障诊断方法
本文提出的传感器故障诊断方法流程如图1所示,分为训练过程与测试过程,具体流程如下:
步骤1对故障信号进行采集,并将故障信号存储于训练样本数据库[S1,S2,…,Sk],Si表示第i类故障信号样本集;
步骤2对[S1,S2,…,Sk]中每个故障信号样本进行Z -score标准化,得到标准化训练样本
步骤3对标准化训练样本中的每个故障信号进行EEMD分解得到m组IMFs;
步骤4分别计算m组IMFs的样本熵,并组成特征向量v=[d1,d2,…,dm]T,将所有故障类型训练样本的特征向量组成训练样本特征集;
步骤5通过训练样本特征集对SRC分类器进行训练,获得超完备字典矩阵A=[A1,A2,…,Ak],Ai为第i类的样本集矩阵;
步骤6对测试信号进行EEMD样本熵特征提取,构造特征向量,求取其在超完备字典A下的稀疏解,通过SRC分类器对测试信号进行故障诊断,输出诊断结果;
步骤7将测试过程中的特征向量补充到训练样本特征集,对SRC分类器进行在线更新。
图1 传感器故障诊断方法流程
4 实验与分析
4.1实验系统
为了验证本文所提出故障诊断方法的应用效果,设计了基于半导体金属氧化物气体传感器的自确认传感器故障诊断实验系统,如图2所示。系统中多功能传感器可以同时采集温度、湿度与气体浓度信息,固定于密闭测试容器(50 cm×20 cm×10 cm)内,对目标气体(氢气)的浓度进行采集,传感器输出信号通过数据采集卡进行模数转换传输到PC机中。在测试过程中,故障诊断算法在PC机上在线执行。由于气敏元件对温、湿度较为敏感,所以在实验过程中,需要对环境的温度和湿度进行监控。
图2 自确认气体传感器故障诊断实验系统
式中,RL为负载电阻;Rs为气敏电阻;Vc为回路电压。当气敏电阻随着浓度的变化时,输出电压Vout也随之改变,实现对气体浓度的定量测量。
通过对气体传感器的长期使用与观察,故障传感器输出信号主要存在以下几种典型形式:偏置故障、冲击故障、周期性干扰、漂移故障、噪声干扰、恒定输出[4,17],信号具体表现形式如图3所示。
半导体金属氧化物传感器采用VIA科技生产的MQ-3传感器,敏感材料为二氧化锡,其输出为电压值
图3 气体传感器典型故障表现形式
由于气体传感器故障数据样本不易获得,利用故障注入电路,原理框图如图4所示,根据上述几种典型故障表现形式,将故障信号叠加到传感器原始信号中,获得各故障情况下的实验信号,用以验证本文提出方法的有效性。
图4 故障注入原理图
4.2实验结果
通过上述自确认气体传感器故障诊断实验系统,在氢气浓度500 ppm,温度27.3℃,湿度34.8%,采样频率50 Hz的条件下,获得气体传感器输出的各种故障状态下各50组数据,将每种状态中40组数据作为训练样本,10组作为测试样本,进行实验分析。
以传感器周期性干扰故障信号为例,其EEMD分解,如图5所示。根据总体平均次数选择方法和加入高斯白噪声准则,加入高斯白噪声比值系数α=0.16,总体平均次数M=α2/e2,期望误差e一般设置为1%,可得M=256。可见,故障信号经EEMD分解后得到5个IMF分量和1个残余分量,对信号的不同频带进行了自适应划分,有效抑制了模态混淆,故障信息频率主要包含在IMF2和IMF3当中。利用样本熵分析可以求得每个IMF分量和残余分量的信号复杂度,获得6个样本熵组成的传感器故障信号特征向量v=[d1,d2,…,d6]T,用来描述传感器故障信号的特征。
图5 周期性干扰故障信号及其 EEMD分解图
表1给出了气体传感器处于正常状态及各种故障状态下,部分样本(样本序号21,22)的特征向量。特征值d1~d5为固有模态函数IMF1~IMF5经样本熵分析得到的样本熵值。可见由于传感器不同状态经EEMD分解得到的各IMF分量包含的故障信息不同,所对应样本熵的特征值具有明显的差异。
利用本文第1.3节中的特征评估方法对训练样本选取的特征向量进行评估,不同特征提取方法的特征评估因子,如表2所示。可以看到,对于所提取的6个特征,EEMD样本熵特征提取方法的特征评估因子最大,较EMD奇异值及EMD能量特征的特征提取方法所提取的特征更加显著,可分程度更高。
表1 气体传感器不同状态下的特征向量
表2 特征提取方法效果比较
在不同信噪比条件下,正常信号EEMD样本熵特征提取鲁棒性实验结果如表3所示。在信噪比60 dB,50 dB,40 dB,30 dB,20 dB和10 dB的条件下,对EEMD分解出的IMFs分量进行样本熵计算(m=1,r=0.2std),可见,EEMD样本熵特征在信噪比30~60 dB噪声范围内,不会受到噪声的明显影响,且偏差小于其类内距离,具有良好的抗噪能力和鲁棒性。虽然对于不同的IMF,其抗噪能力存在差异,这是由于样本熵值与EEMD分解出的IMFs的幅值与频率有关,但只要相似容限r的取值大于噪声的幅值就能有效避免噪声对样本熵的影响。
表3 不同信噪比下EEMD样本熵特征提取鲁棒性实验
表4给出了基于不同特征提取方法和分类器的传感器故障诊断结果。SVM采用径向基核函数K(xi,xj)= exp{-‖xi-xj‖2/2s2},核参数s的初始范围为0~20,惩罚因子取值范围为1/N≤c≤1,本文根据8倍交叉验证法惩罚因子选取0.5,核参数选择10。可见,本文提出的故障诊断方法相对于EMD能量特征与SVM结合方法和EMD奇异值分解与SVM结合方法故障识别率分别提高了4.28%和8.0%,达到了97.14%。这是由于EEMD能够良好地抑制EMD中模态混淆问题,可以对传感器输出信号进行稳定分解,减少了对特征提取的影响。样本熵特征提取的物理意义与传感器故障产生形式一致,更适合对故障信号进行特征提取,具有良好的稳健性、抗噪能力和一致性。SRC分类器实现了在线更新,增强了自适应能力,提高了故障识别率。
表4 故障诊断方法比较
5 结 论
针对自确认气体传感器故障诊断问题,本文在分析气体传感器故障模式的基础上,提出了一种结合EEMD样本熵特征提取和稀疏表示分类的故障诊断方法。EEMD可以跟随信号自身的变化,自适应地分解为包含信号特征的一组IMF分量,抑制了模态混淆,适合对非线性和非稳态信号分解;样本熵提取IMF分量中的故障特征,提高了特征的可分性,具有良好的抗噪能力和鲁棒性;SRC将各状态故障特征构成超完备字典并进行在线更新,通过重构误差进行故障识别。实验结果证明,该方法平均故障识别率达到97%以上,实现了气体传感器状态自确认,提高了传感器的可靠性。
[1]Dang L,Tian F,Zhang L,et al.A novel classifier ensemble for recognition of multiple indoor air contaminants by an electronic nose[J]. Sensorsand Actuators A:Physical,2014,207(1):67-74.
[2]Thomas P,Magnus F,Marcus T.Gas turbine sensor validation through classification with artificial neural networks[J].Applied Energy,2011,88(1):3898-3904.
[3]Wan Y,Li H,Liu J,et al.Sensitive detection of indoor air contaminants using a novel gas sensor based on coral-shaped tin dioxide nanostructures[J].Sensors and Actuators B:Chemical,2012,165(1):24-33.
[4]Shen Z G,Wang Q.Failure detection,isolation,and recovery of multifunctional self-validating sensor[J].IEEE Trans.on Instrumentation and Measurement,2012,61(12):3351-3362.
[5]Shen Z G,Wang Q.Status self-validation of multifunctional sensor using multivariate relevance vector machine and predictive filters[J].Measurement Science and Technology,2013,24(3):035103.
[6]Shen Z G,Wang Q.Data validation and validated uncertainty estimation of multifunctional self-validating sensors[J].IEEE Trans.on Instrumentation and Measurement,2013,62(7):2082-2092.
[7]Feng Z,Wang Q,Shida K.A review of self-validating sensor technology[J].Sensor Reυiew,2007,27(1):48-56.
[8]Zhao J S,Li Y,Qiu T.Amethod for sensor fault diagnosis based on wavelet transform and neural network[J].Journal of Tsinghua Uniυersity(Science and Technology),2013,53(2):205-209.(赵劲松,李元,邱彤.一种基于小波变换与神经网络的传感器故障诊断方法[J].清华大学学报(自然科学版),2013,53(2):205-209.)
[9]Feng Z,Wang Q,Shida K.Design and implementation of a selfvalidating pressure sensor[J].IEEE Sensors Journal,2009,9(3):207-218.
[10]Cheng J S,Yu D J,Yang Y.Fault diagnosis approach based on intrinsic mode singular value decomposition and support vector machines[J].Acta Automatica Sinica,2006,32(3):475-480.(程军圣,于德介,杨宇.基于内禀模态奇异值分解和支持向量机的故障诊断方法[J].自动化学报,2006,32(3):475-480.)
[11]Wu Z,Huang N E.Ensemble empirical mode decomposition:a noise assisted data analysis method[J].Adυances in Adaptiυe Data Analysis,2009,1(1):1-41.
[12]Richman J S,Moorman J R.Physiological time series analysis using approximate entropy and sample entropy[J].American Journal of Physiology-Heart Circulatory Physical,2000,278(3):2039-2049.
[13]Wright J,Yang A Y,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.
[14]Guo D M,Zang D,Zhang L,et al.Sparse representation-based classification for breath sample identification[J].Sensors and Actuators B:Chemical,2011,158(1):43-53.
[15]Wang Y J,Jiang Y C,Kang S Q,et al.Diagnosis method of fault location and performance degradation degree of rolling bearing based on optimal ensemble EMD[J].Chinese Journal of Scientific Instrument,2013,34(8):1834-1840.(王玉静,姜义成,康守强,等.基于优化集合EMD的滚动轴承故障位置及新能退化程度诊断[J].仪器仪表学报,2013,34(8):1834-1840.)
[16]Zurek S,Guzik P,Pawlak S.On the relation between correlation dimension,approximate entropy and sample entropy parameters,and a fast algorithm for their calculation[J].Physica A,2012,391(24):6601-6610.
[17]Wang Q J,Cheng J L.Research on fault mode and diagnosis of methane sensor[J].Journal of China Uniυersity of Mining and Technology,2008,18(3):386-388.
Self-validating gas sensor fault diagnosis method based on EEMD sample entropy and SRC
CHEN Yin-sheng,JIANG Shou-da,LIU Xiao-dong,YANG Jing-li,WANG Qi
(School of Electrical Engineering and Automation,Harbin Institute of Technology,Harbin 150001,China)
Aiming at the fault diagnosis problem of self-validating gas sensor under the condition of nonlinear and non-stationary,a sensor on-line fault diagnosis method is proposed to conduct the feature extraction and intelligent identification for the sensor signals in different fault modes.Firstly,the sensor output signal is adaptively decomposed to a series of intrinsic mode functions(IMFs)by ensemble empirical mode decomposition(EEMD)according to sensor signal change,and each of IMFs and residue is conducted by the sample entropy analysis to extract the complete features of the sensor output signal.Afterwards,the over complete dictionary is comprised of the feature vectors of training samples in different fault conditions by using sparse representationbased classification(SRC).The SRC classifier is updated subsequently to improve the adaptivity of it for fault diagnosis.The minimum e1norm constraint problem is applied to obtain the sparse represent coefficient of testing sample and sensor fault type identification is determined by reconstruction error minimum between test sample and its reconstructed signal in different fault conditions.The experimental results show that the proposed method can significantly extract more features of the sensor fault signal compared with the other fault diagnosis methods and the fault diagnosis recognition rate increases over 4%and reaches 97.14%.
self-validating gas sensor;fault diagnosis;ensemble empirical mode decomposition(EEMD);sample entropy;sparse representation-based classification(SRC)
TP 206+.3
A
10.3969/j.issn.1001-506X.2016.05.37
1001-506X(2016)05-1215-06
2015-04-23;
2015-08-19;网络优先出版日期:2016-02-15。
网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160215.1438.010.html
国家自然科学基金(61201306,61271094,61327804)资助课题
陈寅生(1986-),男,博士研究生,主要研究方向为传感器故障诊断、数据融合、自确认理论。
E-mail:chen_yinsheng@126.com
姜守达(1964-),男,教授,博士,主要研究方向为数字信号处理、故障诊断技术。
E-mail:jsd@hit.edu.cn
刘晓东(1967-),男,副教授,博士,主要研究方向为故障诊断技术、计算机辅助测试。
E-mail:liuxiaodong@hit.edu.cn
杨京礼(1984-),男,讲师,博士,主要研究方向为网络测试、图像处理。
E-mail:icehit0615@163.com
王祁(1943-),男,教授,主要研究方向为智能传感器及信息处理。
E-mail:wangqi@hit.edu.cn