基于小波能谱熵和集成经验模态分解的传感器故障诊断耦合算法研究
2018-08-29史历程赵群飞王玉璋
史历程, 赵 骁, 赵群飞, 王玉璋
(1. 上海交通大学 机器人视觉与图像测控实验室, 上海 200240; 2. 中国航空发动机集团沈阳发动机设计研究所, 沈阳 110015; 3. 上海交通大学 燃气轮机研究院, 上海 200240)
燃气轮机是各类航空喷气发动机及其衍生燃气轮机、重型发电燃气轮机、车辆与工业驱动燃气轮机、舰船动力燃气轮机及各种微型燃气轮机的总称[1],具有启动快、效率高、运行平稳的特点,在航空、航海和发电系统等领域得到了广泛的应用。航空和舰船用燃气轮机具有启停频繁、运行工况复杂和运行环境复杂等特点。而发电系统用燃气轮机要求长时间稳定运行、长寿命、低维护成本等。
为了保证燃气轮机安全稳定运行,需要使用各种类型的传感器进行监控,而传感器输出信号的实时性、准确性和可靠性直接影响发动机的控制和安全,一旦传感器发生故障,后果十分严重。燃气轮机结构复杂,工作环境恶劣,所需要的传感器种类很多,其敏感元件容易受到各种干扰,其非平稳性、非线性度很高[2],所需测量的参数(如温度、压力等)范围大,传感器信号具有维度高、稳定性差和非线性度高等特点。由此可见,研究高效、可靠、快速的传感器故障诊断算法,对于燃气轮机高效可靠运行、降低检修维护成本具有重要的意义。
传统的信号分析方法如傅里叶变换,很难对这种非平稳特征的数据进行分析,而且也很难对数据在时域和频域进行精确分析。针对传统方法对传感器故障诊断方面的不足,近年来国内外学者进行了大量的研究。Zhao等[3-5]提出了基于小波变换的故障诊断方法,通过小波变换来实现传感器的故障检测,虽然一定程度上解决了传感器故障诊断问题,但也存在局限性。小波变换一旦选定基函数,转换特性固定,其适应性较差,对多种类型传感器信号的诊断有一定的局限性。为了得到适应性更好的故障诊断算法,一些学者尝试利用人工智能领域的思想来解决问题。朱嵘嘉等[6]采用模糊逻辑来实现燃气轮机气路单一故障诊断,通过建立故障诊断的模糊数学模型和模糊诊断矩阵,依据模糊诊断矩阵和最大隶属原则进行燃气轮机的故障诊断,在故障表征与原因之间建立模糊关系,由隶属度大小来检测燃气轮机故障,在实际的燃气轮机故障检测中有可靠合适的检测精度,但其自学习、自更新能力不强,很难应用到更广泛的范围内。神经网络[7-9]作为近年来人工智能领域的研究热点,广泛应用于故障类型的分类,但其存在易陷入局部最小点和过学习等问题。支持向量机(SVM)作为一种特殊的单层神经网络非线性分类模型,刘静雅等[10-11]将其应用在信号故障诊断领域,针对不同故障类型的监测数据建立不同的分类器模型,实现对燃气轮机部件传感器信息的故障诊断,但SVM分类器需要多个二分类器组合实现多分类,且需要优化合适的核参数与惩罚因子才能获得满意效果。上述基于残差的分类模型,其残差物理本质反映不明显,往往不具有客观性。为了获取信号的本质特征,增强诊断算法的客观性, Dang等[12-13]通过经验模态分解(EMD)对信号进行分解,获得固有模态函数(IMF)和残余分量,并将其能量及信号削减比组成等特征构成特征向量进行故障诊断。但由于EMD存在模态混淆现象,使分解的稳定性降低,在一定程度上影响了后续特征提取效果。陈寅生等[14]介绍了一种利用噪声辅助方法来抑制EMD的模态混淆现象,引入表示信号产生新信息的速率的样本熵(SE)来反映信号本质的特征向量,并采用通过稀疏表示分类(SRC)进行信号故障的分类方法,成功提高了故障诊断的准确率,并在一定程度上增强了算法的自适应性。不过由于需要对信号进行预处理,且增加了信号复杂度,这种方法比原始EMD的分解时间更长,有时不能满足燃气轮机的实时性要求。
笔者提出一种基于多特征提取与故障分类诊断的耦合算法,并建立燃气轮机状态监测及故障诊断系统,可通过振动、位移、转速、温度和压力传感器所集成的传感器监测网络进行实时采集及信息提取,运用集成经验模态分解(EEMD)计算样本熵,利用小波分解来计算小波熵等方法进行故障提取。同时根据故障模式与传感器类型的不同,采用不同的故障分类识别方法进行燃气轮机故障的综合诊断,使燃气轮机健康管理系统具有精确的实时状态监测和全面准确的故障诊断功能。
1 基本原理
1.1 小波函数形式
小波分析的核心是利用小波变换对信号作出分解并进行分析,其基本思想是用一簇函数来表示或逼近一信号或函数。
(1)
式中:Cψ为ψ(t)的允许性条件。
则ψ(t)为一个基本小波函数,简称为小波。
通过伸缩和平移,该函数可生成一簇小波函数,称为小波序列:
(2)
式中:a为尺度参数;b为定位参数。
ψa,b(t)的离散小波变换定义为:
(3)
式中:a0、b0分别为a和b的离散值;k为离散变换系数;j∈Z。
1.2 小波能谱熵(WEE)
小波能谱熵是小波分析理论与熵原理的结合,充分发挥了二者的优点,既能达到信息融合的目的,又能更有效地分析突变信号,能更好地适应信号的特征提取。小波能谱熵的计算步骤如下。
将任意信号x(t)向不同尺度的小波空间投影,则可得到不同尺度下的细节信号:
(4)
式中:Cj(k)和dj(k)分别为低频分量系数和高频分量系数。
设时间序列长度为N,则信号x(t)在第j层k时刻各小波变换的结果可表示为:
D={Dj(k)},k=1,…,N,j=1,…,J
(5)
根据小波变换系数在不同尺度内的能量分布情况,可计算出信号在不同尺度的小波能谱熵:
(6)
1.3 集成经验模态分解
EEMD方法从本质上讲是对一个信号进行平稳化处理,其结果是将信号中不同尺度的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列(即IMF)。
EEMD方法的计算步骤[14]如下:
(1) 将一定幅度的高斯白噪声n(t)叠加到原始信号x(t)上,生成新信号:
x(t)=x(t)+n(t)
(7)
(2) 对信号反复进行EMD分解,得到IMF集合:
x(t)=[{c1(t)}, {c2(t)}, …, {cJ(t)}]
(8)
式中:cJ(t)为第J次EMD分解得到的IMF分量。
(3) 将该集合进行总体平均,获得EEMD分解得到的IMF分量,原始信号x(t)经过EEMD 分解后的结果为:
(9)
式中:r(t)为经过EEMD分解后的剩余分量。
IMF分量反映了原始信号的特征尺度,代表着非线性、非平稳数据序列的本征模态特征,通过分析IMF分量的特征,便可推知原数据序列的特征信息。样本熵是一种时间序列复杂性测度方法,表示时间序列产生新信息的速率,这与传感器故障信号的产生形式一致,一般来说,信号越复杂,样本熵越大。样本熵的计算步骤如下:
(1) 将N点时间序列x(i)按序号组成一组m维矢量:
x(i)=[x(i),x(i+1), …,x(i+m-1)],
i=1,2,…,N-m+1
(10)
(2) 定义矢量x(i)与x(j)之间的距离为最大坐标差,按序号组成一组n维矢量:
d[x(i),x(j)]=max[|x(i+k)-x(j+k)|],k=1,2,…,m-1,i=1,2,…,N-m+1
(11)
(3) 对于给定相似容限r,统计第i个向量与其他N-m个向量之间的距离小于r的数目,并计算其与N-m的比值,记为:
(12)
式中:Θ为Heaviside函数。
(13)
(5) 增加矢量维数为m+1,通过重复上述计算步骤,得到Cm+1(r)。
(6) 时间序列x(n)的样本熵为:
(14)
当时间序列长度N为有限值时,上式可转化为:
(15)
2 2种算法的比较与融合
2.1 操作系统与数据集
基于LabVIEW平台,实现了各路传感器性能状态参数在线采集、综合分析和整机诊断的功能。以某燃气轮机机组为研究对象,得到其17路传感器运行数据,每路传感器有51 055个数据,将80%的运行数据作为训练样本,20%的运行数据作为测试样本。图1给出了几路具有代表性的传感器信号的波形图。由图1可以看出,各传感器由于测量部件的工作原理、位置及工况的不同,无论其量纲、信号大小还是模式都有很大差异,凭借传统的故障诊断算法很难对各类传感器进行统一诊断。
传感器输出信号主要存在以下几种典型故障形式:开路故障、短路故障、阶跃故障、脉冲故障、周期故障、漂移故障和噪声干扰等[10],信号具体特征如图2所示。将故障信号分别叠加到各传感器模拟采集的原始信号中,即可得到最终采样信号。
(a) 燃油反馈
(b) 导叶电流
(c) 大气温度
(d) 滑油供油温度
(e) 计量阀控制前油压
(f) 压气机出口压力
(a) 无故障
(b) 开路故障
(c) 短路故障
(d) 阶跃故障
(e) 脉冲故障
(f) 周期故障
(g) 方差突变故障
(h) 漂移故障
2.2 特征提取
为了评估所提取的特征向量对各故障类型的可分性,笔者提取了传感器各种故障状态下采用不同算法得到的特征向量。表1给出了油压传感器处于正常状态及各种故障状态下通过WEE方法得到的特征向量。首先构造第1~第5层小波低频系数与高频系数,计算其相应的小波能谱熵WEE,并选取各级小波分量的方差σ、均值μ与小波能谱熵WEE组成的向量来构成最终的特征向量。由表1可知,传感器在不同状态下经小波熵计算得到的各小波分量包含的故障信息不同,所对应的特征值同样具有明显的差异。
将信号样本进行EEMD 分解。根据总体平均次数选择方法和加入高斯白噪声准则,加入高斯白噪声的幅度A=0.28,期望误差e设为1%,集成平均次数为100。利用样本熵分析可以求得每个IMF分量和残余分量的信号复杂度,从而获得传感器故障信号特征向量,用来描述传感器故障信号的特征。
表1 油压传感器不同故障类型下的WEE特征向量
表2给出了油压传感器处于正常状态及各种故障状态下的EEMD特征向量。信号经EEMD分解后得到4个IMF分量和1个残余分量。特征值d1~d4为IMF1~IMF4经样本熵分析得到的样本熵。特征值d5为EEMD分解后得到的残余分量样本熵。由于传感器在不同状态下经EEMD分解得到的各IMF分量包含的故障信息不同,所对应样本熵的特征值具有明显的差异,展示了良好的故障可分性。
表2 油压传感器不同故障类型下的EEMD特征向量
为了更好地分析各类算法的优缺点,考虑到燃气轮机的应用背景,分别以脉冲信号作为典型的突变型故障,以漂移故障作为典型的缓变型故障,并考虑到不同传感器信号的测量范围差异,分别进行信号的傅里叶变换、小波变换、小波熵和EEMD分解仿真实验,结果如图3~图7所示。图3为平稳脉冲信号的特征提取仿真实验结果。由图3可以看出,傅里叶变换后的信号出现了特征值上下振荡,而小波变换的各层分量则在故障点处出现了特征值的突变,而EEMD同样在第一层IMF分量中出现了特征值突变,可以认为这些方法在处理平稳脉冲信号时都可以进行准确的诊断。
图3 幅值为40的平稳脉冲信号的特征提取
图4 幅值为40的非平稳脉冲信号的特征提取
图5 幅值为100的非平稳脉冲信号的特征提取
图6 幅值为10的非平稳漂移信号的特征提取
图7 幅值为100的非平稳漂移信号的特征提取
图4为非平稳脉冲信号的特征提取仿真实验结果,图4在图3中信号的基础上增加了均值为0、幅值为4的均匀白噪声。由图4可以看出,傅里叶变换后的特征值变得杂乱无规律,而其余2种方法都出现了特征值的突变,因而傅里叶变换不适用于非平稳脉冲信号的故障分类。
图5为幅值为100的非平稳脉冲信号的特征提取仿真实验结果。由图5可以看出,在信号测量范围变大之后,虽然特征值变化曲线与图4相似,但各层小波分量的尺度大小随之发生了明显变化,而利用小波能谱熵提取的小波熵值并未发生明显变化。这说明利用小波能谱熵进行不同尺度信号的故障分类可以建立一个统一的阈值进行诊断,而传统的小波变换则不适用。
图6为幅值为10的非平稳漂移信号的特征提取仿真实验结果。由图6可以看出,各层小波特征值并无明显变化规律,而利用EEMD分解得到的第4层IMF出现了特征值周期性的变化,因此EEMD分解比小波变换更适合于漂移故障的诊断。
图7为幅值为100的非平稳漂移信号的特征提取仿真实验结果。由图7可以看出,虽然信号的尺度变大了,利用EEMD得到的样本熵值变化并不明显,因此进一步证明该方法在同种漂移故障不同幅值的识别上具有统一性。
2.3 诊断实验结果及分析
将数据集中各类传感器信号作为输入,并叠加7类故障,样本熵相似容限r设为0.2,SRC稀疏层参数设为20,每类故障分别诊断20次,统计各类算法平均准确率与所需时间。
表3给出了基于不同特征提取方法和K近邻(K-Nearest Neighbor,KNN)分类器的传感器故障诊断的识别准确率结果。由表3可以看出,采用文献[8]的方法在处理缓变型故障时得到了较好的准确性结果:EEMD有效抑制了模态混叠,其抗噪能力和鲁棒性强,可以对传感器输出信号进行稳定分解,减少了对特征提取的影响;而相比于小波熵,样本熵特征提取的物理意义与传感器故障产生形式一致,更适合对故障信号进行特征提取;SRC分类器自适应能力更强,也更适合对多目标进行分类,因此产生了更高的识别准确率。
表4给出了基于不同特征提取方法和分类器的传感器故障诊断的实时性结果。由表4可知,小波熵结合KNN分类器得到了最快的诊断时间,这是由于K近邻分类决策上只依据最邻近的一个或几个样本的类别来决定待分样本所属的类别,而SRC分类器需要大量故障信号的原始样本来建立完备字典,求取稀疏解并计算最小残差值的类别,其计算量相对较大。另外采用EEMD对信号进行分解时需叠加噪声信号,这也增大了计算复杂度。
表3 各类算法识别准确率比较
表4 各类算法识别速度比较
2.4 耦合算法实验结果
耦合算法采用混合式的结构模型,结合传感器信号参数阈值,对采集到的传感器数据进行初步诊断,诊断结果正常则再输入到耦合算法模型中,缓变型故障如周期故障等按照EEMD方法进行故障诊断;而突变型故障如短路故障等则采用WEE方法进行诊断。为了保证2种算法判定的可靠性,引入综合判定参数,当传感器满足一段时间且连续多次诊断为同一类型故障时,算法会判定其发生了该种类型故障,如果不满足该条件时则不输出故障结果,其诊断流程如图8所示。
利用综合判定模块获得2种算法的诊断结果后,再根据不同类型的燃气轮机传感器需求,划分不同的诊断优先级,对于诊断优先级较高的传感器,采用较快的诊断方法优先处理,而诊断优先级较低的传感器则随后处理,并且根据故障类型的不同采用不同的诊断算法,两者结合最终综合分析出对应故障结果。耦合算法诊断结构框图如图9所示。
图8 综合判定故障流程
图9 耦合算法结构框图
为了验证耦合算法的诊断效果,选择所有传感器信号作为输入并叠加各类故障各10次,统计平均诊断时间与识别准确率,如表5所示。其中,模拟开路故障诊断检测结果如图10所示。
由表5可以看出,将EEMD与小波熵2种算法进行融合,再结合各传感器工作特性,建立参数阈值辅助进行诊断,与前文提到的算法相比,所提出的耦合算法既提高了故障的识别准确率,同时降低了诊断时间,具有更可靠、快速的诊断效果。
表5 耦合算法识别准确率和诊断时间结果
图10 模拟开路故障检测结果
3 结 论
(1) 耦合算法克服了单一或单源传感器对于机构故障诊断分类的局限性,为燃气轮机传感器故障诊断提供了更可靠而全面的结果。
(2) 耦合算法提高了各类故障的识别准确率,其中漂移故障的识别准确率达到97%,其余各类故障的识别准确率最低也达到了91%。
(3) 耦合算法提高了故障诊断的识别效率,对速度要求高的故障类型(如短路故障和脉冲故障等)所需诊断时间降低至0.4 s以下;对需要长时间、多样本识别的故障类型(如周期故障等)的诊断时间降低至3.07 s,达到了实际过程中控制系统对故障诊断的实时性要求。