APP下载

基于EMWPE-Relief-LSTM的传感器故障诊断方法

2021-11-17王建君

计算机仿真 2021年9期
关键词:特征向量分量模态

林 涛,张 达,王建君

(河北工业大学人工智能与数据科学学院,天津 300130)

1 引言

传感器广泛应用于各种控制系统中,以获取各种物理量的数据。由于恶劣的工况环境,电池耗尽,自然老化等各种因素导致控制系统中的传感器易发生故障。故障传感器采集的数据可靠性低,这些可靠性低的数据会造成控制系统后续的决策、判断失去意义[1]。因此,从传感器的输出数据中提取故障信号以便及时的对其故障进行诊断,具有很大的现实意义。

文献[2]利用小波变换来判断传感器是否发生故障,如果发生故障则用BP神经网络对传感器输出数据进行预测,通过计算预测值与实际输出值之间的残差大于阈值的频率进行故障类型的识别。该方法的小波的基函数一旦选定,就会使得模型的转换特性固定,从而导致模型的自适应能力变弱。文献[3]对传感器的输出信号进行经验模态分解,得到一组模态函数,将每个模态函数的样本熵作为传感器的故障特征,这些特征通过SRC分类器分类得到传感器的故障状态。该方法特征提取时所用的样本熵具有单一尺度和无法描述局部排列结构的局限性。文献[4]与文献[5]分别通过径向基函数神经网络(RBF)和广义回归神经网络(GRNN)对时序数据预测,如果预测值与传感器实际输出之间的差值超过阈值就将传感器的运行状态判定为故障。这两种方法将残差与固定值进行比较,只能诊断出传感器有没有发生故障,无法诊断出传感器发生了何种故障,在故障诊断的功能上具有一定的局限性。

集成经验模态分解(EEMD)是一种新型自适应信号处理方法,无需设置小波基函数,适用于分析处理非平稳、非线性信号[6],分解后的本征模态分量有利于传感器输出数据宏观结构信息的提取。排列熵能够反应时序数据的局部排列结构[7]。多尺度加权排列熵是对排列熵的改进,能够克服排列熵无法反应时序数据的幅值信息和单一尺度的局限性。Releif算法能够得到各特征的权重,有利于故障特征的降维。长短期记忆网络(LSTM)是改进的循环神经网络,其通过对循环神经网络细胞结构的改进,有效的解决节点之间信息记忆力下降的问题,被广泛应用于各种分类问题[8]。

传感器故障特征包含在其输出数据的宏观结构、局部排列结构、幅值和各个尺度中[9]。为了充分提取故障特征和高效准确的识别故障类型,本文提出一种基于经验多尺度加权排列熵与特征选择长短期记忆网络组合算法(EMWPE-Relief-LSTM)的传感器故障诊断方法。该方法在构造特征向量时首先利用集成经验模态分解将传感器输出信号分解成不同频率的本征模态分量,然后用峭度与方差这两个指标筛选出包含最多传感器故障信息的本征模态分量,最后将所选本征模态分量的多尺度加权排列熵(EMWPE)构造为故障特征向量。由于特征向量的维数较高,可能导致识别的精度低,耗时长,因此需要对特征降维。本文采用Relief算法得到特征向量各特征的权重,通过设定权重阈值,去除相关性低的特征,实现降维。特征向量降维之后,需要使用多分类器进行故障诊断,本文采用长短期记忆网络(LSTM)分类器识别传感器故障。将特征向量输入分类器实现传感器故障诊断。

2 算法基本原理

2.1 集成经验模态分解

集成经验模态分解是一种新型的自适应信号处理方法,适用于分析传感器故障这类具有非线性、非平稳性特点的信号。集成经验模态算法步骤如下[10]:

1)将白噪声信号nm(t)加入原始信号x(t)上后得到新的信号xm(t),xm(t)形式如式(1)所示

xm(t)=x(t)+nm(t)

(1)

式中,nm(t)表示第m次添加的白噪声,xm(t)表示第m次加完白噪声后的待处理信号;

2)采用EMD对信号xm(t)分解,得到不同频率的本征模态分量(IMF)。分解后原始信号与分解信号满足式(2)

(2)

式中ci,m表示第m次EMD分解后得到的第i个IMFs分量,I是IMF的数量,rm表示残余分量。

3)重复步骤1)和步骤2)共M次,得到IMF集合为[{c1,m(t)},{c2,m(t)},…,{cM,m(t)}],其中m=1,2,…,I;

4)利用白噪声的频谱均值为0的特征,将步骤3)中的各IMFs求平均值得到IMF分量,IMF各分量值如式(3)所示

(3)

式中,cj(t)为第j个EEMD分解到的IMF分量;

2.2 多尺度加权排列熵

排列熵(PE)是度量时间序列复杂性的一种方法,其通过领域值比较,并将这些数值映射成符号模式序列来实现对时间序列信号复杂性的度量,度量值大小只与任意两采样点有关,具有良好的鲁棒性和抗噪声能力[11]。但是排列熵存在无法反应时序数据中幅值特征和单一尺度的缺点,对于传感器采集的时序数据来说,其故障特征不仅包含在排序结构中,还包含在幅值和多个尺度中。加权排列熵(WPE)是对排列熵的一种改进,加权排列熵如式(4)所示[12],从式(4)中可以发现加权排列熵将时序数据的幅值引入了排列熵。加权排列熵同时反应了时序数据的顺序结构和幅值信息,相比于排列熵其对噪声的鲁棒性更好。

(4)

式中pw(πk)为时间序列的K种排列模式,每种模式πk的加权概率值。pw(πk)形式如式(5)所示。

(5)

式中m是嵌入维数,τ是时间延迟。

虽然WPE改进了PE不能反应幅值信息的缺点,但是其只能在单一的尺度上反应时序数据的顺序结构信息和幅值信息,无法估算在不同尺度上的复杂度。多尺度加权排列熵(MWPE)结合了加权排列熵(WPE)与多尺度分析,能够描述不同尺度下的加权排列熵。多尺度加权排列熵(MWPE)的计算过程如下:

(6)

2)分别计算每个尺度的加权排列熵,这个排列熵就是MWPE, MWPE的形式如式(7)所示。

(7)

式中x是时间序列,s是尺度因子,m是嵌入维数,τ是时间延迟。

2.3 Relief特征降维

Relief算法是一种特征权重算法,其通过各个特征与类别的相关性赋予特征不同的权重。权值越大表明该参数对目标的分类能力越强[13]。设定权值的阈值,移除小于阈值的参数可以实现特征降维。Relief算法步骤如下:

1)随机选择样本数据R;

2)从与R同一类的样本中找到最近邻样本H,从不同类的样本中找到最近邻样本M;

3)如果R的某特征与H的距离大于与M的距离,降低该特征的权重,反之增加该特征的权重。更新特征属性p的权值如式(8)所示

(8)

式中,x为参数样本;p∈P;H(x)为x的同类最近邻点。M(x)为不同类的最近邻点。diff()函数形式如式(9)

(9)

4)重复m次步骤3),得到各特征的平均权重

2.4 LSTM多分类器

LSTM是增加了记忆功能的循环神经网络,能够解决时序数据后面的节点对前面节点的信息记忆力下降的问题[14]。在组成结构上LSTM的隐藏层有三个门,分别为输入门,遗忘门,输出门。这些门的输出值的大小都在0和1之间,输出值的大小决定了通过门的输入量的大小。LSTM通过这三个门来实现了对输出值状态和隐藏层状态的保护和控制。

图1为标准的LSTM隐藏层细胞结构,设输入时间序列为(x,x2,…,xt,…,xn),则在t时刻隐藏层各个门之间满足式(10)-(15)。

it=σ(Wi*Xt+Ui*ht-1+Vi*Ct-1+bi)

(10)

gt=tanh(Wc*xt+Uc*Ht-1+bc)

(11)

ft=σ(Wf*xt+Uf*ht-1+bf)

(12)

Ct=it*g+ft*Ct-1

(13)

Ot=σ(W0*xt+U0*ht-1)

(14)

ht=Ot*tanh(Ct)

(15)

式中ft为遗忘门的激活值,Ot为输出门的激活值。ht和ht-1时间步t和时间步t-1时记忆单元的输出。ct和ct-1分别为时间步t和时间步t-1记忆单元的状态为记忆单元候选状态。

图1 标准LSTM细胞结构

3 传感器故障诊断方法

基于经验多尺度加权排列熵与特征选择长短期记忆网络组合算法(EMWPE-Relief-LSTM)的传感器故障诊断方法在对传感器故障诊断时分为故障特征提取、故障特征降维、故障特征识别三个阶段。算法完整的工作流程如图1所示,其步骤可总结如图2。

1)使用集成经验模态分解对传感器待检测信号分解,分解成4个不同频率的本征模态分量(IMFs),利用峭度和方差筛选出包含传感器故障特征最多的IMF;

2)计算所选IMF的多尺度加权排列熵,将其构造为传感器故障特征向量;

3)通过Relief算法去除相关性较低的特征,实现对故障特征向量的降维;

4)将降维后的特征向量输入LSTM分类器实现传感器的故障识别。

图2 传感器故障诊断流程图

4 实验结果及分析

4.1 实验数据

本文使用河北某公司2017-2018年NO2气体传感器所采集的数据作为原始数据。在原始数据中注入了偏差故障、漂移故障、冲击故障、恒值故障,每种故障类型有5000组数据。注入偏差故障的偏差常数为平均值的30%-70%,注入漂移故障的漂移常数为原始值的5%-10%,注入冲击故障的冲击波幅值为平均值的2-3倍,注入恒值故障的恒定值为平均值的1-2倍。传感器正常状态的数据与故障状态的数据如图3所示。

图3 传感器健康数据与故障数据

4.2 故障特征提取

4.2.1 集成经验模态分解

采用集成经验模态分解将传感器输出的时间序列数据分解。分解后如图4所示,原始数据被分解为4个不同频率的本征模态分量。

图4 原始数据和本征模态的波形

4.2.2 本征模态分量选择

峭度和方差对冲击信号和偏差信号十分敏感[15],所以本文通过峭度和方差这两个指标来对集成经验模态分解的本征模态分量(IMFs)进行筛选。筛选的目的是数据降噪和找到包含最多故障信息的本征模态分量。

不同频率本征模态分量的峭度和方差如图5所示,从图中可以发现,低频IMF分量的峭度和方差远大于其余几个分量。根据峭度和方差对传感器故障信号的敏感特性可以发现低频本征模态分量包含了最多的传感器故障信息。

图5 IMF的峭度和方差

4.2.3 特征向量的构造

将低频本征模态分量的多尺度加权排列熵构造为传感器故障诊断的特征向量。本文多尺度加权排列熵的尺度数为13,所以特征向量的维数为13维。不同故障的特征向量如图6(a)所示,从图中可以发现所构造的特征向量能够很好的区分不同的故障。

中低频,中高频,高频所构造的特征向量如图6(b)、图6(c)、图6(d)所示,从图中可以发现利用低频所构造的特征向量对不同故障的区分度明显要高于这三个频段。对比结果验证了选择低频本征模态分量的多尺度加权排列熵作为传感器故障诊断特征向量的优越性。

图6 不同频率本征模态分量的EWMPE

4.3 特征降维

上节所构造特征向量的特征维数为13维,高维使得分类算法在运算时需要较多的计算资源和时间,同时高维中某些相关性较低的特征可能会对分类造成反作用,这些缺点会降低算法的可用性。为了提高算法的可用性,采用Relief选择算法来降低特征向量的维数。图7为通过Relief算法得到的特征向量13个特征的特征权值。选定权值阈值为0.13,保留权值最高的5个属性组成降维后的特征向量。

图7 特征分量的权重

将选中的特征作为LSTM分类器的输入,所选特征及其识别的精度和算法消耗的时间如表1所示。从表1中可以发现,权重最大的5个特征的分类准确率略大于所有特征的分类准确率,同时算法所消耗的时间减少了一半。这表明特征权重比较小的特征在实际中可能对分类造成反作用,也表明了采用Relief降维可以有效的提高算法的可用性。

表1 不同特征向量的平均准确率和耗时

4.4 故障识别

将故障特征输入LSTM分类器,识别传感器的故障类型。

实验采用的LSTM分类器的连接层节点数为50,损失函数为交叉熵,dropout参数值为0.3,训练方法为时间反向传播法(BPTT)。为了降低由于数据集划分对模型造成的影响,本文使用了10折交叉验证。首先将原始数据分为了10份,然后每次挑取其中的一份作为测试集,其余的9份作为训练集,重复10次后,得到了10个模型及其测试的指标,最后计算10组指标的平均值作为10折交叉验证下的性能指标。

表2是LSTM分类器对故障特征向量的分类结果。对于传感器的冲击故障和传感器的恒值故障,故障识别准确率为100%,这是因为冲击故障与恒值故障使得传感器输出序列的局部结构发生了显著的变化。正常状态、偏差故障和漂移故障都有很小的偏差,主要是因为当偏差常数和漂移率较小时,其局部结构与传感器正常时输出序列的结构变化不明显,所以导致故障识别时存在一定的错误。

表2 传感器不同故障的诊断结果

4.5 不同诊断方法性能的比较

为了进一步说明本文所提方法的优越性,本文选择与排列熵作为特征提取方法的PE-Relief-LSTM算法,文献[3]所提的EEMD-样本熵-SRC算法,文献[16]所提的改进粒子滤波算法对比。表3给出了不同算法的诊断准确度和耗时。从表3中可以看出PE-Relief-LSTM算法的诊断准确率要远远小于本文所提算法,这是由于本文所提算法在故障特征提取时,综合提取了宏观结构、局部排列结构、幅值和多尺度特征。相较于PE-Relief-LSTM算法只提取局部排列特征,本文所提方法的特征提取更加全面。文献[3]所提方法耗时时间远远大于本文所提方法,且诊断精度略低于本文所提方法,这是由于其没有对特征向量降维,高维特征向量会大大增加算法的耗时,且其中权重低的特征还可能对分类起反作用。文献[16]所提方法由于无需每次进行EEMD分解,所以耗时略小于本文所提方法,但本文所提方法的精度比其高5%,这是由于本文所提方法能够更加全面的提取故障特征。

本文所提方法综合考虑了诊断精度和诊断耗时时间,能够在使用较低的时间达到较高的传感器故障诊断准确率,具有很强的应用价值。

表3 故障诊断方法比较

5 结论

为了准确和高效的识别传感器故障,本文充分提取了传感器宏观、微观和各个尺度的特征,综合运用了Relief降维和LSTM分类算法,提出了一种基于经验多尺度加权排列熵与特征选择长短期记忆网络组合算法(EMWPE-Relief-LSTM)的传感器故障诊断方法。

本文提出的方法对于不同的传感器检测效率不同。对于NO2气体传感器,本文提出的传感器故障诊断方法的平均准确率达到99.3%,综合效果优于PE-Relief-LSTM、EEMD-样本熵-SRC、改进粒子滤波算法。

综上所述,EMWPE-Relief-LSTM算法在传感器故障诊断中取得了较为理想的效果,为今后传感器的故障诊断提供了新的思路。

猜你喜欢

特征向量分量模态
联合仿真在某车型LGF/PP尾门模态仿真上的应用
基于老年驾驶人的多模态集成式交互设计研究
高中数学特征值和特征向量解题策略
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
三个高阶微分方程的解法研究
模态可精确化方向的含糊性研究
论《哈姆雷特》中良心的分量
氨基酸序列特征向量提取方法的探讨