APP下载

基于CEEMD-LSTM的离心泵偏工况诊断方法研究

2022-10-17刘荣伟何伟挺汪琳琳吴大转

振动与冲击 2022年19期
关键词:离心泵特征提取准确率

刘荣伟, 何伟挺, 汪琳琳, 杨 帅, 武 鹏, 吴大转

(1. 浙江大学能源工程学院化工机械研究所, 杭州 310027; 2. 浙江中控技术股份有限公司, 杭州 310027)

离心泵作为典型的流体输送设备,广泛应用于电力、化工、农业灌溉等领域。全球水泵电力消耗约占工业设备总消耗的25%, 我国离心泵电力需求量高达水泵耗电的80%[1]。离心泵在偏工况状态下运行时,其内部流动会趋于紊乱,激振力增强,导致效率下降,能耗上升,磨损加剧,严重情况下甚至会引发安全事故[2]。因此,建立可靠的离心泵工况诊断方法,为后续的调整措施提供参考,对于保障离心泵的高效运行,节约机组能耗,有效排除安全隐患等都具有迫切的现实意义[3]。

国内外学者从试验出发,在运行工况对离心泵振动影响方面做了较多研究。陈长盛等[4]发现流量变化对低、高频的影响更为明显,在叶频处尤为突出,周林玉[5]采用大涡模拟和滑移网格技术研究了离心泵在偏工况下叶轮内部的压力脉动,并且发现运行工况小于0.6Qd(额定流量)时,压力脉动明显比设计工况剧烈。Guzzomi等[6]提出了从振动信号出发评估离心泵能效的可能性,并试验验证低频段下离心泵振动信号与效率的相关性,但试验数据较少,相关性较模糊。这些研究都表明了利用振动信号进行离心泵偏工况诊断的可行性。

目前,国内外学者在离心泵机械故障诊断这一领域展开了大量研究[7-8],结合时频分析、机器学习方法,采用建立诊断指标或者诊断模型的方式,取得了很多有价值的成果。

在非设计工况诊断方面的研究大多围绕空化故障,在偏工况诊断方面的研究较少。伍柯霖等[9]提出了基于频带能量和峭度的主导频带时频分析法,用于表征离心泵空化,但是需要手动计算频带能量,选取主导频带,较为繁琐。周云龙等[10]提出利用多点噪声,结合奇异值分解和BP(back propagation)神经网络,诊断离心泵早期汽蚀故障,但工序繁琐,需要将多个单指向性麦克风附于泵体的不同部位采集信号。龚波[11]基于奇异值分解来提高信噪比,从电机定子电流信号中提取离心泵的工况特征,从而实现偏工况诊断,但该方法有两个问题:① 电流信号受电网工频的影响很大,电流特征很容易淹没在电网工频的波动之中;② 奇异值分解只是进行了预处理,对离心泵工况的诊断还停留在肉眼观察时域、频域图进行判断的阶段,无法评判诊断的准确率等信息。

基于上述原因,本文针对离心泵无机械故障情况下的偏工况诊断问题,提出了一种互补集合经验模态分解(complementary ensemble empirical mode decomposition, CEEMD)和长短时记忆网络(long and short time memory network, LSTM)相结合的方法,CEEMD对采集的离心泵振动信号进行工况时、频域特征提取,并利用LSTM进行智能识别,最后利用仿真信号和试验数据加以验证。

1 经验模态分解理论

1.1 经验模态分解

经验模态分解(empirical mode decomposition, EMD)方法由Huang[12]提出,是一种自适应的时频局部分析方法,特别适用于非线性非平稳信号的分析处理,它基于任何信号都可以拆分成若干个本征模函数(intrinsic mode function, IMF)之和的假设,摆脱了傅里叶变换的局限性,即:① IMF与采样频率无关;② 基于数据本身变化。IMF反应原始信号的局部信息,其需要满足两个条件:

(1) 在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不能超过一个;

(2) 上、下包络线相对于时间轴局部对称。

EMD算法对原始信号x(t)基本步骤如下:

① 找出x(t)所有的局部极大、极小值点,用三次样条函数连接所有局部极大值点作为上包络emax(t),连接所有局部极小值点作为下包络emin(t);

② 计算上下包络线的均值包络m(t)=(emax(t)+emin(t))/2, 计算信号x(t)与m(t)的差h1=x(t)-m(t);

③ 如果h1满足IMF的条件,那么h1为分解得到的第一个分量IMF1,将;如果h1不满足IMF的条件,将h1看作是新的原始信号,循环步骤①~②,直到h1满足IMF的条件;

④ 将分解出的IMF1剥离,得到信号r1=x(t)-h1,将r1看作是原始信号重复上述步骤,依次得到IMF2,IMF3,…,IMFn,当标准差0.2

(1)

此时,满足式(2):

(2)

式中,rn为分解筛除n个IMF后的信号残余分量,代表了信号的趋势。IMF1~IMFn分别对应的分量频率由高到低排列,不同频率带宽也不相同。

在小波分解中,获得的时域波形是由小波分解尺度决定的,并且小波分解需要预先选择小波基。而EMD分解根据数据本身分解,得到IMF分量的频率带宽无需设定参数来控制。但是EMD分解最大的问题之一是:IMF存在模态混叠现象,为了解决这个问题,集合经验模态分解应运而生了。

1.2 互补集合经验模态分解

针对EMD方法的不足,Zheng[13]提出以噪声辅助来解决模态混叠问题的集合经验模态分解(ensemble empirical mode decomposition, EEMD)方法。EEMD需要预先设定平均处理次数,添加白噪声的幅值。白噪声的频谱均勾分布,白噪声使得信号会自动分布到合适的参考尺度上。由于零均值噪声的特性,噪音经过多次的平均计算后会相互抵消,这样集成均值的计算结果就可以直接视作最终结果。集成均值的计算结果与原始信号的差值随着集成平均的次数增加而减少。EEMD虽然解决了模态混叠的问题,但是由于白噪声的引入,使得分解得到的IMF都混入了特定尺度下的噪声成分,很难将其完全剔除,使IMF的信噪比降低。

针对EEMD方法的不足,Yue等提出采用正负成对的形式加入辅助噪声,这样就很好地消除了IMF中的残余辅助噪声,提高了计算效率和信噪比。CEEMD算法流程如图1所示。其中添加白噪声的幅值可选0.2倍~0.5倍原始信号的标准差或者可随噪声的强度而适当调整增大[14]。

图1 CEEMD算法流程图Fig.1 CEEMD algorithm flow chart

2 循环神经网络理论

2.1 循环神经网络结构

循环神经网络(recurrent neural network, RNN)是一类用于处理序列数据的神经网络,可用于分类和回归问题。循环神经网络由输入层、隐藏层、输出层构成,每一个时间步都有输出,并且隐藏单元之间有循环连接,如图2所示。

图2 循环神经网络结构Fig.2 Schematic diagram of circulatory neural network

(3)

RNN输入层到隐藏层由权重矩阵U连接,隐藏单元之间由权重矩阵W循环连接,隐藏层到输出层由权重矩阵V连接。式(7)~式(10)定义了RNN模型的前向传播

at=b+Wst-1+Uxt

(4)

st=tanh(at)

(5)

ot=c+Vst

(6)

(7)

式中:b、c为偏置向量;tanh、softmax函数为激活函数,激活函数的引入增加了神经网络模型的非线性。

2.2 长短时记忆模型

RNN具有两个问题,在时间步数较大或者时间步较小时,RNN网络的梯度较容易出现衰减或爆炸,虽然裁剪梯度可以应对梯度爆炸,但无法解决梯度衰减的问题。因此,RNN在实际应用中较难捕捉时间序列中时间步距离较大的依赖关系。

针对RNN存在的问题,LSTM在RNN的基础上引入了3个门,即输入门、遗忘门和输出门,以及隐藏状态形状相同的记忆细胞,从而记录额外的信息。长短期记忆门的输入均为当前时间步输入Xt与上一时间步隐藏状态Ht-1,输出由激活函数为sigmoid函数的全连接层计算得到(下文用σ表示),因此,这三个门的值域均为[0, 1]。LSTM隐藏层内部结构如图3所示。

图3 LSTM隐藏层内部结构Fig.3 Hidden layer internal structure Diagram of LSTM

具体来说,输入门It、遗忘门Ft、输出门Ot的公式如下:

It=σ(XtWxi+Ht-1Whi+bi)

(8)

Ft=σ(XtWxf+Ht-1Whf+bf)

(9)

Ot=σ(XtWxo+Ht-1Who+bo)

(10)

(11)

3 研究方法

3.1 基于CEEMD-LSTM的离心泵偏工况诊断流程

基于CEEMD-LSTM的离心泵偏工况诊断方法融合数据预处理、工况特征提取和工况识别分类,具体流程如图4所示。整个流程大体分为4个部分:① CEEMD特征提取:将采集到的离心泵双通道振动信号分别进行CEEMD处理,对分解得到的IMF分量进行挑选,再将双通道信号融合成原始数据集;② 工况区划分:建立工况划分标准,将原始数据集划分到不同工况,并保证样本数据的均匀性;③ LSTM参数优化:对LSTM模型的网络结构,梯度下降方法进行优化;④ LSTM模型训练及测试:将数据集划分为训练集和测试集,将训练集输入优化的LSTM模型训练网络参数,再将测试集输入到训练好的LSTM模型,验证测试结果的准确率。

图4 基于CEEMD-LSTM的离心泵偏工况诊断流程图Fig.4 Diagnostic flow chart of eccentric condition of centrifugal pump based on CEEMD-LSTM

3.2 仿真验证

在诊断模型中,特征提取是非常重要的一环,本文选用CEEMD方法进行特征提取,此节利用仿真信号将CEEMD与EMD、EEMD方法做对比,凸显CEEMD的有效性。

仿真信号s、t均为两个不同频率的正弦信号叠加:

(12)

对于信号s,频率f1=4 Hz,f2=120 Hz,振幅A1=1.0,A2=0.2;对于信号t,频率f1=5 Hz,f2=100 Hz,振幅A1=1.5,A2=0.5。将高频信号处理成间断性,仿真信号s如图5所示。

图5 仿真原始信号Fig.5 Simulated original signal

将仿真信号进行EMD处理,结果如图6所示。EMD方法将信号s分解成3个IMF分量,IMF3对应信号的低频段,IMF1对应高频段。但是IMF1中出现明显的模态混叠现象,其中包含差异极大的特征时间尺度,因此IMF1没有意义。

图6 仿真信号EMD处理结果Fig.6 Simulation signal EMD processing results

仿真信号s的EEMD处理结果如图7所示。设定平均处理次数m=200,添加白噪声幅值为0.2倍原始信号的标准差,EEMD方法将信号s分解成4个IMF分量,可以看出IMF1中不存在模态混叠问题,出现明显的周期高频分量,IMF4对应原始信号的低频段。EEMD在EMD方法的基础上需要设定平均处理次数、添加白噪声幅值,但是处理效果更好。

图7 仿真信号EEMD处理结果Fig.7 Simulation signal EEMD processing results

仿真信号s的CEEMD处理结果如图8所示。设定平均处理次数m=10,添加白噪声幅值为0.2倍原始信号的标准差,CEEMD方法将信号s分解成8个IMF分量,取前4个给以展示。对比EEMD与CEEMD的IMF,可以发现经过CEEMD处理后IMF分量的辅助噪声残留大幅减少,信噪比大幅增加,更能反应原始信号的信息,并且少量的平均处理次数就能达到效果,相比EEMD方法计算量也有大幅降低。

图8 仿真信号CEEMD处理IMF1~IMF4Fig.8 IMF1~IMF4 are processed by simulation signal CEEMD

同样对信号t分别进行EMD、EEMD、CEEMD处理后输入到LSTM模型中训练。这里LSTM模型采用下文根据试验数据优化得到的结构参数,训练结果如图9所示,可见经过CEEMD处理后的识别准确率最高,并且在迭代80次后趋于稳定,EMD处理后的识别准确率最差,并且随着迭代步数增加一直在振荡。

图9 仿真信号不同特征提取方法的识别结果Fig.9 The recognition results of different feature extraction methods of simulation signals

4 试验验证

4.1 试验描述

本文离心泵的性能和振动试验在杭州大路实业有限公司的闭合实验台上进行,试验装置示意图如图2所示。由离心泵、电机、进出口管路、进出口压力传感器、流量计、水箱、阀门等部分组成。试验用离心泵型号为HZE80-40-315,参数如表1所示。

图10 试验装置Fig.10 Schematic diagram of experimental apparatus

表1 试验用离心泵型号参数Tab.1 Experimental centrifugal pump model parameters

在离心泵的径向和轴向位置安放振动加速度传感器,这2个测点的振动由B&K传感器采集,如图11所示。试验采用NI公司的PXIe-4497型数据采集仪在离心泵不同运行工况下,对径向和轴向位置的振动信号进行采集,采样频率设置为50 kHz。

图11 加速度传感器安放位置Fig.11 Position of acceleration sensor

试验前,先向闭式试验系统中注水,排出系统内的气体。启动离心泵,通过调节出口管路的电动阀门开度达到控制流量的效果。衡定电机在额定转速,调节电动阀门的开度从小到大依次增加,测定14个工况下离心泵的进出口压差、2个测点的振动信号、电机的实际电流电压。

4.2 工况区划分与特征提取

在物理上,由于湍流和叶片通过事件导致压力分布的变化,从进口到流量的低效率流动可能会造成不同的径向力,因此这里选取径向测点分析。选取离心泵小流量、设计点、大流量三个工况点,分别做其时、频域图,如图12所示。

图12 离心泵不同工况点时、频域图Fig.12 Centrifugal pump time and frequency domain diagram of different working conditions

从图12可知:① 离心泵振动能量随着流量增加而增大;② 在低频段,离心泵设计工况振动能量最小,小流量、大流量的振动能量均较大。这是因为离心泵的振动噪声信号主要由确定性信号、调制信号、噪声信号三种成分组成[15],确定性信号主要由叶轮周期性旋转和机械故障综合作用引起,包含了与旋转频率、叶片通频及相关谐波相对应的频谱内容,通常处于低频带,这种低频信息代表低效流体-动力-结构相互作用,流动效率进一步的分析集中在这一频带。而调制信号是由于叶轮旋转过程中周期性的冲击引起,包含了空化和湍流等流体现象所造成的激励,通常处于高频带;噪声信号来自环境噪声和测量噪声两方面,主要为高斯白噪声。

利用水力学法对测得的试验数据处理,计算离心泵的效率,利用均方根值(root mean square, RMS)计算各个工况低频段的能量,如图13所示。从图13可知,① 离心泵运行在最佳能效点(QBEP)附近时低频段能量较低,在小流量、大流量偏工况区振动能量较高;② 低频段振动信号与离心泵的效率相关,利用低频段振动信号进行偏工况诊断是可行的。设定小于0.8QBEP流量范围为小流量偏工况区,0.8QBEP~1.2QBEP流量范围为正常工况区,大于1.2QBEP流量范围为大流量偏工况区。

图13 离心泵效率与低频段振动RMS值对比Fig.13 Centrifugal pump efficiency and low frequency vibration RMS value comparison

将不同工况下的离心泵的振动信号进行CEEMD处理,以设计工况为例,离心泵设计工况下径向振动信号CEEMD处理后的部分IMF分量及其频率分布图,如图14所示。经过CEEMD信号处理后共得到18个IMF分量,IMF1~IMF18所在的频带依次降低,从上述可知,需要得到振动信号的低频段。因此选择对IMF5~IMF18加和处理。经过工况划分后,三个工况区的工况点数量分布不同,因为为了保证每个工况区的样本均衡性,在对各个工况点进行特征提取后,需要对小流量偏工况区和正常工况区进行降采样处理(见图13)。最后将轴向、径向的振动信号融合,得到后续识别诊断的数据集。

图14 设计工况CEEMD处理部分IMF及其频率分布Fig.14 CEEMD processes part of IMF and its frequency distribution under design conditions

4.3 LSTM模型参数优化

将上述处理得到的离心泵振动数据集等量划分10 000组数据矩阵样本,取4/5组数据作为训练样本,1/5组数据作为测试样本,根据三个能效区所占的工况点数目,将训练样本和测试样本平均分到每个工况点。

LSTM模型中网络结构是首先要考虑的,隐藏层和神经元的数量会很大程度上影响神经网络的性能。本文的问题是利用LSTM做时序振动信号的分类,隐藏层数为1时,可以拟合任何包含一个有限空间到另一个有限空间的映射,满足本文要求,因此设定隐藏层数量为1。隐藏层中使用的神经元太少会导致欠拟合,过多会导致欠拟合,因此需要对其进行优化。在网络迭代过程中,需要应用基于梯度的优化算法更新网络权重,因此优化方法的选用也至为重要。常用的优化方法有SGD、AdaGrad、RMSProp和Adam算法,对比这四种优化算法在不同神经元数量下的测试准确率,如图15所示。设置学习率为0.001,损失函数为交叉熵函数,训练步数为50。

图15 不同优化算法、神经元数量识别结果Fig.15 Identification results of different optimization algorithms and number of neurons

从图15可知,RMSProp、Adam算法的整体效果较好,测试准确率都在95%以上,而SGD、AdaGrad算法效果较差,测试准确率在65%左右。对比RMSProp 和Adam发现,当神经元数量在60~120之间时,Adam算法的测试准确率略高于RMSProp算法,本文采用Adam算法,神经元数量90进行离心泵偏工况诊断。

4.4 诊断结果

将训练样本输入到基于上文优化的LSTM模型中,每一步抓取50个子集输入网络中训练,并且在每一步训练结束之后将得到的网络模型应用于测试集,将识别出的工况类标与正确类标比较,并计算每个子集的正确率与损失,如图16所示。一共进行了100次迭代计算,迭代前期测试准确率逐步上升,最终在98.5%左右保持不变。

图16 离心泵偏工况诊断性能结果Fig.16 Diagnostic performance results of eccentric condition of centrifugal pump

小波分析(WL)是经典的时频分析手段,应用十分广泛,本文将小波分析应用于提取振动信号的低频信息,与EMD、EEMD、CEEMD以及不作任何处理作对比。除此之外,本文采用了双通道信息融合的方式,为了凸显该方式的有效性,将其与单一通道处理进行对比,结果如表2所示。

表2 不同特征提取手段下不同通道信号测试准确率Tab.2 Test accuracy of signals in different channels under different feature extraction methods %

根据表2可知,EMD、EEMD、CEEMD方法对离心泵振动信号做特征提取,对偏工况的诊断识别有显著的帮助,而WL方法处理后跟将振动信号不做任何处理直接输入到LSTM模型训练的效果差别不大,测试准确率并无显著提升,可见EMD、EEMD、CEEMD方法在离心泵偏工况诊断问题中的有效性,以及相对WL方法更加优越。对比EMD、EEMD、CEEMD三种方法,经过CEEMD方法特征提取后的测试准确率最高,EMD方法特征提取后的测试准确率最低,与仿真结果相符。对比双通道与单通道可知,径向测点的振动信号比轴向测点更能反应离心泵不同工况特征;经过双通道振动信号融合后,模型的测试准确率进一步提升,基于CEEMD-LSTM模型的准确率从96.6%提升到了98.5%。综上所述,经过双通道信息融合,采用CEEMD进行特征提取,结合LSTM进行诊断识别,能够高精度地诊断离心泵是否偏工况运行。

5 结 论

本文针对离心泵偏工况状态表征和识别问题,提出了一种基于CEEMD和LSTM的诊断模型。根据效率曲线划分工况区,对不同工况时频分析,采用CEEMD方法进行特征提取,进一步结合LSTM实现了高精度工况识别。通过研究,得出以下结论:

(1) 离心泵的低频段振动信号能够反映其工况状态,在最佳能效点附近振动水平较低,大流量、小流量偏工况区振动水平较强,因此,进一步的工况诊断研究集中在这一频带。

(2) 将测点的振动信号通过CEEMD特征提取后,可以很好的表现离心泵不同工况区的特征,其效果优于EMD、EEMD和WL方法,得到的训练集输入到LSTM中,能够在测试集中取得很好的效果。LSTM模型的优化算法中,RMSProp、Adam的效果优于SGD和AdaGrad。

(3) 径向测点的振动信号相对轴向更能反映离心泵工况特征;双通道振动信号融合后输入到CEEMD-LSTM模型中,测试准确率有进一步的提升。本文模型结合信号预处理、特征提取和工况识别,实现了端到端的离心泵偏工况诊断,可用于关键流程泵的监测。

猜你喜欢

离心泵特征提取准确率
同步定位与建图特征提取和匹配算法研究
基于座头鲸“结节效应”的仿生离心泵空化特性
基于贝叶斯网络的舰船离心泵类系统声学故障诊断方法
基于机器学习的离心泵气液两相压升预测
离心泵后泵腔内液体压力数值分析与验证研究
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究