基于CUM3-CNN的柴油机高压油路故障诊断
2023-02-22梅检民赵慧敏王双朋
常 春, 梅检民, 赵慧敏, 沈 虹, 王双朋
(陆军军事交通学院,天津 300161)
柴油机作为重要的动力源,快速、准确诊断其故障具有重要意义。振动信号中蕴含了丰富的故障信息,以其不解体、易采集等优点,越来越广泛的被应用于故障诊断。但柴油机机构复杂、振源多样,并且振动信号大多是非平稳和非高斯信号,淹没在各种高斯噪声和干扰中,利用传统的二阶统计量(功率谱、自相关等)分析方法,很难达到理想的效果[1]。高阶累积量具有对高斯有色噪声恒为零的特点,理论上可以完全消除高斯噪声的影响,因而可以用于提取高斯有色噪声中的非高斯信号[2]。蔡剑华等提出了由信号高阶谱恢复功率谱的方法,提取滚动轴承故障特征,但是该方法计算量大耗时长,不便于应用于实时监测。沈虹等[3]利用角域四阶量切片谱方法提取连杆轴承故障特征,虽然通过重采样的办法,克服了非平稳信号对角切片与非对角切片不相等的问题,但是对于对角线以外的信息不能有效的反映。任金成等[4-5]分别提取振动信号时频分布图和三阶累积量图的灰度共生矩阵图像纹理特征来诊断柴油机故障,取得了一定的效果,但是这些方法要从图像中再次提取特征用于分类识别,计算繁琐且易遗漏有效信息,影响了故障诊断的准确率。
卷积神经网络(convolutional neural network,CNN)专门用来处理图像等具有类似网格结构的数据,具有自动提取抽象特征的能力,避免人工提取特征的片面性[6],目前已经应用到机械故障诊断领域,并取得了一定的效果。吴春志等[7-8]将一维卷积神经网络应用于齿轮箱故障诊断,直接以振动信号作为输入,实现故障诊断,但缺乏对原始振动信号进行噪声抑制,对低信噪比振动信号的故障诊断效果还需进一步研究。李恒等[9]将短时傅里叶变换(short-time Fourier transform,STFT)时频图与卷积神经网络相结合,袁建虎等[10-12]将不同的小波变换(wavelet transform,WT)时频图与卷积神经网络结合实现机械故障诊断,但因时频图本身没有噪声抑制能力,图像识别率容易受到图像质量好坏的影响。
针对上述问题,本文提出了一种利用卷积神经网络识别振动信号三阶累积量(third-order cumulant,CUM3)灰度图的柴油机故障诊断方法。利用三阶累积量抑制高斯噪声的先天特点,采用三阶累积量对缸盖振动信号进行分析,生成抑制噪声后的灰度图像,作为卷积神经网络的输入,用具有动量的随机梯度下降优化算法和学习率退火方法训练卷积神经网络,通过遗传算法优化训练参数,用训练好的网络对柴油机高压油路的5种工况进行故障诊断,取得了良好的效果。
1 基于CUM3-CNN的故障诊断原理
1.1 三阶累积量及其噪声抑制原理
设x(t)为零均值的随机信号,其三阶累积量可表示为
(1)
式中:τ1,τ2为滞后量;E{·}为数学期望。
设随机变量x服从高斯分布N(0,σ2),则x的概率密度函数为
(2)
从而得到x的矩函数为
(3)
则x的第二特征函数为
(4)
利用累积量ck与Ψ(ω)的关系式
ck=(-j)kΨk(0)
(5)
式中,ck为随机变量x的k阶累积量,可以得到随机变量x的各阶累积量为
c1=0,c2=σ2,ck=0,k>2
根据以上推导可以得出,任意一个零均值的高斯随机过程,其高阶(三阶及以上)累积量恒为零。因此,对于信号中的加性高斯噪声,通过三阶累积量的计算,可以完全抑制噪声的影响。
1.2 卷积神经网络
卷积神经网络是一种带有卷积结构的多层监督学习神经网络,它使用卷积运算代替一般的矩阵乘法。该网络采用梯度下降法对网络中的权重参数反向调节,通过不断的训练迭代提高网络的精度。一个卷积神经网络主要由输入层、卷积层、归一化层、修正线性单元(ReLU)、池化层、Dropout层、全连接层和softmax层等组成。其结构如图1所示。
图1 卷积神经网络结构图
1.2.1 输入层
输入层是整个网络的输入,对于图像输入它是一个像素矩阵,一般黑白图片深度为1,彩色图片深度为3。
1.2.2 卷积层
卷积层通过卷积核与像素矩阵卷积,得到特征图,卷积核会有规律的移动,与输入特征做矩阵乘法求和并叠加偏差量
Zl+1(i,j)=[Zl⊗wl+1](i,j)+b=
(6)
1.2.3 修正线性单元
修正线性单元(rectified linear unit, ReLU)是一个非常简单的非线性激活函数,可表示为
yReLU(x)=max(0,x)
(7)
其导数可表示为
(8)
在正数区间ReLU的导数为1,且不会饱和,使用ReLU得到梯度下降的收敛速度要比使用sigmoid或tanh函数时快得多,能有效的避免梯度消失[13]。
1.2.4 池化层
池化层对得到的特征图进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为相邻区域的特征图统计量。池化层选取的池化区域由池化大小、步长和填充控制。
Lp池化是受视觉皮层内阶层结构启发而建立的池化模型。其表达式如下
(9)
式中:f为卷积核大小;s0为卷积步长;p为预指定参数。当p=1时,Lp池化在区域内取均值,被称为均值池化;当p→∞时,Lp池化在区域内取极大值,被称为最大池化[6]。
1.2.5 Dropout层
Dropout可以通过直接修改神经网络结构提高网络的泛化能力。在进行神经网络训练时,每一次迭代,随机删除固定比例(Dropout率p)的隐藏层单元,构建新的网络,用以上方法重复迭代直至训练结束。通过这种方法可以减少神经元之间的依赖性,从而提高网络的泛化能力[14]。
1.2.6 全连接层
全连接层中的神经元与前一层的所有神经元相连接,整合卷积层或池化层中具有类别区分性的局部信息,以识别较大的模式。最后一个全连接层将特征组合在一起来对图像进行分类。
1.2.7 softmax层
softmax激活函数对全连接层的输出进行归一化。softmax层的输出由总和为1的多个正数组成,它代表输入样例所属种类的概率分布。
1.3 基于CUM3-CNN的故障诊断方法
本文充分利用三阶累积量对高斯噪声的抗噪能力和卷积神经网络自动提取抽象特征的能力,对振动信号进行三阶累积量计算并生成灰度图像,作为卷积神经网络的输入;用小批量随机的方法划分训练样本,采用具有动量的随机梯度下降算法和学习率退火方法训练卷积神经网络,通过遗传算法优化训练参数,从而提高网络的收敛效果和计算效率,形成准确、高效的智能故障诊断方法,具体计算流程如图2所示。
图2 基于CUM3-CNN的故障诊断流程图
2 试验设置与数据采集
2.1 试验设置
试验对象为潍柴WD615.71Q-1型六缸柴油机。在柴油机的第6缸缸盖上侧和左侧分别安装振动传感器,采集柴油机的缸盖振动信号,同步测取柴油机转速信号,传感器安装位置如图3所示。
(a) 振动加速度传感器
上位机为NI PXIe-1078计算机,采用PXIe-4499声音振动采集卡采集振动信号,采用PXIe-6361数采卡同步采集转速信号;振动传感器为PCB M603C01振动加速度传感器,转速信号为霍尔传感器,试验装置示意图,如图4所示。
图4 试验装置示意图
2.2 数据采集与分析
试验时,柴油机转速分别为800 r/min,1 000 r/min,1 200 r/min,1 400 r/min,1 600 r/min,1 800 r/min,对第6缸高压油路设置了正常、漏油、断油、喷油器压力高和喷油器压力低5种技术状态,同步采集柴油机空载运转时的缸盖振动信号和转速信号,各通道采样频率为65.5 kHz,采样点数为131 072点。试验工况如表1所示。
表1 柴油机试验工况表
图5为柴油机在转速1 000 r/min时不同技术状态下一个工作循环的缸盖上侧振动信号时域图和功率谱。从时域图中可以看出,仅图5(e)断油工况的振动信号在0 CA°左右的幅值稍小于其他工况,时域图无法分辨各个工况;从功率谱图来看,各工况振动信号的能量都集中在5 kHz附近,幅值区别不明显且没有规律,说明功率谱也不能有效分辨各个工况。因此,从原始信号的时域和频域,很难提取出区别不同工况的故障特征。
(a) 正常时域图
根据式(1),对柴油机在转速1 000 r/min时不同技术状态下一个工作循环的缸盖上侧振动信号进行三阶累积量分析,取其滞后量为-50≤τ1,τ2≤50,将结果归一化到0~1的灰度值内。结果如图6所示。
(a) 正常
从图6中可以看出,不同工况三阶累积量的分布和灰度值有所不同,正常状态下,其振动信号的三阶累积量分布较为集中且能量较大,随着燃烧情况的变化,三阶累积量的分布也越来越分散,在断油工况下其分布最为分散,虽然通过人为观察,能在一定程度上发现不同工况下的微弱差别,说明三阶累积量能有效抑制信号中的噪声干扰,突出信号中的有效特征。但不同信号的特征不同,人为观察效率低、主观影响大,要提供故障诊断的效率和精度,需要自动提取特征并能智能识别故障的方法。
3 基于CUM3-CNN的故障诊断
3.1 数据集建立
将一个工作循环缸盖上侧振动信号的三阶累积量灰度图作为一个样本,对5种工况下的每个转速分别取60组样本,每种工况组成360个样本的数据集,从中取240个样本作为训练集,其余120个样本作为测试集。数据集的划分情况如表2所示。
表2 数据集划分情况
3.2 卷积神经网络构建
本文所用卷积神经网络模型,如表3所示。输入图像为101×101大小的灰度图像;卷积层设置4个3×3大小的卷积核,步长为1;在卷积层之后使用批量归一化层,来加速网络训练并降低对网络初始化的敏感度;批量归一化层后接一个非线性激活函数——修正线性单元(ReLU);池化层采用最大池化层,核大小为2×2,步长为2;之后连接一个Dropout层,其Dropout率用参数p表示,全连接层输出为5,通过softmax层输出5种分类的概率。
表3 卷积神经网络参数
3.3 卷积神经网络训练
本文采用具有动量的随机梯度下降优化算法(stochastic gradient descent with momentum,SGDM)训练卷积神经网络,学习速率采用退火的方法动态调节,将学习速率乘以一个小于1的系数,每10轮减小一次学习率。为了降低计算成本,用随机小批量的方法划分训练样本,批量大小为32,每次用一个小批量来训练网络,完成整个训练数据集所有批量的训练为一轮完整训练周期,最大的训练轮数为20轮,每轮训练都会打乱数据,并在每轮训练结束计算基于验证数据集的准确度,验证数据不用于更新网络权重。
网络有3个重要的超参数需要调节,分别是初始学习速率r、学习速率退火系数f和Dropout率p。为了提高模型的精度,降低泛化误差,本文采用遗传算法优化训练参数。遗传算法个体数目取10,最大进化代数50代,交叉概率取0.4,变异概率取0.2,以网络对原测试集和分别混有-3 dB,0,3 dB噪声的测试集的验证误差平均值作为适应度函数,其适应度曲线如图7所示。
图7 适应度曲线
经过50代进化,最终进化出的最优参数组合为:初始学习速率r=0.004 5、学习速率退火系数f=0.688 5和Dropout率p=0.468 9。
3.4 结果分析
采用训练集对本文提出的方法(CUM3-CNN)训练,并通过测试集检验训练后模型的准确率,训练进度如图8所示。从图8中可以看出,经过两轮的训练,模型的验证准确度就达到了95%以上,20轮训练过后,最终的训练准确度和验证准确度都达到了99.5%,表明该方法收敛速度快、泛化能力强。
图8 训练进度图
缸体上侧信号和缸盖左侧振动信号训练网络模型对5种工况的最终验证准确度如表4所示。
表4 不同部位采集信号的最终验证准确度
从表4可以看出,对每个工况的60组测试集数据,CUM3-CNN方法具有较高的准确率,缸盖上侧信号比缸盖左侧信号的准确率更高,说明缸盖上侧振动信号对5种工况蕴藏的故障特征更加敏感,更适合用来进行故障诊断;缸盖上侧振动信号的CUM3-CNN方法能准确区分传统方法难以分辨的5种工况,并且保持了较高的计算效率,实现了柴油机多故障工况的准确、高效故障诊断。
3.5 对比分析
为了检验本文方法的故障诊断性能,分别对比了本文所提出的CUM3-CNN方法和吴春志等和周奇才等所用的1D-CNN方法、李恒等所用的STFT-CNN方法、袁建虎等、陈仁祥等、卓德兵等所用的WT-CNN方法在原测试集和噪声环境下的故障诊断准确率,验证本方法的有效性。
3.5.1 不同方法的故障诊断性能对比
用不同的方法对原始信号生成尺寸相同的灰度图数据集,训练集和测试集都按照表1进行划分,所用的卷积神经网络结构和训练参数完全相同,对比4种方法故障诊断性能,各方法在其对应的测试集的验证准确度如图9所示。
图9 不同方法的验证准确度对比
从图9中可以看出,CUM3-CNN方法的收敛速度比1D-CNN方法、STFT-CNN方法和WT-CNN方法都要快。表5列出了不同方法在各自对应测试集的最终验证准确度和训练时间。
表5 不同方法的最终验证准确度和训练时间对比
从表5可以看出,CUM3-CNN方法的最终验证准确度为99.50%,比1D-CNN方法(90.67%)、STFT-CNN方法(96.17%)和WT-CNN方法(97.50%)的最终验证准确度高。以上结果说明,CUM3-CNN方法比STFT-CNN方法和WT-CNN方法用于柴油机故障诊断的准确率更高。
3.5.2 噪声环境下的故障诊断性能对比
在实际诊断过程中,所采集到的信号中难免会受到噪声的干扰。为了验证噪声环境下上述3种方法的故障诊断性能,在测试集中加入信噪比为-5~5 dB的高斯白噪声,分别用不同的方法生成灰度图数据集,输入到3.5.1节中训练好的对应的卷积神经网络,各方法在噪声环境下的故障诊断准确度如图10和表6所示。
图10 不同方法在噪声环境下的故障诊断性能对比
表6 不同方法在噪声环境下的故障诊断准确度对比
从图10中可以看出,在噪声环境下CUM3-CNN方法的故障诊断性能明显优于1D-CNN方法、STFT-CNN方法和WT-CNN方法。从表5中可以看出,随着信噪比的提高CUM3-CNN方法、1D-CNN方法和STFT-CNN方法的故障诊断性能也总体在提高,CUM3-CNN方法的故障诊断准确度在83%~99%,1D-CNN方法的故障诊断准确度在23.17%~63.50%,而STFT-CNN方法的故障诊断准确度不足50.00%,WT-CNN方法的故障诊断准确度只有20.00%左右。以上结果说明,CUM3-CNN方法有良好的噪声抑制能力,在噪声环境下用于柴油机故障诊断,诊断准确度明显高于1D-CNN方法、STFT-CNN方法和WT-CNN方法。
4 结 论
(1) 本文采用随机小批量方法划分训练样本,用SGDM算法和学习率退火方法训练CUM3-CNN方法,通过遗传算法优化训练参数,提高了模型的诊断精度和泛化能力。
(2) 缸盖上侧振动信号比缸盖左侧振动信号更适合用于柴油机高压油路故障诊断。
(3) CUM3-CNN方法有良好的噪声抑制能力,在柴油机故障诊断的应用中比1D-CNN方法、STFT-CNN方法和WT-CNN方法的诊断准确率更高,特别是在噪声环境下有明显的性能优势。