一种1D-CNN 与多传感器信息融合的液压系统故障诊断方法
2023-05-30陈书辉章猛刘辉张超勇
陈书辉,章猛,刘辉,张超勇
(华中科技大学 数字制造装备与技术国家重点实验室,武汉 430074)
液压系统各个元件与工作介质在封闭的油路中工作,故障发生不直观,排查难度大,诊断困难。液压系统的压力、流量信号具有明显的非线性,伴随外部噪声与振动干扰,其故障特征提取十分困难。液压泵与蓄能器均为液压系统核心零件,直接影响液压系统的健康与性能,因此准确可靠的诊断液压泵和蓄能器状态非常重要。
现有液压系统故障诊断常借鉴机械系统故障诊断模型,例如隐马尔科夫模型[1]、支持向量机[2]等。随着深度学习的发展,BP 神经网络[3]、深度置信网络[4]、卷积神经网络[5]、堆栈自编码[6]等神经网络模型开始大量应用于故障诊断。其中卷积神经网络是一种典型的深度前馈神经网络,主要用于图像处理,进行故障诊断时需要将一维信号转换为二维信号,常用的方法主要有灰度图像[7]、连续小波变换[8]、Hibert-Huang 变换[9]、经验模态分解EEMD[10]等。
传统卷积神经网络一般为二维CNN,Kiranyaz等[11]提出了一种一维CNN 网络,其能有效处理一维信号,直接由神经网络进行数据处理、特征提取、特征选择、状态识别等步骤,完成端到端的的故障诊断,极大简化了故障诊断流程[12],并在故障诊断方面取得良好的效果[13]。 Wu 等[14]使用一维卷积神经网络模型对原始振动信号进行故障诊断,结果显示1D-CNN 的测试准确度达到了99.3%,效果优于传统方法。Wang 等[15]融合了声音与振动信号,结合1D-CNN 诊断轴承故障,该方法的诊断准确率可达99.85%。 Wang等[16]提出一种多传感器数据融合的CNN 模型对旋转机械故障进行诊断,对风电试验台和离心泵的诊断结果分别为99.47%和97.32%,表明模型具有更高的识别精度和更快的收敛速度。Huang 等[17]使用多尺度卷积神经网络对轴承进行故障诊断,结果表明多尺度的卷积核可以提取更多的故障特征,提高诊断精度。
与轴承、齿轮等转子系统相比,液压系统中传感器信息数量较多,其中压力与流量信号是液压系统的特有信号,还有噪声、温度、振动等辅助信号,需要综合考虑多传感器信息诊断[18-19]。本文提出了一种多尺度一维卷积神经网络与多传感器信息融合的故障诊断模型,对蓄能器与液压泵进行故障诊断。在提出方法中,采用多尺度卷积核提取不同维度的故障特征,用多传感器信息融合方法提高诊断精度,使用Softmax 进行状态识别。通过实验验证和比较,验证提出模型的优越性。
1 一维卷积神经网络
卷积神经网络(CNN)通常由输入层、卷积层、池化层、全连接层和输出层5 个模块组成。一维卷积神经网络(1D-CNN)结构如图1 所示。
图1 1D-CNN 结构图
卷积层通过卷积核对上一层输出进行卷积运算,实现特征提取与降维,表达式为
激活函数对输入值执行非线性变换,增强神经网络的非线性。本文采用ReLU 作为激活函数,即
式中:x为输入值;f(x)为激活值。
池化层旨在降低特征面的分辨率,对数据进行采样操作可以减少参数量,提高计算速度,通常使用最大池化层,其模型为
全连接层不再提取特征,而是对提取的特征进行组合,然后映射至样本标记空间,结合Softmax 分类器实现分类结果的输出,分类过程为
式中:yj为 样本的分类值;zj为第j个神经元的节点值;M为类别总数。
2 深度神经网络
2.1 多尺度卷积神经网络
一般的卷积神经网络在提取故障特征时,使用单一大小的卷积核,有可能会遗漏局部重要特征,导致模型准确度低,泛化性能差。因此本文基于CNN的基本原理,提出了多尺度一维卷积神经网络(Multi scale one dimensional convolutional neural network,MS1D-CNN)模型,结构图如图2 所示。传感器信号预处理之后输入卷积神经网络,第一层卷积层使用大卷积核获取较大的特征接受域,可以作为低频滤波器,捕捉低频特征的同时抑制高频噪声。第一层卷积之后使用多尺度分支并行提取特征,将信号分为3 个分支,利用3 个不同尺寸的卷积核进行卷积操作,不同的滤波器获取信号不同频段的故障特征,实现提高模型预测精度,每个分支都有两层卷积层和两层池化层;提取特征后将3 种特征展平,并输入全连接层并进行分类。
图2 MS1D-CNN 模型结构图
2.2 多传感器信息融合
多传感器信息融合(Multi sensor information fusion,MSIF)是将不同传感器获取的信息,通过某种方法融合在一起进行综合分析,以获得更准确的状态识别。与单传感器相比,多传感器系统的准确度、容错能力均有较大提升。本文基于MS1D-CNN神经网络实现多传感器数据的特征层融合,提出了多尺度一维卷积神经网络与多传感器信息融合的深度神经网络模型(MS1D-CNN-MSIF),其结构图如图3 所示。
图3 MS1D-CNN-MSIF 模型结构图
3 个传感器信号并行处理,首先通过MS1D-CNN卷积模块提取特征,3 个模块共9 个分支的特征数据展平后汇聚到全连接层,然后通过Softmax 进行分类,得出最终的诊断结果。
3 实验验证与分析
本文实验数据来自德国萨尔布吕肯机电一体化和自动化技术中心的液压系统状态监测数据集[20],液压试验台示意图如图4 所示,系统以60 s 为周期进行恒定负载循环,通过压力PS、流量FS 等传感器测量系统状态。蓄能器和液压泵实验验证分析如下。
图4 液压试验台示意图
3.1 蓄能器实验验证分析
本文对蓄能器的压力状态进行识别,选用3 个压力传感器信号(PS1、PS2、PS3)进行分析,压力传感器采样频率为100 Hz,单个样本数据宽度为6 000。蓄能器的样本数据如表1 所示。
表1 蓄能器样本数据
3.1.1 模型训练与参数
诊断蓄能器的3 个传感器数据宽度相同,因此MS1D-CNN 卷积模块采用相同的参数设置。模型中第一层卷积采用16 个64 × 1 的卷积核,移动步长为12 × 1。多尺度卷积模块分为3 个支路,每个支路上的两层卷积与两层池化层参数相同,其中卷积核大小均为3/7/11 × 1,移动步长均为2 × 1,第二层卷积核数量为32,第三层卷积核数量为64;池化层采用最大池化层,池化区域大小均为4 × 1。模型中所有卷积层均采用ReLU 激活函数,填充方式均为same。全连接层神经元数量为128,dropout 参数设置为0.5,Softmax 层的输出神经元数量为4,对应蓄能器几种压力状态。
算法流程图如图5 所示,模型训练参数为:训练批处理大小为100,总训练轮数eochs 为500;损失函数采用交叉熵损失函数;使用Adam 优化算法,学习率设为0.002;为防止过拟合,设置提前停止法,并保存最优模型。
图5 算法流程图
3.1.2 模型训练与参数实验结果分析
训练过程中,模型在训练集与测试集上的损失值与准确率如图6 所示,模型训练150 代左右终止。由图可知,在迭代过程中,随着迭代次数的增加,精度曲线均呈上升趋势,损失值曲线均呈下降趋势,模型性能越来越好。经过多轮迭代之后,模型在训练集上的损失最终趋近于零,识别准确率也达到100%。在测试集上,模型的损失值逐渐下降,然后保持波动状态;识别准确率则由最初的40%迅速提高而后逐渐稳定下来,训练过程中的最高识别准确率为99.50%,约在75 代左右。
图6 蓄能器诊断实验训练过程中模型的损失值与准确率
测试结果的混淆矩阵如图7 所示,矩阵网格上的数值分别代表每一类样本中预测正确的数量以及所占比例。由图可知,在最佳压力与接近失效类别的预测中,正确预测达到100 个,所占比例为100%;轻微减压与严重减压类别的预测中,正确预测99 个,占比99.0%;测试样本集总的预测正确率为99.50%,从测试的结果来看本文模型可以有效识别出蓄能器的4 种压力状态。
图7 蓄能器诊断混淆矩阵
为更加直观的研究蓄能器状态在神经网络每一层中分类效果,采用t-分布随机近邻嵌入(t-SNE)算法对原始信号、多尺度卷积输出信号、多传感器融合信号、全连接层输出信号、模型输出信号进行二维可视化,如图8 所示。
图8 t-SNE 降维可视化
图8a)~图8c)为传感器原始信号,原始信号特征混杂,蓄能器各个状态分散且混合在一起,难以区分。图8d)~图8f)为单传感器信号经过多尺度卷积之后的输出信号,对比原始信号,多尺度卷积输出信号开始聚集,可分性明显增强。图8g)为3 个传感器融合输出信号,大部分区域的信号已经分离并聚合在一起,仅有局部区域信号点混杂,可分性进一步增强。图8h)为模型全连接层的输出信号,蓄能器的各个特征已基本分离并聚合,达到了线性可分的效果。图8i)为模型最终输出信号,相比于全连接层输出信号,最终输出信号中蓄能器4 类状态达到最佳聚集效果,有了明显的线性分界线。
3.1.3 模型效果对比
选取一维卷积神经网络(1D-CNN)、多尺度一维卷积神经网络(MS1D-CNN)、极限学习机(ELM)、支持向量机(SVM)、堆栈稀疏自编码器(SSAE)进行对比实验。1D-CNN、MS1D-CNN 模型参数与训练参数与本文模型一致;同时,选择文献[9]中的ELM、SVM、SSAE 的模型与本文模型进行对比。每种模型进行10 次测试,取平均值进行对比,对比结果如表2 所示。可以看出,本文MS1D-CNN-MSIF模型的平均识别准确率可达99.20%,明显高于ELM、SVM、SSAE 模型,证明本文模型对蓄能器状态识别的有效性。从1D-CNN到MS1D-CNN 模型,3 个传感器的准确率分别提升了2% ~ 6%不等,显示多尺度卷积策略能有效提高故障诊断的准确率。本文MS1D-CNN-MSIF 模型得出的识别准确率高于3 种MS1D-CNN 单传感器模型,表明多传感器信息融合策略有助于提升识别准确率。
表2 蓄能器章台识别结果对比
3.2 液压泵实验验证与分析
本文对液压泵的泄漏状态进行识别,使用两个压力传感器信号(PS2、PS3)与一个流量传感器信号(FS1)进行分析,流量传感器采样频率为10 Hz,单个样本数据宽度为600。液压泵的样本数据如表3所示。
表3 液压泵样本数据
3.2.1 模型训练与参数
诊断液压泵的数据来自两种传感器数据,其中压力传感器(PS2、PS3)对应的MS1D-CNN 卷积模块参数设置与上文蓄能器模型对应的模块参数完全一致;流量传感器(FS1)对应的MS1D-CNN 卷积模块参数大部分与上文蓄能器模型相同,不同之处在于由于数据宽度不同,第一层卷积层的移动步长减小为6,第二与第三层卷积层移动步长减小为1。此外全连接层、dropout 层参数与上文蓄能器模型一致,但Softmax 层的输出神经元数量为3,对应液压泵的3 种泄漏状态。
模型训练参数与上文蓄能器模型一致,算法流程相同。划分测试样本时每一类液压泵状态均随机选择125 个样本作为测试集,约占30%。
3.2.2 实验结果分析
训练过程中,模型在训练集与测试集上的损失值与准确率如图9 所示。模型训练70 代左右就提前停止,相比于蓄能器诊断,液压泵状态的识别速度更快,识别效果更好。由图可知,在20 代左右模型在训练集与验证集上的准确率就接近1,损失值趋近于0,证明了本文模型良好的故障诊断能力。模型在测试集上的识别准确率在40 代左右达到最大值,为100%,此后一直稳定在99.73%左右。
图9 液压泵诊断实验训练过程中模型的损失值与准确率
测试结果的混淆矩阵如图10 所示。由图可知,在轻微泄漏与严重泄漏类别中,模型的识别正确率均为100,无泄漏类别中正确预测124 个,所占比例为99.2%;测试样本集总的预测正确率为99.73%,从测试的结果来看,本文模型可以有效识别出液压泵的3 种泄漏状态。
图10 液压泵诊断混淆矩阵
为更直观的分析本文模型分类效果,采用t-分布随机近邻嵌入(t-SNE)算法对原始信号、多尺度卷积输出信号、多传感器融合信号、全连接层输出信号、模型输出信号进行二维可视化,如图11 所示。
图11 t-SNE 降维可视化
图11a)~图11c)分别为PS2、PS3、FS1 传感器原始信号,图11d)~图11f)为单传感器信号经过多尺度卷积之后PS2、PS3、FS1 的输出信号,图11g)为3 个传感器融合输出信号,图11h)为模型全连接层的输出信号,图11i)为模型最终输出信号。可以看出,传感器原始信号特征混杂,液压泵各状态难以区分;经多尺度卷积模块提取特征之后,液压泵状态信号开始聚集,可分性明显增强;再经传感器信号融合之后,多数区域的信号已经分离并聚合;到模型全连接层,液压泵各状态已经完全分离并聚合,基本达到了线性可分的效果;最终输出信号中3 类数据达到最佳聚集效果,有了明显的线性分界线。
3.2.3 模型效果对比
为验证本文模型对液压泵的识别效果,选取一维卷积神经网络(1D-CNN)、多尺度一维卷积神经网络(MS1D-CNN)、极限学习机(ELM)、支持向量机(SVM)、长短期记忆网络(LSTM)、堆栈稀疏自编码器(SSAE)、深度置信网络(DBN)做对比实验。1D-CNN、MS1D-CNN 模型来自本文模型;由于文献[6]与文献[4]的诊断数据与诊断对象与本文一致,因此选择文献[6]中的ELM、SVM、SSAE 的模型以及DBN 模型与本文的模型进行了对比。每种模型进行10 次实验,取平均值进行对比,对比的结果如表4 所示。
表4 液压泵状态识别结果对比
可以看出,本文MS1D-CNN-MSIF 模型的平均识别准确率可达99.79%,明显高于ELM、SVM、SSAE、DBN 模型,证明了本文模型对液压泵状态的优秀识别效果。从1D-CNN 到MS1-DCNN 模型,3 个传感器的准确率分别提升了1% ~ 3%,MS1D-CNN-MSIF模型得出的准确率要高于3 种MS1D-CNN 单传感器模型,进一步证明了多尺度卷积策略、多传感器信息融合策略有助于提高故障诊断准确率。
4 结论
1)MS1D-CNN-MSIF 模型为端到端的故障诊断模型,适合处理一维时序信号,无须复杂的特征提取与选择等操作,诊断方法简单便捷,解决了液压系统难以诊断的问题。
2)使用多尺度卷积策略提取传感器信号不同频率的故障特征,模型的诊断精度较单尺度卷积更高。
3)使用多传感器信息融合策略实现了多传感器数据的特征层融合,模型的诊断精度较单传感器诊断更高。
4)对比ELM、SVM、SSAE、DBN 等模型,本文提出模型对蓄能器与液压泵的故障诊断具有更好的效果。