深度可分离卷积神经网络轴承剩余寿命预测

2022-12-30步伟顺唐苑寿刘国威

机械设计与制造 2022年12期

步伟顺，姚磊，唐苑寿，刘国威

（济南重工集团有限公司，山东济南 250000）

1 引言

工业互联网技术广泛应用于机械设备的健康检测与管理。在设备运行的过程中，传感器采集到海量数据对机械设备剩余寿命的预测带来了新的机遇与巨大挑战。随着机械系统复杂程度不断提高，建立精确的数学或物理预测模型已经不太可能。准确地建立相应的RUL预测模型，越来越成为研究的现实需要。

传统的数据驱动RUL 预测包括四个主要过程：（1）数据获取；（2）特征提取和选择；（3）退化行为学习；（4）RUL估计。利用传感器监测获取数据并进行特征提取，提取的特征有些对退化特征不敏感，甚至不能为RUL提供有用信息。如，文献[1]对轮齿裂缝的退化状态采用均方根等信息，文献[2]用卷积神经网络自适应构建HI。文献[3]分析利用混沌原理进行故障特征重构；文献[4]智能方法故障诊断，文献[5]利用CNN和BP神经网络自适应构建模型。这些方法主要缺点如下：（1）人工构造特征不稳定；（2）模型复杂度较高；（3）与卷积神经网络为代表的深度学习方法学习能力方面存在差距。

综合研究分析，拟提出一种新的深度可分卷积神经网络（DSCNN轴承剩余寿命预测方法。引入可分离卷积层、压缩激励（SE）单元，创立可分离卷积构建块。基于多个可分离的卷积构建块叠加，从原始输入数据中自动学习高维表示。通过将学习到的表示输入最后一个完全连接层来估计RUL。可分离卷积引入机械系统预测中，不仅有效地模拟了不同传感器数据之间的相互关系，而且大大减小了预测网络的宽度与深度，提高了预测网络模型预测的精确性与准确性。

2 神经网络介绍

2.1 可分卷积神经网络

标准卷积在卷积的过程中，存在在卷积的深度过程中参数量无限的放大，增加计算量与时间。深度可分离卷积卷积神经网络提出了一种新的思路：对于不同的输入通道采取不同的卷积核进行卷积，卷积过程分成两个过程：深度卷积（Depthwise）过程和点卷积过程（Pointwise）；卷积过程，如图1所示。深度卷积，如图1（a）所示。逐点卷积，两者合起来就是深度可分离卷积，如图1（b）所示。深度卷积负责滤波，特征信息为（A，A，1）；输入通道特征映射。逐点卷积转换通道，特征信息为（1，1，D），深度卷积的输出特征映射。深度卷积参数量为（A×A×1）×D，逐点卷积参数量为（1×1×D）×F，即深度可分离卷积参数量为：A×A×D+D×F；深度可分离卷积参数与标准卷积参数之比为：

图1 标准卷积和深度卷积Fig.1 Standard and Deep Convolutions

（A×A×D+D×F）∕（A×A×D×F）=1∕F+1∕A2

深度网络一般迭代次数较多，1∕E数值较小，深度可分离卷积参数缩小比例取决于卷积核信息量的大小。经过推算可知，卷积核3×3×1具有较好的效果。

2.2 信息特征响应自动调节

可分离卷积网络特征信息，映射过程中包含不同权重的价值信息。为了突出权重价值信息较大的映射，过滤掉权重价值信息无用映射。可分离卷积层后面设计压缩激励单元，该压缩激励单元能通过评估每个通道的映射权重自动调节响应。信息特征响应调节过程包括压缩和激励两个步骤如下：

（1）压缩操作将可分离卷积层的所有输出信道的全局信息通过使用全局平均池化来缩小卷积输出嵌入到信道描述符中，信息过程描述为下式计算：

整个响应调节架构通过研究设计如下：一个全局池化层、两个全连接层、一个通道乘法层组成。全连接层包括D∕t个神经元的缩减层和具有C个神经元的维度增加层对自动响应机制进行参数化。最后，通过将可分离卷积的特征映射与相应的信道权值进行信道相乘，得到信息特征校准的映射。

3 深度可分卷积网络架构

整个网络架构分离为学习子网和寿命估计子网。网络架构如图2所示。学习子网利用可分离卷积层卷积不同传感器输入数据尺寸H×1×D，信道卷积核大小设

图2 可分卷积网络架构Fig.2 Dividable Convolutional Network Karchitecture

置为A×1，点卷积核的数量即输出信道数量设置为D。采用平均池化层进行参数采样，池大小p等于步长s，学习到的低层映射输出给可分离卷积设计单元获得更高的映射特征，两个可分离卷积层的参数设置一致，即每个信道级卷积核尺寸A×1大小，并且每个可分离卷积层中包含总共2dN个点卷积核。平均池化采用非重叠窗口，设计成p=s，并且兼顾模型预测精度与计算效率，SE单元中的维数减少率T设置为16。

剩余寿命估计子网利用全局平均池化层从表示学习子网接收高维表示，最后第D个可分离卷积设计单元的2DN个输入特征映射转换为2DN大小的向量。通过全局平均池化实现降维与减少参数总数。通过利用全连接层作为DSCN 的输出层来实现RUL估计。

4 实例验证

4.1 数据来源

实验数据为滚动轴承加速寿命台架试验采集的振动加速度数据，它来源于IEEE 2012年的PHM数据挑战赛[6]。数据集包含3种工况条件，17个滚动轴承的全生命周期振动数据。使用加速度传感器采集垂直和水平方向的振动加速度。数据采样间隔为10s，采样率为25.6kHz，持续时间为0.1s；因此，每条采集数据包含2560数据点，共2803条采集数据。描绘了工况一条件下的水平振动信号信息，如图3所示。工况一与工况二各有8和6个数据集，4和2个数据集作为训练数据集；工况三有3个数据集，都作为测试数据集。采集水平和垂直振动信号作为DSCNN的输入。

图3 原始振动信号Fig.3 Original Vibration Signal

在DSCNN网络模型中，首先设计超参数包括信道卷积核大小A×1、点卷积核数目D、池化大小p、SE单元的降维比例t和可分离卷积设计单元数目N。为了得到可靠稳定模型与预测精度，通过对训练数据集进行10折交叉验证来设计参数。设计时间单元长度为6，处理归一化振动信号。时间信息单元将连续采样时间点处获得的振动信号映射成高维向量，然后将该向量作为映射输入DSCN中，包含7175680个数据点，输入量大小为43054080×1×2。模型训练过程中损失函数采用均方误差（MSE），利用优化器迭代更新网络权值和偏差，使MSE损失函数最小化。

4.2 结果验证

时间单元大小的增加使得RUL预测更加准确，同时减少了RUL估计值的波动，网络模型深度和宽度设置平衡了精度和计算时间。标准卷积、可分卷积预测网络具有与DSCNN相同的架构和超参数设置。与标准卷积相比，可分离卷积减小了82%模型参数，从而降低了计算成本；与可分离卷积相比，压缩激励单元的引入只增加了5%的参数具体，如表1所示。可分卷积与深度可分卷积预测网络模型的性能估计结果，如图4、图5所示。通过充分分离时间相关性和跨通道相关性，DSCNN在精度和计算复杂度方面优势非常明显。

表1 模型参数对比Tab.1 Comparison of Model Parameters

图4 可分卷积模型预测结果Fig.4 Separable Convolution Model Prediction Results

图5 深度可分卷积模型预测结果Fig.5 Prediction Results of Deep Separable Convolution Model

4.3 结果分析

分析四种现有常用预测方法用来预测所测试轴承的剩余使用寿命。五种模型的剩余寿命预测，如图6 所示。分析结果可知。深度学习模型DBN、CNN、LSTM和DSCN明显优于传统的机器模型支持向量机SVM，深度学习网络模型对轴承退化特征信息表征能力较强，能够更好地挖掘有价值的轴承退化信息，建立更准确的RUL预测模型。此外，设计的DSCNN在所有深度预测模型中获得较高的预测精度，这表明DSCNN能提供最准确的RUL估计结果。因此，提出的DSCNN方法在轴承剩余寿命预测方面优于其他四种预测方法。所提出的DSCNN 具有较高的RUL 预测精度，优于传统的数据驱动方法和典型的深度学习模型。

图6 模型预测对比Fig.6 Comparison of Model Predictions

5 结论

（1）DSCNN 与传统的方法对比，DSCNN 直接利用原始多传感器数据作为输入，避免了人工特征提取所需的先验知识和专业知识，减少了人工参与环节，提高了寿命预测精度。（2）改进DSCNN结构充分分离时间相关性和跨通道相关性，捕捉不同传感器数据故障在不同部件之间的传播和相互作用，减少了训练模型数据，提高精度。（3）引入信息特征响应自动调节单元，对数据映射所需超参数减少，减少计算机利用空间，提高计算效率。