APP下载

改进的CNN-LSTM轴承故障诊断方法

2021-04-19汪友明

西安邮电大学学报 2021年1期
关键词:轴承卷积故障诊断

汪友明,程 琳

(西安邮电大学 自动化学院,陕西 西安 710121)

滚动轴承作为机械设备的易损部件,其健康状态对整个机械设备的性能、稳定性以及使用寿命有着巨大的影响[1]。因此,在滚动轴承出现局部损伤、缺陷或者早期故障时,需要准确地获取故障信息并快速地识别故障。轴承故障数据具有数据量大、故障类型多和和运转速率高等3个特点[2]。每个轴承有上万个测试样本点,需要通过智能诊断方法进行自动分析,在不同工况、不同频率下造成轴承故障的原因和类型也多种多样。并且,机械设备的各个部分密切相关,仅仅因为轴承的微小故障就有可能使整个机械设备处于瘫痪状态。

特征提取和状态分类是轴承故障诊断的重要部分。传统的轴承故障诊断大多采用机器学习[3]的方法,需要信号处理技术和诊断经验,依赖轴承故障数据的先验知识提取特征,使得训练的网络模型普适性差,给不同工况下的故障识别与诊断带来了严重困扰。深度学习[4-6]能够从原始机械故障输入数据中提取出具有良好抽象和泛化的特征,尤其适合处理复杂故障诊断数据。卷积神经网络[7](Convolutional Neural Network,CNN)作为深度学习的经典算法之一,其局部连接、权值共享以及池化操作等特性使之可以有效降低网络的复杂度,降低训练参数的冗长现象,具有鲁棒性强、容错能力高、易于训练和优化等优点。利用CNN能够捕获特征的优势,对旋转机械进行故障诊断[8]。当加速度传感器所采集的滚动轴承振动信号为一维时序数据时,利用紧凑的自适应一维CNN分类器可对滚动轴承进行进行轴承故障分类[9]。根据长短时记忆(Long Short-Term Memory,LSTM)网络善于处理故障数据时间序列的优势,处理小波包变换提取的特征向量,可实现风电机组滚动轴承故障诊断[10]。LSTM网络还可对于轴承的故障部位和故障程度进行有效识别[11]。

上述方法虽然能够对轴承故障特征进行自主学习,但是在CNN中并没有考虑时间序列数据中隐藏的长期依赖关系,即当前时间步长与先前时间步长之间的相关性,这是形成可分类特征的关键。忽略时间序列数据可能会出现数据丢失、异常等问题,为此,拟提出一种改进的卷积-长短时记忆网络(Convolutional Neural Network-Long and Short Term Memory,CNN-LSTM)滚动轴承故障诊断方法实现特征的时序表达。该方法先利用卷积神经网络方法提取轴承数据的局部复杂特征,再将输出的特征信息加载到LSTM中,提取时间序列数据的全局特征,以克服卷积神经网络对长时间依赖关系建模能力弱的缺点。最后,通过对故障轴承从低层到高层的特征表示,实现故障诊断。

1 数据预处理

为了方便卷积神经网络的计算,将采集到的轴承加速度振动一维信号转换成二维信号。采用原始一维序列信号逐行堆叠的方式进行信号的维度转换,将1×2 400一维数据转化为60×40二维特征矩阵,变换示意图如图1所示。

图1 二维矩阵变换

2 改进的CNN-LSTM方法

为了克服浅层网络难以表征大数据和不同工况下轴承故障振动信号与健康状况之间复杂的映射关系,将预处理后的二维数据输入卷积神经网络中,选用ReLU函数作为激活函数,采用2个卷积层、2个池化层和1个全连接层。池化操作一般有最大池化和平均池化,选用最大池化提取显著的轴承故障特征。改进的CNN-LSTM滚动轴承故障诊断方法采用卷积神经网络提取轴承振动深层数据特征,捕捉丰富的局部关联信息,利用长短时记忆网络中隐藏单元的记忆模块提取时序特征,处理时间序列问题。将卷积特征和提取时序特征相融合,从而输出诊断结果。如果达到比较高的分类精度,则可得到分类结果,反之,则重新调整参数进行网络训练。改进的CNN-LSTM结构如图2所示。

图2 改进的CNN-LSTM结构

2.1 提取数据特征

CNN是一种带有卷积结构的前馈深度神经网络,其结构包括输入层、卷积层、降采样层、全连接层和输出层。深度神经网络的基本构成是神经元,在神经元中存在一个激活函数,由于非负区间的梯度为常数,不存在梯度消失问题,使得网络的收敛速度维持在一个稳定状态。利用CNN自动提取轴承故障特征过程描述如下。

对于CNN卷积层的第r层输出故障信号二维特征图,可表示为

(1)

对于采样层的第r层输出故障信号二维特征图,可表示为

(2)

式中:down表示下采样函数;β为乘性偏置。

对于第r层的全连接层的输出,可表示为

xr=f(wrxr-1+br)

(3)

式中,xr-1为输出前一层二维特征图,wr为全连接层的权值矩阵,br为偏置项。

2.2 提取时序特征

LSTM网络是循环神经网络[12](Recurrent Neural Network,RNN)的一种特殊类型,其增加了输入门、输出门和遗忘门等3个控制单元学习长期依赖信息。LSTM网络中的控制单元对输入信息进行判断,留下符合规则的信息,不符合的信息则被遗忘。利用LSTM网络,提取长短时的间隔信息以及预测时间序列[13-14],LSTM网络结构如图3所示。

图3 LSTM网络结构

将式(3)得到CNN的输出结果输入LSTM网络中。LSTM网络当前时刻的输入特征图表示为

(4)

其中,M表示选择的输入故障信号二维特征图个数。x(t)的前一节点的输出特征图表示为

(5)

其中,N表示输出特征图的个数。

对数据进行更新和整合,得到输入门为

(6)

式中:wmd和bmd分别表示在当前时刻第m个特征图输入门i(t)所对应的的权重和偏置;wnd和bnd分别表示在前一时刻第n个特征图所对应的权重和偏置;σ表示sigmoid激活函数;g(t) 表示信息候选向量。

(7)

式中:wmφ和bmφ分别表示在当前时刻第m个特征图遗忘门f(t)所对应的的权重和偏置;wnφ和bnφ分别表示在前一时刻第n个特征图所对应的的权重和偏置。

根据输入门和遗忘门传递的信息,得到新的信息候选值

(8)

信息候选值选用tanh函数激活,并与输出门

(9)

进行计算,从而得到网络输出

(10)

其中:wmφ和bmφ分别表示在当前时刻第m个特征图输入门i(t)所对应的的权重和偏置;wnφ和bnφ分别表示在前一时刻第n个特征图所对应的权重和偏置。

3 实验及结果分析

3.1 实验数据

实验数据来自美国凯斯西储大学(Case Western Reserve University,CWRU)的滚动轴承数据中心[15]。CWRU轴承中心数据采集系统由1个电动机、1个扭矩传感器和1个功率测试计组成,如图4所示。

图4 CWRU轴承中心数据采集系统及轴承结构

轴承的损伤为用电火花加工的单点损伤,电动机风扇端和驱动端的轴承座上方各放置1个加速度传感器,采集故障轴承的振动加速度信号。采集系统是在采样频率为48 kHz,电机负载工况为2马力,转速为1 750 r/min工作条件下记录振动加速度信号数据。被检测的轴承一共有内圈故障、外圈故障和滚珠故障等3种缺陷位置,损伤直径分别为0.18 mm,0.36 mm和0.54 mm,9种故障状态加上正常状态,一共存在10种状态。在对数据进行重构时,为了最大化对数据进行特征分析,将所有样本点重构为2 000个样本,每个样本有2 400个数据点,每种故障类型有200个样本。将1×2 400一维数据转化为60×40二维特征矩阵进行处理,作为卷积神经网络的输入。这样处理既降低了数据处理的复杂性,又保留了原始振动数据的关键特征。

实验样本信息如表1所示。不同类型的轴承振动信号时域波形如图5所示,其中,横坐标表示采样点数,纵坐标表示幅值,单位为mm。由于不同类型的故障信号时域波形间存在的相似性难以有效识别的问题,直接将振动数据转化为二维矩阵,利用深度学习方法进行特征提取。

表1 实验样本信息表

图5 不同类型的轴承振动信号时域波形

3.2 网络搭建

CNN结构由2个卷积层、2个池化层和1个全连接层组成。网络超参数批次大小batch_size设置为50,网络的步数设置为64,隐藏单元设置为128,故障类型是10种。第1个卷积层的卷积核尺寸为5×5,步长为1,卷积特征为25。第1个池化层步长为2,池化特征为25。第2个卷积层的卷积核尺寸为5×5,卷积核深度为25,步长为1,卷积后的特征为50。第2个池化层步长为2,池化特征为50。对振动数据进行二维处理后,得到60×40的图像,采用5×5的卷积核,步长为4,卷积层的输出维度为15×10,并增加1个全连接层,将输出结果输入长短时记忆网络中,经过3个控制门进行处理后,输出给分类器进行分类。改进的CNN-LSTM滚动轴承故障诊断方法的参数设置如表2所示。

表2 卷积层和池化层的参数设置

3.3 诊断结果

改进的CNN-LSTM轴承故障诊断方法在TensorFlow深度学习库中进行训练,需要不断更新参数,寻找最优参数。轴承故障诊断的常用评估指标包括F1分数、准确率、精确率和召回率。在相同实验环境下,构建相应的网络结构,分别对比改进的CNN-LSTM、CNN-LSTM、LSTM、CNN、支持向量机(Support Vector Machine,SVM)及反向传播神经网络(Back Propagation Neural Petwork,BPNN)[16]等方法的轴承故障监测与诊断结果,如表3所示。

表3 不同方法的滚动轴承故障监测诊断结果

由表3可以看出,改进的CNN-LSTM方法的诊断准确率约为99%,可稳定、准确地诊断出不同故障位置和故障模式下的轴承故障。与LSTM和CNN相比,改进的CNN-LSTM方法和CNN-LSTM方法均具有更高的诊断识别率,表明LSTM方法的引入可以提高网络的诊断性能。基于传统特征工程的SVM和BPNN方法的诊断结果最差,这是因为这两种方法是先对原始信号进行模态分解,再经过希尔伯特变换,经验模态分解的端点效应,限制了的数据处理能力。

深度学习方法的初始化是随机的,初始化状态的不同可能导致同一数据集的性能不同。对改进的CNN-LSTM、CNN-LSTM、LSTM、CNN、SVM及BPNN等方法进行10次实验,分别对比不同初始化状态下的准确性和稳定性,箱线图结果如图6所示。

图6 10次试验的轴承故障监测诊断准确率

由图6可以看出,改进的CNN-LSTM方法的诊断准确性超过99%。CNN-LSTM方法的诊断结果在最高水平上可以达到98%,但是在不同的初始化过程中表现不一,并且出现异常点。与其他方法相比,改进的CNN-LSTM的中位值精度更高,更稳定,诊断结果优于CNN、LSTM和其他单一表达域SVM及BPNN的方法。改进的CNN-LSTM方法不仅在收敛速度上明显快于其他5种方法,而且训练误差最终收敛在0.1以下,取得了良好的测试精度,具有更好的监测诊断能力。

CNN-LSTM结构的轴承故障诊断方法训练过程需要不断更新参数,寻找最优参数。在识别任务中混淆矩阵是评价算法的一个指标。为了研究改进的CNN-LSTM、CNN-LSTM、LSTM和CNN等方法在不同组合故障类别下的性能,在多个实验目标和实际轴承组合故障分类组合下,得到的混淆矩阵故障诊断结果如图7所示,其中,横坐标代表预测标签值,纵坐标代表真实标签值。

图7 4种方法的混淆矩阵故障诊断结果

由图7(a)可以看出,改进的CNN-LSTM方法能够对轴承复合故障进行有效分类,平均精确率能达到99%以上,高于其他3种方法,表明该方法在滚动轴承故障诊断分类中具有明显的优越性。

4 结语

作用在轴承故障振动信号上的改进的CNN-LSTM方法,利用卷积神经网络提取轴承数据的复杂特征,通过加入长短时记忆提取丰富的故障特征时间序列信息,可自动学习对诊断轴承故障有益的特征。实验结果表明,改进的CNN-LSTM方法在CWRU轴承数据库上的准确率达到99%左右,主观诊断结果和客观评价指标均优于CNN-LSTM、LSTM、CNN、SVM及BPNN等现有方法,具有较高的分类精度和较强的稳定性。

猜你喜欢

轴承卷积故障诊断
基于全卷积神经网络的猪背膘厚快速准确测定
比亚迪秦EV充电系统故障诊断与排除
异步立式感应电机轴承系统设计
基于神经网络的船舶电力系统故障诊断方法
迈腾B81.8T起动机无法启动故障诊断分析
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
斯凯孚展示用于电动汽车的先进轴承产品
一种轴承拆卸装置的实用设计