深度学习在电梯轿厢振动故障诊断中的应用研究*
2021-02-25张兴合高丙朋南新元
张兴合,高丙朋*,陈 飞,南新元
(1.新疆大学 电气工程学院,新疆 乌鲁木齐 830001;2.新疆维吾尔自治区特种设备检验研究院,新疆 乌鲁木齐 830001)
0 引 言
电梯异常振动是电梯故障的反映,异常振动的存在严重危害设备的运行安全,设备寿命和安全性能大打折扣。因此,对电梯健康进行状态监测和故障预测极为重要。
昆明理工大学易仕琳[1]研究了电梯的结构、故障产生原因和故障诊断预测。山东大学王健[2]研究了支持向量机在电梯故障预测上的应用。李敬伟等[3]针对导轨不平顺作用下曳引电梯轿厢的水平方向振动,对导轨在不同激振频率下电梯轿厢的动态特性原理进行了分析研究。浙江大学王志平[4]利用电梯运行特征大数据,研究了高速电梯的急停故障快速诊断。冯鑫等[5]优化BP神经网络理论,进行了电梯故障诊断。徐金海等[6]利用振动信号时域峰值、频域频率值及功率谱密度和时频域能量分布的多参数振动特征量,对电梯机械部件不同工况下的振动特性进行了研究。
由于电梯轿厢振动信号复杂,涉及因素众多,且相互影响。以上方法都暴露出特征发掘不够的问题。
相比人工特征,深度学习提取特征更加全面。深度学习作为机器学习领域的新型方法,其具有强大的特征提取能力[7-9]。将深度学习应用在故障诊断领域的研究已经逐渐引起国内外学者的重视[10]。陈志平等[11,12]研究了大数据分析方法在电梯故障诊断与预测,最终可准确地对电梯机械系统故障进行诊断与预测,验证了电梯轿厢振动信号对电梯故障诊断的可行性。
电梯承运质量测试仪采集到的信号,包括垂直方向振动信号和水平方向振动信号。但电梯水平方向振动信号对电梯导向系统的故障以及电梯老化有较高的敏感度,而这些故障对电梯的承运安全起到决定性作用。
通常,电梯水平方向振动主要体现3种运行状况:(1)正常运行振动对应电梯导轨向系统正常;(2)冲击性异常振动对应导轨接头的间隙及距离错差或导轨平面有突起等故障;(3)周期性异常振动对应滚动导靴的外形不规则,或者导轮的外圆面有突起干扰点等故障。
笔者针对电梯系统运行过程中故障诊断精确度不够高的问题,和电梯轿厢振动故障诊断在卷积神经网络运用上的空白问题,研究深度学习在电梯轿厢振动故障诊断中的应用。
1 基本原理介绍
卷积神经网络(CNN)是深度学习算法中的一种,在特征自学习分类中广泛应用。CNN通常包括输入层、卷积层、池化层和最后的全连接层[13]。
卷积层是对图像进行卷积运算,提取出图像特征。卷积核相当于一个窗口,在输入图像上一个stride的大小进行平移和上下移动,当卷积核在图像上移动一遍的时候就完成了对输入图像的卷积运算,即:
(1)
卷积层使用PyTorch中的conv2d,conv2d参数包括输入通道数,输出通道数也就是卷积核个数、卷积核尺寸、步长、填充空洞、分组和偏置。卷积层输出的尺寸与输入和卷积核的关系量化公式如下:
(2)
式中:Hin,Hout—卷积层的输入输出;p[0]—输出层的填充值;d[0]—卷积核的空洞值;k[0]—卷积核的尺寸;stride[0]—卷积核的步进。
本文采用Relu函数作为激活函数,反向传播过程中不会影响总体的梯度。且Relu层输出均为正数,负半轴导致死神经元。梯度大于0的时候是1也可以缓解梯度消失。
以上过程的运行为卷积神经网络的前向传播,网络训练主要包括参数前向传播和误差反向传播。前向传播是将频谱图输入到网络中,经卷积、池化、全连接层等操作。误差反向传播通过计算实际故障识别结果与标签之间的误差,将得到的误差值反向传播,得到各层的误差[14],进而修正每层网络的权值和偏置。
本研究对网络权值和偏置的修正采用SGD随机梯度下降法进行修正,梯度下降法的优化思想是用当前位置负梯度方向作为搜索方向,即当前位置的最快下降方向,所以也被称为是最速下降法。
简单神经网络结构示意如图1所示。
图1 简单神经网络结构示意图
图1中,一个5层的神经网络每层包含一个神经元,则有:
zi=xiωi+bi
(3)
hi=σ(zi)
(4)
x4=h3,x3=h2,x2=h1
(5)
式中:xi—每层输入;bi—偏置;ωi—权重;zi—输出;hi—激活后的输出;σ—神经元的激活函数。
设最终的损失函数为L,则可利用链式法则的反向传播方法求L关于xi的梯度过程,即:
(6)
式中:L—最终输出的损失函数。
2 残差神经网络在本研究的应用
残差神经网络用来解决深层网络效果出现退化的问题。在深层网络中,存在梯度消失或梯度爆炸。虽然初始归一化和中间归一化在很大程度上解决了这一问题,但在更深层次的网络上归一化不能有效解决梯度问题。对此,学者[15]提出了Res-Net(residual neural network),对随着网络的加深网络出现梯度爆炸或梯度消失现象进行了优化。
笔者采用由BasicBlock组成的Resnet18网络模型为主体。本研究网络结构参数如表1所示。
表1 本研究网络结构参数表
表1中,每一个BasicBlock中包含两个卷积层,加上卷积层1和最后的全连接层共18个卷积层,是其中Resnet18的由来。
此外,在不同环境的电梯使用情况不同,所以每次采集信号都应严格控制变量、测量标准。但在测量过程中会出现测量错误信号、偶然错误,影响测量精度和数据可信度。
在处理信号时,应筛选掉出现测量错误和偶然错误信号,采用信号中间稳定部分作为研究对象,提高研究的可参考性。
3 实验及结果分析
3.1 信号的采集与预处理
该实验采用新疆维吾尔自治区特种设备检验研究院的电梯承运质量测试仪(由PMT公司制造的EVA-625型),对信号进行分类标签后,进行数据预处理,分离出水平方向振动信号和竖直方向信号。
经过半年的特定信号采集,共采集到了185条数据,经过筛选和数据预处理,得到153条可用数据,其中测试集15条数据,训练集122条数据,验证集16条数据。预处理后的信号在不经过连续小波变换之前,作为输入采用传统的特征工程加支持向量机方法进行诊断,统计诊断正确率。
笔者采用10折交叉验证(10-fold Cross Validation,K-CV)、基于遗传算法优化参数的支持向量机(GA-LSSVM)和基于粒子群优化的最小二乘法的支持向量机(PSO-LSSVM)进行了对比试验。笔者建立了10个模型,把10个模型分类准确率的平均值作为该方法下分类器的性能指标。笔者将支持向量机的参数集用遗传算法和粒子群算法进行了优化,得到了参数的最优解,避免进入局部最优;将预处理后的信号输入参数优化的支持向量机训练中,得到了最终的分辨结果与深度学习方法,进行了对比。
深度学习网络对电梯运行状态分类如图2所示。
图2 深度学习网络对电梯运行状态分类
由图2可见,将预处理后的数据经过连续小波变换将一维时域振动信号变换成二维时频信号,从频谱特性分析得出电梯运行特征,连续小波变换在不同的尺度来满足对细节分析的需求。
本研究流程框图如图3所示。
图3 本研究流程框图
由图3可见,处理好的数据分为训练集、验证集和测试集;训练集输入网络训练,然后对验证集和测试集进行验证和测试。
3.2 网络训练
笔者将采集的实验数据进行数据预处理,后通过连续小波变换变换成二维时频信号进行数据增强,然后归一化为标准数据,输入到模型中。
在调试过程中确保网络模型输入输出正确的同时,还要特别注意学习率(Lr)、训练迭代次数(Epoch)以及输入批大小(Batchsize)等超参数的设置。
每次设置超参数,观察对辨别精度的影响。超参数设置对网络训练的影响如表2所示。
表2 超参数设置对网络训练的影响
表2中,每批输入图片的多少影响网络的训练精度,如果学习率初始值比较大,还是会造成过拟合。
该实验采用深度学习网络训练模型对电梯轿厢振动的信号进行分类,分类出电梯的不同运行状态。
网络训练精度和误差曲线如图4所示。
图4 网络训练精度和误差曲线图注:Acc value—训练精度;Train_acc—训练集精度;Vaid_acc—验证集精度;loss value—训练误差;Train_loss—训练集误差;Valid_loss—验证集误差
由图4可知,在120个epochs(迭代次数)附近的时候,验证集达到了100%验证精确度,后训练集达到了98.68%训练准确度。
各模型诊断结果对比如表3所示。
表3 各模型诊断结果对比
从表3可以看出:基于Resnet的故障诊断准确率高于特征工程的分辨准确率,而且在参数设置合适的情况下,准确率上限更高;训练过程中可用tensorboard观察权值数据梯度直方图,可以明显看出各层参数梯度在不断集中,网络训练过程成效显著。
可见:深度学习网络对电梯轿厢振动信号的分类精度明显高于传统机器学习算法精度,证明了电梯轿厢振动用深度学习来处理的可行性。
4 结束语
本文采用深度学习方法,针对电梯轿厢的振动进行故障诊断;电梯承运质量检测仪采集轿厢振动信号,将信号分离出水平振动信号,采用连续小波变换将一维时域信号变换成二维时频信号;经过数据预处理和数据增强输入到深度学习神网络,通过调整参数训练网络。
实验结果表明:该方法对故障验证集分辨率达到了100%,训练集分辨率达到了98.68%,对比传统机器学习故障诊断分辨率提高了3个百分点;该结果证明了深度学习在电梯轿厢振动故障诊断方面的可行性。