基于变分自编码器的轴承健康状态评估*
2020-12-08尹爱军戴宗贤任宏基
尹爱军, 王 昱, 戴宗贤, 任宏基
(1.重庆大学机械传动国家重点实验室 重庆,400044) (2.重庆市计量质量检测研究院 重庆,401120)
引 言
轴承运行健康状态评估(prognostics and health management,简称PHM)及其退化性能的侦测在现代机械设备中具有越来越重要的作用。近年来,学者们提出了诸多轴承运行健康状态评估方法[1-5]。张朝林等[6]提出了一种基于本征时间尺度分解(intrinsic time-scale decomposition,简称ITD)多尺度熵和极限学习机的轴承健康状态识别模型。朱朔[7]针对冗余特征降维问题,提出了一种基于改进局部保留投影算法的滚动轴承特征向量降维方法。刘小勇[8]提出了一种基于长短时记忆网络的评估方法,对轴承和涡轮的退化性能进行预测。Qiu等[9]通过使用自组织映射方法将提取到的特征融合构建为轴承健康状态检测指标。
以上方法均通过人为提取数据特征或对数据的真实概率分布和组织形式进行某种假设,进而再通过实验对假设进行验证。该方法有如下限制:①基于人为假设数据,使用数据驱动构建模型的方法,评估效果依赖于模型的参数调校,难以在同类数据上具备较好的鲁棒性;②基于人工提取低维特征的方法损失了原始数据的信息量,冗余无法确定,且所提取的特征对状态评估的贡献度难以定量描述,造成评估模型只能在特定工况下才能达到理想的效果,且大多数特征提取一般是基于某种特定的假设下;③基于支持向量机(support vector machine,简称SVM),深度神经网络(deep neural networks,简称DNN)等智能学习方法完全由数据驱动,缺乏理论背景且对数据的数量较为依赖。轴承在复杂多变的工况下运行并伴随大量环境噪声,在数据量较为缺失的情况下,使得该评估方法难以在轴承状态侦测方面具备较好的通用性。
由于信号频域幅值谱在其特征空间具有更为稳定的概率分布,提出了一种面向高熵特征的变分自编码器轴承健康状态评估模型。通过建立振动信号频谱在特征空间的概率分布量化模型并最大化其边缘似然概率,实现对振动信号频谱高维空间中真实复杂概率分布的精确逼近,完成对振动信号状态的定量评估。通过实验及对比,证明了变分自编码器在轴承运行健康状态评估上具有较好的准确性和鲁棒性。
1 变分自编码器
(1)
其中:P(x(i))为观测数据x(i)的概率密度函数。
VAE试图极大化P(x(i))的似然概率,从而估计观测数据的真实分布。
对于隐空间先验分布P(z),VAE指定其服从标准正态分布N(0,I)。其中:I为z空间中的单位阵。同时,变分自编码器使用后验分布P(z|x(i))对具体观测数据的隐空间分布进行度量。VAE使用变分推断方法,构造可优化函数Q(z|x(i);φ),通过优化参数φ,逼近真实后验分布P(z|x(i))。根据变分理论并考虑易优化性,优化目标通过Kullback-Leibler(简称KL)散度进行度量,即
(2)
对式(2)运用贝叶斯定理变形可得
logP(x(i))-KL[Q(z|x(i))‖P(z|x(i))]=
Ez~Q[logP(x(i)|z)]-KL[Q(z|x(i))‖P(z)]
(3)
式(3)包含了最初式(1)的优化目标P(x(i)),由于KL[Q(z|x(i))‖P(z|x(i))]≥0且无法直接计算,因此优化目标可变为极大化logP(x(i))的变分证据下界(evidence lower bound,简称ELBO),即
(4)
VAE通过最大化变分下界来实现最大化边缘似然概率P(x(i))。对于Pθ和Qφ,一般可采用多层神经网络实现。在VAE中,Q(z|x(i);φ)被指定为一个具有对角协方差矩阵的多维高斯分布
Q(z|x(i);φ)=N(z;μ(i),σ(i)∘Ι)
(5)
其中:μ(i),σ(i)可由一个多层神经网络输出,即VAE假设观测数据后验分布服从高斯分布。
对于Ez~Q[logP(x(i)|z;θ)]项,为避免其对Qφ梯度过大而引起计算不稳定问题,VAE使用基于蒙特卡洛采样的随机梯度变分贝叶斯评估器(stochastic gradient variational Bayes,简称SGVB)对优化目标进行估计,同时使用自编码变分贝叶斯(auto-encoding variational Bayes,简称AEVB)算法[10]进行训练,并在实际模型中采用重参数技巧解决后验分布采样过程中梯度不可计算的问题,最终变分下界的估计值可表示为
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]+
(6)
其中:L为隐变量z的采样次数;z(i,l)=μ(i)+σ(i)∘∈(l);∈(l)~Ν(0,I)。
变分自编码器实现采用最小化解码数据和观测数据L2范数,从而间接优化logPθ(X(i)|z),所以式(6)的优化目标为
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]-
(7)
其中:fθ为解码器。
为使基于蒙特卡洛采样的SGVB优化器[10]获得收敛,VAE对观测数据采用小批量多批次方式进行优化,使L(θ,φ;x(i))达到最终稳定解。
2 基于VAE的轴承健康状态评估模型
2.1 评估模型及训练
基于VAE的轴承健康状态评估模型实质是健康状态下振动信号x(t)频谱X(f)的边缘概率分布P(X(f)),对于轴承运行状态下频谱X(f),评估模型P(X(f)),计算X(f)所表征健康状态的概率值,从而实现对轴承健康状态的定量评估。由式(3)得
(8)
评估模型通过对P(X(f))进行最大似然估计,从而使P(X(f))逼近真实边缘概率分布。由于KL[Q(z|X(f))‖P(z|X(f))]≥0且无法计算,因此采用变分下界L(θ,φ;X(f))作为logP(X(f))的估计。由于AEVB算法采用小批量多批次方式进行训练,若单批次训练数量达到一定规模(100以上),根据均值场论[14],L(θ,φ;X(f))中蒙特卡洛采样次数可降为一次[10]。笔者指定评估模型单批次训练数量为128,每批次训练采样一次。因此,变分下界L(θ,φ;X(f))表示为
P(z)]-‖fθ(z(i))-X(f)(i)‖2}
(9)
在训练阶段,VAE将轴承振动信号频谱解码为连续三维隐空间中后验分布参数,同时使后验分布与先验分布的KL散度及编解码前后频谱间L2范数最小化,以此实现对所有训练数据的边缘似然概率最大化。图1为基于VAE的轴承健康状态评估模型及其训练,具体训练步骤如下。
图1 基于VAE的轴承健康状态评估模型Fig.1 Model architecture for the bearing health status evaluation with VAE
1) 从训练集数据中随机选取128个观测数据点,组成单批训练集{X(f)(i)|i=0,1,…,127}。
2) 将单批训练集中每个数据点X(f)(i)送入编码器,得到对应后验分布N(z;μ(i),σ2(i)∘I)。
3) 从三维标准正态分布中采样128个噪声{∈(i)|i=0,1,…,127},结合对应后验分布生成隐变量{z(i)|z(i)=∈(i)∘σ2(i)+μ(i)}。
5) 重复步骤1~4,直至模型总体损失函数值低于设定值,保存模型参数Qφ及Pθ。
2.2 基于变分下界的状态评估指标
轴承健康状态评估指标即为对应频谱X(f)的边缘似然概率响应值P(X(f))。由分析可知,P(X(f))无法直接计算,而是通过其变分下界L(θ,φ;X(f))对其对数值logP(X(f))进行估计,且由于高斯后验分布的简化假设导致变分推断存在一定误差[15],因此P(X(f))不能直接作为轴承健康状态评估指标。L(θ,φ;X(f))作为logP(X(f))的一个下界逼近,同样可作为预测阶段的健康状态评价指标,由此得出的评价结果是偏严格的,即真实退化程度不会高于评估退化程度,这对发现轴承运行早期故障是有益的。
为了避免计算解码器解码期望而带来的额外采样运算,直接使用后验高斯分布期望值作为采样隐变量。设某时间段轴承振动信号为x(t),频谱为X(f),则基于变分下界的健康状态评估指标E表示为
(10)
其中:u(X(f))为X(f)后验分布期望值。
E(x(t))值越大,表明其退化程度越严重。对轴承振动频谱X(f),首先通过解码器Qφ(X(f))得到其高斯后验分布期望u及方差σ,通过u,σ构建后验分布N(u,σ),并计算其和先验分布的KL散度KL[N(u,σ)‖N(0,I)]。同时,将期望u送入解码器fθ,得到解码值fθ(u),并计算解码值与真实值间L2范数‖fθ(u)-X(f)‖2,最终KL[N(u,σ)‖N(0,I)]与‖fθ(u)-X(f)‖2之和即为轴承健康状态评估指标。
3 实验结果及分析
为了验证变分自编码器对轴承振动信号状态评估效果,笔者选取辛辛那提大学智能维护系统实验室开源滚动轴承加速退化实验数据集[16]。试验台传动轴由交流电机通过皮擦带轮驱动测试轴旋转,转速恒定为2 kr/min。实验共有4个数据采集通道,均采用加速度传感器收集对应轴承振动信号,采样频率为20 kHz。笔者使用轴承1振动数据作为数据集。实验历时9 840 min后,轴承1出现外圈故障,停止实验。
在轴承运行全过程9 840 min内,选取前100个数据集(前1 000 min)作为训练数据集,其余数据均作为测试集。为了降低训练数据维度,每个数据集选取转子旋转一圈时间(5 s)的采样信号作为训练数据维度,对模型进行随机多批次训练。训练完毕后对轴承全退化过程健康状态进行评估,图2为VAE轴承健康状态评估结果。区域Ⅰ为早期训练数据状态评估结果,区域Ⅱ为轴承后续运行状态评估结果。可见,在1 000~5 000 min时间段内,轴承未表现出退化迹象,其健康状态评估值和训练阶段的评估值具有相同的变化波动趋势,这说明基于VAE的轴承健康状态评估指标在测试集同类数据上具有良好的泛化能力。
图2 VAE轴承健康状态评估结果Fig.2 Evaluation results of bearing health status with VAE
基于VAE的轴承健康状态评估模型通过隐变量来表征振动信号的潜在状态,隐变量蕴含解码器对原始信号特征的有效转化和提取。因此,对于一个有效的评估模型,其隐变量的分布状态及变化趋势应当和评价指标结果相似。为了验证VAE对轴承振动信号状态的隐变量解码分布,在轴承运行全过程中每间隔10 min对解码后隐变量进行可视化分析。
图3为全退化过程振动信号频谱隐变量分布。图中,三维坐标系建立在三维先验标准正态分布空间,坐标原点位于先验高斯分布均值处。由于VAE使用标准正态分布作为先验分布,因此前1 000 min内测试数据隐变量分布符合高斯分布先验假设,且在1 000 min至轴承开始退化前时间段内,隐变量分布仍符合高斯分布,这进一步说明了模型在测试数据集同类数据上具有良好的泛化能力。随着轴承退化性能逐渐加重,隐变量开始逐渐偏离先验分布,且偏离程度基本和退化性能成正比。这说明VAE正是通过调整隐变量在其空间分布,从而达到表征轴承振动信号频谱有效特征的目的,而不是强行通过编解码器对训练数据进行强行记忆,由此也证实了解码器学习到了从高维原始特征空间到低维有效特征空间的平滑映射。
图3 全退化过程振动信号频谱隐变量分布Fig.3 Embedding hidden space of vibration spectrum point overall test time
为验证基于VAE的轴承健康状态评估模型对轴承退化性能评估的准确性和敏感性,将其评估结果分别与传统健康状态评估指标的结果进行对比,所有评估指标的评估值均被归一化到0~1区间,结果如图4所示。
图4 VAE状态评估归一化值及对比Fig.4 Normalized evaluation value and comparison with other methods
从图4可以看出,基于VAE的轴承健康状态评价方法对退化数据的评估结果与传统健康状态评估结果的曲线走势基本一致,证明了其对轴承退化性能评估的准确性。图4表明,基于VAE的评价方法在轴承退化早期状态评估敏感度上大大优于其他评估方法,在轴承开始进入退化时,评估值发生了明显变化,这有利于尽早对轴承退化状态进行判断,避免进入二次突变恶化造成更严重的事故。
VAE通过建立轴承振动数据的概率模型从而对其健康状态进行定量评估。基于隐马尔科夫模型(hidden Markov model,简称HMM)、深度信念网络(deep belief network,简称DBN)等代表性概率推断模型在轴承状态评估方面得到广泛研究[17-20]。
图5为VAE,HMM和DBN评估结果对比,评估值被归一化在0~1区间。为了量化不同评价方法下的临界退化时间点,采用3σ原则[21]确定出4 000 min前轴承的健康状态评估值上界,并以此上界作为健康状态至退化状态的评估值转变点,由此确定不同方法下轴承退化的临界时间点,结果如表1所示。
图5 VAE,HMM和DBN评估结果对比Fig.5 Evaluation results in comparison with VAE, HMM, and DBN
表1 VAE,DBN和HMM临界退化时间Tab.1 Threshold degradation time of VAE,DBN and HMM min
可见,基于HMM的评估方法对轴承早期故障的侦测较为迟滞,在后期退化状态的侦测上敏感度也较弱。基于DBN的评估方法在轴承健康状态转变临界时间点判断上稍落后于VAE评估方法,退化后期对轴承退化状态的评估敏感度也不及VAE方法强。基于VAE的评估方法仅需要少量样本进行训练,其状态评估结果不仅在进入轴承退化临界点时具有敏感的变化趋势,且在相同退化状态下的评估敏感度均高于HMM和DBN。因此,基于VAE的轴承健康状态评估方法相比其他概率推断方法更为准确、高效。
4 结束语
提出了一种基于变分自编码器的轴承状态评估方法。通过变分推断的方式,从振动信号频域中自动学习潜在的状态概率分布,并将其应用于轴承运行状态评估中,取得了较好的效果。证明了变分自编码器在处理轴承运行状态评估方面具有良好的准确度,对异常状态更为敏感,且无需人为提取特征和复杂的参数设置,不需要对特定的系统进行针对性的参数设置和调校。在小容量训练数据集上具备良好的鲁棒性,工程应用上具有一定的推广价值。