APP下载

基于条件变分自编码器的齿轮箱故障诊断

2020-08-07王昱尹爱军

装备环境工程 2020年7期
关键词:变分齿轮箱编码器

王昱,尹爱军

(重庆大学 机械工程学院 机械传动国家重点实验室,重庆 400044)

齿轮箱是现代机械设备的重要部件,也是失效频率高发部件。齿轮箱的失效往往致使整个机械系统进入瘫痪或运行失控,造成不必要的财产损失甚至人员伤亡[1]。因此,对齿轮箱失效故障的准确有效诊断是维护设备稳定、安全运行的重要保障。

目前用于齿轮箱故障诊断的方法数量众多,包括噪声分析法、振动分析法、油液分析法、声学分析法、温度分析法等[2],而基于振动信号的故障诊断方法应用最广。武哲等[7]利用多元经验模态分解对多通道振动信号进行自适应分解,并依据峭度准则和相关系数对此进行特征提取。党建等[8]将排列熵算法用于水轮发电机组非平稳振动信号的故障诊断中,取得了较好的效果。Wang等[9]提出利用振动信号的局部均值分解对低速螺旋齿轮箱进行诊断的方法。张亢等[10]将局部均值分解(LMD)与阶次跟踪相结合,提出一种变转速工况下的滚动轴承故障诊断方法。Ali等[11]将振动信号的经验模态分解与深度神经网络结合,以实现轴承故障的自动诊断。

在以上及现有的故障诊断方法中,均存在一些共有的不足点:一是需要对特定振动信号作针对性的特征提取,造成参数设置复杂且通用性不足;二是需要振动信号符合某些特定的假设,而对于信号和假设间的真实相关性,往往既缺乏理论依据,也缺乏最佳实践;三是一些结合现代深度学习模型的方法数据依赖量大,而实际工况下的数据收集往往较困难。

针对以上问题,文中提出一种基于条件变分自编码器的故障诊断方法。该方法可避免复杂的人工特征提取,采用振动信号频域幅值谱作为故障诊断特征向量,通过学习幅值谱到各个故障下的条件概率分布,实现故障分类器的概率模型建立。区别于其余应用于机械故障诊断的自编码器模型[12],该模型侧重于从理论角度对频谱分布进行概率建模,而非仅从工程角度构建复杂、缺乏可解释性且较难训练的特征提取网络,其表现更加具有可控和可追溯性。实验表明,基于条件变分自编码器的故障诊断方法在齿轮箱故障分类任务上取得了很高的精度,并具有较少的数据依赖和较高的通用性,能有效对齿轮箱各失效故障进行准确识别诊断,具有较高的工程实用价值。

1 条件变分自编码器理论

条件变分自编码器(CVAE)是变分自编码器(VAE)[15]的改进和扩展。首先阐述变分自编码器的基本思想。

由于 x维度往往很高,难以直接建立符合式(1)的优化模型。变分自编码器设定x由某一低维隐变量z生成,即:

受z的维度限制,式(2)中的积分计算较为困难。为此VAE引入后验分布 p (z|x),使得在 p (z|x)上通过蒙特卡洛采样算法得以实现对式(2)的有效估算。由于后验分布 p (z|x)是隐式存在的,并不能为此提供显式的优化途径。VAE实际使用可优化的推断后验分布作为真实后验分布的近似,并使用变分推断方法优化φ使得逼近 p (z|x)。由于 qφ(z|x)往往被指定为高斯分布,考虑易优化性,VAE使用KL散度作为变分推断的具体实现形式:

对式(3)运用贝叶斯定理变形得:

在对 ELBO的实际计算上,VAE提出了一种随机梯度变分贝叶斯(SGVB)评估器作为对ELBO的高效估算:

通过优化L~VAE(x;θ,φ),VAE得以获得对单一数据X的概率密度分布p(X)的极大似然优化。而在具有标签数据Y条件下,条件变分自编码器在此基础上实现了对条件概率分布 p (X |Y)的估计[22]。但此类条件变分自编码器主要用于辅助 VAE生成更加特定化的数据,并不能胜任对数据性质的判别任务。沿用p(X|Y)条件变分自编码器思想,文中导出能胜任于分类任务的另类条件变分自编码器p(Y|X)。

在同时具有观测数据X及标签Y条件下,容易将式(4) lgp(x)扩展为lgp(y|x)形式:

式(8)、(9)导出了条件概率分布 (|)pyx的对数概率密度下界。和 VAE的随机梯度变分贝叶斯评估器同理,CVAE的优化评估器可表示为:

同样,z(l)通过重参数化函数重采样,以避免梯度消失。

在实际训练中,选择对角协方差标准正态分布作为先验分部p(z),对角协方差高斯分布作为后验分布

2 基于CVAE的振动信号分类模型

为尽可能在不损失原始振动信号信息量的前提下,获取较为通用稳定的信号特征,文中对原始信号x(t)做定长窗口傅里叶变换,并取变换后的频域幅值谱x(f)线性归一化至[0,1]区间作为特征向量,将其导入CVAE模型进行训练。在分类预测阶段,若标签类别共有n类,则将待预测原始信号x(t)分别和每一类标签yi组合并通过 CAVE计算其随机梯度变分贝叶斯评估器得到n个下界评估值,最后将n个下界评估值送入softmax层输出对应每一个类别的置信概率,并根据置信概率实现对振动信号各故障类型的诊断识别。模型结构如图1所示。

图1中MLP为多层神经网络,分别代表CVAE编码器及解码器,均输出高斯分布。菱形区域表示可优化项,即随机梯度变分贝叶斯评估器组成部分,通过菱形区域项可使用Adam等随机梯度优化算法对模型进行训练优化。由于优化算法使用了 (|)pyx的下界,而对真实 (|)pyx的估计较为麻烦,且在模型经过充分训练后,有理由相信变分证据下界能够足够逼近真实分布的 (|)pyx,因此在分类预测阶段仍使用下界作为对真实分类概率分布 (|)pyx的估计,并将下界的评估值送入softmax层以输出每一类别的置信概率。另外,训练和预测过程可同时进行,也可分别进行。

图1 基于CVAE的振动信号故障分类模型结构Fig.1 Structure of vibration signal fault classification model based on CVAE

模型在训练阶段的具体流程见表1。算法的输入接口为原始振动信号x(t),最后返回神经网络参数θ及φ。在分类预测阶段,只需恢复神经网络参数,即可实现对信号故障类别x(t)的快速识别诊断。

表1 振动信号分类器训练流程Tab.1 Training process of vibration signal classifier

3 齿轮箱故障诊断实验

3.1 实验系统配置

图2 实验配置Fig.2 Experimental configuration:a) experimental system; b) gearbox interior

文中通过齿轮箱故障诊断实验验证模型对振动信号的分类性能。实验系统整体配置如图 2a所示。电机(SIEMENS, 3~, 2.0 HP)通过联轴器驱动齿轮箱运转,同时电机通过变频器(DANFOSS VLT 1.5 kW)进行调速。齿轮箱输出轴通过传动皮带联接一个电磁扭矩负载(ROSATI, maximum 8.83 kW)。电磁扭矩负载受控于一扭矩控制器(TDK-Lambda, GEN 100-15-IS510),使得其负载扭矩可被动态调节。加速度传感器(PCB ICP 353C03)和声传感器(PANAMETRICS V109)可分别收集齿轮箱运转过程中的振动和声音信号。数据采集盒(DAQ, NI cDAQ-9234)将加速度传感器和声传感器的输出数据送入计算机(HP Pavilion g4-2055la)进行存储。齿轮箱的内部布置如图2b所示。二级减速器通过三根传动轴及 4个传动齿轮组成。输入斜齿轮1(Z1=30,模数=2.25,压力角=20°,螺旋角=20°)安装在输入轴 1上,轴 2上安装有两级传动斜齿轮(Z2=Z3=45),通过末级齿轮 4(Z4=80)将功率传递至轴 3。除此之外,齿轮箱失效部件还包括轴承1及轴承座1。齿轮箱不同工况下的失效模式见表2。

表2 齿轮箱失效模式及工况Tab.2 Failure modes and working conditions of gearbox

在表2中,实验在3种输入转速、3种负载转矩下共有11种失效模式,其中A为齿轮箱正常状态模式。对于每种失效类型、转速及扭矩,加速度传感器和声传感器均重复进行5次数据采集。每次数据采集包括24个采样周期,每个采样周期历时0.4096 s。加速度传感器和声传感器的采样频率分别被设置为10 kHZ和 50 kHZ。通过上述方式,实验系统在 11种模式下总共采集到11 880段声音信号和11 880段振动信号。

3.2 实验结果及分析

为不失一般性,本实验仅以振动信号作为齿轮箱数据采集样本。对于齿轮箱所有振动信号,以50 000次连续采样点对原始数据进行切分,并对切分后的每段振动信号变换到频域空间取幅值谱。每段幅值谱均线性归一化到0~1区间。对于每一种失效模式,随机打乱不同工况下的频谱信号,并等量均分后分别作为训练集和测试集。经过上述处理,在总共11种失效模式下,训练集和测试集均具有2035个样本数据,每个样本数据具有25 001维。在所有训练集均具有全部失效模式标签的情况下,对CVAE模型进行故障诊断分类性能测试。测试结果如图3所示。

图3 CVAE模型测试集分类准确率Fig.3 Classification accuracy of CVAE model test set

从图3可见,CVAE模型取得了优异的分类性能,在测试数据集上综合平均分类正确率达到 98.88%,且部分故障类别模式下的分类正确率达到 100%。表明模型拥有很高的故障分类精度。

为了和传统基于特征提取的故障诊断方法进行对比,文中分别选取具有代表性的四种模型进行故障分类实验:基于策略的统计学习模型K近邻(KNN);基于时间序列建模的长短期记忆网络模型(LSTM);经典非线性分类器支持向量机(SVM);现代数据驱动模型深度神经网络(DNN)。在原始振动信号特征提取方面,选取时域11个特征量、频域13个特征量以及14个小波包能量特征,共计38个工程信号特征组成38维向量作为上述模型的单个训练样本。KNN、LSTM、SVM、DNN、CVAE模型的分类准确率分别为83.93%、94.05%、65.48%、69.64%、98.88%。由此可见,CVAE模型在故障诊断分类准确率上大大领先于其余模型,表明其能够有效对齿轮箱振动信号频谱空间概率分布进行建模,不仅具有更好的通用性,也取得了更好的效果。

4 结语

文中提出了一种基于条件变分自编码器的齿轮箱振动信号故障诊断模型。以原始信号幅值谱作为特征向量,并从理论上阐述了CVAE模型在故障分类任务上的有效性。最后通过实验进一步证明了CVAE模型在齿轮箱振动信号故障分类任务上具有优异的性能,故障分类准确度比其余模型更为优越,且无需复杂的特征提取,具有更少的数据依赖性及更强的通用性。对比其余模型,表现出了其在齿轮箱故障分类诊断任务上的优越性。

猜你喜欢

变分齿轮箱编码器
风电齿轮箱轴承用钢100CrMnSi6-4的开发
逆拟变分不等式问题的相关研究
求解变分不等式的一种双投影算法
基于FPGA的同步机轴角编码器
关于一个约束变分问题的注记
提高齿轮箱式换档机构可靠性的改进设计
基于PRBS检测的8B/IOB编码器设计
一个扰动变分不等式的可解性
杭州前进齿轮箱集团股份有限公司
JESD204B接口协议中的8B10B编码器设计