基于GAN的轴承故障诊断方法
2020-09-10柴志豪
柴志豪
摘要:针对轴承工作过程中早期故障样本少、故障类型不平衡的问题,提出一种基于生成式对抗网络(GAN)的数据增强方法。该方法应用快速傅里叶变换(FFT)对轴承信号进行预处理,然后将频谱作为GAN的输入,生成故障样本数据。最后,将生成的数据与原始数据结合构成新的数据集,并利用支持向量机(SVM)实现故障分类识别。通过轴承实验和统计学特性验证,表明该方法可以生成有效故障样本,同时采用扩充后的新数据集与原始数据集相比诊断准确率更高。
关键词:滚动轴承;故障诊断;生成式对抗网络;支持向量机
0 引言
滚动轴承是旋转机械中最重要的零件之一,因其复杂的工况和结构极易发生故障,从而造成重大经济损失。实际应用中,旋转机械设备多数情况在正常状态下工作,因此可以收集到的故障数据较少,且存在着故障类型不平衡的问题[1-2]。
目前很多学者针对轴承早期故障诊断展开了大量研究。苏文胜等提出一种基于EMD和谱峭度法的故障诊断方法,应用EMD对信号进行预处理从而提高诊断率[3];刘晨斐等提出将改进采样方法和SVM结合,使得样本达到均衡,从而提高变压器故障诊断率[4];张思敏应用等角度重采样提取故障特征,实现齿轮箱故障识别[5];侯文擎等提出一种基于SDAE的方法,得到故障状态的特征表示,应用Soft-max进行故障分类识别[6]。本文提出一种基于生成式对抗网络的数据集增强方法,该方法利用GAN强大的特征提取和数据生成能力,解决了非平衡、小样本条件下轴承故障特征难以提取的问题,通过实验验证了其有效性。
1 生成式对抗网络
生成式对抗网络(generative adversarial networks,GAN)是近年来广受好评的深度学习模型,基于统计学和博弈论来生成数据样本,已迅速成为人工智能研究和应用领域中一种非常重要的模型和工具[7-8]。生成式对抗网络有生成器(G)和判别器(D)两部分组成,将随机噪声z输入到生成器中,生成器通过学习真实样本的概率分布pd,利用随机噪声z生成逼真的伪样本,通过不断训练生成器以达到以假乱真的目的。判别器则用来区分真实样本和生成器生成的样本,二者构成一个动态的博弈过程。理想状况下生成器生成足以“以假乱真”的样本,而判别器难以分辨生成的样本是否真实,此时D(G(z))=0.5,生成式对抗网络的目标函数loss为[9]:
2 基于GAN的故障诊断方法
利用GAN处理原始信号,利用生成信号扩充数据集,并对该包含更多故障信息的数据集应用SVM进行分类,算法流程如图2所示。
方法步骤如下:
①将原始数据集划分为训练集和测试集;
②对信号进行快速傅里叶变换,将得到的频谱作为GAN的输入;
③训练GAN网络,得到生成样本并扩充数据集;
④利用SVM对扩充后的数据集进行分类;
⑤根据实验结果验证方法有效性。
3 实验验证分析
3.1 实验数据采集
本实验在轴承故障模拟试验台(MFS)上进行实验数据采集。轴承型号为MBER-10K ,振动信号由安装在轴承壳体上的加速度计在2100rpm(35 Hz)的驱动速度下采集,采样频率设置为10240Hz。本实验模拟轴承的四种运动状态:正常状态、滚动子故障状态、内圈故障状态和外圈故障状态。图3为四种状态的时域图。
3.2 统计学特性分析
首先对生成信号和原始信号进行统计学特性分析,依次计算二者的欧氏距离、皮尔逊相关系数和KL散度。欧式距离可体现二者之间的距离并评估其相关性,皮尔逊相关系数为两变量之间相关性的度量,KL散度评估二者之间的差异。进行三十次实验,并将结果取平均值。
由表1可知,生成信号与真实信号之间欧氏距离较小,表明其相关度较高;皮尔逊系数为0.7840,表明二者线性相关;KL散度为0.1431表明生成信号与原始信号之间概率分布较小。以上结果表明生成信号与真实信号的概率分布较为接近,满足故障诊断所需样本的要求。
3.3 故障诊断结果
四类故障分为四组并分别采集60组振动数据,从每组的数据中随机中选出40组作为训练样本集,其余20组数据作为测试样本集。将GAN训练生成的数据按照1:1的比例添加到原始数据集中,应用SVM对扩充后的数据集进行故障分类识别。
将扩充后的数据集与原始数据的分类结果进行对比,基于扩充数据集的平均故障诊断率高达97.3%,基于原始数据集的平均故障诊断率为88.5%。图4为两种数据集的分类结果。
图4中,对原始数据集进行分类,虽然可以实现部分故障的分离,但是滚动子故障与外圈故障混叠严重,无法有效分离;图5利用GAN扩充后的数据集分类后各类型故障聚类更紧密,基本达到完全分离,效果更好。
上述实验表明,所提出的基于GAN的轴承故障诊断方法有较好的故障分类效果。实验结果证明,利用GAN算法可以生成有效的仿真信号,从而解决数据不平衡问题,显著提高了平均故障诊断率。
4 结论
综上所述,为了解决轴承早期故障诊断中振动信号样本不足、樣本不平衡等问题,本文提出一种基于GAN的轴承故障诊断方法。该方法利用GAN算法的特征提取和样本生成能力生成有效的仿真信号,实现了小样本、不平衡下的信号数据集增强,提高了故障诊断模型的识别能力。
参考文献:
[1]张雪英,栾忠权,刘秀丽.基于深度学习的滚动轴承故障诊断研究综述[J].设备管理与维修,2017(18):130-133.
[2]沙美妤,刘利国.基于振动信号的轴承故障诊断技术综述[J].轴承,2015(09):59-63.
[3]苏文胜,王奉涛,张志新,郭正刚,李宏坤.EMD降噪和谱峭度法在滚动轴承早期故障诊断中的应用[J].振动与冲击,2010,29(03):18-21,201.
[4]刘晨斐,崔昊杨,李鑫,束江,李亚.不对称样本下基于支持向量机的变压器故障诊断[J].高压电器,2019,55(07):216-220.
[5]张思敏.基于启动电流的转子系统齿轮箱故障诊断方法研究[D].太原理工大学,2019.
[6]侯文擎,叶鸣,李巍华.基于改进堆叠降噪自编码的滚动轴承故障分类[J].机械工程学报,2018,54(07):87-96.
[7]S. Shao, S. McAleer, R. Yan, P. Baldi, Highly-accurate machine fault diagnosis using deep transfer learning, IEEE Trans. Industr. Inform. 2018.
[8]M. Arjovsky, S. Chintala, L. Bottou, Wasserstein gan, arXiv preprint arXiv:1701.07875, 2017.
[9]I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, Y. Bengio, Generative adversarial nets, Adv. Neural Inf. Process. Syst. 2672-2680, 2014.