基于1D CNN-XGBoost的滚动轴承故障诊断
2022-09-19张超秦敏敏张少飞
张超,秦敏敏 ,张少飞
(1.内蒙古科技大学机械工程学院,内蒙古包头 014010;2.内蒙古自治区机电系统智能诊断与控制重点实验室,内蒙古包头 014010)
0 前言
机械设备广泛用于现代社会的各行各业,轴承是机械设备中最通用的组成部件,一旦发生故障,很可能引发严重的事故。近几十年来,由机械设备故障而引发的严重经济损失和人员伤亡事故的例子很多。如陕西秦岭发电厂发生了由轴系断裂引起的5号发电机组故障停机,导致了巨大的经济损失。因此,全面了解轴承运行状态是保证设备正常运转的必要一环。
在滚动轴承故障诊断领域中,常用的分类算法有支持向量机(SVM)和人工神经网络(ANN)。但SVM和ANN都存在着缺陷。SVM对缺失数据十分敏感,且对于非线性问题没有固定的解决方法,因此核函数的选择变得尤为重要。ANN的使用需要大量的参数,如网络拓扑结构、权值等,且学习时间过长。XGBoost是由CHEN和GUESTRIN提出的一种新型提升决策树算法,能够利用CPU的多线程实现多行并行运算,大大减少了运算时间,且算法的精度更高,这些优点使得XGBoost被广泛应用于工程领域。
当XGBoost应用在轴承故障诊断时,首先需要使用合适的方法从时序信号中提取出相关的特征信息,然后将这些特征数据作为输入。当前轴承信号特征提取的方法主要有时域分析法、频域分析法和时频域分析法。张钰等人提出使用时域分析提取特征,把最大值、峭度、歪度等指标做为特征向量输入到XGBoost中进行训练和分类,但是该方法忽略了信号中的频域信息和时频域信息,分类效果较差。针对上述问题,吴定会等提出从信号的时域、频域、时频域中共同提取特征,将多特征融合向量输入XGBoost中进行训练和分类,虽然该方法充分挖掘了信号的特征信息,但是步骤过于繁琐容易出现错误,且自适应性差。基于轴承信号的非线性特点,还可以使用小波包变换法进行特征提取,但是使用单一方法会使得特征的提取不充分,容易造成有用信息的丢失。与上述的特征提取方法相比,一维卷积神经网络(One Dimensional Convolutional Neural Network,1D CNN)解决了人工手动提取信号特征的弊端,可以自适应地对轴承信号特征信息进行深度挖掘,得到更完整的特征信息。
综合以上分析,本文作者利用一维卷积神经网络和XGBoost的优势,提出混合模型1D CNN-XGBoost,以实现滚动轴承信号的自适应特征提取,缩短故障分类时长,得到具有较高准确率和良好泛化性能的故障分类模型。
1 一维卷积神经网络模型
卷积神经网络是一种深度学习算法,其基本结构如图1所示。该算法的本质是对多个卷积核进行不断学习,再使用卷积核对数据进行卷积和池化操作,从而达到提取数据相关特征的目的。一维卷积神经网络的结构与CNN相似,但是其输入为一维向量,卷积核和特征图也是一维的,因此一维卷积神经网络更加适合处理时序信号。
图1 CNN基本结构
1.1 卷积层
卷积层是卷积神经网络的核心部分,卷积层通过卷积核对前一层的特征图进行卷积得到相应特征,再使用合适的激活函数进行非线性变换获得新的特征图,具体过程如下:
(1)
1.2 下采样层
下采样层也叫池化层,深度学习中存在许多不同的池化函数,如最大池化函数,其作用是通过卷积核将输入的特征图划分为许多矩形区域,并且输出每个区域的最大值。池化层通过不断地减小数据的空间大小,使得相关的参数随之减少,在一定程度上防止过拟合的发生。池化过程如下:
(2)
式中:()表示最大池化函数。
1.3 输出层
输出层包含了全连接层和分类层两部分,其中全连接层的作用是将上一层的分布式特征映射到一维空间中,再通过分类层进行分类输出。全连接层转化过程如下:
(3)
2 XGBoost算法
XGBoost算法是对GBDT算法的一种改进。XGBoost与GBDT的最大区别是XGBoost对代价函数进行了二阶泰勒展开,并加入了正则项,使得过拟合的情况不易发生。并且XGBoost使用多线性并程计算,使得训练速度得到了巨大的提升。其算法模型如下:
(4)
该模型的目标函数包括损失函数和正则项两部分:
(5)
采用加法分布的策略对该模型进行优化,可以确保损失函数不断降低,直到优化完所有的棵树。
3 1D CNN-XGBoost模型
1D CNN-XGBoost算法的流程如图2所示。该模型主要由1D CNN特征提取器和XGBoost分类器两部分组成。首先将轴承信号划分为训练集和测试集,再将训练集数据输入到一维卷积神经网络进行训练,待训练完成时,保存该网络模型并使用该网络提取特征,再将特征向量输入到XGBoost进行训练,最后使用训练好的XGBoost模型进行故障分类。
图2 1D CNN-XGBoost算法流程
4 实验与分析
4.1 实验数据来源
采用凯斯西储大学轴承数据中心提供的数据集作为实验的数据来源。实验台如图3所示,该实验台由1.5 kW的电动机、扭矩传感器和一个功率测试计组成。使用电火花加工技术分别对轴承内外圈和滚动体引入故障,故障尺寸为0.177 8 mm。在轴承的驱动端和风扇端分别安装加速度传感器进行数据的采集,由于风扇端受到的外部干扰较多,选用驱动端采集的数据,采样频率为12 kHz。
图3 CWRU实验台
4.2 数据集构建
采集到的驱动端的4种不同的轴承状态数据分别为正常状态数据、内圈故障数据、外圈故障数据、滚动体故障数据。每种状态取300个样本,样本长度为400;在每种状态的300个样本中,取210个样本作为训练集,剩下的样本作为测试集,具体划分如表1所示。
表1 数据集构建
4.3 实验结果分析
本文作者使用的一维卷积神经网络的模型结构如表2所示,主要包含2个卷积层、2个池化层和2个全连接层,每个卷积层的激活函数都为ReLU函数(),并且加入了一个dropout层防止过拟合;学习率设为0.01,迭代次数设为20,batch_size设置为32。将训练集的数据代入模型中进行训练,训练过程中准确率曲线和损失函数曲线分别如图4和图5所示。可以看出:该模型没有发生过拟合,训练效果较好。当训练完成时保存该模型,用该模型作为特征提取器提取特征,再将特征数据集代入到XGBoost模型中。
表2 网络结构
图4 准确率曲线(数据集1) 图5 损失函数曲线(数据集1)
在使用XGBoost算法时,首先需要通过经验对一些参数进行设置。决策树的深度设置为6,若设置过大易发生过拟合;叶节点的最小权重为0.572 6;最小损失分裂值为0.811 6,;学习率为0.1,过大易发生过拟合,其余参数选择默认值。参数设置完成后,再将一维卷积神经网络提取的特征向量数据集代入XGBoost模型中进行训练和测试,各种分类结果如图6所示。可知:除内圈故障分类准确率为99%,其他类型准确率均为100%。该结果充分显示了文中模型在故障分类精度上的优越性。
图6 混淆矩阵(数据集1)
为进一步体现1D CNN-XGBoost模型的优势,分别与XGBoost以及1D CNN模型进行比较,其中XGBoost模型使用的数据集并没有进行特征提取,而是直接使用第4.2节中的数据集。在机器学习中,常常使用准确率、召回率以及准确率和召回率的调和平均数作为指标对模型分类效果进行评估。这些指标的计算公式如下:
(6)
(7)
(8)
式中:表示预测正确的标签数量;表示预测标签中错误的标签数量;表示实际标签中分类错误的标签数量。
分类结果对比如表3所示。可以看到:1D CNN-XGBoost模型的各个指标均高于XGBoost和1D CNN模型,其性能有了很大的提升,同时发现没有使用特征提取数据集的XGBoost的模型分类效果较差,准确率只有90.81%。更证明了在使用XGBoost前,使用合适的方法对数据进行特征提取的必要性。
表3 分类结果对比 单位:%
4.4 泛化性研究
为验证1D CNN-XGBoost的泛化性,使用一组新的滚动轴承数据集进行实验。该数据来源于内蒙古科技大学机械工程学院的HZXT-DS-003双跨双转子滚动轴承实验台,如图7所示。
图7 HZXT-DS-003 滚动轴承实验台结构简图
滚动轴承的型号为6205-2RS,用电火花在轴承滚动体外圈、内圈沟道上加工直径为0.178 mm的单点损伤。轴承数据通过加速度传感器从轴承座上采集,轴的转动速度为1 000 r/min,采样频率为1.2 kHz。每种轴承状态数据取样本600组,样本大小为1 024,每组样本打上标签,取400组作为训练集,其余作为测试集,数据的划分如表4所示。
表4 构建的数据集2
将训练集数据代入一维卷积神经网络中进行训练,该一维卷积网络的结构与第4.3节中的结构相同,其训练过程的准确率曲线和损失率曲线分别如图8、图9所示。可以看到:曲线的波动幅度不大,测试集的准确率略低于训练集,损失率略高于训练集,模型未发生过拟合的情况,训练效果较好。
图8 准确率曲线(数据集2) 图9 损失函数曲线(数据集2)
将训练好的模型提取特征输入到XGBoost模型中进行训练,其中决策树的深度设置为7;叶节点的最小权重为0.572 6;最小损失分裂值为0.611 6;学习率为0.1,其余参数设置为默认值。将训练好的模型进行故障分类,结果如图10所示。可知:轴承正常状态的分类准确率为100%,内圈和滚动体的分类准确率为99%,外圈的分类准确率为97%。结果表明:1D CNN-XGBoost模型在其他数据集上依旧适用,且分类的准确率较高,普适性和泛化性得到了充分的证明。
图10 混淆矩阵(数据集2)
5 结论
XGBoost模型的输入数据若不进行特征提取处理,其分类的准确率较低。因此,需要合适的方法对数据进行自适应特征提取。传统的手动提取特征的方法较为繁琐且丢失信息严重,本文作者提出的1D CNN-XGBoost模型可以自适应地提取特征,特征信息挖掘程度高。通过实验对比可知所提模型的分类准确率高,具有很好的分类性能和泛化性,为轴承故障分类研究提供了参考。