基于HOG图像处理的滚动轴承故障诊断方法
2024-03-31李雪原孙太华
李雪原, 陈 品, 陈 剑,2, 孙太华
(1.合肥工业大学 噪声振动工程研究所,安徽 合肥 230009; 2.安徽省汽车NVH工程技术研究中心,安徽 合肥 230009)
0 引 言
滚动轴承是机电设备中重要的零部件,也是设备的易损件之一[1],其状况好坏对整个系统的安全运行和功能实现有着决定性的影响[2],对滚动轴承进行有效的故障诊断不但可以防止机械精度下降,杜绝安全事故发生,而且可以提高机电设备的性能、稳定性和使用寿命[3-4]。因此,滚动轴承的故障诊断对工业生产的安全性和可靠性意义重大[5]。
在工作条件下,故障特征受载荷、润滑条件、零部件间的振动等各种因素的影响,周围复杂噪声振动环境会影响滚动轴承微弱的故障特征提取。滚动轴承故障诊断的关键在于故障特征的提取和故障类型的识别[6]。近年来,数字图像处理和计算机视觉技术应用不断成熟,在智能监控[7]和行人检测技术[8]等各领域中有着广泛的应用,因其较强的直观性和包含丰富的状态信息,在滚动轴承故障诊断模式识别领域也开始得到应用。国内外已有不少将图像处理方法引入故障诊断领域以实现对轴承故障类型自动判定的研究。文献[9]通过将采集的振动信号转化为振动频谱图像进行处理,并利用卷积神经网络(convolutional neural networks,CNN)方法进行图像处理分类以实现轴承故障诊断,但该方法缺少自适应能力且需要大量原始数据;文献[10]提出一种使用InceptionV3模型基于振动信号波形图像识别的故障诊断方法,但该方法稳定性较差;文献[11]通过连续小波变换将振动信号转化为图像,利用图像识别网络提取信号的时频域特征实现准确分类,但步骤繁杂。
针对滚动轴承故障数据处理方法存在计算量大、步骤繁杂、用时长以及特征提取不全面的问题,本文提出一种基于梯度直方图(histogram of oriented gradient,HOG)图像处理算法的轴承故障识别与诊断方法。滚动轴承发生故障时会产生周期性的振动,分析故障数据时发现有明显的故障频率成分,由于是周期性的振动数据,采用图像处理算法可以有效地进行特征识别。该方法先使用变分模态分解(variational mode decomposition,VMD)分解采集的原始振动信号,生成二维图像;然后利用HOG算法[12]提取该二维图像的灰度、纹理、边缘等特征信息,HOG算法是通过计算图像梯度的大小和方向并统计各个块之间的数据信息,它对偏移敏感性不高且鲁棒性强,能够有效地刻画图像特征。为了解决二维图像处理数据维度过大的问题,采用多维尺度分析(multi-dimensional scaling,MDS)对上述特征数据进行降维处理,既提高了所述方法的识别能力又减少了图像处理的运算时间,使识别效率得到有效提升。
1 基本方法
1.1 梯度直方图算法原理
HOG算法是一种检测物体特征的描述特征方式,常用在计算机视觉和图像处理领域中[13],该算法特征提取过程如图1所示。
图1 图像特征提取过程
HOG特征提取步骤描述如下。
1) 首先将整个图像缩放成一定大小的规范图像,方便后期提取特征,然后将图像转化为灰度图。
2) 通过Gamma校正法对待分类图像进行灰度化,然后归一化处理,这里取γ=1/2,即
I(x,y)=I(x,y)γ
(1)
3) 使用梯度表示图像像素值变化最快的方向,设某一像素点的坐标为(x,y),则该点的梯度大小、方向计算方法为:
Gx(x,y)=H(x+1,y)-H(x-1,y)
(2)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(3)
其中:Gx(x,y)、Gy(x,y)分别表示像素点的水平方向梯度值和垂直方向梯度值;H(x,y)表示像素值大小。
4) 像素点(x,y)处的梯度幅值和梯度方向分别为:
(4)
(5)
5) 分别计算每个划分cell单元内像素点的梯度大小及其方向,即可得到每个cell单元的方向梯度直方图,直方图区间bin表示cell单元内梯度幅值和方向的映射。其中图像块block由cell单元构成,然后联合全部图像块的HOG特征得到整体图像的HOG特征,这就是该图像对应的特征描述,对图像进行分块处理可以有效降低图像局部变化带来的影响。
HOG特征提取算法流程如图2所示。
图2 HOG特征提取流程
1.2 多维尺度分析理论基础
MDS算法是对目标分析对象的差异性(或相似性)信息进行调度,在高维到低维的空间映射过程中能够保留样本点相似性的关键信息,使其尽可能与原先的相似性匹配[14]。MDS的本质是寻找一个低维空间矩阵,使得低维空间矩阵能够保持高维矩阵数据点之间的联系。
设原始高维空间有n个样本点x1,x2,x3,…,xn组成的样本空间,其MDS降维步骤描述如下。
1) 计算高维空间中的距离矩阵Dn×n,其中dij表示样本点xi与xj的距离,则D是对角线全都为0的实对称矩阵。此时dij可以表示为:
(6)
(7)
由于在k维空间中点可以进行平移和旋转,因此会有多种分布要求,为便于讨论,一般希望降维后的数据X均值中心化,即
(8)
由式(7)和式(8)可以推出:
(9)
(10)
(11)
根据式(9)可得:
(12)
根据式(11)~(13),将Sii和Sjj转化为用dij表示的形式,可以得到:
Sij=
(13)
则点积矩阵S中Sij为:
(14)
3) 对矩阵S进行特征值分解,计算特征值及其对应的特征向量,即
S=QΣ2QT
(15)
Σ2=diag[λ1λ2…λn]
(16)
选取前k个较大的特征值的根号值和特征向量用于数据降维,至此实现了高维空间的n个距离可用k维空间的n个坐标描述,即
X=QkΣk
(17)
1.3 遗传算法优化的支持向量机分类
支持向量机(support vector machines,SVM)主要思想是找到一个超平面进行数据集分类,并以此超平面为标准正确分类出所有的训练样本,同时使训练样本中离超平面有“最大间隔”[15],如图3所示。
图3 SVM分类示意图
1) 给定训练样本集yi∈{-1,1},D={(x1,y1),(x2,y2),…,(xm,ym)},划分超平面的方程为:
wTx+b=0
(18)
其中:w=(w1,w2,…,wd)表示法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。
2) 由图3可知,最优分类线为直线P,直线P1和直线P2为距离最优分类线最近的数据点同时平行于直线P,在直线P1和直线P2上的点满足条件:
wTx+b=1
(19)
wTx+b=-1
(20)
这些线上的点称为“支持向量”,支持向量与超平面之间的距离为|1/w2|,支持向量之间的距离为|2/w|,由线性优化理论可知,该最优超平面的问题可表示为:
(21)
s.t.yi(wTxi+b)≥1,i=1,2,…,m
(22)
3) 式(22)是一个凸二次规划问题,通常引入拉格朗日乘子法,将约束条件问题转化为对偶问题:
(23)
(24)
最终可以得到最优分类函数为:
f(x)=sgn(wTx+b)=
(25)
4) 在现实问题中训练样本常存在线性不可分的问题,低维空间中的线性不可分问题通常采用非线性变化,将其转化到高维空间中使其线性可分。转化到高维空间中的方法是引入核函数K(xi,x),因此在非线性SVM的最优分类函数为:
(26)
这里使用高斯径向基核函数得:
(27)
其中,σ>0为高斯核的带宽。
5) 遗传算法(genetic algorithm,GA)起源于对生物系统所进行的模拟研究,是借鉴生物界自然选择和进化机制发展的一种全局优化概率搜索算法。GA算法借鉴了达尔文的进化论和孟德尔的遗传学说,本质上是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。
使用GA算法优化SVM关键参数惩罚因子c和核函数参数g,得到最优的分类模型,具体步骤如下:
1) 对上述降维处理后的数据构建SVM参数集。
2) 设置终止迭代次数和精度,对每个样本进行编码并初始化种群。
3) 对训练集中的所有数据计算种群适应度进行评估。
4) 当种群最优个体适应度达到给定的精度或者达到最大迭代次数则进入步骤6),否则执行下一步。
5) 对当前种群进行选择、交叉、变异产生子代种群,转到步骤3)继续。
6) 终止迭代得到最优惩罚因子cbest和核函数参数gbest,并通过训练得到最佳轴承故障分类模型。
2 轴承故障诊断模型
2.1 数据处理
采集不同故障模式的时域信号构建样本集,直接对原始信号进行分段,选取每段采样点数需要考虑样本至少覆盖1个周期,本文选取每段点数为5 120个采样点,然后采用变分模态分解(variational mode decomposition,VMD)[16]对样本进行分解,得到多个固有模态分量(intrinsic mode functions,IMF),生成各种工况下的二维图像。
VMD是通过变分问题的构造和求解使每个模式分量的中心频率和带宽不断更新,从而获得最佳的分量和中心频率,本质上是将经典维纳滤波器推广到多个自适应频段,将信号分解成指定数量的有限带宽模式分量,并最小化每个模式分量的估计带宽之和[17]。因此与直接使用原信号相比,使用VMD分解后生成的图像可以增加图像所包含的特征信息,同时减少噪声干扰。对采集到的原始数据进行处理,其分解层数均为K,本文所用数据集中K=4,具体分解示意图如图4所示。
图4 轴承振动信号单个样本VMD分解图
2.2 特征提取与降维
采用HOG算法对上述二维图像提取特征数据,根据1.1节理论可知在其他条件不变的情况下,若在对图像缩放的像素大小选择较大时,则图像在表达二维振动信号的局部细节信息会更加清楚,但是block在图像内的滑动次数会增加,进而增加特征数据的维数,在特征矩阵内增加许多元素,使数据出现冗余的情况;对滑动步长进行选择时,滑动步长的增加会同时引起cell单元增大和滑框block尺寸变大,在整个图像内的滑动次数会减小,HOG特征矩阵的维数会减小,但是映射到直方图中会模糊局部细节的表现。因此图像的大小和滑动步长的选择都会影响HOG特征数据的描述。
经过多次验证发现,当选取图像像素大小为64×64时,检测窗口的尺寸为16×16,窗口的滑动步长为(8,8),其运行速度快且实现效率高,此时提取特征维数结果计算如下所述。
block在一个图像内行和列的滑动次数分别为:
(28)
(29)
因此整个图像内的滑动次数为7×7=49次,在一个检测窗口中给出的cell单元的尺寸为8×8,则一个检测窗口中一共有2×2=4个cell单元。这里bin(直方图区间)将梯度方向划分成9个区间,将幅值填充到对应的梯度方向区间内,则每个cell单元上都可以由一个9维的直方图向量用来表示梯度幅值和方向。
由以上分析可知,在一个像素大小为64×64的图像内,其HOG特征的维数为49×4×9=1 764维。
图像处理方法所提取出的特征向量存在维度高的问题,在高维空间中会给计算带来很大的麻烦,尤其本文中振动图像构成简单,提取图像的特征矩阵会出现样本稀疏的问题。而在高维空间中更容易找到一个超平面将目标分开,但是高维空间中训练分类器相当于在低维空间中构建一个复杂的分类器,会过于注重结果的正确性,甚至把一些错误数据当成正确数据参与分类,再对新数据进行预测时容易出现过拟合的情况,缺乏对新数据的泛化能力,这种现象被称为“维数灾难”(curse of dimensionality)。
使用降维方法可以有效地降低以上危害,在低维空间中有效提高样本的密度,提高对新数据的泛化能力,在计算难度下降的同时保留关键信息,便于后续进行特征识别,从而进一步缩短特征运算时间。
2.3 轴承故障诊断模型
由2.2节获得低维图像特征数据后,采用GA算法优化的SVM分类模型进行训练,提高分类模型的精度,其流程描述如下:
1) 采集原始数据,分段后经VMD处理构建一定大小的二维振动信号图像。
2) 使用数字图像处理方法HOG提取图像特征。
3) 利用MDS算法进行特征数据降维处理,对处理后的数据集添加标签,建立分类模型,划分训练集与测试集。
4) 导入训练集,采用GA优化SVM惩罚因子c和核函数参数g,得到最优参数。
5) 以最优参数建立最佳分类模型,输入测试集得到分类结果。
3 实验与分析
为验证所提方法的有效性,数据采集使用轴承型号为NU1010EM和N1010EM的单列圆柱滚子轴承,轴承参数见表1所列。其中:NU1010EM拆卸方式为内圈可拆;N1010EM拆卸方式为外圈可拆。
表1 滚动轴承参数
采用合肥工业大学航空发动机主轴轴承试验机采集不同类别故障轴承振动数据。
试验前使用线切割加工方式分别加工出包括内圈故障、内圈滚子故障、外圈故障、外圈滚子故障、滚动体故障以及正常轴承在内的6种故障参数的轴承数据,加工示意图如图5所示,试验装置如图6所示。
图5 滚动轴承滚动体和内圈单点故障图
图6 轴承信号采集试验装置
上述故障尺寸均为9×0.2 mm,信号采集试验装置以20.48 kHz采样频率分别采集3种工况的轴承故障振动信号用于分析。
各工况参数见表2所列。
表2 工况参数
数据集选取在一种工况下每种故障类型的124个样本,则一种工况下的不同故障共6×124个数据集,对不同类型的故障添加类别标签,分别为[1 0 0 0 0 0]、[0 1 0 0 0 0]、[0 0 1 0 0 0]、[0 0 1 0 0 0]、[0 0 0 1 0 0]、[0 0 0 0 1 0]、[0 0 0 0 0 1]。选取其中70%划分训练集,并且使用五折交叉验证法划分验证集,其余30%作为测试集,用来验证模型的诊断分类能力。
采集到工况1下6种故障类型部分时域数据信号,如图7所示。
图7 轴承振动信号部分时域图
验证实验使用的计算机配置及其软件版本为:Windows 10 64位操作系统,处理器为AMD R7-4750u@1.7 GHz,内存为16 GiB,使用的软件版本为MATLAB 2021a。
为了验证本文方法的优越性,将本文方法与方法1(未使用VMD预处理的方法)、方法2(使用VMD方法)处理统计每个IMF分量的峭度、峰值因子、裕度因子、方差、均方根5个特征参数,共计20个数据作为输入向量,并对这3种方法进行对比实验(对比方法除所述之处不同外,其他过程均相同)。
为了更加直观地反映3种方法的特征数据分布情况,结合T-SNE高维数据可视化(T-stochastic neighbor embedding)方法,对工况1下的特征数据进行低维可视化展示。
3种方法下的数据集在低维空间中的映射视图如图8所示,其中不同类别标签使用不同的颜色表示。
图8 T-SNE数据可视化视图
从图8可以看出:图8a和图8b中的部分数据点混合在一起,使得后续分类效果容易出错;而图8c中的类别分离明显,各种特征之间可以得到有效的分隔。
3种方法的实验结果对比见表3所列。
表3 实验结果对比
由表3可知:采用本文所提出的基于图像处理故障诊断方法准确率最高;采用方法2 VMD预处理比方法1直接使用原始时域信号生成的图像效果高2%~3%,预处理可以使图像更加规范化同时增强时域信号数据特征,在不同故障类型下表达的图像特征更加明显,同时去除了降噪处理这一流程;本文方法比采用统计IMF特征参数的准确率提高2%~5%,与使用有限个特征参数相比,本文方法可以更加有效地利用时域振动信号故障特征进行诊断,同时方法2在计算特征参数时需要对每个IMF分量分别计算特征数据,需要全部数据参与运算,该方法运算数据量太高,运行速度缓慢,耗时较长。
以上结果验证了图像识别技术在故障诊断领域能够得到有效的利用,能有效快速识别在噪声干扰下的故障特征,避免了使用复杂信号分解的手工特征提取方法带来的故障信息丢失,降低了诊断过程的操作难度,减少了运行时间。
4 结 论
本文提出了一种利用图像处理的轴承故障诊断方法,基于航空发动机主轴轴承试验机采集不同类别故障轴承振动数据,将图像处理的计算方法引入故障诊断领域,对于使用振动信号的旋转机械结构的故障诊断有一定的借鉴意义。该方法流程简单,操作步骤少。实验结果表明,该方法可以提高模型鲁棒性和泛化能力,同时保证分类结果的准确性。
1) 将故障检测问题转换为图像识别问题,将传统的特征参数运算过程转化为灰度图像的灰度值运算过程,整个故障诊断流程不需要任何手动的特征提取,有效地缩短了特征提取时间,减少了处理步骤。
2) 由实验对比结果可知,采用VMD方法对时域数据处理后生成数字图像,增加了图像表达的信息数据,增强了图像特征之间的差异性。
3) 采用MDS方法对数字图像特征数据进行降维,不但可以保留原始数据中的有效信息,而且进一步缩短了特征运算时间。