改进VPMCD方法在滚动轴承故障诊断中的应用

2014-12-05潘海洋程军圣

中国机械工程 2014年4期

杨宇李杰潘海洋程军圣

湖南大学汽车车身先进设计制造国家重点实验室，长沙，410082

0 引言

滚动轴承的故障诊断本质上是一个模式识别的过程。神经网络、支持向量机等模式识别方法在滚动轴承故障诊断中应用广泛。但人工神经网络具有存在局部极小点、收敛速度慢、网络学习和记忆不稳定等缺陷，而且如何根据特定问题来确定网络的结构目前尚无很好的办法，仍需凭经验和试验［1］；支持向量机（support vector machine，SVM）分类结果受到核函数及参数的影响，而且该方法处理大量数据时由于有寻优的过程而计算量很大［2］。除了本身固有的缺陷外，神经网络和支持向量机在进行模式识别时都忽略了从原始数据中提取的特征值之间的相互内在关系。

然而，在机械故障诊断中，所有或部分特征值之间大都具有一定的内在关系，而且这种内在关系在不同的系统或类别（相同的系统在不同的工作状态下）间具有明显的不同。因此，可以对各个特征值之间的相互内在关系建立数学模型，对于不同的类别可以得到不同的数学模型，从而可以采用这些数学模型对被测试样本的特征值进行预测，把预测结果作为分类的依据，进一步进行模式识别。基于此，Raghuraj等［3］提出了一种新的模式识别方法——基于变量预测模型的模式识别（variable predictive model based class discriminate，VPMCD）方法，同时还将该方法与神经网络、支持向量机等其他模式识别方法进行了对比，验证了VPMCD方法的有效性和优越性。然而VPMCD法是采用最小二乘回归估计参数，最小二乘回归是建立在自变量之间不存在高度线性相关的假定基础上的，而实际情况中各种自变量之间总是存在着一定的线性相关性的。当这种相关程度比较高时，采用最小二乘法会导致回归分析的正则方程组出现病态，从而使最小二乘法的参数估计不稳定，模型拟合精度难以保证，在此基础上进行预测将可能产生严重的偏差甚至错误［4］。

针对这一缺陷，本文提出了VPMCD方法的改进方法，采用主成分回归估计来代替最小二乘估计。主成分回归估计方法［5］是对普通最小二乘估计方法的一种改进方法。主成分回归估计法在简化结构、消除预测变量之间的线性相关性方面起到了明显的效果，因此，在回归估计时具有比最小二乘法更好的性能。

本文将改进的VPMCD方法应用于滚动轴承故障诊断，先采用局部特征尺度分解（local characteristic－scale decomposition，LCD）方法［6］将滚动轴承振动信号分解成若干个内禀尺度分量（intrinsic scale component，ISC），然后分别求出前几个ISC分量的近似熵［7］作为特征值组成特征向量，最后采用改进的VPMCD方法得到各故障特征值的预测模型，并利用预测模型对待诊断样本的故障类型和工作状态进行分类和识别。

1 改进的VPMCD方法

1.1 VPMCD方法

VPMCD方法是一种基于变量预测模型的模式识别方法，它认为被用来将系统划分为不同类别的全部或部分特征值之间具有内在变量关系，利用不同类别之间的相互内在关系建立数学模型，并采用各类训练样本数据对模型参数进行估计得到不同的预测模型，再通过预测模型对测试样本进行预测分类。

以机械故障诊断问题为例，采用p个不同的特征值X ＝（X1，X2，…，Xp）来描述一个故障类别，对于其中的特征值Xi来说，当故障类别不同时，其他的一个或者多个特征值对Xi的影响也会发生变化。因此，特征值Xi与其余的一个或者多个特征值之间存在着一定的函数关系，而这种关系既可以是线性的，也可以是非线性的。为了识别滚动轴承的故障类型，需要有能够描述这些函数关系的数学模型，以便对测试样本的特征值进行预测，进一步对测试样本进行分类，这种模型称为变量预测模型。

为特征值Xi定义的变量预测模型是一个线性或非线性的回归模型，可以选择以下四种模型之一。

（1）线性模型（L）：

（2）线性交互模型（LI）：

（3）二次交互模型（QI）：

（4）二次模型（Q）：

式中，Xi为被预测变量；Xj（j≠i）、Xk为预测变量；b0、bj、bjj、bjk为模型参数（回归系数）；r为模型阶数，r≤p－1。

以p个特征值为例，选取上述四种模型中任意一个模型，用特征值Xj（j≠i）对Xi进行预测，都可以得到：

式（5）称为变量Xi的变量预测模型VPMi，其中e为预测误差。

VPMCD方法的步骤如下：

1.2 基于主成分估计的VPMCD方法

Raghuraj等［3］提出的VPMCD方法在预测模型的训练过程中采用最小二乘法进行参数估计，但是当自变量间存在高度线性相关时，用最小二乘法进行参数估计会出现病态，这样会使得估计得到的参数很不稳定，在具体取值上与真实值有较大偏差。

多元线性回归分析［8］的一个基本假设是自变量之间不存在多重共线性（线性相关现象），要求设计矩阵Z的秩rank（Z）＝q＋1（q为自变量个数）。如果自变量之间存在完全的线性关系，则它们之间的相关系数为1。一般情况下，自变量之间存在着程度不同的线性相关现象，自变量之间的简单相关系数在0～1之间变化，这时称变量之间存在着近似共线性。变量间存在着近似共线性是一种普遍现象。

当对回归模型

用最小二乘法进行参数估计时，所得的估计量为

其中，Z为设计矩阵，Z′Z为z1，z2…zq的相关系数矩阵，当自变量间存在完全的多重共线性时，设计矩阵Z的秩rank（Z）＜q＋1，此时｜Z′Z｜＝0，（Z′Z）－1不存在，正规方程组Z′Z＾β ＝Z′y 的解不唯一。当自变量间存在近似共线性，且这种近似共线性程度较高时，此时｜Z′Z｜≈0，（Z′Z）－1的对角元素很大的方差阵D（＾β）＝σ2（Z′Z）－1（σ2为方差估计函数）的对角元素很大，因而β0，β1，β2，…，βq的估计度很低。它将给回归分析带来如下影响：①估计量的方差很大，不能正确判断预测变量对被预测变量的影响程度。②回归系数的方差不断增大，回归系数的估计值对于样本数据的微小变化非常敏感，其估计值的稳定性变差。③多元回归方程用于预测时，样本数据中存在的多重共线性问题会在预测中存在，它对预测结果会产生影响，预测结果不确定性会增大。针对这一缺陷，本文提出了基于主成分估计的VPMCD方法，即采用主成分估计代替最小二乘估计。

作为最小二乘估计的一种改进方法，主成分估计通过对原始变量相关矩阵内部结构关系的研究，找出影响模型过程的几个综合指标，使综合指标为原来变量的线性组合。综合指标不仅保留了原始变量的主要信息，彼此之间又不相关，使得在分析模型时容易抓住主要矛盾。主成分估计在回归分析中已经得到了广泛的应用，本文只就其剔除变量间多重共线性的过程进行阐述。

在进行分析前，将各变量进行标准化处理，以消除不同变量存在不同量纲的影响。标准化数据后，设

将主成分估计和最小二乘估计在自变量出现高度线性相关时的预测结果进行比较，结果如表1所示。假设已知x1、x2与y的关系服从线性回归方程：

其中ε为预测误差，x1，x2与ε各取12组值，如表1所示。

表1 数据的取值

2 基于改进VPMCD的滚动轴承故障诊断方法

在滚动轴承故障振动信号特征提取算法中，近似熵在描述信号的复杂性时具有较好的抗噪、抗干扰能力，而且利用较短数据即可以较稳健地估计出信号的近似熵。同时，近似熵能用于随机过程和确定性过程，其取值大小会随着随机过程和确定过程的混合比例不同而不同［7］。因此，近似熵能表征信号的复杂程度和产生新模式的概率，可将其应用于故障诊断领域。而且，文献［7］指出，在实际计算中，数据长度N为有限值，当近似熵的嵌入维数s＝2，相似容量r＝0.1SDx～0.2SDx（SDx为原始数据x（i）的标准差）时，熵值对N的依赖程度最小，具有较合理的统计特性。因此，可以通过近似熵算法对滚动轴承振动信号进行特征提取。

然而滚动轴承振动信号往往表现出非平稳、非线性特性，若直接进行近似熵计算会影响诊断精度，因此，必须先对原始振动信号进行处理。

本文将近似熵算法和LCD算法应用于滚动轴承故障诊断中，通过LCD将滚动轴承振动信号分解为若干个平稳的ISC分量，计算每个ISC分量的近似熵，再利用不同ISC分量中提取的近似熵之间存在相互关系这一特点，采用改进的VPMCD方法建立预测模型，从而进行模式分类。

3 应用

本文将改进的VPMCD方法应用于滚动轴承故障诊断中，采用美国西储大学电气工程实验室的滚动轴承试验数据来对该方法的有效性和优越性进行验证，所采用的轴承型号、参数和试验装置见文献［9］。采样频率为48kHz，电机负载为0.746kW，转速为1772r／min，故障类型分别为：正常状态、外圈故障、内圈故障、滚动体故障。故障点的直径为0.01778mm，故障深度为0.02794mm，每种状态各得到200个样本。

对各样本的原始信号进行LCD分解，信号分解中选择标准偏差法作为终止判据，选择镜像对称延拓方法减少边界效应。由于滚动轴承故障振动信号的故障信息主要集中在高频段，因此，可选取前四个ISC分量，并对各分量求取近似熵值（算法中选择s＝2，r＝0.2SDx），分别标记为x1、x2、x3、x4。将所得的近似熵值组成特征向量，以此作为分类器的输入进行模式识别。

对于四类状态，每类状态可以得到四组特征值，在进行训练和预测之前，先对各特征值的线性相关性进行分析。从四组特征值中选取其中一组作为被预测变量，其余三组作为预测变量，通过相关分析，得到各变量之间的相关系数。对不同类别的不同预测变量进行相关分析时会出现相似的情况，由于篇幅有限，本文在表2中只列举了外圈故障状态下，当被预测变量为x4时，各预测变量之间的相关系数矩阵。

表2 预测变量间的相关系数矩阵

从表2可以看出，各预测变量与其平方项之间，各预测变量与其所在的交互项之间的相关系数都很高，例如x1与的相关系数为0.9965，x1与x1x2的相关系数为0.7661。当模型类型选用LI、Q、QI时，用最小二乘法进行参数估计会出现较大偏差，进而影响分类精度。

为了证明改进的VPMCD相对于原始方法能更好地运用于滚动轴承故障诊断，本文分别用Re－substitution（简称RS）检验、K－fold cross－validation（简称K－CV）检验、Jack－Knife（简称JK）检验对两种方法进行验证，其中RS检验能验证算法的自相容性［10］，K－CV检验和JK检验是较为客观和严格的交叉检验［11］，能反映算法的推广能力。

用RS检验验证时，在两种方法下通过训练得到各变量的最佳模型阶数和模型类型如表3和表4所示。

表3 VPMCD训练得到的最佳模型类型和最佳模型阶数

表4 改进VPMCD训练得到的最佳模型类型和最佳模型阶数

表3和表4中的预测模型类型和模型阶数都是以最小预测误差平方和作为判别依据得到的。然而，从两表中可以看出，原始VPMCD方法通过训练得到的都是三阶二次交互模型，而改进的VPMCD方法通过训练得到的预测模型类型和模型阶数随着被预测变量和状态的不同而不同。这是因为原始VPMCD方法用最小二乘估计时认为随着变量数目的增加，由估计所得的模型拟合性应该更好。但是随着预测变量的增加，变量间的线性相关性也相应增加了，这样反而有可能降低估计精度。

通过三种检验（本文取K－CV检验中的K＝10），对比两种方法的分类结果，如图1～图4所示。

图1 两种算法的RS检验精度

图2 两种算法的10－CV检验精度

图3 两种算法的JK检验精度

图4 两种算法在三种检验下的总检验精度

从图1～图4中可以看出，两种算法的检验精度都比较高，但是相比而言，改进VPMCD方法的检验精度比原方法有所提高。例如，在RS检验中（图1），改进VPMCD方法的外圈故障状态检验精度（93.00%）比原始 VPMCD 方法（90.5%）提高了2.5个百分点；在10－CV检验中（图2），改进VPMCD方法的内圈故障状态检验精度（95.00%）比原方法（93.00%）提高了2个百分点；在JK检验中（图3），改进VPMCD方法的外圈故障状态检验精度（93.00%）比原始VPMCD方法（90.00%）提高了3个百分点。因此，从图4中可以看出，改进VPMCD方法在三种检验下的总检验精度都要高于原VPMCD方法，这说明该方法无论是在算法的自相容性方面还是在算法的推广性方面都要优于原方法，而且该方法在三种检验下的高识别精度也说明了它非常适合于滚动轴承故障诊断。

4 结语

改进的VPMCD方法在参数估计时将主成分估计代替原始VPMCD中的最小二乘估计，弥补了最小二乘估计在变量间出现高度线性相关时难以估计出较稳定的回归参数的不足。通过试验比较可知，改进的VPMCD方法不仅具有非常高的识别精度，而且在自相容性、推广性方面都要优于原始VPMCD方法，因此该方法更加适合于滚动轴承的故障诊断。

值得一提的是，虽然试验中从同一振动信号下的不同ISC分量中提取的近似熵都具有一定的相互关系，但是这种相互关系的具体情况却难以确定，而且特征值之间相互内在关系的实际预测模型也无法得到。然而，本文的重点在于利用特征值之间的相互内在关系建立预测模型，达到模式识别的目的，这种内在关系的具体情况并不需要知道，相应的实际模型也可以利用具体的模型来近似代替，只要达到所需要的分类精度即可。VPMCD方法是在假设特征值之间存在相互内在关系的前提下，通过训练样本从四种预测模型（L型、LI型、Q型和QI型）中选择最佳预测模型，以此作为实际模型的近似模型，并通过近似模型对测试样本进行测试，从而对滚动轴承的故障类型和工作状态进行分类。试验数据的分析结果表明，该方法达到了较高的识别精度，能有效地对滚动轴承的工作状态和故障类型进行识别。

［1］Wang C C，Kang Yuan，Shen Pingchen，et al.Applications of Fault Diagnosis in Rotating Machinery by Using Time Series Analysis with Neural Network［J］.Expert System with Application，2010，37（2）：1696－1702.

［2］Fei Shengwei，Zhang Xiaobin.Fault Diagnosis of Power Transformer Based on Support Vector Machine with Genetic Algorithm［J］.Expert Systems with Application，2009，36（8）：11352－11357.

［3］Raghuraj R，Lakshminarayanan S.Variable Predictive Models－a New Multivariate Classification Approach for Pattern Recognition Applications［J］.Pattern Recognition，2009，42（1）：7－16.

［4］Breiman L.Heuristics of Instability and Stabilization in Model Selection［J］.The Annals of Statistics，1996，24（4）：2350－2383.

［5］Gurmessa T K，Bárdossy A.A Principal Component Regression Approach to Simulate the Bed－evolution of Reservoirs［J］.Journal of Hydrology，2009，368：30－41.

［6］程军圣，郑近德，杨宇.一种新的非平稳信号分析方法－局部特征尺度分解［J］.振动工程学报，2012，25（2）：215－220.Cheng Junsheng，Zheng Jinde，Yang Yu.A Nonstationary Signal Analysis Approach—the Local Characteristic—Scale Decomposition Method［J］.Journal of Vibration Engineering，2012，25（2）：215－220.

［7］Pincus S M.Approximate Entropy as a Measure of System Complexity［J］.Proc.Nati.Acad.Sci.USA，1991，88：2297－2301.

［8］Brown C E.Use of Principal－component，Correlation，and Stepwise Multiple－regression Analyses to Investigate Selected Physical and Hydraulic Properties of Carbonate－rock Aquifers［J］.Journal of Hydrology，1993，147：169－195.

［9］Case Western Reserve University Bearing Data Center.Bearing Data Center Fault Test Data.［EB／OL］.［2009－10－01］.http：／／www.eecs.case.edu／laboratory／bearing.

［10］Cai Yudong，Ricardo P W，Jen C H，et al.Application of SVM to Predict Membrane Protein Types［J］.Journal of Theoretical Biology，2004，226：373－376.

［11］Mardia K V，Kent J T，Bibby J M.Multivariate Analysis［M］.London：Academic Press，1979.