基于全局约束的局部融合线性嵌入算法的轴承故障诊断
2023-08-06刘远红黄颖涛
刘远红 黄颖涛
摘 要 提出一种基于全局约束的局部融合线性嵌入方法,该方法首先在原始空间对数据进行低秩约束,捕捉数据的全局子空间结构,同时去除数据噪声;其次分别在低秩子空间和原始空间中挖掘数据的两种几何结构;然后,通过重构误差评估两种结构的重要性,实现两种结构的线性融合;最后,构建数据的低维重构函数,完成数据显著特征的提取。在标准的轴承数据集与实验室采集的数据集上进行验证,结果表明:所提方法能够很好地利用数据的全局信息以及局部重构信息,更具鲁棒性,故障识别率也得到了相应的提高。
关键词 局部线性嵌入 特征提取 低秩约束 全局结构 局部结构 数据降维
中图分类号 TP391 文献标识码 A 文章编号 1000-3932(2023)04-0529-09
随着现代化生产系统对安全性[1]和稳定性[2]要求的提高,机械故障诊断技术[3]得到了迅速发展。振动信号[4]中蕴含了设备丰富的信息,因此振动信号常用于机械设备的故障诊断。然而在实际应用中,采集的振动信号冗维度高,这就导致有限的数据在空间中的分布变得稀疏[5],难以形成有效的簇,增加了对数据分析的难度。因此从高维数据中提取出能表征原始数据最本质的特征[6]是非常必要的。
流形学习[7]作为一种非线性降维方法,已成为近年的研究热点。流形学习的基本思想是在高维空间中挖掘数据的某种局部结构,并在低维流形中保持这种结构不变,实现对数据显著特征的提取。目前,一系列经典的流形学习算法相继被提出,如拉普拉斯特征映射(Laplacian Eigenmaps,LE)算法[8]、等距映射(Isometric Mapping,ISOMAP)算法[9]、局部切空间对齐(Locally Tangent Space Alignment,LTSA)算法[10]、局部保持投影(Locality Preserving Projections,LPP)算法[11]及局部线性嵌入(LLE)算法[12]等。其中LLE算法以保持数据局部重构权值不变进行低维嵌入,成为了流形学习中最为经典的算法之一。
然而,LLE算法在对数据进行特征提取时仍然存在一些局限性,如LLE算法对局部结构的选取和噪声较为敏感。针对局部邻域选取问题,王锐等从数据度量方式出发,提出利用马氏距离、余弦相似性等度量方式对数据的相似性进行评估,使得数据间的相关性更加可靠合理[13,14]。LIU Y H等則同时考虑数据的两种局部线性结构,再有机地将两种结构以不同方式融合起来,有效解决原算法只考虑单一结构的问题[15,16]。针对数据噪声问题,JAIN N等从数据局部线性结构出发,自适应地进行近邻选择,有效解决邻域参数对特征提取结果的影响[17,18]。文献[19,20]则考虑数据对噪声敏感的问题,提出一种对数据特征提取的同时对数据噪声具有鲁棒性的改进方法。文献[21]提出可以根据数据的结构保持将众多降维算法分为局部结构保持和全局结构保持两类,局部结构反映数据的内部属性,全局结构可以理解为数据的外部整体属性。受文献[21]的启发,以上算法在对数据特征提取的时候只关注数据的局部结构,忽略了数据的全局结构。在实际应用中,一旦局部结构遭到破坏或者局部邻域选择不当,会使识别精度大幅降低。
因此,笔者提出一种基于全局约束同时融合两种局部结构的降维算法。该算法将核范数作为原始数据的低秩约束,以捕获数据的全局子空间结构,用L21作为数据噪声的约束。然后,为了更好地利用数据的结构信息同时兼顾去除噪声的影响,挖掘并融合低秩子空间和原始空间的局部拓扑结构。最后构建数据的低维重构函数,实现对数据进行显著特征的提取。从实验结果可以看出,该方法能够有效地解决算法对邻域选取敏感的问题,且在各方面都优于其他相关算法。
1 相关工作
本节首先简要介绍两种相关算法的基本理论:局部线性嵌入算法和鲁棒主成分分析(Robust Principal Components Analysis,RPCA)算法。
1.1 局部线性嵌入算法
1.2 鲁棒主成分分析算法
2 基于全局约束的局部融合线性嵌入
本节主要描述全局约束的局部融合线性嵌入(GC-LFLE)的目标函数以及算法过程。
传统的LLE及其优化算法都是利用不同度量方式得到的数据的单一局部结构。这些方法对数据噪声非常敏感,因为一旦数据存在噪声或者误差,数据的局部结构就会发生改变,同类数据可能就被分离开来,此时再仅仅依靠局部结构来保持数据的完整性显然是不可行的。考虑到数据遭到破坏的可能性,同时兼顾数据最原始的结构,将两种结构结合起来才能有效地解决数据噪声对算法的影响。所以为了更好地保持数据的原始结构,笔者利用数据的低秩结构来保持数据的全局结构,同时假设数据噪声是稀疏的。
3 实验结果与分析
笔者采用两个滚动轴承数据集进行实验,实验所对比的线性降维方法主要有RPCA+LLE、线性判别分析方法(Linear Discriminant Analysis,LDA)、LPP,非线性降维方法有LLE、ISOMAP、LTSA。其中RPCA+LLE算法是先对数据进行RPCA去噪,再将低秩矩阵直接进行LLE特征提取的过程,采用此方法是为了与笔者所提的同时考虑全局约束和局部信息融合的方法形成对比。
3.1 数据集介绍
CWRU数据集。该数据集是凯斯西储大学提供的公开数据集,其实验数据来自于图2所示的测试平台,包括一个1 470 W的电机(左),一个扭矩传感器/编码器(中),一个功率测试计(右)和电子控制设备(未显示)。该数据集在负载为0、采样频率为12 kHz、转子转速为1 720 r/min的情况下采集,包含正常数据、滚珠故障数据、轴承内圈故障数据和轴承外圈故障数据4种。整个数据集为1024×400的矩阵,其中,每一个样本包含1 024个数据点,每一类数据包含100个样本。
OL数据集。该数据集是笔者所在实验室采集的数据集,其实验平台由电机、轴承和齿轮箱组成,如图3所示。该数据集在负载为0、电机采样频率为10 kHz、转速为1 400 r/min的情况下采集,也包含正常数据、滚珠故障数据、轴承内圈故障数据和轴承外圈故障数据4种数据,其中,每一个样本包含1 024个数据点,每类数据包含100个样本。
3.2 数据可视化实验
本实验中,分别将所有对比方法以及笔者提出的GC-LFLE方法用在两个数据集上进行实验。图4表示将CWRU数据集应用每种算法将高维数据降到三维的可视化结果,图5表示在OL数据集上的三维可视化结果。每幅图中红色点表示正常数据,蓝色点表示滚珠故障数据,绿色点表示轴承内圈故障数据,黑色点表示轴承外圈故障数据。从图4、5可以看出,笔者所提方法在两个数据集上都可以将4类数据有效地分开,同时同类数据保持很好的紧密型。其中LPP算法(图4e、5e)有3类数据分类效果表现比较好,类内紧凑性和类间分散性都取得很好的结果,但总存在两类数据混在一起的情况。
3.3 数据聚类实验
笔者所提方法GC-LFLE与相关算法的实验结果对比见表1,在对比实验中加入了LDA方法。从表1数据可以看出,所提算法可以很好地保持数据类内的紧密型和类间的可分性。从RPCA+LLE的结果看来,对原始数据先进行去噪处理有适当改善后续数据局部对特征提取的影响,不过仅考虑单个局部结构去进行特征提取仍然无法达到很好的效果;LDA和LPP的结果也显示在CRWU中取得了不错的效果,但在数据类内收敛性上表现得还不够优越;而笔者所提方法GC-LFLE在类内收敛性和类间分散性上都取得了很好的效果,自然聚类的指标J也取得了一个特别理想的值。综上所述,该实验进一步证明所提算法在两个数据集上的先进性,这与可视化实验的结果一致。
3.4 识别精度实验
为进一步验证笔者所提方法将数据投影到低维时数据的聚类效果,在两个数据集上进行识别精度测试实验。该实验将每类100个样本分成80个训练样本和20个测试样本,随机抽取测试样本先对其进行降维处理,再识别其故障类型。与相关算法的比较结果如图6所示,可以看出,笔者所提方法对每一类故障数据的识别都非常成功,且对两个数据集的每类故障样本的识别精度都达到了97%以上。
3.5 鲁棒性实验
大多数流形学习方法虽然在数据降维上取得了不错的效果,但仍然存在一个问题:对邻域拓扑结构的选取非常敏感,当数据局部遭到破坏或者近邻参数k选取不同,都可能造成局部邻域结构发生变化,从而使得识别精度大幅下降。经分析,邻域敏感是因为近邻参数k的选取和局部结构不完整,直接影响算法对数据特征的提取结果,这给后续研究带来了很大的难题。本实验从识别精度和可视化两个方面去验证笔者所提方法在近邻参数选择问题上的鲁棒性。
3.5.1 识别精度鲁棒性实验
为验证算法在选取不同近邻参数k时对故障识别精度的影响,本实验在两个数据集上分别选取4、7、10、13、16五种不同k值,其识别精度结果如图7所示。可以看出在两个数据集上选取不同k值时,其他算法的识别精度随着k值变化出现了波动,而笔者所提方法基本保持稳定。对比图7a、b可以发现,同一算法面对不同数据集时,不仅识别精度最高时所对应的k值不同,而且随着k值变化识别精度变化趋势也不同,反映出不同数据集存在不同的内部结构,相同算法最优的识别精度所对应的参数也不同。相反地,笔者所提方法识别精度一直保持在比较稳定的状态且都高于其他算法。同时也得以验证:当数据局部结构发生变化(不稳定或者存在噪声)时,加入全局约束也可以很好地保证数据的真实性和完整性,从而使得算法更具鲁棒性。
3.5.2 可视化鲁棒性实验
与识别精度鲁棒性实验出发点一样,为验证不同k值对数据三维可视化的影响,利用笔者所提方法在两个数据集上分别选取4、16两种不同k值,三维可视化结果如图8、9所示。从实验结果可以看出,在k取不同值时,三维可视化结果都呈现出较好的聚类效果,再次证明笔者所提方法对参数k具有鲁棒性。
4 结束语
笔者提出一种基于全局约束的局部融合线性嵌入方法,该算法充分利用了数据的结构信息,同时考虑低秩子空间和原流形空间中的几何结构,使得其得到的低维嵌入结果更能反映滚动轴承真实的运行状态。最后,在两个滚动轴承故障数据上进行大量实验,验证了该算法对近邻参数k的鲁棒性,故障识别精度达到了97%以上,进一步体现出该方法的优越性。
参 考 文 献
[1] 李志杰,陈吉清,兰鳳崇,等.机械外力下动力电池包的系统安全性分析与评价[J].机械工程学报,2019,55(12):137-148.
[2] 龚榕,罗思琦,叶波,等.厚度无损检测仪器的精度长期稳定性研究[J].机械工程学报,2019,55(21):161-169.
[3] 张键.机械故障诊断技术[M].北京:机械工业出版社,2008.
[4] 沈继忱,赵士荣,董明瑞.管道振动故障三维识别方法[J].化工自动化及仪表,2012,39(1):28-31.
[5] 姜维,庞秀丽.面向数据稀疏问题的个性化组合推荐研究[J].计算机工程与应用,2012,48(21):21-25.
[6] YUILLE A L,HALLINAN P W,COHEN D S.Feature extraction from faces using deformable templates[J].International Journal of Computer Vision,1992,8(2):99-111.
[7] LIN T,ZHA H.Riemannian Manifold Learning[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2008,30(5):796.
[8] SCH?魻LKOPF B,PLATT J,HOFMANN T.Convergence of Laplacian Eigenmaps[C]//Advances in Neural Information Processing Systems 19: Proceedings of the 2006 Conference.MIT Press,2006:129-136.
[9] BALASUBRAMANIAN M.The Isomap Algorithm and Topological Stability[J].Science,2002,295.DOI:10.1126/science.295.5552.7a.
[10] ZHANG Z Y,ZHA H Y.Principal Manifolds and Nonlinear Dimension Reduction via Local Tangent Space Alignment[J].Journal of Shanghai University,2002,8(4):406-424.
[11] HE X F.Locality preserving projections[J].Advances in Neural Information Processing Systems,2003,16(1):186-197.
[12] ROWEIS S T,SAUL L K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science,2000,290:2323-2326.
[13] 王銳,王新.基于小波包熵和马氏距离的级联式变频器故障诊断[J].自动化仪表,2017,38(12):27-30;36.
[14] MIAO A M,SONG Z H ,GE Z Q,et al.Nonlinear fault detection based on locally linear embedding[J].Journal of Control Theory & Applications,2013,11:615-622.
[15] LIU Y H,HU Z B,ZHANG Y S.Bearing feature extraction using multi-structure locally linear embedding[J].Neurocomputing,2020,428(4):280-290.
[16] 李元,李榕.基于多核支持向量机的多模态过程故障检测[J].化工自动化及仪表,2022,49(3):286-293.
[17] JAIN N,VERMA S,KUMAR M.Adaptive Locally Linear Embedding for Node Localization in Sensor Networks[J].IEEE Sensors Journal,2017(9):2949-2956.
[18] 张绍辉,李巍华.可变近邻参数的局部线性嵌入算法及其在轴承状态识别中的应用[J].机械工程学报,2013,49(1):81-87.
[19] ZHANG Y S,YE D,LIU Y H,et al.Robust locally linear embedding algorithm for machinery fault diagnosis[J].Neurocomputing,2018,273:323-332.
[20] HUANG L Z,ZHENG L X,CHEN C Y,et al.Locally Linear Embedding Algorithm with Adaptive Neighbors[C]//International Workshop on Intelligent Systems & Applications.IEEE,2009.DOI:10.1109/IWISA.2009.5 072944.
[21] 赵孝礼,赵荣珍.全局与局部判别信息融合的转子故障数据集降维方法研究[J].自动化学报,2017,43(4):560-567.
[22] CANDES E J,LI X D,MA Y,et al. Robust Principal Component Analysis?[J].Journal of the ACM,2011,58(3):1-37.
(收稿日期:2022-09-23,修回日期:2023-05-24)
Bearing Fault Diagnosis Based on Global Constraint and Local Fusion Linear Embedding Algorithm
LIU Yuan-hong , HUANG Ying-tao
(College of Electrical and Engineering Information,Northeast Petroleum University)
Abstract The local linear embedding method based on global constrain was proposed, which firstly imposed low-rank constraints on the data in the original space, captured the global subspace structure of the data and removed data noise at the same time; secondly, it mined two geometric structures of the data in the low-rank subspace and the original space, respectively; then, through reconstructing the error, the importance of the two structures was evaluated, including realizing linear fusion of the two structures; finally, the low-dimensional reconstruction function of the data was constructed to complete extraction of the salient features of the data. Validation on the standard bearing data set and the data set collected in the laboratory shows that, this method can make good use of the global information of the data and the local reconstruction information, and it has good robustness together with correspondingly improved fault recognition rate.
Key words local linear embedding, feature extraction, low-rank constraints, global structure, local structure, data dimension reduction