APP下载

奇异值分解与移移学习在电机故障诊断中的应用

2017-04-21沈飞陈超严如强

振动工程学报 2017年1期
关键词:迁移学习特征提取故障诊断

沈飞 陈超 严如强

摘要:针对变转速、变负载条件下的电机故障诊断问题,提出了一种基于自相关矩阵奇异值分解(Singular ValueDecomposition,SVD)的特征提取和迁移学习分类器相结合的诊断方法。对于Hankel矩阵提取的奇异值向量,设计了平均曲率区分度指标来描述特征差异性,迁移学习TrAdaBoost算法通过迭代过程中调节辅助振动数据的权重来帮助目标数据学习,提升了分类正确率,同时利用向量夹角余弦进行可迁移度检测从而避免负迁移。试验结果表明,SVD无需利用故障先验知识,具有通用性,且迁移学习相比传统机器学习在目标振动数据较少条件下性能得到显著提升。

关键词:故障诊断;奇异值分解;迁移学习;可迁移度;特征提取

中图分类号:THl65+.3;TPl81

文献标志码:A

文章编号:1004-4523(2017)01-0118-09

DOI:10.16385/j.cnki.issn.1004-4523.2017.01.016

引言

变工况环境、无法直接测量以及新故障类型等条件往往导致电机故障诊断中目标故障数据量较少甚至无法获得,训练故障数据与目标故障数据分布特性不同等情况的发生。而AdaBoost迭代算法,K最近邻分类算法(KNN)等传统机器学习分类方法均以训练数据与测试数据具有相同的分布特征且数据量足够为前提,将不再适用。

为克服外在因素的影响,在故障特征提取方面,Yang等人提出了一种基于变量预测分类(VPM-CD)的故障模型,将局域均值分解(LMD)和阶次跟踪分析相结合用于变转速滚动轴承振动故障特征的提取,模型能有效区分轴承故障状态;Borghesani等针对变工况情况利用倒谱分析对信号进行预白化处理,用于自适应损伤识别;陈小旺等人推广了一种迭代广义同步压缩变换方法,有效改善了同步压缩变换分析频率时变信号时的时频可读性,并应用于变工况下行星齿轮箱的故障诊断,但是现有方法大多基于故障特征的已知先验知识,如故障频率、噪音干扰等,在通用性方面有所欠缺。在故障分类方面,Guyon等针对训练与目标故障数据的不同分布特征提出因果挑战算法,并利用权重特征排列的支持向量机(sVM)算法进行分类;Bassiuny等人以希尔伯特边缘谱为输入特征,建立学习矢量量化(LVQ)网络模型,上述方法均取得了良好的诊断效果,但其实质仍是改进的机器学习,未能克服其算法局限性。

迁移学习近年来受到机器学习领域的广泛关注,其具备学习先前任务的知识和技巧并应用到新任务的能力。传统机器学习中,学习任务之间是相互独立的,当两者数据分布不同时,在训练集训练好的学习系统无法取得满意表现,需要进行重新训练。而在迁移学习中,虽然源任务和目标任务不同,但可以從不同源任务的不同数据中挖掘与目标任务相关的知识并帮助目标任务的学习,其已在文档分类、计算机视觉、搜索排序等领域得到了应用。本文借鉴迁移学习在其他领域的成功应用,利用相邻或常规故障数据帮助少量目标故障数据分类,提出一种新的电机故障诊断方法。同时,采用自相关奇异值分解(SVD)的电机故障特征提取方法,为迁移学习提供不依赖先验知识,且具备一定物理意义的特征,奇异值特征的普适性与迁移策略的灵活性,使得电机故障诊断能够有效克服变转速变负载带来的物理条件变化的影响,增强诊断通用性,降低成本;同时通过精确计算迁移学习的可迁移度,从而帮助辅助数据的选取,有效避免负迁移。

3.实验研究与性能分析

3.1实验条件与参数

实验数据来自美国凯斯西储大学电机轴承数据中心,振动信号由图2所示的电机轴承测试系统测得,系统包括电机(左),测力计(右)以及控制电路。数据通过16通道的加速度计采集,采样频率12kHz,测试实验条件与参数如表1所示,包括变转速与变负载时不同故障程度与故障位置的振动数据采集。

3.2基于SVD的特征提取与性能分析

根据SVD特征提取原理,对表1实验条件的电机轴承数据进行特征提取,试验测得不同电机轴承故障的无冗余向量维数Q在127~164之间波动,表明有效故障特征与冗余噪音的区分边界较为模糊,故Hankel矩阵维数选取M=N=Q=150。

所得奇异值特征向量的平均曲率曲线如图3所示,图3中不同电机轴承故障对应点间的平均曲率间距反映特征区分能力,故有如下结论:

1)故障类型的量变与质变间存在差异,图3(b)中,健康轴承(0mm)与故障轴承的平均曲率问距大于故障轴承内部间距;

2)故障类别的本质存在差异,图3(c)中,三类外圈故障问平均曲率间距小于外圈与其他故障部位间距;

同时奇异值特征向量的平均曲率随维数递减,即维数Q越小,轴承故障分类能力越强。然而维数越小,包含的有用信息量越少,故根据式(4)进行特征选取,如下:

电机轴承故障直径的区分度D4与分类性能指标参数q的比值曲线如图4所示。图4表明,特征维数从150降低至50时,其分类性能提升达29.53%(0vs.0.356mm),至少提升11.67%。表2给出了故障直径诊断目标的分类性能指标参数表。可见,当Dk/g大于0.893时,诊断统计正确率达99.9%。图4中2组曲线满足正确率要求,3组曲线不能满足该要求(即无论维数如何选取,诊断精度均低于99.9%),而0.178mm和0.356mm两类故障区分性能在维数为96达到目标效果(点①),故选取特征维数96,此时兼顾诊断正确率、信息量以及计算量要求。

3.3迁移学习试验与性能分析

3.3.1可迁移度试验与性能分析

试验中目标振动数据采用等比例故障样本,辅助振动数据的分布比例如表3所示;变转速与负载时试验参数设置如下:1)目标数据:1797,1772,1730r/min转速样本;2)辅助数据:1750r/min转速样本,其单故障奇异值向量相似度如表4所示。变试验对象参数设置如下:1)目标数据:驱动端样本;2)辅助数据:风扇端样本,其单故障奇异值向量相似度如表5所示。

根据表4和表5,可以得到如下结论:

1)变转速与负载时振动数据对电机轴承故障诊断的影响小于变试验对象的影响(即表4所示的单故障相似度整体大于表5),是由于来自不同试验对象的辅助数据与目标数据共性较小。

2)变转速与负载对内圈故障的影响略大于其他故障类型,而变试验对象对各故障部位的影响较为平均,是由于变转速的辅助与目标数据只对与转速相关的故障类型影响较大,而变试验对象对所有故障类型产生影响。

3)无论是变转速、变电机负载还是变试验对象,其影响均随着故障程度(直径)的增大而增大,即呈正相关。

故在引入辅助数据时,合理分配辅助数据的故障比例尤为重要,根据表3和式(10),计算变转速与负载、变试验对象的目标和辅助数据的综合相似度值,如表6所示。

根据综合相似度值列表,设置迁移学习参数如下:1)目标振动数据样本:50组;2)辅助振动数据样本:50和250组;3)迭代次数:20次。设置KNN机器学习参数如下:1)目标振动数据样本:50,100,150,200和250组;2)迭代次数:20次。比较故障诊断正确率,得到可迁移度阈值st,统计列表如表7所示。表7表明:辅助数据较少时,诊断性能的提升需要与目标数据更大的相似度,辅助数据较多时,阈值上升缓慢,更有助于st选取。实施迁移学习之前,综合相似度Sw与st相比较,若Swt,则导致负迁移,应重新选取辅助数据样本。

3.3.2迁移学习试验与性能分析

迁移学习参数设置如下:1)目标振动数据样本:50组;2)辅助振动数据样本:50和250组;3)迭代次数:20;4)测试振动数据样本:300组,5)均值统计:10次。利用表6提供的辅助数据组合对1:1与1:5比例条件的目标振动数据进行故障诊断,得到故障部位和故障直径的诊断结果,如表8和图5所示。

根据图5,计算综合相似度与诊断正确率曲线的相关系数分别为0.85和0.95,表明电机轴承故障的迁移学习分类结果与辅助数据选取显著相关,辅助数据与目标数据共性越大,越有利于故障诊断。同时表8和图5表明,在目标数据与辅助数据比值为1:1的基础上再注入4倍辅助数据有助于增强学习效果。最后注意到,故障部位的学习条件比故障直径诊断更为苛刻,后者即使在综合相似度低于0.75时仍能保证100%的正确率,故St应当按照前者选取。

为了进一步验证目标数据量与两者比值对诊断性能的影响,笔者又进行了相关研究,图6描绘了不同数据量和比值的故障部位诊断正确率曲线,可以得到如下结论:

1)目标数据与辅助数据比值为1:1时迁移学习的诊断效果最差,比值增大时效果较好。考虑到迁移学习中辅助数据样本多于目标数据样本,故其优势体现在曲线前端。

2)目标数据量越多,诊断正确率越高,100组数据的正确率平均比10组数据提升17.19%,但学习数据越多,计算量越大,所需时问越长,故两者应适中选取。

本文同时对传统机器学习与迁移学习进行性能比较,机器学习采用KNN算法,参数设置如下:1)目标振动数据样本:50,100,150,200和250组;2)迭代次数:20;3)测试振动数据样本:300组;4)均值统计:10次。其诊断正确率如表9所示,迁移学习采用5倍辅助数据,两者性能比较如图7所示,可以发现:

1)当目标数据量较大时,两者均能达到很好的性能;当目标数据量较小时,机器学习无法诊断,而迁移学习仍能保证85%以上的正确率,在10倍标识数量(50组)时迁移学习较机器学习诊断性能提升12.69%。

2)两者故障直径分類性能均优于故障部位分类性能,说明迁移方法对不同诊断目标性能同时提升。

就复杂度而言,虽然基于TrAdaBoost算法的迁移学习在KNN机器学习的基础上增添了权值调整,带来一定的计算量,但相比其性能的提升是值得的。但电机轴承目标振动数据足够时,无迁移学习的必要。

为进一步验证迁移学习方法的适用性和通用性,对比迁移学习在大幅变转速条件下的应用优势,本文利用电机模拟试验平台进行试验,如图8所示。实验条件包括:1)转速:20,30,40,50Hz;2)电机故障类型:转子不平衡(UBM)、转子弯曲(BRM)、断条(BRB)和健康(HEA);3)采样频率:20 kHz。

由表10可以得到如下结论:

1)当目标数据不足时,不论是转速恒定点还是变化点,迁移学习对机器学习的诊断性能提升均较为明显(约25%);目标数据充足时,转速变化点的提升性能(16.45%)优于转速恒定点(3.44%),即转速变化点振动特性不一致时,即使增加目标数据量,机器学习性能也无法显著提升;

2)大幅变速和小幅变速实质是针对不同测试时刻而言,并且可以看出,电机转速幅值变化对机器学习诊断性能影响较大(m=40时诊断正确率相差4.34%),而对迁移学习算法影响较小(m=40时两者均为91.00%)。

电机试验证明,变转速时迁移学习比机器学习更具优势,后者若将振动特征不同的辅助数据并入目标数据,其不但没有帮助,反而误导诊断结果,而迁移学习则对诊断性能产生正向效应。

4.结论

本文结合奇异值特征提取与迁移学习策略提出一种电机故障诊断方法,结论如下:

1)自相关奇异值分解方法能够有效提取电机故障微弱信号特征,其不依赖于先验知识,更具通用性,所提特征便于计算区分度和可迁移度,特征选取兼顾信息量、计算量以及诊断性能的平衡。

2)迁移学习策略利用辅助数据的权重调整帮助少量目标数据的学习,相比传统机器学习,变转速、变负载及变试验对象条件的少数据量诊断性能提升明显,且前两者对诊断性能的影响小于后者,同时辅助数据的选取条件、目标与辅助数据比值条件等对学习性能的影响较大。

3)迁移学习相比传统机器学习的优势在于,若引人振动特征不同的辅助数据,前者将提升诊断性能,后者则误导诊断结果。

猜你喜欢

迁移学习特征提取故障诊断
风力发电机组齿轮箱轴承故障诊断分析
基于EMD和SSAE的滚动轴承故障诊断方法
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
从认知角度探讨大学英语网络教学模式
基于曲率局部二值模式的深度图像手势特征提取
一种基于迁移极速学习机的人体行为识别模型
大数据环境下基于迁移学习的人体检测性能提升方法
基于R8C的汽车OBD通用故障诊断仪设计