基于机器学习的旋转机械故障诊断研究
2020-04-19陈亚楠胡凯凯陈刚胡婵娟舒晖李籽圆
陈亚楠 胡凯凯 陈刚 胡婵娟 舒晖 李籽圆
旋转机械广泛存在于大中型机械装置中,如汽轮机、燃气轮机、离心式及轴流式压缩机、泵、水轮机、发电机和航空发动机等。大中型旋转机械一般安装有振动监测保护和故障诊断系统,通常在旋转机械关键点上安装振动传感器,采集关键点振动信息。通过对采集的数据进行时域、频域、时频域、小波变换、自相关等分析,能够对旋转机械进行故障诊断。但是这种方法需要工程师有足够的经验,且因机组数量多,人工分析费时费力。
机器学习是近些年兴起的新学科,是人工智能和模式识别领域共同的研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。机器学习常见的算法有决策树算法、朴素贝叶斯算法、支持向量机算法、随机森林算法、人工神经网络算法、回归算法和深度学习算法等。理论上,直接将采集到的大量振动原始数据及标签数据(通常是有无故障)作为机器学习的输入,能够实现对模型的训练。但是,对于实际工程问题,往往正负样本极不均衡,正样本(无故障)数据量远远大于负样本(有故障),且原始数据通常维度较高,直接采用原始数据往往会导致模型过拟合,模型泛化能力差。
因此,本文结合针对旋转机械的振动分析方法和机器学习常用的分类方法,通过提取不同特征作为机器学习的输入,大大降低了数据维度,并通过模型训练,构建了故障诊断和预测模型,用于旋转机械的故障自动诊断。
特征提取
通常对于旋转机械的状态监测系统,所采集到的原始信号为高频信号,维度高,不适合直接作为机器学习的特征输入,而从原始信号中提取特征信息可有效降低输入特征维度。
一、时域特征提取
旋转机械在状态发生改变时,时域参数能够反映其状态变化。当旋转机械发生故障时,可能出现冲击,表现在时序图中即是某些点远远超出其他点(图1)。
常用的时域参数包括峰值、均值、方差、歪度、峭度、均方根值、波形指标、脉冲指标、峭度指标、歪度指标和裕度指标。
对于一组信号xi,i=1,…,n,其时序特征如表1所示。
有量纲的幅值诊断参数值会随着故障的增大而不同程度增大,且其中峭度对探测信号中含有脉冲的故障最敏感。有量纲幅值诊断参数值也会因工作条件(如负荷、转速、记录仪器的灵敏度等)的改变而改变,实际上很难加以区分。通常希望幅值诊断参数对故障足够敏感,而对信号的幅值和频率的变化不敏感,即与机器的工作条件关系不大,为此引入了不受工作状况影响的无量纲幅值参数。无量纲时域参数对故障的敏感性与稳定性情况如表2所示。
根据旋转机械的工作特性及不同的诊断目标,需选用不同的时域指标作为时域特征。
二、频域特征提取
工程应用中,常用快速傅里叶变换(FFT)作为频谱分析方法,使信号从时域空间变换到频域空间。在频谱图中,旋转机械特征频率、倍频及幅值变化可用于诊断旋转机械状态。如图2所示,通常频谱图中含有测量范围内所有频谱信息。
对于特定诊断问题,需从频谱中截取目标频率带,在频率带中自动抽取频率与对应幅值作为频域特征(图3)。
三、时频域特征提取
旋转机械在其寿命末期,在频谱图中呈现出整个频率段幅值增大的情况,且尖峰不明显。将原始信号通过快速傅里叶变换后,在某个频率段范围内,将信号按照时序特征抽取方法计算时频域特征,计算的指标包括波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、均方根值,并将提取的指标组成一维向量。
四、功率谱密度特征提取
功率谱是功率谱密度函数的简称,其定义为单位频带内的信号功率,表示信号功率随着频率的变化情况,即信号功率在频域的分布狀况。
旋转机械在状态正常、运行良好的情况下,少有能量泄漏;出现状态异常时,其运行不平稳会导致能量泄漏。特定频率段的功率谱可用于旋转机械状态检测。某信号功率谱如图4所示。
五、自相关特征提取
自相关是指信号在一个时刻的瞬间值与另一个时刻的瞬间值之间的依赖关系,是对一个信号的时域描述。如果一个信号包含一种模式,该模式会在几秒钟的时间周期后重复自身,则该信号与其延迟后的信号之间将具有很高的相关性。某信号的自相关图如图5所示。
模型训练及预测
数据准备:包括正负样本数据收集,故障特征频率收集,并通过数据预处理,去除空值、异常值等无效数据。
模型训练:将搜集到的数据分成训练数据和测试数据,从原始数据中提取时序特征、频域特征、时频域特征、PSD特征和自相关特征并组成模型的输入特征,将其输入至多种分类器模型(常用的机器学习分类模型包括对数几率回归、随机森林、梯度提升、支持向量机和神经网络等)中进行训练,从训练及测试结果中挑选出表现最好的模型,并对模型参数进行保存。
故障预测:读取需要预测的原始数据,抽取原始数据特征,包括时序特征、频域特征、时频域特征、PSD特征和自相关特征,组成输入特征。载入训练好的模型参数,将输入特征输入至模型中,输出预测结果。模型训练及预测流程如图6所示。
案例分析
某型号风电齿轮箱发生中速级断齿,其啮合频率为19.2Hz。训练集共58组数据,正例29,负例29;测试集共32组数据,正例14,负例18。选取低频段作为频谱及时频域段关注频段。分别提取每一组数据的特征值作为模型的输入,提取的指标包括:时域有量纲和无量纲指标作为时域特征;0~100Hz频率段内幅值及对应频率作为频域特征;0~100Hz频率段内有量纲和无量纲指标作为时频域特征。正例标记为0,负例标记为1。
采用不同算法进行训练,测试结果如表3所示。从表中不同分类算法在训练集及测试集上的表现可以得出,梯度提升分类器表现最优,在训练集上的准确率达到100%,在测试集上的准确率达到90%,有效检测出了中速级断齿故障。
总结
本文针对旋转机械振动分析和机器学习各自的优缺点,将两者有机结合,采用振动分析方法,从原始信号及其频域信号中提取时域特征、频域特征、时频域特征、PSD特征和自相关特征,组合作为机器學习的输入,通过搜集的故障案例数据进行模型训练,并在测试集上获得较好表现。
该方法可广泛应用于旋转机械的状态监测领域,实现各类故障的自动诊断和预测。但需要指出的是,该方法针对特定问题,需要提取其特征频率带,对于无法获取特征频率带的部件,需结合模糊匹配算法实现特征频率带的自动匹配,使算法具备更强的适应能力。
(作者单位:中车株洲电力机车研究所有限公司)