基于谱形因子和Elman神经网络的高速轴承RUL预测方法*
2022-09-22赵艳莉王文远
赵艳莉,王文远,何 进
(1.郑州财税金融职业学院 信息工程系,河南 郑州 450003;2.河南工业大学 机电工程学院,河南 郑州 450001)
0 引 言
当前,清洁能源愈发广泛地应用于世界各国的民生领域,其中,风能在清洁能源中所占的比重日益增大。例如,美国计划在2030年前使风能占国内总能量产出的20%[1]。然而,由于负载频繁变化和服役环境恶劣,风力发电机的传动系统时常处于极限工作状态,致使机组故障率居高不下,严重影响了风能的经济性[2]。
风力发电机通常采用增速齿轮箱以实现低速轴到高速轴的转速传递。研究表明,在风力发电机齿轮箱各类故障中,轴承故障占比极高,约为76.2%[3]。因此,对风力发电机齿轮箱轴承进行有效的故障预测与健康管理(PHM),从而降低风力发电机轴承组件的故障率,是提高风能经济效益的关键。
PHM旨在监控、评估产品的健康状态,诊断故障并预测产品的RUL。在现阶段,PHM所涉及的剩余使用寿命(RUL)预测方法主要可分为3种,即基于模型的方法、数据驱动方法以及二者的混合方法。
其中,基于模型的预测方法假设可以构建精确合理的物理模型,以描述产品的性能退化,例如Paris裂纹扩展模型[4]等。LI Y等人[5]提出了两种故障传播模型,进行滚动轴承的缺陷增长率评估和RUL预测。但两种模型具有较强的特异性,难以广泛应用于其他类型轴承的RUL预测。LUO M L等人[6]提出了滚动体层裂区激励机制和轴承滚珠—层裂相互作用接触模型,然而该模型相对复杂,难以应用于实际的轴承RUL预测过程中。李云龙等人[7]针对轴承外圈的单点故障,建立了考虑润滑剂效能的滚动轴承动力学渐进模型,并以SKF6205轴承为例进行了分析,取得了较好的效果;但是该模型依然存在复杂度较高的缺陷。
综上所述,基于模型的RUL预测方法成本高昂,且开发能够准确描述有寿件全寿命周期行为的模型几乎不可行。因此,在实际的应用过程中,基于模型的预测方法难以取得令人满意的效果。
数据驱动方法通过在线传感器,进行产品的状态监测与数据收集,得出产品的性能退化规律,从而预测产品的RUL。由于振动信号携带与受损部件故障特征相关的基本动态信息,因此,目前大多数风力发电机的状态监测系统采用振动信号分析技术。在数据处理方法层面,人工神经网络[8]、隐马尔可夫模型[9]、支持向量回归(support vector regression, SVR)[10]、贝叶斯网络[11]和递归神经网络(recursive neural network, RNN)[12]等已广泛应用于基于数据驱动的RUL预测中。KORDESTANI M等人[13]对基于数据驱动的PHM方法进行了综述。SOUALHI A等人[14]利用Hilbert-Huang变换,从振动信号中提取了故障特征指标,但未对各指标的适应度进行讨论。SAIDI L等人[15]5从谱峭度(spectral kurtosis, SK)中提取了振动信号的时域特征,并利用SVR预测了风力发电机的RUL。
然而,在实际应用中,SVR的参数选择较为困难。韩国栋等人[16]针对燃气轮机性能退化预测问题,提出了基于平均影响值和一维卷积神经网络的预测方法,取得了较好的效果,表明了数据驱动方法的适用性强。
混合方法综合了前述两类方法的优势。BECHHOEFER E[17]从振动信号中提取了风力发电机高速轴承的故障特征指标,进而利用Paris模型和卡尔曼滤波器对轴承的RUL进行了更新。但Paris模型对于实际问题的过分简化,可能导致RUL预测结果存在较大偏差。QIAN Y等人[18]将增强的相空间扭曲与修正的Paris裂纹扩展模型相结合,利用多时间尺度方法预测了轴承的RUL。
然而,当存在数据噪声时,该方法得出的预测结果与实际数据偏差较大;同时,该方法的计算成本较高。
基于上述讨论,笔者提出一种基于谱形因子(SSF)和Elman神经网络(ENN)的风力发电机高速轴承RUL预测方法。笔者首先利用TEO对原始振动信号进行预处理,增强信号的冲击分量及其信噪比;定义一种SSF,并据此对轴承故障特征指标进行变换,并采用所提出的适应度函数,对变换后的指标进行筛选;基于实测数据,利用Elman神经网络(ENN)预测轴承的RUL,并将其结果与采用已有方法所得结果进行对比分析。
1 基于SSF-ENN的轴承RUL预测原理
基于谱形因子(SSF)和Elman神经网络(ENN)方法的产品RUL预测流程,如图1所示。
图1 基于SSF-ENN方法的产品RUL预测流程
1.1 TEO基本原理
KAISER J F[19]首次引入了TEO进行信号能量跟踪。对于连续信号x(t),TEOψ[·]可定义为:
(1)
当ψ[·]应用于由简单谐振子(例如质量弹簧振荡器)产生的振动信号时,首先由牛顿定律导出如下运动微分方程:
(2)
式中:m—振子质量;k—弹性系数。
基于TEO的振动信号瞬时能量为:
(3)
式中:ω—振动频率;A—振幅。
将式(2)的解x(t)=Acos(ωt+φ)代入式(1),可得出:
ψ[x(t)]=[Acos(ωt+φ)]=A2ω2
(4)
由于同时考虑了振动信号的瞬时振幅和同步频率,因此,TEO有利于增强信号的瞬态冲击分量。
1.2 特征指标提取和筛选
特征指标提取在产品故障识别及RUL预测中具有至关重要的作用。当采用TEO信号进行产品RUL预测时,需要解决如下两个问题:
(1)如何基于TEO信号构建产品故障特征指标;
(2)如何评估指标对RUL预测的适用性。
1.2.1 所提SSF的定义
笔者首先给出一种形状因子(shape factor, SF),它是定义信号形状的无量纲量,其定义式如下:
(5)
式中:xi—离散信号点;N—信号点数量。
SSF的计算首先需要利用短时傅里叶变换(STFT)进行信号的时频分解,进而针对每个频率分量计算信号的SF。
STFT算法所涉及的信号关系如图2所示。
图2 STFT算法所涉及的信号关系
参照图2,STFT将总长度为I的信号离散为若干相互重叠的信号块,各信号块的长度为K且起始时刻的间隔为H。
对于第n个信号块(n∈,且n≥1),其起始及终止边界函数is(n)和ie(n)分别由下述公式给出(is(1)=0):
is(n+1)=is(n)+H
(6)
ie(n)=is(n)+K-1
(7)
将离散傅里叶变换应用于长度为K的第n个信号块,可得出:
(8)
式中:X(k,n)—短时频谱;n—信号块计数指标;k—采样率;w(·)—采样窗函数;j—虚数单位。
最后,参考定义式(5),谱形因子(SSF)由下式给出:
(9)
1.2.2 基于适应度的轴承故障特征指标筛选
通常,在进行产品故障预测时,有诸多故障特征指标可供选择。然而,并非所有指标均能有效表征产品故障并用于RUL预测,因此,有必要对各类故障特征指标进行筛选。
故障特征指标筛选方法主要可分为如下两类:
(1)通过使用奇异值分解、主成分分析和等距特征映射等方法,将故障特征投影到新的空间中[20];
(2)基于单调性、趋势性和可预测性等度量参数,选择能够合理表征产品性能退化的故障特征指标[21]15。
笔者采用上述第二类方法进行产品故障特征指标筛选。
单调性表示特征指标潜在的增加或降低趋势[21]17,其定义式为:
(10)
在式(10)中,M的取值范围为[0,1]。当特征指标完全单调时,M=1;当特征指标完全非单调时,M=0。
趋势性与特征指标的形式及其时变性有关,反映了产品状态随时间的变化规律。
趋势性的定义式为:
(11)
式中:fi—特征曲线离散值;ti—离散时间指标。
可预测性表征了与参数路径相关的故障传播程度,其计算方式为:
(12)
最后,笔者利用如下表达式计算待选故障特征指标的适应度:
适合度=单调性+趋势性+可预测性
(13)
1.3 基于ENN的RUL预测及其不确定性区间量化
当筛选出合理的产品故障特征指标后,笔者基于ENN模型对产品RUL进行了预测。ENN是一个局部反馈递归神经网络,属于非线性状态空间模型,且由输入层、隐层、承接层和输出层组成。
由于包含了承接层,因此,隐层神经元输出与其输入的关联性,使得ENN对输入层数据的轨迹具有敏感性。承接层神经元可被视为记忆单元,因此,承接层提供了内部反馈,显著提高了ENN处理动态信息的能力。同时,当采用ENN进行产品RUL预测时,除可给出RUL预测值外,还可以得出相应预测值的置信区间。
ENN的输入-输出关系可以用如下非线性回归模型表示:
yi=f(xi;θ*)+εi
(14)
式中:xi,yi—输入及输出向量;θ*—待优化权重及偏差参数向量;εi—网络预测值与实际值的偏差向量。
ENN预测值可表示为:
(15)
(16)
式中:f′(·)—梯度函数。
进一步,在置信水平为(1-α)×100%的条件下,ENN预测值的置信区间可表示为[22]:
(17)
其中:
(18)
(19)
2 实验及结果分析
2.1 实验装置
实验环境及设备如图3所示。
图3 实验环境及设备
实验过程所涉及的设备及参数如表1所示。
表1 实验过程所涉及的设备及参数
根据图3及表1,笔者利用径向安装在高速轴上的加速度计采集信号,在50 d内每天采集时长为6 s的原始振动信号。信号通过24位delta-sigma模数转换器进行数字化,采样频率为100 kHz。实验过程中,对于所监测的高速轴承,其完全失效(RUL=0 d)的判定标准为:裂纹扩展长度占周线长度的30%或裂纹扩展跨度占内圈宽度的25%。
实验过程中检出的高速轴承内圈裂纹,如图4所示。
2.2 特征提取和筛选结果
监测过程中6 s内高速轴转速(频域)变化实例,如图5所示。
图5中,在工作过程中,风力发电机高速轴转速具有明显的振荡特性,该特性会明显降低轴承的使用寿命,因此,必须对轴承进行有效的PHM。
监测过程中的原始振动信号及其TEO信号,如图6所示。
图6 监测过程中的原始振动信号及其TEO信号
高速轴承RUL预测所涉及的故障特征指标,如表2所示。
表2 高速轴承RUL预测所涉及的故障特征指标
表2中部分故障特征指标随时间的变化曲线,如图7所示。
图7 表2中部分故障特征指标随时间的变化曲线
由图7可知:第20 d之后,大多数指标未能反映轴承性能退化趋势,例如均值、对数熵。因此,利用未经变换的指标难以进行轴承RUL的准确预测;
然而,当经过SSF变换后,故障特征指标的单调性和趋势性都得以改善。这是由于TEO增强了振动信号的冲击分量;同时,振动信号经过了STFT的时频转换,降低了齿轮等临近零件对于信号的影响。
各故障特征指标的定量化分析如图8所示。
由图8可知:当采用SSF变换后,多数特征指标的3种特性,即单调性、趋势性与可预测性都得到了较为明显的改善;
除峰-峰值和平均值外,其余各指标在变换后的单调性显著提高。此外,在SAIDI L等人的工作中[15]6,从SK中提取特征获得的最大单调性值约为0.102 0,而利用笔者所提方法得到的值为0.265 3;
进一步,为筛选出最能反映风力发电机高速轴承性能退化过程的故障特征指标,笔者定量计算了各指标相应的适应度值。
基于SSF变换后各故障特征指标的适应度计算值,如表3所示。
表3 基于SSF变换后各故障特征指标的适应度计算值
根据表3的计算结果,笔者首先采用对数熵进行高速轴承的RUL预测。
2.3 基于ENN的风力机高速轴承RUL预测
在利用ENN进行轴承RUL预测之前,笔者首先将故障特征指标数据样本分为3部分,即训练集、验证集和测试集。然后,分别将数据样本的前20%(模式1)、30%(模式2)和40%(模式3)作为训练集,以便在一定程度上避免欠拟合与过拟合现象,并通过减去第一个样本来减弱样本偏移性。
对于上述3种模式,笔者均利用剩余样本的2.5%作为验证集,其余样本用作测试集。同时,笔者参考文献[23]所提出的方法,对训练样本进行归一化处理,并得出故障特征指标临界值(即产品失效时刻的数值),并将归一化的轴承百分比寿命设置为ENN网络输出。
为了获得准确的RUL估计值,在进行了大量离线测试的前提下,笔者确定了ENN的最佳结构。
ENN结构参数如表4所示。
表4 ENN结构参数
基于ENN的风力发电机高速轴承RUL预测结果,如图9所示。
图9 基于ENN的风力发电机高速轴承RUL预测结果
由图9可知:在95%置信区间条件下,随着训练样本数量的增加,3种模式下的高速轴承RUL预测结果逐渐接近实际值;同时,笔者所提方法的精度可在较长时间范围内得到保持。
为验证采用适应度进行特征指标筛选的合理性,在相同的ENN结构与预测模式条件下(采用模式3),笔者进一步利用均方根和标准差指标,进行轴承RUL预测。
采用均方根和标准差指标的RUL预测结果,如图10所示。
图10 采用均方根和标准差指标的RUL预测结果
参照图10可知:当采用均方根和标准差指标预测轴承RUL时,依据式(20),二者的RMSE分别为1.46%和2.35%,预测精度均低于采用对数熵指标所得结果(参见表5)。因此,指标适应度与预测结果误差在数值上存在反向关系,验证了故障特征指标所提筛选方法的合理性。
最后,为验证所提方法的有效性,笔者引入了3种回归方法进行对比分析。这3种方法为:极限学习机(extreme learning machine, ELM)[24]、前馈反向传播(forward feedback back propagation, FFBP)[25]和SVR[26]。
对于上述3种方法,除FFBP与所提方法中的ENN采用相同的模型参数外,其余两种方法均首先进行了模型选择,以确定最佳超参数。对于SVR,笔者首先进行了交叉验证和网格搜索以选择出最佳核参数;对于ELM,则采用了Sigmoid激活函数,并通过5~650次遍历搜索确定了最佳神经元数量[27]。
笔者利用均方根误差(root mean square error,RMSE)评估了4种方法的预测性能:
(20)
为方便起见,在采用对数熵作为故障特征指标的前提下,笔者针对前述第3种预测模式进行方法对比。
各方法的RUL预测结果对比如表5所示。
表5 各方法的RUL预测结果对比
由表5可以明显看出:笔者所提方法的误差明显低于其他回归方法。
基于所提方法得出的风力发电机高速轴承RUL,如图11所示。
图11 基于所提方法得出的风力发电机高速轴承RUL
3 结束语
针对风力发电机高速轴承RUL准确预测问题,笔者基于TEO理论,提出了一种基于谱形因子(SSF)和Elman神经网络(ENN)的风力发电机高速轴承RUL预测方法。
笔者利用TEO对原始振动信号进行了预处理;定义了一种SSF,并据此对轴承故障特征指标进行变换,并采用所提出的适应度函数,对变换后的指标进行筛选;基于实测数据,利用Elman神经网络(ENN)预测了轴承的RUL,并将其结果与采用已有方法所得结果进行了对比分析。研究结果表明:
(1)利用SSF对风力发电机高速轴承故障特征指标进行变换后,各指标的单调性等特征明显改善。通过预测误差的对比可知,采用SSF变换后的TEO信号对数熵是进行风力发电机高速轴承RUL预测的最佳指标,因此,其适应度在故障特征指标筛选上具有合理性;
(2)由于采用了TEO对原始信号进行预处理,因此,相较于其他3类数据驱动预测方法,该方法具有更高的精度,且可以给出所预测RUL的置信区间;
(3)由于TEO可以有效地削弱原始振动信号的噪声,且提高其冲击分量,因此,笔者所提预测方法具有较长时间的精度保持性(约为35 d)。
在风力发电机变速箱中,齿轮也是其必不可少的部件之一,并且齿轮也极易出现故障。因此,笔者在后续将基于上述方法,对非平稳条件下的齿轮退化行为进行预测。