APP下载

多元特征融合的涡扇发动机剩余寿命预测

2023-02-13蒋朝云朱贵富王海瑞

化工自动化及仪表 2023年1期
关键词:特征向量特征提取寿命

蒋朝云 李 亚 朱贵富 王海瑞

(昆明理工大学信息工程与自动化学院)

设备或系统在运行与非运行过程中,都会在各种因素的作用下发生退化,当退化量积累到某个临界点,就会发生故障,甚至失效。 发动机作为动力系统的“心脏”,一旦失效,将会给环境、人员安全及经济等方面造成不可挽回的损失,故其稳定性、可靠性、维修性和安全性一直是行业关注的焦点。

为提高发动机的相关性能、 降低维修成本,提高系统维护的可承受性,发动机剩余使用寿命(Remaining Useful Life,RUL) 已成为当前研究的热点[1]。在现有的研究中,关于设备或系统在退化建模与寿命预测方面的探索已有众多研究成果,包括不同的方法和技术。 王玺等采用非线性Wiener过程对发动机进行性能退化建模并实现了RUL的预测[2]。 王国锋等研究了基于Gamma过程的谐波减速器性能退化过程[3]。主要方法为:首先基于设备性能退化数据构建退化模型,其次根据实时监测数据实现对模型参数的实时更新,进而结合RUL概率密度函数进行RUL的预测。 在此类方法中,大多采用单一传感器在单一工况下的研究方法,这种方法仅在特定情况下有效。 刘帅君分别从单监测参数与多监测参数两方面对发动机退化过程进行了描述[4]。近年来,随着传感器技术的飞速发展,对目标设备的监测往往采取同时多个传感器监测的方式,该方式引导了学者采用多传感器数据进行实验研究,但也只运用了单一特征提取方式对多传感器数据进行性能退化描述。 郭庆和李印龙利用专家经验并结合核主成分分析(Kernel Principal Component Analysis,KPCA)对多传感器数据建立了航空发动机退化健康指标[5]。 刘帼巾等利用自编码器对状态监测数据进行特征提取并构建了健康指标[6]。 洪骥宇等利用降噪自编码器提取出有利于评估剩余寿命的数据特征[7]。随着工业程度不断提高,设备的结构也日益复杂,针对不同的预测对象以及数据类型需要根据其失效机理的认知程度以及数据量的大小来选择特征提取方式,如果选择错误可能会导致预测结果发生较大误差甚至失败。 故依赖单一特征提取方式并不足以准确描述系统的潜在退化机制,单一特征提取方式的局限性导致了预测精度的局限性。

特征提取方法多种多样,不同方式各有其侧重点,侧重点不同导致其存在不同的特性[7]。为避免主观选择特征提取方式导致结果的偏差,可以采用组合方式对数据进行特征提取,即分别采用不同的特征提取方式对原始数据进行特征提取然后进行特征融合,使各类方式扬长避短,较大限度地发挥各类方式的长处。 此外,众多研究结果表明,Wiener过程能够较好地描述系统的退化过程[8],该模型在设备剩余使用寿命预测领域中得到了广泛应用。

在此,笔者提出一种多元特征融合的涡扇发动机RUL预测方法: 将多种特征提取方式所得特征向量线性融合构建一个能够准确表征发动机退化情况的复合健康指标(Composite Health Indicators,CHI);利用预测寿命与真实寿命均方误差最小化方法确定各特征向量的融合系数;采用线性Wiener过程对CHI进行退化建模, 实现发动机RUL的实时预测。 最后通过涡扇发动机退化仿真数据集验证笔者所提方法的有效性。

1 多元特征提取

1.1 数据预处理

考虑到数据在时间上的相关性,采用改进后的指数平滑法(Exponential Smoothing,ES)对涡扇发动机多传感器数据进行降噪处理[9],即:

其中,x0、y0分别为初始时刻(t=0)的原始数据值与平滑处理后的值;yt为xt经过平滑处理后的值;衰减因子r=2/(b+1),b=20。该方法在保留原始数据变化趋势的同时, 达到了平滑与降噪的目的,其根本思想是对历史数据赋予指数衰减的权重并相加得到当前时刻平滑后的观测值。

采用归一化方法将平滑处理后的数据限定在[0,1]之间,即:

其中,Xi,j(t)为yi,j(t)经过归一化后的观测值;max(y:,j)、min(y:,j)分别为N台训练发动机中第j个传感器监测数据的最大值与最小值。 同时,为防止归一化后数据值过大或过小导致的溢出问题,采用如下方法进行处理:若Xi,j(t)>1,则Xi,j(t)=1;若Xi,j(t)<0,则Xi,j(t)=0。 由于经过归一化后的数据无量纲,所以实验部分的数据也无量纲。

1.2 特征提取

为融合多种特征提取方式的优点,且考虑到发动机各项性能参数的非线性关系,笔者采取自编码器(Autoencoder,AE)与KPCA分别对各传感器数据进行特征提取,为融合CHI做准备。

1.2.1 AE非线性降维

AE[10]在训练时无需设置标签,是以输入作为输出,能够对输入数据进行非线性降维。 AE由编码器和解码器两部分组成,其中编码器实现输入数据向隐含层的非线性映射,即:

其中,h为非线性映射关系;g(·)为非线性激活函数;w1、b1为输入层与隐含层之间的权值和偏置。

解码器将隐含层特征重构为原始数据,即:

其中,w2、b2为隐含层与输出层之间的权值和偏置。

网络以输入和输出的误差为损失函数,即:

通过L函数的反向传播不断调整网络参数,使其达到最小。

1.2.2 KPCA非线性降维

KPCA是一种非线性主成分分析方法[11]。 令X(t)=(x1,x2,…,xm)表示处理后的传感器数据,并通过φ(x)映射得到高维空间矩阵Φ(X)=(φ(x1),φ(x2),…,φ(xm))。 其协方差矩阵C为:

对C进行特征值分解得到特征值λ和特征向量W,其中W=(w1,w2,…,wn),且满足λW-CW=0,进一步有:

其中,A=(a1,a2,…,am),且ai=1/λiφ(xi)T。

将式(6)代入式(7),并取核函数k(xi,xj)=φ(xi)Tφ(xj)与核矩阵K,可得:

其中,核矩阵K有Kij=k(xi,xj),取高斯核函数:

本研究中c取1/20000。

对于任意参数样本,在特征空间中主元上的投影为:

选取累计贡献率大于85%的主成分表征发动机退化特性。

2 复合健康指标的构建

2.1 构建CHI

令chii(t)为第i(i=1,2,…,N)个发动机在t时刻的复合健康指标,其计算式为:

其中,Qi(t)为第i个发动机经过多种特征提取方式整合的特征向量集,Qi(t)=[qi,1(t),qi,2(t),…,qi,s(t)],qi,j(t)表示第i个发动机第j个特征向量在t时刻的观测值,s为特征向量个数;W=[w1,w2,…,ws]T为融合系数向量;wj为第j个特征向量的融合系数,表征了该特征向量在融合过程中的权值。

2.2 确定失效阈值

鉴于发动机在实际应用中由于退化过程的不确定性,不同发动机在失效时所对应的退化量有一定偏差。 因此,同类型发动机在相同失效模式下,可以通过待定失效阈值与每个发动机真实失效时刻所对应退化量的方差最小化方法来确定其失效阈值[12],即有:

其中,P为发动机待定失效阈值;chii,Mi为第i个发动机在失效时刻tMi时的融合退化量, 由此可得发动机的平均失效阈值为:

由式(13)得出的平均失效阈值即为式(12)中P的最优解。

2.3 基于线性Wiener过程的退化建模

根据数据特点,采用线性Wiener[13]过程对CHI进行退化建模分析,其过程如下:

其中,chii,0为第i个发动机的初始退化量;αi表示第i个发动机的漂移系数,描述该发动机的退化率;σi为第i个发动机的扩散系数, 描述发动机在退化过程中的随机性;B(t)表示标准布朗运动;CHIi(t)为第i个发动机在t时刻的复合退化量。

2.4 求解融合系数

2.4.1 参数估计

其中,Mi为第i台发动机测量的运行周期数目。

2.4.2 发动机寿命预测

根据线性Wiener随机退化过程与首达时间(First Hitting Time,FHT)的性质[14],若发动机性能退化量首次达到或者超过其失效阈值P时, 即判定发动机失效,其寿命Ti可定义为:

2.4.3 确定融合系数

确定融合系数后,便可通过式(11)得到各涡扇发动机的复合健康指标。

3 发动机剩余使用寿命评估

3.1 参数估计

3.1.1 离线参数估计

3.1.2 在线参数估计

对于具体运行的发动机, 需要对漂移系数αi进行实时更新,使模型与发动机实际运行情况更加吻合。根据式(11),某发动机从t=0时刻到t=tk时刻融合健康指标的观测数据为chi1:k={chi(tr),0=t1≤tr≤tk}。

3.2 在线寿命预测

由式(18)可知第i个发动机在tk时刻的剩余寿命为:

综上所述,笔者所提的涡扇发动机剩余寿命预测方法流程如图1所示。

图1 涡扇发动机RUL预测流程

具体步骤如下:

a.多元特征融合。 首先对发动机多传感器数据进行降噪、归一化处理,然后采用不同特征提取方式分别对处理后的数据进行特征提取,再根据多元特征融合公式,以预测剩余寿命与真实剩余寿命均方误差最小为目标函数得到融合系数。

b.参数估计。 通过数据集离线估计漂移系数α与扩散系数σ,并确定出参数α的初始值,然后结合Bayesian公式实现模型参数αi的在线更新。

c.RUL预测。 结合模型,通过式(27)、(28)获取发动机的RUL。

d. 方法论证。 将采用单一特征提取方式的RUL预测方法与笔者所提方法进行对比验证。

4 实验验证

4.1 数据集

实验采用美国宇航局提供的商用模块化航空推进系统仿真(CommercialModularAero-propulsion System Simulation,C-MAPSS)数 据 集[16],该 数 据 集为航空涡扇发动机RUL预测领域被广泛使用的基准数据。 笔者采用该数据集中的FD001数据集进行对比实验验证。FD001数据集包含100个同类型发动机的训练集、测试集和测试集当前所对应的RUL。 其中,训练集和测试集各包含100个发动机的全寿命历史监测数据与部分寿命测试数据,每组数据共26列(第1列为发动机号,第2列为运行周期数,第3~5列为运行条件,后21列为机身21处传感器监测数据)。

4.2 构建健康指标

根据前文所述方法,对涡扇发动机多传感器数据进行降噪、归一化处理,然后分别进行自编码器降维与核主成分分析,得到能表征发动机退化性能的特征向量。

通过AE将多传感器数据降至一维数据,称为健康指标1(HI1);通过KPCA对多传感器数据进行主元分析,其中部分主成分的相关信息见表1。从表1中可以看出, 第1个主成分的贡献率高达87.64%(大于85%),其在一定程度上能够较好地表征发动机性能退化趋势, 将其称为健康指标2(HI2)。

表1 部分主成分的贡献率分析表

通过笔者所提构建CHI方法, 得到HI1与HI2的融合系数为W=[1.9513 -0.9513]。 由此可得到CHI的观测数据如图2所示(发动机运行时间的单位是运行周期数),CHI的阈值P=4.7245, 得到部分发动机的健康参数如图3所示。

图2 健康指标观测数据

图3 部分发动机的健康参数

4.3 RUL预测精度对比分析

为体现多元特征融合方法在RUL预测领域的有效性,需对CHI以及HI1、HI2的监测数据分别采用线性Wiener过程进行退化建模分析, 不同方法的模型参数见表2。

表2 不同方法的模型参数

考虑到根据历史退化数据估计所得的参数,会随着实时监测数据的增加而更加贴合发动机退化过程中的真实参数,故实验选择发动机最后12个寿命周期进行寿命预测, 得到3种健康指标下的RUL预测结果如图4所示 (剩余寿命预测时刻、发动机剩余寿命的单位是运行周期数)。

图4 3种健康指标的RUL预测结果

根据图4的实验结果, 可以计算剩余预测寿命的均方根误差(Root Mean Square Error,RMSE)来量化其预测精度。 RMSE在tk时刻的值可定义为:

由此可得3种健康指标下发动机在相同运行条件下的Rmse,k值如图5所示。 从图5可以看出,随着发动机运行周期数目的增加,CHI、HI1与HI2下的Rmse,k值都在逐渐变小,且CHI的Rmse,k值最小,相较于HI1与HI2而言整体分别下降了24.93%与8.76%。 实验结果验证了基于多元特征融合的涡扇发动机剩余寿命预测方法能够有效融合多种特征提取方式的优势, 并提高了RUL预测的准确性。

图5 不同监测点3种健康指标的Rmse,k值

5 结论

5.1 笔者所提方法采用了多种特征提取方式对发动机多传感器数据进行了深层挖掘,提高了对数据的利用率,增强了特征提取率。

5.2 CHI由多种特征提取方式所得特征融合而成,该健康指标构建方法可以克服基于单一特征提取方式的RUL预测方法在应用中因主观选择特征提取方式错误而面临失败的难题。

5.3 通过对比实验验证表明,采用多元特征融合的方法相较于特征融合前均方根误差整体分别下降了24.93%与8.76%。

猜你喜欢

特征向量特征提取寿命
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
人类寿命极限应在120~150岁之间
仓鼠的寿命知多少
马烈光养生之悟 自静其心延寿命
基于Daubechies(dbN)的飞行器音频特征提取
一类特殊矩阵特征向量的求法
人类正常寿命为175岁
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
Bagging RCSP脑电特征提取算法