APP下载

基于SFA-LOF-LDD的航空发动机异常检测方法研究

2023-07-27李泱李德文蔡景左洪福张营韩辰球

机床与液压 2023年13期
关键词:差值航空阈值

李泱,李德文,蔡景,左洪福,张营,,韩辰球

(1.南京林业大学汽车与交通工程学院,江苏南京 210037;2.南京航空航天大学民航学院,江苏南京 211106;3.杭州海康威视数字技术股份有限公司,浙江杭州 310051)

0 前言

航空发动机是飞机重要的动力源,长时间在恶劣的工作条件下运行,其安全性和可靠性面临很大的挑战[1]。气路参数通常被选择为健康参数,作为表征发动机健康状态的重要指标。基于数据驱动的气路异常检测方法不依赖建模和知识经验,在数据特征挖掘方面具备很大优势,逐渐成为航空发动机异常检测研究的热点。

数据驱动的热门领域,如机器学习[2]和深度学习[3]在模型拟合方面具有突出性能。WANG等[4]提出基于概率神经网络和支持向量机的发动机控制系统故障诊断与优化方法,提高了故障诊断的准确性。LIN等[5]结合集合经验模态分解和支持向量机识别复杂设备轴承的故障状态,提高了诊断精度。WANG等[6]提出一种基于噪声的发动机故障诊断的不完全小波包分析预处理方法,能同时处理平稳和非平稳信号,实现发动机的故障诊断。以上方法对于故障诊断能取得很好的效果,但依然存在训练样本获取困难、模型复杂度高、易受高维特性和关联复杂的数据影响的问题。随着综合信息处理技术的发展以及多学科的不断交叉,信息融合技术[7]为提高状态监测和故障诊断智能化程度开辟了广阔的前景。杨洁等人[8]利用一维卷积神经网络对轴承故障振动数据进行特征提取与分类,将不同传感器采集的波形信号进行融合,有效提高了航空发动机轴承故障诊断的准确率。YAN等[9]将多个选定特征融合为表征发动机性能的健康指标,并用滑动窗口检测方法确定当前健康状态的观测指定规则,实现航空发动机的退化评估。但无论是哪种数据驱动方法,都依赖大量的监测数据。而飞行过程数据包括大量的非线性动态信息和故障信息,且不同气路参数间关系复杂、噪声多,因此有效提取数据特征将直接影响异常检测的准确性。一些传统的特征提取方法,如主成分分析[10]、偏最小二乘法[11],能将高维数据投射到低维子空间,使其保留原始数据的主要差异特征,但二者使用条件基于的假设在实际应用中不容易被满足。慢特征分析(Slow Feature Analysis,SFA)作为一种新的特征提取方法,能够从时间序列数据中提取受时间影响较慢的特征,以较低的算法复杂度充分提取工业过程的基本特征,逐渐广泛应用于故障诊断领域。LIU等[12]提出一种动态相关特征选择的慢特征分析算法,解决数据变量间的高维、高相关问题。ZHANG等[13]开发一种基于双向动态核慢特征分析的监控方案,构建Hotelling的T2和SPE统计量来检测故障。ZHONG等[14]提出一种具有最小冗余最大相关度的分布式动态慢特征分析方法,实现全厂过程的故障检测。以上研究都充分利用慢特征分析的优势提取固有退化特征,为有效检测故障提供完整的特征信息。

通过慢特征分析得到的原始特征空间,要经过突变点检测以实现故障诊断。突变点检测算法包括基于统计[15]、聚类[16]和密度[17]等方法。其中基于密度的方法简单便捷,且不受数据分布的影响,量化每个点的异常程度。对于航空发动机气路参数的异常检测,考虑使用基于密度的异常点检测方法,能够敏感识别数据点与近邻数据的波动情况。为了在发动机开始退化时发出警报,需设置合适的阈值线。相较于传统的固定阈值线,自适应滑动窗能根据不同窗口的数据分布特点调整窗口大小,通过设置动态阈值线降低异常检测对正常的数据波动的敏感度,减少虚假报警的次数,有更高的检测精度。LOU等[18]提出一种基于自适应阈值的条件高斯网络方法,有效避免在故障监测中过程变量因噪声或干扰引起的微小波动而造成的误判。PARSAI、AHMADI[19]开发一种自适应阈值函数来代替固定阈值取零的方法,提高识别技术的准确性。ZHAO等[20]提出一种基于核密度估计和向后指数均值滤波的自适应阈值设置方法,提高航空发动机故障检测的精度和效率。

综上所述,本文作者设计一种基于慢特征分析、局部离群因子(Local Outlier Factor,LOF)和局部分布差异(Local Distribution Difference,LDD)的动态阈值异常检测方法,用于航空发动机气路异常检测。该方法首先利用慢特征分析对发动机气路参数原始差值提取有效特征,然后对原始特征空间构造局部离群因子监控统计量,定量表征发动机的健康状态,最终筛选出异常值。通过滑动窗设置动态阈值线,充分利用不同窗口数据分布特点,自适应调整窗口大小,提高异常检测的效率和精度。并以民航客机实际运行数据进行实验研究,证明所提方法的可行性和有效性。

1 航空发动机气路参数选择

机载QAR是一种记录飞机发动机气路状态监测参数的设备,涵盖飞行操纵品质监控的绝大部分参数的记录。采样频率为1 Hz,能完整记录图1中包括滑行、起飞、爬升、巡航、下降、着陆等飞行阶段的数据。其中巡航阶段是一种持续推进的、接近于定常飞行的飞行状态,该状态下发动机的气路状态监测参数相对稳定,因此本文作者选择QAR数据中巡航阶段的数据进行研究。

图1 飞机的飞行阶段

文中研究对象为B737飞机CFM56-7B型发动机QAR数据中的监控参数。QAR数据包含大量飞行状态参数,若将所有参数都纳入异常检测的范围,会降低检测效果。因此需要筛选合适的参数使其满足:(1)与发动机的健康状态关系密切;(2)QAR数据中记录完整。根据工程师经验与发动机原理,选择表1中发动机排气温度(Exhaust Gas Temperature,EGT)、燃油流量(Fuel Flow,FF)、低压转子转速(N1)、高压转子转速(N2)、低压压气机出口总温(T25)、高压压气机出口总温(T3)这6个参数构成发动机异常检测数据集。

表1 实验选取的航空发动机性能参数

常规的发动机异常检测是建立在单台发动机状态参数的数据基础上,此类检测方法无法排除飞行工况、高度、温度及马赫数等因素干扰而出现的波动。B737飞机包含左、右两台发动机,以某架飞机发动机巡航阶段的EGT为例,分别作出左、右发动机EGT随时间的变化趋势如图2所示。

图2 左(a)、右(b)发动机EGT

由图2可知:左、右发动机EGT均稳定在500 ℃左右。从单台发动机的EGT变化曲线来看,左、右发动机的变化趋势非常接近且稳定,未见明显的异常波动,直观上很难判断是否出现故障。且实际工程经验表明同架飞机上的所有发动机由于所处工况及外界环境等因素十分接近,发动机同时发生故障的可能性很小,发动机间性能参数的差值一般稳定在较小的波动范围内,因此双发动机性能参数差值对发动机健康状态的变化更加敏感。文中计算同机双发动机性能参数差值作为数据源,如式(1)所示:

Δ=M1-M2=[N11-N21,N12-N22,…,N1n-N2n]

(1)

式中:Δ为同机双发性能参数差值向量;M1为左发动机性能参数向量;M2为右发动机性能参数向量;N11,N12,…,N1n为左发动机性能参数值;N21,N22,…,N2n为右发动机性能参数值。

2 健康因子构建

2.1 基于SFA-LOF-LDD的动态阈值异常检测方法

提出一种基于SFA-LOF-LDD的动态阈值异常检测方法,流程如图3所示。该方法分为离线阶段和在线阶段,具体的步骤如下所示:

图3 异常检测流程

(1)离线阶段。①计算训练数据的同机双发性能参数差值;②构建健康状态SFA模型,并获得模型的参数。

(2)在线阶段。①计算测试数据的同机双发性能参数差值;②利用离线阶段获得的SFA模型参数,构建SFA模型,获得原始慢特征矩阵;③构造LOF监控统计量,进行异常检测;④基于窗口局部分布差异,自适应调整窗口大小,设置动态阈值线,连续10点超过阈值则发出警报。

该模型主要包括慢特征分析、局部立群因子和局部分布差异三部分内容,描述如下。

2.2 基于慢特征分析的特征提取方法

航空发动机气路性能会有随时间正常退化的趋势,这类缓慢平稳的退化趋势一般不会出现较大异常波动。慢特征分析是一种从输入信号向量中学习没有随时间变化或随时间缓慢变化特征的方法[21]。利用慢特征分析提取航空发动机中随时间变化缓慢的特征,通过该类特征变化趋势来反映发动机运行是否出现异常。

慢特征分析的目标是找到一个映射函数g(x),满足输出变量f(t)=g(x(t))具有随时间变化缓慢的特征。

给出一个M维时间序列输入信号:

x(t)=[x1(t),x2(t),...,xM(t)]

(2)

式中:t∈[t0,t1],表示时间范围。

找到式(2)映射函数,使式(3)的输出变量随时间变化缓慢,通常以关于时间的一阶导数平方的均值为指标反映变化速率。

g(x)=[g1(x),g2(x),...,gN(x)]

(3)

f(t)=[f1(t),f2(t),...,fN(t)]

(4)

构建优化目标:

(5)

约束条件(6)(7)(8)分别保证各变量均值为0、 方差为1,以及各变量之间互不相关,每个变量的变化速率均比下一个变量缓慢:

〈fn(t)〉t=0

(6)

〈(fn(t))2〉t=1

(7)

〈fm(t)fn(t)〉t=0 ∀m

(8)

对每个慢特征f(t)进行线性特征转化,慢特征与原始输入信号的线性组合形式为

(9)

SFA优化问题的求解要先利用白化处理使各变量互不相关,通过奇异值分解来实现。定义x(t)的协方差矩阵:

P=〈x(t)xT(t)〉t

(10)

根据奇异值分解有:

P=UΛUT

(11)

式中:U和Λ分别表示特征矩阵和特征值对角阵。根据白化矩阵Q=Λ-1/2UT,白化后的数据为

Z=Λ-1/2UTx=Qx

(12)

将式(12)代入式(9),得:

(13)

〈fn(t)fn(t)T〉t=R〈ZZT〉RT=RRT=I

(14)

(15)

根据奇异值分解:

(16)

W=RQ=RΛ-1/2UT

(17)

2.3 基于密度的局部离群因子算法

通过慢特征分析得到的原始特征需进行特征融合,构造监控统计量以实现异常检测。局部离群因子(LOF)是一种基于密度的局部离群点检测算法,能识别无动态性的非线性过程的离群点[22]。给定一个数据集D,D中各个数据点的LOF计算过程如下:

任取一个数据点p,D中除p以外的任意一个数据点为o,p和o之间的欧氏距离定义为d(p,o);

点p的第k距离dk(p)=d(p,o),是以p为圆心向外覆盖第k个邻近点,并满足:(1)数据集除点p外至少有k个点o′使d(p,o′)≤d(p,o);(2)数据集除点p外至多有k-1个点o′使d(p,o′)

p的第k距离邻域Nk(p)为p的第k距离及其以内所有数据点的集合,即:

Nk(p)={o′|d(p,o′)≤dk(p)}

(18)

点o到p的第k可达距离dk,reach(o,p)为点o到p的欧氏距离与点o的第k距离的较大值:

dk,reach(o,p)=max{d(o,p),dk(o)}

(19)

计算点p的第k局部可达密度dk,lr(p):

(20)

计算点p的第k局部离群因子fLOF,k(p):

(21)

2.4 基于局部分布差异的自适应窗口调整策略

基于慢特征分析和局部离群因子的异常检测模型能够实现航空发动机气路性能健康监测,但需设置合理的控制限判断是否发生突变。局部分布差异(LDD)是一种描述不同片段数据分布情况的方法。通过LDD自适应调整滑动窗口大小,能充分利用数据局部特征信息,提高突变点检测精度[23]。

假设第i个窗口数据的均值波动记为Vi,差值波动记为Di。

(22)

(23)

式中:Zi为第i个窗口的数据Z,包括初始窗口到目前窗口内的所有待观测数据;var为求方差;std为求标准差。

定义变量fLDD,i,表示第i个窗口与上一个窗口数据分布差异情况。

(24)

式中:i>1且为正整数,fLDD,i为百分值。

由此可计算每个窗口相对于上一窗口的局部分布差异,制定自适应滑动窗调整策略如下:设置相似度阈值为δ。若fLDD,i≤δ,认为两个窗口数据的局部分布差异小,扩大窗口以提高检测速度;若fLDD,i>δ,认为两个窗口数据的局部分布差异大,缩小窗口以提高检测精度。

3 航空发动机异常事件案例验证

航空发动机排气温度指发动机涡轮出口喷出的燃气平均温度,它是衡量发动机工作正常与否的重要参数。航空公司通常以此监测飞机发动机的健康水平,排气温度超温是一种典型的航空发动机异常事件。为验证本文作者提出的基于SFA-LOF-LDD的动态阈值异常检测方法能否准确识别异常点,以某航空公司B737飞机发动机两个排气温度超温异常事件为例进行验证。

3.1 排气温度超温异常事件一

3.1.1 实验数据准备

实验选取某航空公司某架B737飞机发动机QAR数据中从2019年6月9日到2020年6月20日期间巡航状态下的6个监控参数为数据源进行验证。分别作出双发动机6个参数及其差值随时间变化的曲线如图4所示。

图4 双发动机6个参数及其差值变化曲线(案例一)

由图4可知:单台发动机气路参数整体变化稳定,未见明显异常波动,偶有1~2个突变点在作差后消失,这表明双发动机性能参数差值相比于单台发动机的性能参数能够降低对外界环境和所处工况的敏感程度。双发动机气路参数差值在前段循环变化稳定,但部分参数差值在尾部出现明显异常波动,这表明同架飞机双发动机性能参数差值相比于单台发动机性能参数表征航空发动机健康状态更具有优势。因此案例一中计算同架飞机左、右发动机巡航阶段的6个气路参数差值作为数据源。由于数据量十分庞大,则每600个点取一个平均值。

3.1.2 基于SFA-LOF-LDD的动态阈值异常检测

计算双发动机6个性能参数差值发现部分参数在末尾处出现异常波动,但是表征不够明显,因此运用SFA对双发动机差值提取相关特征进一步分析,从而得到图5六个随时间变化最缓慢的特征。与原始参数差值相比,这6个慢特征更能代表发动机性能参数随时间变化的固有属性,反映发动机的健康状态。

由图5可知:6个慢特征在前六千多个时间点都处于稳定状态,而在末尾处有不同程度的明显波动。通过慢特征变化规律可以大致判断末尾处出现异常,但由于不同特征开始异常波动的循环和波动程度不同,无法准确识别突变点所在循环,需要通过特征融合进一步判断。

图5 案例一的慢特征提取结果

运用LOF方法将提取的6个慢特征融合为一个监控统计量,并用指数加权移动平均法(Exponentially Weighted Moving Average,EWMA)[24]进行平滑。

vt=βvt-1+(1-β)θt

(25)

式中:β表示加权下降的速率;θt为t时刻的LOF值;vt为t时刻的EWMA值。

采用基于LDD的自适应窗口调整策略,设置初始窗口长度为150,相似度阈值δ为0.4,每次移动时窗口扩大或缩小原来长度的1.5倍,窗口长度最小不低于150,构建航空发动机健康状态随时间变化曲线如图6所示。

图6 基于SFA-LOF-LDD的航空发动机

图6为SFA提取的6个特征融合成的LOF统计量随飞行时间的变化趋势。可知:在前948个循环内,LOF始终处于稳定状态;在949循环开始突变并发出警报,增加到一定高度后维持一小段的波动,再次超过阈值线并急剧上升,并在992循环到达峰值后下降。此案例中,所提方法发出警报时对应的时间为2020年3月30日,而航空公司在2020年6月2日收到报警信号,即峰值处对发动机进行维修。可见文中所提方法能够提前航空公司发出警报,为制定可靠的发动机维修计划预留更多的时间。

3.2 排气温度超温异常事件二

3.2.1 实验数据准备

为了进一步验证文中所提异常检测方法的有效性,将这套异常检测方法应用于该航空公司另一架B737飞机排气温度超温异常事件。实验选取该飞机发动机QAR数据中从2019年3月20日到2019年6月26日期间巡航状态下的监控参数作为数据源,同样选择左、右发动机的TEGT、QFF、N1、N2、T25、T3这6个参数的差值进行实验。分别作出双发动机6个参数及其差值随时间变化的曲线如图7所示。

图7 双发动机6个参数及其差值变化曲线(案例二)

由图7可知:案例二中不同发动机同一参数的变化趋势稳定,无法直接从单台发动机性能参数变化曲线识别异常波动。而对双发动机性能参数作差后的变化曲线也较为稳定,未见明显异常波动。与案例一相比,案例二发动机退化趋势不明显,因此需要运用SFA对双发动机差值提取相关特征进一步分析,同样每600个点取一个平均值以减少数据量。

3.2.2 基于SFA-LOF-LDD的动态阈值异常检测

经过SFA得到图8反映发动机健康状态的6个随时间变化最缓慢的特征。

图8 案例二的慢特征提取结果

由图8可知:在整个飞行时间内,特征1最稳定,几乎没有出现异常波动。其余特征在前半段循环也较稳定,但在尾部出现不同程度的明显波动。依靠所得慢特征信息,无法准确识别异常点。因此运用LOF方法将提取的6个慢特征融合为一个监控统计量,并用EWMA进行平滑。采用与案例一相同的自适应窗口调整策略,构建航空发动机健康状态随时间变化曲线如图9所示。

图9 基于SFA-LOF-LDD的航空发动机

由图9可知:在前335个循环内,LOF始终处于稳定状态;从336循环开始突变并发出警报;在351循环达到峰值,此时航空公司接到报警对发动机进行维修。此案例中,所提方法发出警报对应的时间为2019年6月18日,而航空公司接到报警的时间为2019年6月27日。由此可见,在退化趋势不明显的情况下,所提方法也能够敏感识别异常点,提前航空公司发出报警,从而预留更多的时间制定发动机维修计划。

4 比较与分析

4.1 与基于SVDD的异常检测方法比较

支持向量数据描述(Support Vector Data Description,SVDD)是一种重要的单值分类算法,通过寻找尽可能小的超球体包围尽可能多的数据样本,而超球体之外的视为异常样本,可用于航空发动机的异常检测[25]。针对案例一和案例二计算的6个参数差值,基于SVDD的发动机健康状态评估结果如图10所示。

图10 基于SVDD的发动机健康状态评估

由图10可知:案例一基于SVDD的发动机健康状态评估结果在400~680循环间波动相对增大,容易产生假警,在最后失效阶段的趋势不明显,未能准确反映发动机的健康状态变化;案例二基于SVDD的发动机健康状态评估结果在整个过程中出现多处顶峰干扰,容易产生连续误警。可见SVDD算法在航空发动机异常检测领域的适用性不高。

除了直接观察算法对发动机健康状态的过程评估结果外,鲁棒性、单调性和趋势性可作为评估健康模型的性能指标[26]。图11总结了所提方法与SVDD的3个性能指标比较结果。可以看出:与SVDD相比,所提出的SFA-LOF方法更适用于航空发动机异常检测。

图11 SFA-LOF与SVDD在鲁棒性、单调性和趋势性方面的比较

4.2 与GMMBID融合方法比较

高斯混合模型(Gaussian Mixture Model,GMM)是一种聚类算法,也可用于故障诊断领域[27]。在此基础上以贝叶斯推断的距离(Bayesian Inference-based Distance,BID)定量表征发动机的性能衰退程度。针对案例一和案例二计算的6个参数差值,基于GMMBID的发动机健康状态评估结果如图12所示。

图12 基于GMMBID的发动机健康状态评估

由图12可知:案例一基于GMMBID的发动机健康状态评估能够较好表征发动机的健康状态,但在案例二的评估过程中,GMMBID出现明显顶峰干扰,容易发生假警。同样将GMMBID的鲁棒性、单调性和趋势性与文中所提方法进行对比,结果如图13所示。可见:文中所提方法能有效降低顶峰干扰,且在鲁棒性、单调性和趋势性方面综合性能更优,相比于GMMBID在航空发动机异常检测领域更具优势。

图13 SFA-LOF与GMMBID在鲁棒性、单调性和

4.3 动态阈值与固定阈值比较

为了证明所提动态阈值方法的优越性,将其与传统的固定阈值相比较。针对案例一和案例二,运用文中所提的基于SFA-LOF的异常检测算法,设置固定阈值线,如图14所示。

图14 基于SFA-LOF的固定窗口异常检测

由图14可知:在两个排气温度超温事件中,固定阈值无法根据数据分布特点动态调整控制限,在异常检测过程中易受正常波动干扰发生虚假报警。由此可见,文中所提基于LDD的动态阈值设置方法能避免正常波动造成的假警,提高异常检测的准确性。

5 结论

提出一种基于SFA-LOF-LDD的航空发动机异常检测方法,研究结果表明:

(1)计算同架飞机左、右发动机巡航阶段气路参数差值能够减少飞行工况、高度、温度及马赫数等外界因素对实验数据的干扰,且对航空发动机健康状态的变化更加敏感。

(2)提出的SFA-LOF异常检测方法能提前航空公司识别异常点,与SVDD和GMMBID方法相比有效减少顶峰产生,降低假警的可能性,且在鲁棒性、单调性和趋势性方面的综合性能更优,更适用于航空发动机的异常检测。

(3)提出的LDD方法能自适应调整窗口大小,设置动态阈值线,避免数据波动造成的虚假报警,提高异常检测的精度,为航空发动机在线健康监测提供了技术支撑。

猜你喜欢

差值航空阈值
“闪电航空”来啦
“闪电航空”来啦
差值法巧求刚体转动惯量
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
比值遥感蚀变信息提取及阈值确定(插图)
枳壳及其炮制品色差值与化学成分的相关性
室内表面平均氡析出率阈值探讨
达美航空的重生之路
基于区域最大值与平均值差值的动态背光调整