APP下载

航空发动机基线挖掘方法对比分析

2020-01-18曹惠玲徐文迪汤鑫豪崔科璐

中国民航大学学报 2019年6期
关键词:基线偏差方程

曹惠玲,徐文迪,汤鑫豪,崔科璐,王 冉

(中国民航大学航空工程学院,天津 300300)

基线方程是指同一类型发动机(或新发动机)在标准状态下的性能参数与控制量等飞行参数之间的函数关系。在航空发动机状态监控和故障诊断中,性能参数换算值与基线值之间的偏差反映了发动机的健康状态,其精确度对监控和诊断结果具有决定性影响。航空发动机的基线模型内置于制造商的状态监控系统中,航空承运人难以获取。目前,航空公司主要依靠飞机通信寻址与报告系统(ACARS,aircraft communications addressing and reporting system)报文与厂家提供的监控软件进行发动机状态监控和故障诊断。为提高监控自主性,减少技术及数据依赖,必须自主获取发动机基线。国内的发动机基线挖掘方法主要有两种:①模仿OEM(original quipment manufacturer),采用试车数据建立基线库;②根据监控管理系统返回的测量值和偏差值反求基线点并建立基线模型。其中,前者需要大量试车数据,耗费大、试验时间长,并不适用于对已投入市场的欧美发动机建立基线库;后者可利用发动机运行数据,通过监控系统提供的偏差值及QAR(quick access recorder)数据反推基线方程,对于正在运营的发动机,该方法已被普遍接受。

林兆福等[1]较早开始研究发动机基线方程的建立方法,根据ECM II 系统提供的部分数据,通过最小二乘曲线拟合方法建立基线方程,同时认为基线与飞行参数有很大关系,并受发动机操作状态的影响。另有学者采用监控管理系统返回数据建立基线,应用函数逼近法建立二次多项式函数待定系数求解模型,然后采用高斯迭代算法求解多元非线性超静定方程[2-6]。付金华等[7]、闫锋等[8-9]针对机载ACARS 系统下载的飞行原始数据,基于神经网络进行基线建模。曹惠玲等[10]根据QAR 数据通过支持向量回归机(SVR,support vector regression)进行基线挖掘,有效提高了发动机基线监控的准确性。对比归纳上述各类方法的适用条件及效果,可为利用基线进行航空发动机状态监控提供理论参考。

1 基线数据来源及数据准备

由于发动机生产厂家和各航空公司实行数据保密,真实数据较难获取,不同学者在进行基线挖掘时采用的数据源并不相同,使得基线挖掘的步骤及准确性受到影响。可采用以下3 种数据来源进行基线拟合:ACARS 数据、QAR 数据和模拟数据。

1.1 ACARS 数据

ACARS 是航空器和地面站之间通过无线电或卫星传输报文的数字数据链系统[11],每次空地循环均产生一定数量的报文数据,利用该数据进行基线拟合是较为准确的数据挖掘方法。首先获取ACARS 报文数据并进行相似修正,同时通过监控软件获取相应的偏差值。然后通过得到的修正值与偏差值反求基线点。再用不同时刻的基线点通过不同拟合方法得到发动机基线方程。

1.2 QAR 数据

发动机工作时各部件不同位置的传感器可获取大量运行数据,除少数经DMU(data management unit)通过VHF(very high frequency)通信系统以ACARS 数据实时传送至地面飞行数据处理工作站外,大量运行数据以QAR 形式储存并离线传递。相比需要通过OEM 以高额费用获取的ACARS 数据,QAR 数据在航后可以直接下载读取,为运营商对飞机及发动机的状态监控、故障诊断、趋势预测提供重要的数据支持。利用QAR 数据进行基线拟合时,可使用QAR 原始数据直接拟合后的常态方程,结合偏差趋势图中性能参数的偏差值或由飞行循环数计算得到的衰退偏差量进行整体平移[10],得到发动机基线方程。

1.3 模拟数据

由于难以获取真实数据,一些学者利用航空发动机原理及飞行规律建立发动机模型,通过模拟数据研究基线方程获取方法[11],重点是拟合方法的精确性,引入更好的数理方法或改良现有的拟合方法,从而得到更精确的拟合结果。

2 基线方程类型及其拟合方法

上述数据来源及准备过程存在差异,通过不同拟合方法得到的基线类型也不相同。以能否得到显性表达式为标准,可将基线方程分为显性方程和隐性方程,同时每种方程又对应不同的拟合方法。

2.1 显性基线方程

显性基线方程直观、简洁,工程应用较广泛。龙江等[12]根据现有基线模型,建立单参数的二次模型,进行相关回归分析。钟诗胜等[4]引入新的拟合方法,通过高斯牛顿迭代法进行回归分析,建立单参数二次关系的发动机基线模型,并在后续研究中利用试车台数据建立三次回归的基线模型[2]。考虑基线受多种因素影响,林兆福等[1]利用正交实验设计原理及最小二乘曲线拟合原理建立多元非线性方程,对实际工程技术改进具有指导意义。以下介绍上述文献中两种较为常用的拟合方法。

2.1.1 最小二乘法

最小二乘法用于数据处理与优化,以数据与其平均值偏差的平方和大小来衡量拟合效果,当平方和最小时,拟合效果最好。最小二乘法不仅可以简便地拟合出曲线,而且具有较高的计算精度。

对于超静定方程组AX=B,其中:A 为m×n 系数矩阵;X 为n 维未知数列向量;B 为m 维列向量;为选取合适的X 使等式成立,引入残差平方和函数S,即

如果矩阵ATA 非奇异,则得到唯一的作为近似最优解,即

利用最小二乘法原理,龙江等[12]建立的发动机EGT基线回归模型为

2.1.2 高斯-牛顿迭代法

除传统算法之外,钟诗胜等[4]将非线性最小二乘问题逐次化为一系列线性最小二乘问题,对超定方程进行多元非线性回归分析来迭代求解。

高斯-牛顿迭代法的基本思想是使用泰勒级数展开式去近似代替非线性回归模型,然后通过多次迭代、多次修正回归系数,使回归系数不断逼近非线性回归模型的最佳回归系数,最后使原模型的残差平方和达到最小,其核心思想是利用泰勒展开式。设非线性回归模型为

其中:r 为待估回归系数;误差项εi~N(0,σ2)。设g(0)=为待估回归系数r=(r0,r1,…,rp-1)′的初始值,将f(xi,r)在g(0)点附近作泰勒展开,并略去非线性回归模型二阶及二阶以上的偏导数项,经代入、移项得

用矩阵形式可将式(7)表示为

用最小二乘法对式(8)估计修正因子B(0),则b(0)=(D(0)′D(0))-1D(0)′Y(0),设g(1)为初次迭代值,则

为检验精确度,设残差平方和为

高斯-牛顿法的优点是在给定的初值较为合理的情况下,收敛速度非常快。基于上述数理理论,钟诗胜等[4]建立了包含5 个性能参数的发动机基线,以EGT回归模型为例,得到基线方程为

2.2 隐性基线方程

以神经网络、SVR 为代表的机器学习算法帮助人们更为有效地解决数据量庞大、关系复杂的实际问题,将其应用于航空发动机基线挖掘,有助于获取更为准确的基线方程。王聃等[13]对现有的SVR、BP 神经网络算法进行改进,建立多参数发动机基线模型,得到了很好的挖掘效果;闫峰等[9]设计了以高斯函数为隐含层激励函数、以线性函数为输出层激励函数的多参数RBF 神经网络,通过Pearson 相关性分析确定网络的输入节点,并使用该网络预测N2 基线,为建立多参数隐性基线模型提供了一种新的思路。以下是两种常见的隐性基线方程获得方法。

2.2.1 神经网络

神经网络(NN, neural network)具备学习、联想、记忆和模式识别等智能信息处理功能,可在大量数据中进行非线性运算和自主学习,并将学习结果分布存储于网络的突触连接中,从而得到对现实中某种算法或函数的逼近[14],在模式识别、预测估计、自动控制等诸多领域中得到了广泛应用,目前使用最多的是BP 神经网络结构。

BP 神经网络是一种多层前馈神经网络,是在现代神经科学研究成果的基础上提出的,具有极强的学习能力、自适应能力和容错能力,如图1 所示。其学习规则如下:①随机取输入值;②估计输出结果与目标的误差;③改变每层各神经元的权重(weight),以求更小误差。

图1 BP 神经网络拓扑结构Fig.1 Neural network topology structure

对于中间层和输出层的各个神经元,输入向量x=(x1,x2,…,xn),对应权值w=(w1,w2,…,wn)T,阈值b 以及激活函数f,则输出向量o =(o1,o2,…,om),可由以下公式得到

其误差函数为

其中:d 为期望输出向量;yo 为输出层输出向量,q 为输出层神经元个数。采用Sigmoid 函数激活BP 神经网络,各隐含层节点对BP 网络的输出具有同等影响,因此BP 神经网络是对非线性映射的全局逼近。

2.2.2 支持向量回归机

SVR 建立在统计学习理论和结构风险最小化原理基础上,对于数据量较少的样本具有优异的建模能力;通过非线性核函数,将输入样本空间映射到高维线性特征空间,能够成功地处理回归问题。

SVR 模型的原理在于根据样本数据,训练集Dn={(xi,yi),i=1,…,q,xi∈Rp,yi∈R},在高维特征空间中构造最优决策函数,即

其中:映射函数φ(x):x→H 是将样本点映射到高维空间的非线性变换。SVR 回归分析可表示为

式中:xi为输入向量;w∈Rp为权值变量;C 为惩罚系数,控制对超出误差样本的惩罚程度;ε 为不敏感损失函数,其值影响支持向量的数目;ζ 为松弛变量,表示样本偏离ε 的程度。通过求解上述模型拉格朗日方程的对偶问题获得原问题的最优解,即

其中:K(xi,x)称为核函数,满足Mercer 条件且K(xi,x)=(φ(xi)φ(x))。

2.3 双发差异

工程中常采用双发差异的监控方式,即同一架飞机上的两台发动机互为基线,通过比较两者性能参数的相对变化进行监控。外界条件相同且运行正常时,左、右发动机的工作线趋势基本相同、差异基本稳定,即差异初值[15]。如果运行中出现较大差异,则意味着其中一台发动机出现了异常,需进一步进行故障定位。

3 基线挖掘应用实例

以PW4056 发动机为例,分别采用两种方式所得基础数据,利用4 种常用拟合方法进行基线挖掘和性能对比。

PW4056 发动机的基线方程是发动机性能参数EGT、N1、N2、FF 经修正后的换算值与控制量EPR 之间的函数关系。同时飞行高度H、计算空速V、大气总温TAT 等飞行参数也对性能参数产生影响[4,10]。由于4个性能参数在基线挖掘时的具体步骤、计算方法相似,因此以EGT 基线为例展开分析。

选用平均绝对误差(MAE, mean absolute error)作为判断基线拟合准确性的参考量,其定义为

其中:xi为样本值;m(xi)为样本对应的标准值;n 为样本容量。MAE 数值与样本值偏离标准值的大小程度成正相关,即MAE 越小整体误差越小。

3.1 基于ACARS 数据

某航空公司一台PW4056 发动机2013年6月1日至2013年6月30日的50 条ACARS 数据以及厂家给出的对应偏差值数据如表1 所示。

表1 ACARS 及偏差趋势图原始数据Tab.1 Original data from ACARS message and deviation tendency chart

经过气路参数标准化修正,通过偏差值反推得到基线点数据后,以EPR 为自变量,EGT 为因变量,分别利用最小二乘法、高斯牛顿迭代法、BP 神经网络、SVR进行基线方程挖掘。

采用最小二乘法和高斯-牛顿迭代法得到的基线方程分别为

EGTcorrect=193.491 7EPR2-216.681 8EPR+394.793 1

EGTcorrect=159.882 0EPR2-140.837 5EPR+

其中,高斯-牛顿迭代法的气路修正方程为

采用单参数BP 神经网络和支持向量机得到的模型计算数值与原始数据对比如图2 所示。

4 种挖掘方法的平均绝对误差如表2 所示。由图2、表2 可知,基线模型预测误差均在±4%以内,精度相差不大,可以被工程上接受。由于偏差值数据是监控系统通过对比基线库数据与ACARS 数据所得,因此通过ACARS 数据和偏差值得到的基线点较准确,用各种挖掘方法得到的基线精度均较高。其中:高斯-牛顿迭代法计算时间最短,且直观性好,方便工程使用;SVR 预测精度最高。

图2 BP 神经网络和SVR 预测数据对比Fig.2 Predicted data comparison between BP neural network and SVR

表2 基于ACARS 数据的基线挖掘预测误差对比Tab.2 Predicted deviation comparison among different detection methods based on ACARS data

3.2 基于QAR 数据

为充分对比4 种方法的特点并分析QAR 数据挖掘的准确性,从上述同一台发动机同时间的数据中筛选得到219 条QAR 数据,对其进行相似修正,按照文献[10]中的加权平均法求取整体偏差值后对QAR 数据进行平移,并通过4 种方法分别进行基线方程拟合,结果如图3、表3 所示。

图3 基于QAR 数据的不同基线模型预测数据对比Fig.3 Predicted data comparison among different detection methods based on QAR data

表3 基于QAR 数据的基线挖掘预测误差对比Tab.3 Predicted deviation comparison among different detection methods based on QAR data

飞行过程中的各性能参数不仅由控制量EPR 决定,还受其他飞行参数影响,基于ACARS 数据进行挖掘时,这种偏差由监控系统自动修正、通过偏差值得到反映,因而基于QAR 数据进行挖掘时若只考虑性能参数与控制量之间的关系进行挖掘会增大误差。针对这种情况,应采用多参数BP 神经网络和SVR,以EPR 及其他飞行参数为输入量进行基线挖掘,以获得更好的准确度。

由图3、表3 可知,计算发现通过QAR 数据得到的基线模型预测误差比上节中略有增大,但都保持在±5%以内,MAE 在1.18%~1.47%之间,说明通过与ACARS 数据同源的QAR 数据进行基线挖掘具有很好的可行性。对比发现单参数拟合精度相似、误差较大,采用多参数拟合后基线预测精度更高,相对于单参数拟合时BP 神经网络、支持向量机的MAE 分别减小15%和13%,说明以QAR 数据进行基线挖掘时多参数的BP 神经网络和SVR 有很好的可行性,而不宜采取单参数、显性方程的基线挖掘方法。

4 结语

原始数据与拟合方法均对基线挖掘产生影响,原始数据对准确性的影响更大。运用ACARS 数据能得到准确的基线点数据,基线挖掘精度比QAR 数据高,因此在状态监控中优先采用ACARS 数据。但ACARS数据量少、不易获取,在条件限制下也可考虑采用同源、数据量大且更易获得的QAR 数据作为替代,但在挖掘时必须考虑除控制量之外其他参数的影响。

利用ACARS 数据进行基线挖掘,各种方法的拟合精度相差不大,其中最小二乘法在数据量小、离散程度不大时表现出较高的精度和稳定性和较小的计算量,因此优先考虑最小二乘法。利用QAR 数据进行基线挖掘,考虑到实际工作过程中性能参数受各种外界条件的影响,单参数拟合精度下降,而SVR 适用于挖掘多个参数之间的函数关系,且与BP 神经网络相比,可通过少量数据获得更高的精度和稳定性,因此优先采用SVR 进行基线挖掘。

猜你喜欢

基线偏差方程
方程的再认识
50种认知性偏差
方程(组)的由来
GNSS 静态相对定位精度分析与比较
如何走出文章立意偏差的误区
圆的方程
基于虚拟基线的相位干涉仪阵列优化设计
真相
一种改进的干涉仪测向基线设计方法
机械装配偏差源及其偏差传递机理研究