飞机飞行参数数据预处理方法研究
2017-06-22金慧琴王正磊胡文春
金慧琴,王正磊,胡文春
(1.海军航空工程学院,山东 烟台 264001;2.92074部队,浙江 宁波 315000)
飞机飞行参数数据预处理方法研究
金慧琴,王正磊,胡文春
(1.海军航空工程学院,山东 烟台 264001;2.92074部队,浙江 宁波 315000)
飞行参数数据的处理对飞机的飞行安全至关重要,而飞行参数数据的误差会显著影响飞行参数数据处理的结果。分析飞行参数数据误差的基本组成,研究飞行参数数据误差中非常规误差的消除方法,给出了四种适用于对不同类型飞行参数数据进行异值剔除与缺失数据估计的方法,仿真结果表明这四种方法大大提高了飞行参数数据的有效性,使飞行参数数据后期处理更便利。
飞参数据;数据处理;异值剔除
飞机在飞行过程中,机载飞行参数记录器实时记录大量的飞行参数数据,在飞行结束后,可对记录器中记录的飞行参数数据进行分析,确定飞机的状态,其结果是再次飞行的依据,对飞机的飞行安全至关重要[1-2]。飞行参数数据的记录过程中,受采集设备故障和随机因素的影响,会造成错误记录,这些错误记录成为误码;同时环境因素的变化和干扰也会引起异常值的出现。因此,在使用飞行参数数据之前,还须对其进行预处理以提高数据的有效性[3]。本文通过分析不同数据的误差来源,针对不同类型和情况的飞行参数数据误差,给出了四种不同的方法对飞行参数数据进行了异值剔除和缺失值的估计。
1 飞行参数数据误差分类
飞行参数数据的误差会明显地影响飞行参数数据处理的结果,尤其在分析飞机不稳定状态的时候,飞行参数数据的误差主要分为随机误差、非常规误差、系统误差、处理误差四种[4]。
1.1 随机误差
随机误差是指由于在测定过程中一系列有关因素微小的随机波动而造成的具有相互抵偿性的误差。随机误差是飞行参数误差中较为常见的一种,由一些微弱因素和未知因素造成,例如飞机零部件的细微变形、数据传输线路的细微影响等。随机误差无法进行预测,但统计特性在设定时间段内是已知的,因此可以通过大量采集数据的方式进行研究,获取统计规律。
1.2 系统误差
系统误差是指由于仪器结构不完善、仪器未校准、本身理论近似性、测量方法不好或测量者生理特点等原因造成的误差。系统误差由系统本身的设计条件和工作状况决定,例如随地球经纬度变化的磁场,随发动机转速变化的排气温度等。系统误差可以用于检测故障,根据实测数据与期望数据之间的偏差情况,可以发现存在的异常并进行判读。系统误差始终对测量造成影响,具有较强的规律性,通常可以使用函数近似表示,便于通过数学方法进行消除。
1.3 非常规误差
非常规误差是指由于特殊条件或者突发故障造成的严重误差。非常规误差一般由外界干扰造成,是飞行参数数据中间断点和异常值的主要来源,例如电子战干扰、线路接触不良等。非常规误差没有固定规律,也难以掌握统计特性,其突发性和严重性容易引起数据“阶跃”或系统故障。
1.4 处理误差
处理误差是指由于数据采集和处理方法的固有缺陷或者操作不当造成的误差。处理误差主要在数据分析处理时产生,例如试验数据的编译码误差和一次处理误差等。处理过程中采用的不同算法自身存在固有缺陷,编译码过程存在误码率,导致处理误差无法消除,但可以通过数据分析总结出一定的规律。
2 飞行参数数据误差的预处理方法
本文所研究的误差消除,主要是上述误差中不满足统计特性的数据,包括非常规误差和其他误差中统计特性不明显的部分,这些数据称为异值。下面给出飞行参数数据异值剔除和参数估计的四种方法。
2.1 增量法
该方法主要针对一些有确定边界的连续信号进行处理,消除那些偏离正常值较大的异值,只是针对飞行参数数据的粗处理[4-5]。
对连续信号f(t),其离散序列f(tk)的增量
Δfk=f(tk)-f(tk-1)
(1)
有界,即存在常数Δ使对于任意的k,有
|f(tk)-f(tk-1)|≤Δ
(2)
据此,可取一正数Δf,简记f(t)的序列f(tk)为fk,对其异常值作如下判断:
如果|fk-fk-1|>Δf,|fi+1-fi|>Δf及|fk+1-fk-1|<2Δf,则判断fk是单重异值;
如果|fk-fk-1|>Δf,|fi+2-fi+1|>Δf,及|fk+2-fk-1|<3Δf,则判断fk、fk+1是二重异值;
如果|fk-fk-1|>Δf,|fi+3-fi+2|>Δf,及|fk+3-fk-1|<4Δf,则判断fk、fk+1、fk+2是三重异值。
异值的替换采用线性插值法,具体描述如下:
对于单重异值fk的替换为:
(3)
对于二重异值fk、fk+1的替换分别为:
(4)
(5)
对于三重异值fk、fk+1、fk+2的替换分别为:
(6)
(7)
(8)
然而Δf的确定并非易事,一般选取
(9)
其中s>0是一常数,而
(10)
在非交叉滑动区间,单一、双重、三重误差可依据上述方法逐次进行修正。
飞行参数数据非常规误差消除的仿真结果如图1所示,采用以上算法可消除飞行参数数据中存在的单一、双重、三重非常规误差。
图1 飞行参数数据的非常规误差消除
2.2 差分法
用多项式逼近一连续函数是一种函数逼近的常用方法,在实际的数据分析和处理的许多插值和滤波方法中有所应用。n次多项式的一项重要性质是其n+1阶导数恒为零,以此得出一种处理飞行记录数据中确定信号的近似方法[6]。假设可用n-1次多项式去逐段近似函数f(t),f(tk)为其离散值序列,其n阶差分
(11)
其中
(12)
于是对于记录数据序列
fk=f(tk)+ηk
(13)
式中,ηk为误差,其n阶差分为
(14)
由此可知,ξk是ηk的n阶差分的一个近似。据此,可作出ηk的n阶差分序列方差的一个估计:
(15)
假设ηk服从正态分布,那么由统计学可知对于0.05的假设检验显著水平,当
(16)
时,可判定ξk是异常值,又由ξk的定义得出fk,fk+1,…,fk+n中有一个异常值。根据经验以及ξk本身的定义,当判定ξk异常时,相应地判定fk+n/2(n为偶数)或fk+n/2和fk+n/2+1(n为奇数)为异常值较为合理。
依据上述方法,异常值仍然可以被判定为二重、三重。仅以至多三重异常值为限,对于更多重的可以用分组的方法进行。差分法是一种统计处理的方法,判断比较准确,异常值的剔除相较增量法更为精确。
2.3 稳健异值检测与修复方法
对于飞机的气动参数,在飞行参数数据处理时要求有更高的精度,在实际数据的异常值处理中,经常遇到门限值的选取影响异常值的判断问题。当外推值与观测值的差值在门限附近变化时,就难以决断是否把它们按照异常值处理[7]。针对这种“拖尾”的正态分布含斑点异值的数据,提出一种“抗干扰”的估计方法,即稳健估计。通过稳健的线性模型系数辨识法,逐点进行异值的辨识与修复[8]。
假定某一飞行参数数据集合为
D={f(t1),…f(tn)}
(17)
由于目标运动的连续性,可以假定测量对象f(t)可合理地分解成3部分:
f(t)=ftr(t)+εs(t)+ε0(t)
(18)
式中,ytr(t)称为趋势分量,描述的是参数的趋势项,εs(t)是数据随机误差分量,ε0(t)为过程的污染分量或突变性分量,其作用结果是使数据发生严重偏离。
假定:在有限时段上,气动参数符合的函数f(t)是几乎处处连续、按段光滑的,可以被代数多项式与三角多项式的线性组合一致逼近,即
εs(t)+ε0(t)
(19)
其中,T为周期性变化分量fp(t)的演变周期。
改写为线性回归模型的形式:
(20)
式中,
(21)
β=(a0,a1,…,al,bi,…,bm,c1,…,cn)T
(22)
ε(t)=εs(t)+ε0(t)
(23)
下面给出估计方程(20)的一组迭代求解算法[9]:
(24)
并置初值为:
(25)
(26)
在数据预处理时,经常使用下列几种φ(w)函数。
Huber型:
(27)
hampel型:
(28)