APP下载

基于核密度估计算法的飞机载荷谱统计技术

2011-03-15汤阿妮

北京航空航天大学学报 2011年6期
关键词:密度估计间隔均值

汤阿妮

(中国飞行试验研究院,西安 710089)

基于核密度估计算法的飞机载荷谱统计技术

汤阿妮

(中国飞行试验研究院,西安 710089)

受到实际条件限制,现阶段的飞机载荷谱实测均采取小子样实测方法,小子样实测数据是取自真实母体的一个简单样本,很难保证数据的充分性、完整性.传统的均值统计法无法对数据缺陷进行弥补.为了克服小子样数据不足问题,将核密度估计技术用于载荷谱统计,取得了良好效果.介绍了核密度估计的相关理论基础,并以某型机下沉速度谱的统计为例,详细介绍了将核密度估计方法用于载荷谱统计的数学过程.结果显示:核密度估计方法对还原载荷谱原貌、补充小子样数据的不足问题具有良好作用.

核密度估计;载荷谱;统计;小子样

为了验证设计数据、改善并优化设计方案、确定机体结构使用寿命,近年来,多种飞机型号进行了载荷谱实测工作.由于条件所限,国内目前的载荷谱实测工作都是小子样实测,即实测一架飞机一定飞行起落的使用载荷,以此代表整个机队甚至整个型号飞机的使用载荷谱.这种方法化解了经济和需求之间的关系,在一定程度上满足了载荷谱实测需求.但由于是小子样实测,难以保证数据的完整性,即实测的使用载荷谱是否能够代表母体的基本特性问题.

在载荷谱编制方法上,采用了多种不同的处理方法以改善载荷谱的可靠度问题,如中值载荷谱编制技术、多代表起落谱技术等.但均值载荷谱依然是使用较多的方法之一,如起落架载荷谱、飞机操纵系统谱、重心过载谱、下沉速度谱等.均值谱的基本方法是对实测数据进行区间投放,对于实测数据的缺陷无法进行弥补.

另一方面,小子样实测数据是来自母体的一个样本,如何利用实测样本最大程度地反映母体特性是数理统计技术要研究的课题之一.近年来发展起来的核密度估计技术在对随机变量进行分布密度函数估计方面得到了较广泛的应用,本文将这种方法用于飞机载荷谱的统计分析,大大改善了小子样数据的不足,取得了良好效果.

1 核密度估计

1.1 一维核估计的定义

由给定样本点集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一.解决这一问题的方法包括参数估计和非参数估计.参数估计又可分为参数回归分析和参数判别分析.在参数回归分析中,假定数据分布符合某种特定的性态,如线性、可化线性或指数性态等,然后在目标函数族中寻找特定的解,即确定回归模型中的未知参数.在参数判别分析中,需要假定作为判别依据的、随机取值的数据样本在各个可能的类别中都服从特定的分布.经验和理论说明,参数模型的这种基本假定与实际的物理模型之间常存在较大差距,这些方法并非总能取得令人满意的结果.由于上述缺陷,Rosenblatt和Parzen提出了核密度估计方法.核密度估计方法属于非参数估计方法,由于核密度估计方法不利用有关数据分布的先验知识,对数据分布不附加任何假定,是一种从数据样本本身出发研究数据分布特征的方法,在统计学理论和应用领域均受到高度的重视[1-3].

在非参数估计方法中,直方图技术是最为直观、最简单的方法,但直方图很难给出较为精确的密度估计结果.核密度估计是在直方图基础上演变而来的具有良好统计性质的密度估计方法.

核密度估计的原理和直方图技术比较类似,直方图记录了实测样本中落在每个区间点的实际个数或频率,可直观地看出每个区间的大致分布趋势.核密度估计则是在计算某一点周围的数据分布时,充分考虑其统计特性,具体地,一维核密度估计的定义为:设X为随机变量,X1,X2,…,Xn为来自X的一个实测样本,则X的概率密度函数f(x)的核估计定义如下:

式中,X=(X1,X2,…,Xn);K(·)为核函数,是一个已知给定的概率密度函数,核函数应满足对称性、非负性;h为带宽系数;n为样本容量.

除一维核估计外,还有多维核估计.本文仅使用一维核估计,对于多维的概念不予介绍.

1.2 核估计精度

影响核密度估计结果的因素有两个:①样本本身;②所取的核函数K(·)和带宽h.可以说,对任何统计方法,样本本身对统计结果均起着决定性作用.在给定样本后,核估计的精度则取决于K(·)及h的选取是否适当.一般的,当K(·)固定时,带宽越大,估计的密度函数就越平滑,但同时带来的后果是f(x)的某些特征被掩盖;带宽较小,估计的密度曲线和样本拟合度较好,但增大了方差,f(x)有较大的波动.

对于在实际使用中应如何确定核函数,文献[1]指出,当给定带宽系数时,不同核函数对估计误差的影响是很小的.理论上讲,任何函数都可以作为核函数.但为了密度函数估计的方便性和合理性,通常要求核函数满足以下条件:

下面列出的是几种常用的核函数:

2)三角函数(Triangle):(1-|x|)I(|x|≤1);

带宽h的选择与样本量n有关.样本量较大时,h较小,反之,h应较大.h的确定还要考虑数据的密集程度,在数据密集区,h选小一点;在数据稀疏区,h选大一点.h的具体计算方法很多,可以参考相应文献.

2 飞机疲劳载荷谱

疲劳载荷谱是飞机疲劳定寿的重要依据,载荷谱反映机体的使用情况,其实质是结构使用中各级载荷大小出现的频数的排列.

载荷谱统计是飞机设计研制工作的重要组成部分,对确定飞机结构使用寿命起着非常重要的作用.在20世纪90年代以前,国内飞机载荷谱统计都是按均值谱编制方法;90年代以后,对机体载荷谱,采用了代表起落随机载荷谱编制方法,而起落架载荷谱则仍然沿用均值谱编制技术.

均值谱编制方法的基本思想是把实测载荷进行分级,经计数处理后,各级载荷出现的频数取重复实测次数的平均值,依次为依据编制载荷谱.均值谱编制通常以任务剖面或任务段为编谱单元,如起落架载荷谱以使用任务段为编谱单元.起落架载荷谱的编制是一个复杂的处理过程,包含计数处理、等寿命折算、等损伤折算等[4],可参考相关文献.

3 核密度估计应用于载荷谱统计

核密度估计方法可以估计出随机变量在其取值范围内某点的概率密度,这与载荷谱统计过程中均值谱统计的思路是一致的,因此可以将核密度估计方法用于载荷谱统计.一般情况下,均值载荷谱以1 000次飞行出现的频次表示,是一个概率的概念,因此对核密度估计结果需要作进一步的计算处理.处理方法如下:

1)计算概率密度.根据给定的核函数和带宽估计载荷的概率密度函数,计算公式如式(1).

2)计算概率.对概率密度估计结果进行数值积分,得到统计概率.可以得到以下两种概率:

①区间概率,即载荷大小位于区间n1和n2之间的概率,计算公式如下:

区间概率的物理意义是一次飞行载荷大小出现在区间n1和n2之间的频数;

②连续概率,即载荷位于最小值到n之间的概率,计算公式如下:

连续概率的物理意义是一次飞行载荷大小在n点的超越频率.

3)计算载荷谱.根据概率计算1 000次飞行谱块:

4)数据推断.根据核密度估计结果推断1000次飞行中可能出现的最大载荷.

推断方法:将概率密度f=0.001代入式(1)求出x值.

4 实例

以某型机下沉速度谱(下沉速度谱是起落架载荷谱统计内容之一)统计为例.在某型机起落架载荷谱实测中,共实测125架次的着陆下沉速度值,其最大值为 1.412m/s,最小值为 0.137m/s,平均值为0.6774m/s.分别用传统的均值统计法和核密度估计法编制该机的下沉速度谱.

4.1 均值统计结果

以0.1m/s为间隔,将下沉速度划分为15个间隔,每个区间的统计结果见表1.以直方图的结果显示为图1.将间隔更改为0.05m/s,对下沉速度重新统计,其结果见图2.这两种结果均为125架次实测下沉速度在不同间隔情况下的均值谱统计结果.从该结果可以看出增大间隔,统计结果有一定程度的改善.

图1 着陆下沉速度实测统计谱(间隔0.1m/s)

图2 着陆下沉速度实测统计谱(间隔0.05m/s)

但由于实测数据有限,下沉速度的分布情况比较离散,其改善程度是非常有限的,再更改间隔,还会得到不同的统计结果,很难得到下沉速度真正的分布情况.如果样本数减少,离散情况将增大.且由于最大下沉速度仅达到1.412m/s,所以,1.412m/s以上的分布情况无法得到.对于整个机队甚至整个型号飞机的使用情况,下沉速度大于1.412m/s是完全可能出现的,只是在测量的125架次中没有遇到而已.这是小子样实测数据无法避免的,同时也是均值统计法不能挽救的.当然,可以利用参数估计方法对其分布形式进行估计,但在样本量较小的情况下,参数估计方法很难得到满意的结果.

4.2 核密度统计法

同样取0.1m/s为估计间隔,按照不同的核函数进行密度估计,结果见图3.由此可见,不同核函数的估计结果差异较小,个别函数统计结果平滑性较差.比较后,选定高斯核函数进行核密度估计.分别取步长为0.05,0.15,0.2 进行计算,计算结果同时列在表1中,图示结果见图4.

表1 某型机下沉速度谱统计结果

图3 不同核函数估计结果对比

从图4可以看出,当取步长为0.05时,计算结果平滑度较差,较多地保留实测数据的原貌,步长增大到0.15时,数据结果比较平滑,再增大到0.2时,平滑度进一步增加.考虑到实际飞行结果,最后选定步长0.2作为计算步长.

图4 不同带宽核密度估计结果对比

与实测谱对应,分别选间隔为0.05和0.1进行统计,结果见图5.可以看出,在选定步长和核函数后,核密度估计结果与间隔的划分没有关系,说明统计结果反映了母体的本质.

图5 某型机着陆下沉速度核密度估计谱

4.3 均值谱与核密度估计谱对比

比较核密度统计谱与均值谱,可以看出,均值谱统计结果与间隔划分关系较大,与样本量的大小关系密切;核密度估计谱大大弥补了实测数据的缺陷,不依赖于数据间隔的划分,体现了母体的真实特性.

同时,核密度估计方法可以很容易地进行数据推断,从该计算结果直接得到了1 000次飞行中出现最大的下沉速度值为1.9m/s,出现次数为0.53.

5 结 束 语

核密度估计是近年来发展起来的非参数估计方法,在很多领域得到了广泛应用.本文将该技术用于飞机载荷谱的统计分析,对于还原载荷谱原貌、解决小子样数据缺陷问题起到了很好的作用.

载荷谱实测对确定飞机实际使用寿命、改进飞机结构设计有重要作用.近年来,国家大力发展航空事业,载荷谱实测任务逐年增多,由于经济原因,目前的小子样载荷谱实测方法将持续较长时间,因此对于新的统计技术研究是非常必要也是非常重要的.

References)

[1]陈希儒,柴根象.非参数统计教材[M].上海:华东师范大学出版社,1993 Chen Xiru,Chai Genxiang.Nonparametric estimation[M].ShangHai:East China Normal University Press,1993(in Chinese)

[2] Epanechnikov V A.Nonparametric estimation of a multidimensional probability density[J].Theory of Probability and Application,1969,14(1):156 -161

[3] Scott D W.Multivariate density estimation:theroy practice and visualization[M].New York:Wile-Blackwell,1992

[4]GJB67.6A—2008军用飞机结构强度规范:重复载荷、耐久性和损伤容限[S]GJB67.6A—2008 Military airplane structural strength specication:repeated loads,durability and damage tolerance[S](in Chinese)

(编 辑:李 晶)

Technique of aircraft loads spectrum statistics based on kernel density estimation

Tang Ani

(Chinese Flight Test Establishment,Xi'an 710089,China)

Restricted by real condition,small sample method is usually used to measure the aircraft loads spectrum.The small sample data is a simple sample from the realmatrix,which can'tensure the adequacy and the integrity of data.The traditional average statistics method which is the common method to be used to develop loads spectrum can't compensate for the defects of data.In order to overcome the shortage of small sample data,kernel density estimation was used to static loads spectrum,and better results were gotten.The basic theory of kernel density estimation was introduced and using the statistic of an airplane's sinking velocity spectrum as an example to describe the mathematical course of kernel density estimation method on load spectrum statistics datailedly.The results show that kernel density estimation method has a good effect for restoring the original appearance of the load spectrum and can make up the shortage of small sample data.

kernel density estimation;loads spectrum;statistics;small sample

V 215

A

1001-5965(2011)06-0654-04

2010-05-04

汤阿妮(1975-),女,陕西潼关人,高级工程师,tangani@sohu.com.

猜你喜欢

密度估计间隔均值
面向鱼眼图像的人群密度估计
基于MATLAB 的核密度估计研究
一种基于改进Unet的虾苗密度估计方法
基于自适应带宽核密度估计的载荷外推方法研究
间隔问题
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
间隔之谜
浅谈均值不等式的应用
均值不等式的小应用