APP下载

小样本理论在航空发动机研制费估算中的应用

2014-12-02张海涛

北京航空航天大学学报 2014年11期
关键词:涡扇军用研制

刘 芳 张海涛

(中国航空工业发展研究中心 财经研究部,北京100029)

20世纪末以来,成本上涨、研制周期延长和价格上涨等一系列因素对世界航空发动机的前景产生了重要影响[1].航空发动机成本指标的提高具有指数性,同时,为建立超前的科技储备而进行的探索研究成本所占比重一代比一代大.美国的制造业从第四代发动机向第五代过渡时,这一比重从15%提高到60%,且所费时间延长近1倍.而且工程设计的变化、估算时所用假设条件的变化、需求更改和包括机体制造成本、人工成本、材料成本以及物价浮动在内的经济因素的变化等原因,使得几乎所有型号的研制费都出现了大幅增长的情况[2].如F135发动机项目,其单台成本已经比最初基线增长了30%之多.因此,在发动机立项论证或设计早期对研制经费需求进行快速和准确的估算非常重要[3].

在项目立项论证或设计阶段早期,美国的普遍做法是采用参数模型法对项目的经费需求进行估算,并回归建立了适用于涡喷/涡扇发动机研制费估算的参数模型[4].由于美国研制的航空发动机型号众多,数据积累和成本管理也较完善,具备普通线性回归的基础条件[5].而我国自行研制的军用涡喷/涡扇发动机较少,发动机样本明显不足,且由于多渠道管理的问题,对技术、经济数据的积累严重不足,无法利用简单的线性回归方法建立参数模型.此外,国内已经建立的军用航空发动机研制费估算模型都是采用普通线性回归建立的,在研究方法和估算精度上都有一定的局限性[6].

本文在国内外已有研究工作的基础上,考虑我国军用涡喷/涡扇发动机型号偏少且基础数据缺失比较严重的现实情况,系统收集了32种军用涡喷/涡扇发动机型号的技术性能和研制费数据,将小样本建模理论中的偏最小二乘(PLS,Partial Least Squares)回归方法应用于航空发动机研制费估算模型的研究,建立了新型的军用涡喷/涡扇发动机的参数估算模型.计算结果表明,该模型较国内其他已有模型的估算精度有所提高,能够满足我国军用发动机研制费估算的需求.

1 小样本理论的建模方法选择

虽然我国各类型航空发动机的型号较多,但自行研制的发动机较少.另外,由于长期以来发动机行业的多渠道管理,设计与管理人员普遍对费用数据的关心不够,造成我国航空发动机型号的费用数据积累不完备.因此在建立我国的航空发动机研制费估算模型时,要充分考虑到数据短缺这一实际情况,不能完全照搬国外模型所采用的传统回归方法,应采用适用于样本数量较少的回归分析方法,建立一种新型的、适用于我国型号实际情况的研制费估算模型.

小样本理论中应用比较多的方法主要有主成分回归、岭回归和偏最小二乘回归[7].本文以美国军用发动机从型号设计到型号合格试车的研制费用为例进行计算分析,对比主成分回归、岭回归和偏最小二乘回归的适用性.由于数据保密的时效性,本文所引用的数据均来源于美国20世纪70年代的军用发动机技术数据,详见表1.变量之间的相关关系如表2所示.

表1 美国军用发动机技术数据Table 1 U.S.military aero engine technical data

表2 变量之间相关系数矩阵Table 2 Correlation matrix between variables

从表1可以看出,解释变量与因变量之间存在一定的线性关系,但是因变量之间也存在比较严重的多重共线性,比如x1和x4,x8,x6的相关系数就都达到0.627以上.

当向量个数大于其维数时,它一定是个线性相关组.故对于样本数少于自变量个数的情况,不用计算各变量之间的相关系数也可以肯定它们一定存在多重共线性[8].即当样本个数少于自变量的个数时,自变量之间就存在完全的多重共线性.这时可以将与其他自变量相关关系较大的变量从估计方程中去掉,以此类推,直到将其他多余的变量全部去除,最后达到变量的个数最多等于或少于样本的个数,这样样本个数少于自变量个数的问题就得到了解决.这就是说,引进偏最小二乘法主要目的是为了处理比较严重的多重共线性问题[9].

1)岭回归计算.

岭回归分析是一种修正的最小二乘估计法,当自变量系统中存在多重相关性时,它可以提供一个比最小二乘法更为稳定的估计结果,并且回归系数的标准差也比最小二乘估计法小[10].

根据高斯-马尔科夫定理,多重相关性并不影响最小二乘估计量的无偏性和最小方差性.但是,虽然最小二乘估计量在所有线性无偏估计量中是方差最小的,但是这个方差却不一定小.于是可以找一个有偏估计量,这个估计量虽然有微小的偏差,但它的精度却能大大高于无偏的估计量.

根据岭回归计算流程,对表1中的样本点进行研制费和技术指标的回归建模,可以得到具体岭回归方程为

这时得到的岭回归方程中回归系数的膨胀因子均小于3,但是岭回归方程的均方根误差(R1=19.1742)偏大.

2)主成分分析计算.

主成分分析是考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标[11].

最经典的做法就是用F1(选取的第1个线性组合,即第1个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多.因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第1主成分.如果第1主成分不足以代表原来P个指标的信息,再考虑选取F2即选第2个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求 Cov(F1,F2)=0,则称 F2为第2主成分,依此类推可以构造出第3、第4,……,第P个主成分.

根据主成分回归计算流程,对表1中的样本点进行研制费和技术指标的建模回归,可以得到取两个主成分后的回归方程:

这个主成分回归方程中回归系数的符号存在一定问题,且主成分回归的均方根误差(R2=6.19)也比偏最小二乘法的大许多.各个回归系数的方差膨胀因子均小于2.5955.

3)偏最小二乘法的回归计算.

偏最小二乘法是一种数学优化方法,它通过最小化误差的平方和找到一组数据的最佳函数匹配.求得一些绝对不可知的真值,而令误差平方和最小.该方法常用于曲线拟合.很多其他的优化问题也可通过最小化能量或最大化熵用最小二乘形式表达[12].

偏最小二乘回归≈多元线性回归分析+典型相关分析+主成分分析

与传统多元线性回归模型相比,偏最小二乘回归的特点是:

①能够在自变量存在严重多重相关性的条件下进行回归建模;

②允许在样本点个数少于变量个数的条件下进行回归建模;

③偏最小二乘回归在最终模型中将包含原有的所有自变量;

④在偏最小二乘回归模型中,每一个自变量的回归系数将更容易解释.

在计算方差和协方差时,求和号前面的系数有两种取法:当样本点集合是随机抽取得到时,应该取1/(n-1);如果不是随机抽取的,这个系数可取1/n.

根据偏最小二乘法中的交叉有效性,回归过程提取两个成分,其预测误差平方和最小(P=0.0407),均方根误差R3=0.95.

回归方程的形式为

从以上的计算实例可知,偏最小二乘回归的效果最好.因此本文选用小样本理论中的偏最小二乘回归方法用于建立我国航空发动机研制费估算模型.

2 研制费估算模型的建立与试算

2.1 建模所用的样本点

经过收集和整理,我国航空发动机技术经济数据库存入了32种发动机型号的数据,都是涡喷/涡扇发动机,主要是歼击机、强击机、轰炸机和教练机的动力装置.这些发动机研制的年代是从20世纪50年代到20世纪90年代,性能范围也比较宽,推重比从3~8[13].基本反映了我国航空发动机研制、生产的全貌,详见表3.

表3 国内航空发动机统计表Table 3 Domestic aero engine statistics table

2.2 模型结构与自变量的选择

进行建模工作之前,比较重要的问题是模型结构的确定和自变量的选择.

参数方程的结构直接影响到预测模型的精度和预测未来发动机费用的准确性.国内外相关研究经验表明,航空发动机研制费估算模型的结构大多采用部分参数对数方程或全部参数对数方程[14].考虑到我国发动机技术、经济数据的自然规律以及偏最小二乘回归的特点和原理,本文采用的参数方程为全部参数对数方程,即

除数据以外,影响估算模型精度的另一个关键是自变量的选择[15].在参数方程中,费用为因变量,主要的发动机技术指标为自变量.影响发动机研制费的技术指标很多,但考虑模型的可用性和简便性,不可能将所有的技术指标都选作自变量,需要选取对费用影响最大的部分技术指标作为自变量.美国兰德公司的研究表明,发动机推力、发动机重量、涡轮进口温度、原型机数量以及研制年代(或完成时间)等因素对发动机的研制费影响最大[16].

通过对国内外相关研究成果的研究,发现以下发动机技术参数对发动机的研制费影响较大,分别是:最大设计马赫数Ma(无量纲),加力推力x1(N),军用推力A(N),加力耗油率x6((kg/N)/h),军用耗油率B((kg/N)/h),发动机推重比D(N/kg),设计空气流量x8(kg/s),风扇压比E(无量纲),总增压比F(无量纲),涡轮进口温度x3(K),最大直径G(mm),总长度H(mm),发动机净重x4(kg),发动机翻修寿命I(h),原型机数量J(台),完成时间x7(季度数),继承系数K(无量纲).其中,完成时间是一个日历型变量,不能直接对其进行数值计算.对于我国的实际情况,首先必须把日历变量转变成数值量,具体办法是将完成时间全部转换成距离1952-01-01的季度数.之所以把1952-01-01作为起始点,是因为考虑我国航空工业是从修理起步的,1951年12月是我国自行修理的第一批涡喷发动机通过合格试车的时间[17].研制继承系数是指所研制的发动机继承以前的发动机技术的比例(见表4),它反映了新技术采用的多少,也能反映现有的结构工艺超前的储备量.

表4 研制继承性系数表Table 4 Development inheritance coefficient table

选择自变量的原则是:①在设计和研制初期易于确定的参数;②对研制费的影响较大;③自变量之间的相关关系较小;④在估算发动机研制费时,自变量必须是确定的数值[18].

选择说明性变量时,主要依据统计回归中的自变量相关关系、自变量与因变量相关关系分析和偏最小二乘回归中的自变量投影重要性(VIP,Variable Importance for Projection)进行分析.其中,VIP指标越高代表该变量对研制费的影响越大[19].分析结果如图1、表5 所示.

表5 自变量相关关系表Table 5 Variables correlationtable

按照偏最小二乘法中的VIP指标划分方法,VIP≥1的自变量是首选的变量,VIP≤0.5的变量是可以考虑剔除的自变量,而介于两者之间的自变量需要再结合自变量之间的相关关系进行筛选.

从图1、表5可以看到:17个自变量对研制费的解释能力分为3类,其中VIP≤0.5的自变量有3个(加力耗油率x6、最大马赫数Ma、发动机总长度H),这3个自变量与研制费的相关系数也比较小,都在0.3以下,可以剔除;VIP≥1的自变量有8个(继承系数K、总增压比F、原型机数量J、加力推力x1、军用耗油率B、军用推力A、风扇压比E、设计空气流量x8),这8个自变量中只有原型机数量和风扇压比与研制费的相关系数在0.6以下,原型机数量与其他自变量的相关系数较小,都在0.6以下,可以保留;风扇压比与军用耗油率、总增压比这2个解释性比较强的变量相关关系较强,相关系数在0.8以上,可以剔除;0.5<VIP<1的自变量有6个(发动机净重x4、完成时间x7、涡轮前温度x3、翻修寿命I、最大直径G、发动机推重比D),这6个自变量中发动机推重比、完成时间、翻修寿命都对研制费有独立的解释能力,与其他自变量的相关关系都较弱,可以保留,最大直径与发动机净重之间存在较强的相关关系,而相对来说,发动机净重对研制费的解释能力更强,宜保留这一技术指标.

基于以上考虑,再结合上百次的试算,本文选取了发动机加力推力、发动机军用推力、发动机军用耗油率、发动机设计空气流量、发动机总增压比、涡轮进口温度、发动机净重、发动机翻修寿命、原型机数量、完成时间、研制继承系数、发动机推重比这12个变量作为自变量.

2.3 估算模型的建立

模型结构和自变量选取完毕后,需要对选取的样本点进行特异点筛选.使用偏最小二乘法对样本进行筛选,发现不存在特异点.因此,模型的拟合效果是理想的,不需要剔除样本.按照偏最小二乘法计算要求,在对样本点进行拟合前,需要选取能够代表所有自变量的主成分,从1个主成分开始试算,直到主成分的累计解释能力能够达到0.8以上时为止.根据交叉有效性指标,研究中选择到第2个偏最小二乘回归主成分时的解释能力达到0.8以上,可以满足建模的需要,在回归计算时选取两个主成分即可.

根据偏最小二乘方法的回归计算,利用这12个自变量建立的研制费估算模型如下:

式中,an为常系数;其他变量含义同上文描述.

使用模型对建模时所用的样本点进行重新的拟合计算,可得选取1个偏最小二乘回归主成分时的拟合精度为73.83%,选取2个偏最小二乘回归主成分时的拟合精度为86.37%,而选取3个偏最小二乘回归主成分时的拟合精度为80.17%.因此,本文选取2个主成分是恰当的,达到了较高的精度.

得到模型后,对建模时所用的样本点的研制费进行估算,可以得到模型拟合的效果图(如图2所示).从拟合曲线图来看,模型的拟合效果比较理想.

同时,可以得到样本的估算误差柱状图(如图3所示),从样本的估算误差来看,模型估算的整体误差在10%以内.

图2 研制费实际值与拟合值的对比曲线图Fig.2 Development costs curves of the actual value and the fitted value

图3 研制费实际值与估算值的对比柱状图Fig.3 Development costs histogram of the actual value and the estimated value

2.4 算例分析

国内相关研究机构、高校等单位在发动机研制费估算工作方面开展过大量的工作,形成了一些模型.其中研究较多的有原航空620所、空军工程大学与北京航空航天大学等.但由于当时我国涡扇发动机型号较少,所形成的模型大多采用的是涡喷发动机的样本.随着我国涡扇发动机型号的不断增多,而且未来我国型号发展的重点也是涡扇发动机[20].因此,在建模过程中加入了新型涡扇发动机作为样本点,所形成的模型才能更好地用于未来型号的研制费估算.本文将研究所得的模型与其他发动机研制费估算方法进行了对比分析.

其中,原航空620所在1987年收集了国内航空发动机技术经济数据,选用8个涡轮喷气发动机样本,选取加力推力和涡轮进口温度作为自变量,采用线性回归的方法建立了涡轮喷气发动机研制费估算模型,没有建立涡扇发动机的研制费估算模型.

空军工程大学在1988年选用18种涡喷、涡扇发动机型号的技术经济数据,选取最大设计马赫数、加力推力、推重比、涡轮进口温度、翻修寿命、实际完成时间、原型机数量等7个技术参数作为自变量,采用线性回归的方法建立了发动机研制费估算模型.

选取某新型涡扇发动机为研究对象,分别采用本文方法、原航空620所方法和空军工程大学的方法对其研制费进行估算,将该型号的加力推力、军用推力、军用耗油率、设计空气流量、总增压比、涡轮进口温度、净重、翻修寿命、原型机数量、完成时间、研制继承系数和推重比等参数代入本文构造的估算模型;将该型号的加力推力和涡轮进口温度等参数代入原航空620所建立的模型中;将最大设计马赫数、加力推力、推重比、涡轮进口温度、翻修寿命、实际完成时间、原型机数量等参数代入空军工程大学建立的模型中.估算结果统一换算为2013年人民币币值,如表6所示.

表6 3种方法估算精度对比Table 6 Accuracy comparison of three estimating methods

计算结果表明,用来估算某新型先进涡扇发动机的研制费,原航空620所和空军工程大学的方法的误差均超出了参数法估算误差在±30%以内的要求,而本文的方法误差在10%以内,可以满足型号研制初期费用估算的需求,说明本文的方法精度较高、实用性强,可应用于先进涡扇发动机的项目立项论证与方案设计等.

3 结论

为了解决航空发动机项目立项和方案设计阶段研制费估算问题,本文分析了小样本建模理论中的多种可用的建模方法,从方法的成熟性和有效性角度考虑,选择了偏最小二乘方法作为建模方法;在进行基础数据处理、模型结构确定的基础上对多个变量进行了筛选,分析了模型的适用性,并确定了估算模型.分析表明:以选取的12个技术指标作为自变量所建立的发动机研制费估算模型平均误差在10%以内,并且对新型涡扇发动机的估算效果要优于20世纪90年的代表方法——原航空620所的方法和空军工程大学的方法,可以满足工程使用的要求.

References)

[1]李屹晖.军用航空发动机全寿命费用分析研究[D].北京:北京航空航天大学,2000 Li Yihui.Analysis and research on the life cycle cost of military aero engine[D].Beijing:Beijing University of Aeronautics and Astronautics,2000(in Chinese)

[2] Brikler J L.Development and production cost estimating relationships for aircraft turbine engines[R].Rand N-1882-AF,1982

[3]刘锦,张海涛.航空发动机研制费估算工作的现状与展望[J].航空发动机,2014,40(1):75-78 Liu Jin,Zhang Haitao.Status and prospects of aeroengine development cost estimation[J].Aeroengine,2014,40(1):75-78

[4]张森,陈永革.基于参数法的3种研制费用估算模型[J].四川兵工学报,2010,31(3):53-56 Zhang Sen,Chen Yongge.Three parametric model of development cost estimating[J].Sichuan Ordnance Journal,2010,31(3):53-56(in Chinese)

[5] Sininger W B.Engine life cycle cost[R].AIAA 76-0754,1976

[6]王如根,曹平,谭崇武,等.航空发动机全寿命费用预测模型研究[J].空军工程学院学报,1992,12(3):15-19 Wang Rugen,Cao Ping,Tan Chongwu,et al.Research of life cycle cost estimating relationships of aircraft turbine engines[J].Journal of the Air Force College of Engineering,1992,12(3):15-19(in Chinese)

[7]王如义.多元线性回归中复共线问题及偏最小二乘回归分析[D].成都:西南交通大学,2004 Wang Ruyi.Multiple linear regression line in the complex of problems and partial least squares regression analysis[D].Chengdu:Southwest Jiaotong University,2004(in Chinese)

[8]纪秋颖,林健.高校生态位适宜度的数学模型及其应用[J].辽宁工程技术大学学报,2006,25(S1):260-262 Ji Qiuying,Lin Jian.Niche fitness model of colleges and universities and its application[J].Journal of Liaoning Technical University,2006,25(S1):260-262(in Chinese)

[9]张凤莲.多元线性回归中多重共线性问题的解决办法探讨[D].广州:华南理工大学,2010 Zhang Fenglian.Multiple linear regression to explore multiple solutions to the problem of linear[D].Guangzhou:South China University of Technology,2010(in Chinese)

[10]柯鹏,杨春信,杨雪松,等.重型货物空投系统过程仿真及特性分析[J].航空学报,2006,27(5):856-860 Ke Peng,Yang Chunxin,Yang Xuesong,et al.System simulation and analysis of heavy cargo airdrop system[J].Acta Aeronautica et Astronautica,2006,27(5):856-860(in Chinese)

[11]罗云宝,侯志强,崔坤林,等.基于BP神经网络的战斗机采购费用估算[J].海军航空工程学院学报,2006,21(4):463-466 Luo Yunbao,Hou Zhiqiang,Cui Kunlin,et al.Prediction for aircraft stock cost based on neural network[J].Journal of Naval Aeronautical Engineering Institute,2006,21(4):463-466(in Chinese)

[12]郭基联,张恒喜,刘晓东.飞机机体研制费用的偏最小二乘回归分析[J].数量经济技术经济研究,2001(4):121-124 Guo Jilian,Zhang Hengxi,Liu Xiaodong.Partial least squares regression analysis for airframe development cost[J].The Journal of Quantitative & Technical Economics,2001(4):121-124(in Chinese)

[13]张恩和.对我国军用航空发动机发展的思考[J].航空发动机,2001,27(3):1-3 Zhang Enhe.Reflections on China's military aero engine development[J].Aeroengine,2001,27(3):1-3(in Chinese)

[14] Curry C E.Engine life cycle cost modeling in the conceptual phase[R].AIAA 75-1288,1975

[15] Nelson J R.Relating technology to acquisition costs:aircraft turbine engines[R].R-1288-PR,1974

[16]徐哲,刘荣.偏最小二乘回归法在武器装备研制费用估算中的应用[J].数学的实践与认识,2005,35(3):152-158 Xu Zhe,Liu Rong.The application and research of PLS in estimating the cost of development in armament[J].Mathematics in Practice and Theory,2005,35(3):152-158(in Chinese)

[17]刘廷毅.航空发动机研制全寿命管理研究及建议[J].航空发动机,2012,38(1):1-6 Liu Tingyi.Research and suggestion of lifecycle management for aeroengine development[J].Aeroengine,2012,38(1):1-6(in Chinese)

[18]于芹章,张福元,艾克武,等.武器装备全寿命费用估算建模有关问题研究[J].装备指挥技术学院学报,2003,14(4):18-21 Yu Qinzhang,Zhang Fuyuan,Ai Kewu,et al.The related research on the problem of evaluation and model of weaponry life circle cost[J].Journal of the Academy of Equipment Command& Technology,2003,14(4):18-21(in Chinese)

[19]李波,许诚,王君珺.导弹武器系统采办费用估算有关问题分析[J].海军航空工程学院学报,2006,21(5):585-588 Li Bo,Xu Cheng,Wang Junjun.Analysis on estimates related problems in acquisition cost of missile weapon system[J].Journal of Naval Aeronautical Engineering Institute,2006,21(5):585-588(in Chinese)

[20]胡晓煜.未来军用航空发动机展望[J].国际航空,2005(5):54-56 Hu Xiaoyu.The future of military aero engine[J].International Aviation,2005(5):54-56(in Chinese)

猜你喜欢

涡扇军用研制
大话军用卡车
仿生眼的研制有新突破
威力无比的军用霰弹枪
基于数字式控制系统的涡扇发动机起动过程失速检测方法
民用飞机设计参考机种之一 波音737-200双发涡扇短程运输机
一种新型固定翼无人机的研制
XV-24A垂直起降验证机的研制与发展
小型涡扇发动机燃油控制规律
猜谜
137Cs稳谱源的研制