APP下载

基于进化KPLS方法的装备修理价格测算研究

2013-04-28王洪峰蒋铁军

关键词:测算装备价格

王洪峰,韩 云,蒋铁军

(1.72687部队司令部,山东 青岛 266000;2.91329部队装备部,山东 威海 264200;3.海军工程大学装备经济管理系,湖北 武汉 430033)

装备修理价格的准确测算是其寿命周期费用测算的关键内容,同时也影响到其全系统全寿命管理的效果[1-2]。由于装备不同,轮次修理时在技术状态上存在差异性,使得其修理价格测算相对于建造价格难度更大。到目前为止,已经有许多方法用于对装备修理价格测算,如经验估算法、类比法、详细分析法和综合分析法等。外军用于装备寿命周期费用估算的方法主要有多元回归分析方法、偏最小二乘回归分析方法等。由于国内外装备修理价格测算模型以及费用数据体系存在一定差异性,外军所建立的模型很难直接应用于我军装备修理价格测算工作中。

由于装备修理价格影响因素复杂,且存在较强的非线性影响关系,在实际建模过程中,一般方法难以取得较好的应用效果。随着机器学习方法的兴起,一些能够较好处理非线性问题的方法初步引入到价格测算领域,核方法由于应用了核映射,能将传统数据空间中的非线性问题通过变换转换成特征空间中的线性问题,同时不额外增大计算量,目前已在许多方面得到了广泛的应用。

鉴于核方法的特征和应用优势,考虑到装备修理目标价格的非线性特征,笔者将核偏最小二乘(KPLS)应用于装备修理价格的测算;同时,考虑到模型中多种参数的确定问题,提出采用粒子群优化(PSO)算法实现各种参数的优选,能非常简便地得到用于装备修理价格测算的优化模型。

1 KPLS回归模型

1985年WOLD就针对在变量集合多重相关条件下的回归建模问题提出了PLS回归方法[3]。设x∈X⊂RN,y∈Y⊂RM分别为数据块X和Y中的N维和M维行向量。PLS通过潜在变量对两个数据块的关系进行建模,将n×N零均值矩阵X和n×M零均值矩阵Y分解为如下形式:

式中:T和U为由提取的p个得分向量组成的n×p矩阵;P和Q为负载矩阵;F和G为残差矩阵。

PLS通常采用的是基于非线性迭代的偏最小二乘(NIPALS)算法[4]。NIPALS算法中权向量w对应如下特征值问题XTYYTXw=λw的第1个特征向量。X的得分向量t可通过计算t=Xw得到。两边同时左乘X,发现得分向量t还可通过求解如下特征值问题XXTYYTt=λt的第1个特征向量得到。Y的得分向量u的估计为u=YYTt。

笔者将线性PLS方法推广为非线性的KPLS方法。对PLS方法核化的关键是将PLS问题表达为数据的内积形式,再用Gram矩阵直接代替内积,即为非线性KPLS方法。对于XXTYYTt=λt和 u=YYTt,由于 XXT=〈X,X〉,YYT=〈Y,Y〉是内积形式,用 K=〈Φ,Φ〉代替 XXT,K1=〈Ψ,Ψ〉代替YYT,即可推出KPLS关于t和u的估计为:

假定使用零均值的非线性KPLS模型,可以通过式(3)中心化特征空间的元素:

式中:In为n维的单位矩阵;1n为元素全为1的n×1列向量。K1的中心化方法与之相同。

提取得分向量t和u后,矩阵K和K1减去基于t和u的秩1逼近,再提取新的t和u,如此下去,直至达到需要的个数为止。不同的消去方法对应不同的KPLS算法。

2 模型优化

在KPLS建模过程中,如何估计模型参数是一个非常重要的问题,直接决定了模型应用效果的优劣。KPLS模型需要确定的参数主要有核参数和高维特征空间中的维数。常见的非线性问题参数估计方法有网格搜索法和梯度下降法等,这些方法的不足之处在于计算量大且容易陷入局部极小值点,效果不好。考虑到具有进化特性的PSO算法的优良性能,笔者将采用PSO算法优化确定模型的参数[5-7]。

为了得到优化的预测模型,采用均方根误差(root mean square error,RMSE)描述验证集的预测误差,RMSE可具体表示为:

同时,采用n折交叉验证的方法来泛化评价模型的预测性能,对于交叉验证,训练样本被分为n个子集,每个子集都有相同的样本数,然后,预测模型开始训练,在第i次迭代中,预测模型对除第i个子集外的所有子集进行训练,然后通过第i个子集计算预测模型误差,所有这些误差的平均就相当于一个较好的泛化误差估计[8]。如n=5时,某一次训练方案如图1所示。

图1 交叉验证的训练方案

此时PSO算法的适应度为:

式中:Error为预测误差;L为交叉验证的折数。

3 应用分析

3.1 数据获取

为了验证该方法的科学性和有效性,笔者引入国产军用航空发动机大修费用及其相关特征参数数据,如表1所示[9]。表1中发动机分为A、B、C、D 4个不同的涡喷型号系列,而E为涡扇发动机,y为装备大修费用,x1为翻修寿命,x2为最大推力,x3为最大燃油消耗率,x4为质量,x5为涡轮前燃气温度。

表1 航空发动机大修费用数据

3.2 参数设置

设定KPLS中的核函数为径向基函数(radial basis function,RBF),根据预测样本集的维数和样本个数,设定KPLS转换后特征空间的维数范围为[1 17],核参数的优选范围设定为[0.000 1 40 000],交叉验证的折数为5。

PSO算法中最大速度Vmax=20,总粒子数n=20,加速因子采用通常使用的c1=c2=2,最大迭代次数为100。惯性因子w采用线性递减算法进行调整,具体调整算式如式(6)所示:

式中:wmax为初始惯性因子;wmin为最终惯性因子;k为当前迭代数;kmax为最大迭代数。文中wmax=0.9,wmin=0.4。考虑到 PSO 是一种随机搜索算法,每次的实验结果可能会由于问题的不同而存在一定范围内的偏差,因此,笔者对设定的情况运行30次,并取其中训练误差最小的一次作为最终的训练结果。

3.3 结果与分析

为了衡量该方法的有效性,选择两个误差指标评价预测的效果。

(1)误差的标准差为:

(2)平均绝对百分比误差为:

为比较不同方法的差异性,分别选取普通线性回归模型和偏最小二乘回归模型进行对比计算。

(1)普通线性回归模型为:ln y= - 17.735 3+1.187 3 ln x1+3.645 1 ln x2

(2)偏最小二乘回归模型为:ln y= - 28.475+1.581 ln x1+1.217 ln x2+0.878 ln x3+1.009 ln x4+1.530 ln x5

经过PSO算法训练以后得到优化的模型参数:新空间维数 d为9;核参数 σ2为36 783.67。不同方法在两种评价指标下的具体测算结果如表2所示。从表2可以看出,常用的普通线性回归和偏最小二乘回归的测算效果相差不大,而笔者提出的基于PSO的进化KPLS方法测算精度与目前常用方法相比有较大的改进。

表2 各种预测方法测算效果比较

采用综合比较得到优化模型,对所有样本进行预测得到的计算结果如图2所示。

实际计算表明,对于得到的进化KPLS模型,无论是对于建模样本的拟合还是对评估样本的外推预测,计算效果都非常好,可以作为一种有效的装备修理价格测算模型在实践中推广应用。

4 结论

图2 修理价格的实际值和测算值

针对装备修理价格测算与核方法的特点,采用KPLS方法建立了装备修理价格测算模型,同时采用PSO进化算法优化模型参数,并针对现实问题展开了应用分析。该方法充分结合机器学习以及核方法的优势,能够在给定的准则下快速自适应得到优化的测算模型。实际应用表明,该模型具有较好的适用性和较高的测算精度,可以作为一种有效的建模方法在装备修理价格测算领域加以应用,同时还可以推广到其他装备修理价格测算工作中去。

[1] 纪云飞,屈鹏,徐可君.基于蒙特卡罗仿真的航空发动机大修费用估算[J].计算机仿真,2009,26(11):57-60.

[2] 谢力,魏汝祥,陆霞,等.基于强化缓冲算子的装备修理价格预测[J].武汉理工大学学报:信息与管理工程版,2010,32(5):807 -810.

[3] WOLD H.Partial least squares[C]∥ Encyclopedia of the Statistical Science.New York:John Wiley&Sons,1985:581 -591.

[4] WOLD H.Path model with latent variables:the NIPALS approach[C]∥International Perspectives on Mathematical and Statistical Model Building.New York:Academic Press,1975:307 -357.

[5] ZHAO Y X,ZU W,ZENG H T.A modified particle swarm optimization via particle visual modeling analysis[J].Computers & Mathematics with Applications,2009,57(11 -12):2022 -2029.

[6] PRAVEEN K T,SANGHAMITRA B,SANKAR K P.Multi-objective particle swarm optimization with time variant inertia and acceleration coefficients[J].Information Sciences,2007,177(22):5033 -5049.

[7] SHI Y H,EBERHART R C.A modified particle swarm optimizer[C]∥Proceedings of the IEEE Congress on Evolutionary Computation.Piscataway:[s.n.],1998:69-73.

[8] MARTIN J K,HIRSCHHERG D S.Small sample statistics for classification error rates i:error rate meas-urements[R].UC Irvine:Department of Information and Computer Science,1996.

[9] 江龙平,叶新农.基于方差分量的航空发动机大修费用估算[J].航空维修与工程,2006(5):27-29.

猜你喜欢

测算装备价格
好装备这样造
港警新装备
防晒装备折起来
基于概率分布的PPP项目风险承担支出测算
价格
价格
价格
有关τ-可测算子的Young不等式与Heinz型不等式的逆向不等式
(T)-可测算子迹的不等式
价格