APP下载

基于主成分分析—RBF神经网络模型的备件预测研究

2009-07-24关子明常文兵

物流科技 2009年4期
关键词:RBF神经网络主成分分析

关子明 常文兵

摘要:备件预测在产品物流保障中占有极其重要的地位,针对现有各种航空备件预测方法精度较低,无法满足实际需求的现状,文章提出了基于主成分分析—RBF神经网络模型的备件预测方法。首先利用主成分分析方法去除原始输入层数据的相关性,以解决RBF神经网络模拟预测备件需求时输入变量过多,网络规模过大导致效率下降的问题,最后选择合适的径向基函数密度训练神经网络。通过结合实例进行分析,取得了较好的效果。

关键词:备件预测;主成分分析;RBF神经网络

中图分类号:F251.2文献标识码:A

Abstract: Spare parts prediction stands a very important status in production logistic guarantee. Existing aviation material prediction approach has a low precision which can't meet the actual need. According to the problem, the forecasting approach for spare parts based on principal component analysis and artificial neural network was given. Firstly the approach can wipe off the correlation of the initial input data, in order to solve the problem that RBF network has too many input factor when predicting and then the efficiency of the neural network descends because of bigger size, at the last we choose the proper RBF density to train the network. The effectiveness of the proposed algorithm was verified by using an instance.

Key words: spare parts prediction; principal component analysis; RBF artificial neural networks

0引言

备件物流是对维修保养、售后产品和物资所涉及的库存、设施和劳动力进行的完整端到端的物流管理。在飞机制造商的备件保障体系中,备件预测占有非常重要的地位。作为一项基础性工作,若无科学和严密的预测,盲目凭经验去生产或购买备件,会造成备件的短缺或浪费,进而严重影响盈利能力。包括空客、波音在内的国际各大飞机制造商都很重视备件预测,进行定性定量的科学计算,使得备件预测成为了他们参与市场竞争的技术优势[1]。通常飞机备件可分为可修复件和不可修复件。可修复件数量不多, 但价格昂贵, 占总费用的85%, 可修件需求分析的效果将直接影响到飞机能否取得合理有效的航材保障[2]。

由于影响备件需求的因素种类众多且复杂多变,准确预测备件需求比较困难。国内飞机制造企业在长期的备件预测实践过程中主要是依据一些经验公式或者参考国外飞机制造企业的方法,简单地将众多的复杂因素简化或合并为几个主要因素,常造成大量有用信息的丢失,因此造成备件预测精度不高,而传统神经网络的预测方法把所有因素都作为神经网络的输入,显然会增加网络的复杂度,降低网络性能,大大增加计算运行的时间,影响计算的精度。

针对上述现象,本文提出了基于主成分分析—RBF神经网络的备件预测模型。该模型首先利用主成分分析技术将影响备件预测的众多因素变量进行分析变换,有效消除原训练样本空间的信息重叠和噪声,尽可能多地保留原有数据的有用信息,降低数据维度,减小网络规模,得到一组彼此不相关的新输入变量,然后将重构的训练样本空间作为RBF神经网络的输入,进行备件预测,通过实例仿真证明取得较好的预测效果。

1主成分分析—神经网络模型原理

本文之所以采用主成分分析—RBF神经网络模型,是由主成分分析和RBF神经网络各自的特点所决定的。主成分分析处在原始因素变量集和RBF神经网络之间,它的作用是对将要输入RBF神经网络的变量进行筛选,接下来把累计贡献率大的变量集作为网络的输入,然后利用RBF神经网络对样本进行训练、测试,从而得到精度更高、稳定性更好的预测值。图1给出了这个模型的流程图,下文将详细介绍此模型的原理。

1.1主成分分析

主成分分析(Principal Component Analysis,PCA)是一种数据压缩和特征提取的多变量统计分析技术,对变量系统中的信息重新进行综合筛选,从中选出若干对系统具有最佳解释能力的新综合变量即主成分,用它们进行回归建模。主成分分析能够有效去除数据间的相关性,在力保数据信息损失最少的原则下,对高维变量空间进行降维处理[3]。主成分分析的步骤如下:

记X是一个有n个样本点和p个变量的数据表,即X==x,x,…,x,其中xj=xj,x,…,xj∈R对应第j个变量。

(1)对数据进行标准化处理,即

=i=1,2,…,n; j=1,2,…,p

式中,是xj的样本均值,sj是xj的样本标准差。

(2)计算标准化数据矩阵X的协方差矩阵V。这时V又是X的相互关系矩阵。

(3)求V的前m个特征值1≥2≥…m,以及对应的特征向量a1,a2,…,am,要求它们是标准正交的。

(4)求第h个主成分X,有X=Xa=ax,式中,a是组合系数a的第j个分量。

(5)求m个主成分的累计贡献率Q=,当Q≥85%时,主成分分析结束。

经过主成分分析可以在保留主要信息的基础上降低输入维数,这将缩小下一步神经网络的规模,同时神经网络输入元素相关性的消除可以增强网络的泛化性能。

1.2RBF神经网络

BP神经网络和RBF神经网络已成为整个神经网络体系中应用最广泛的网络结构。相比较而言,RBF神经网络在训练速度、逼近能力等方面则更具优势。RBF神经网络具有收敛速度快、不易陷入局部极小点、鲁棒性好和易于实现等优点。已经证明,RBF神经网络可以在任意精度下逼近任意的非线性函数[4]。因此本文选取RBF神经网络。

RBF(Radial Basis Function)神经网络即径向基函数神经网络,是1998年提出的一种典型的三层前馈网络,由输入层、隐层和输出层组成。

经过主成分分析后,RBF神经网络的输入为m维向量X′=X,X,…,X,即影响备件需求预测的m个主成分。隐层为l维向量R=R,R,…,R,隐层节点个数的确定至今没有理论上完善的计算公式,本文在经验公式的基础上遍历尝试,直到达到误差满意为止。网络的输出为一维向量Y,对应着神经网络的最终预测值。隐层作用函数采用径向基函数,实现对输入层信息的非线性变换,本文采用高斯核函数(Gaussian Kernel Function)如下:

RX′=exp-

其中ci为第i个径向基函数的中心(ci∈Rm, i=1,2…,l);是径向基函数的均方差或宽度,用来调节网络的灵敏度;X′-c是向量X′-c的范数,表示X′与c的欧几里德距离;RX′在cj处有一个唯一的最大值,随着X′-c的增大,RX′迅速衰减到零。RBF神经网络的输出形式为线性函数:fX′=WRX′,其中W表示第i个隐层单元到输出单元Y的权值。

RBF神经网络的训练过程就是对两组网络参数的学习:(1)径向基函数中心ci、隐层结点数m、均方差。(2)隐层到输出层的连接权值W。其中径向基函数中心c的计算采用最近邻聚类学习算法,不需要事先确定隐单元的个数,而且依据样本的输入信息进行聚类迭代,以确定RBF神经网络中心[5]。利用最小二乘法进行参数估计,得到隐含层到输出层的权值W。

2实例研究

2.1数据收集和因素集选取

本文以我国某航空制造企业有寿命要求的可维修初始备件的预测为实例,根据国内外备件预测的实际工程经验和考虑到统计数据的可获得性,选取共8项因素作为模型的指标变量,它们分别是:产品单机安装数X1(件)、飞机架数X2(架)、单机在计算时间间隔内的平均飞行时间X3(小时)、产品送修平均周转时间X4(天)、产品平均更换间隔时间X5(天)、产品平均拆毁率X6(%)、产品平均订货周期X7(天)、保障率X8(%),以该备件需求数量Y(件)为神经网络的输出。收集该企业1992年至2007年备件需求历史数据,共4类30组历史数据样本。本文将前28组数据作为主成分分析—RBF神经网络模型的训练样本,将最后2组数据作为测试样本,利用计算机进行数据仿真实验。

2.2基于SPSS的主成分分析

SPSS软件作为世界知名的统计软件,具有强大的数据处理、统计挖掘和分析制图的能力,其中的因子分析模块功能,可以进行主成分分析,整个样本数据的标准化处理、相互关系矩阵计算、特征值计算和主成分提取均通过该模块实现。本文将收集的28组训练样本(不含备件需求数量Y)数据输入SPSS软件,进行主成分分析,分析结果如下:

表1所示的是总方差解释表,左半部分给出了特征值、特征值占总方差的比例、特征值占总方差累积贡献率,可以看到当主成分(Component)提取到第4个时,主成分对信息累积贡献率达到86.322%≥85%,涵盖了原始指标变量85%以上的信息,符合主成分提取的要求。由表1可知前四个主成分的特征值分别是:1=2.920,2=2.004,3=1.279,4=0.703,表1右半部分仅给出了我们所要提取的主成分信息。经过最大迭代次数25次之后生成的主成分碎石图(Scree Plot)如图2所示。

提取得到主成分后,我们关心的是原始变量与主成分之间的关系,由于我们采用的最小二乘回归算法,表2主成分得分系数矩阵(Component Score Coefficient Matrix)给出了原始变量与主成分之间的线性关系,根据该矩阵以及原始变量的观测值可以计算主成分的得分,例如:X′1=-0.298X1+0.014X2+0.074X3+0.291X4+0.096X5+0.284X6+0.215X7+0.163X8。

2.3 基于Matlab的RBF神经网络仿真分析

经过主成分分析后,接下来利用Matlab软件进行神经网络仿真。首先需要确定神经网络的输入和目标样本,将训练样本经过主成分分析后得到的数据X′作为输入样本,将原始训练样本的备件需求数量Y作为目标样本,由此可以确定该网络的结构:输入层有4个神经元,输出层有1个神经元。首先要对输入和目标样本进行归一化处理,这样可以避免某些变量的大幅度波动给网络训练带来的影响,防治部分神经元达到过饱和状态[6]。利用newrb命令创建一个RBF网络,该命令在创建RBF网络时可以自动选择隐含层的神经元数目,省去人工尝试隐层神经元的麻烦[7],直到平方和误差SSE满足要求为止,此处设MSE=0.001,并简称该网络为PCA—RBF网络。

与其他神经网络不同,RBF神经网络中的径向基函数分布密度Spread是网络设计过程中非常重要的参数,它将严重影响RBF网络的性能和精度[8]。本文将分别创建Spread为0.1,0.2,0.3,0.4,0.5的5个RBF网络,通过与真实值的误差分析对比来选择一个最优值,如图3所示。

由图3可以看到,当径向基函数的分布密度为0.1时,RBF网络的误差最小,逼近效果最好;当径向基函数的分布密度为0.5时,网络的误差最大,逼近效果最差。下面用Spread=0.1来训练RBF网络,网络训练效果如图4所示,训练到第25步,网络的均方误差MSE达到要求。将训练样本和PCA—RBF网络训练值同时绘入图4,可见PCA—RBF网络非常完美的拟合了原训练样本。

下面证明基于主成分分析的RBF神经网络在训练性能和时间上的优越性:首先我们将未经过主成分分析的训练样本数据输入RBF神经网络,在保持Spread=0.1和MSE=0.001不变的前提下,创建一个输入层有8个,输出层有1个神经元的RBF神经网络,利用Matlab训练该网络,训练效果如图5所示。由此可见,当未经过主成分分析的RBF神经网络训练到第25时,网络误差约为0.01,没有达到SSE的要求。

除了误差训练效果以外,我们还关心两个网络在计算精度上存在的差异。接下来将测试样本归一化处理后,输入到两个已经训练完成的神经网络中,通过网络计算分别得到输出值,将该值与测试样本中的真实值比较,如表3所示PCA—RBF神经网络在计算精度上也优于RBF网络。

3结论

本文研究基于主成分分析—RBF神经网络模型的备件预测,通过实例证明具有很好的预测效果。对比于传统的RBF神经网络,该模型优化了网络结构,减少了输入维数,降低了训练样本的相关性,具有更高的精度和更好的性能。由于利用主成分分析—RBF神经网络模型进行备件预测不需要建立复杂的数学方程,具有自适应和学习的功能,可以作为今后航空备件预测的有效方法。

但是,如何找到最佳的径向基函数密度以及借鉴其他类型神经网络算法优化提高模型的预测精度都是今后研究的重点。随着研究的深入,基于主成分分析—RBF神经网络模型的备件预测方法将会获得更加广泛的应用。

参考文献:

[1]原石中. 民用飞机备件需求量预测方法研究[J]. 航空工程与维修, 2002,2:47-49.

[2]William C. A handbook of supply inventorymodels[R]. AD-A187269, 1987.

[3]王惠文, 吴载斌,等. 偏最小二乘回归的线性与非线性算法[M]. 北京: 国防工业出版社, 2006.

[4]周开利. 神经网络模型及其Matlab仿真程序设计[M]. 北京: 清华大学出版社, 2005.

[5]朱明星. RBF网络基函数中心选取算法的研究[J]. 安徽大学学报: 自然科学版, 2000,24(1):73-78.

[6]Wang Yaonan. A Neural Fuzzy Logic Self-Organizing Co- ntroller For Nonlinear System Control[J]. Control Theory And Applications, 1997;14(5):748-753.

[7]Demuth H, Beale M. Neural Network Toolbox User's Gui- de—Neural Network Toolbox For Use with Matlab[M]. The Math Works, Inc., 2002.

[8]Hagan T, Demuth H, Beale M. Neural Network Design[M]. Boston, MA: PWS Publishing, 1996.

猜你喜欢

RBF神经网络主成分分析
无线Mesh网络发展
基于NAR模型的上海市房产税规模预测
无线Mesh网络安全性研究
无线Mesh网络基础知识
主成分分析法在大学英语写作评价中的应用
基于RBF神经网络的PID自校正控制研究
江苏省客源市场影响因素研究
基于RBF神经网络的一回路核动力装置典型故障诊断
服务贸易结构优化路径研究
RBF神经网络在创业板新股定价问题上的研究