APP下载

基于PCA的神经网络在港口货物吞吐量中的预测

2012-08-08穆俊鹏

网络安全与数据管理 2012年19期
关键词:吞吐量货物港口

穆俊鹏 ,李 娟 ,张 明

(1.上海出版高等专科学校 信息化办公室,上海 200093;2.上海海事大学 信息工程学院,上海 201306)

随着经济的发展,港口的建设逐渐炽热化,但如果港口的发展规模供大于求就会造成资源的浪费[1],因此有必要对影响港口发展的港口货物吞吐量进行预测分析,使其成为港口建设和发展的理论依据。目前,在预测领域最为广泛的应用技术是人工神经网络模型,它具有较好的容错能力和较快的总体处理能力,而且能通过样本数据完成学习或训练,训练后的神经网络具有推广或者泛化能力(对未来数据的预测能力),故而本文采用神经网络模型对港口货物吞吐量进行预测。

1 研究方法

1.1 主成分分析法[2]

主成分分析也称主分量分析,它是将多指标转化为少数的几个综合指标,且这几个综合指标能够反映出原来多个变量反映的大部分信息。换言之,就是将许多相关性很高的变量转化成彼此相互独立的变量。

1.2 BP神经网络

BP神经网络的基本原理是:输入信号由输入层经过隐含层的变换函数作用后到达输出层得到目标信号,然后将输出的目标信号与实际数据相比较,利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层地反传下去,就获得了所有其他各层的误差估计。但它存在一些缺点[3]:如:易陷入局部最小、收敛速度慢、隐含层的结点个数难以确定等问题。为了能够获得更好的泛化全局最优性能,主要完成以下的改进[4]:(1)提高网络训练的速度;(2)提高训练的精度;(3)避免网络陷入局部极小点。本文采用主成分分析法提取出关键因子主要是为了防止网络因影响因素过多而陷入局部极小点,从而提高模型的学习能力和泛化能力。

1.3 GRNN神经网络[5]

广义回归神经网络是一种前馈式神经网络,不仅具有全局逼近的性能,还具有最佳逼近性能。它是依据非线性回归分析建立在非参数估计基础上的一种非线性回归径向基神经网络。由于GRNN的非线性映射能力较强,且网络最后收敛于样本聚集量较多的优化回归面,故常应用于函数逼近、模式分类等方面。

2 实例分析

选取GDP、工业总产值、第一产业值、第二产业值、第三产业值、固定资产投资总额、进出口总额、社会消费品总额、人口总数、货运量、铁货物运输量和公货物运输量12个影响港口货物吞吐量的因素[2,6]。以上海港口为例收集了12个影响因素,数据来源于上海统计如表1所示。

2.1 利用PCA提取关键因子

步骤如下:

计算出影响因素之间的相关系数矩阵,其中 rij(i,j=1,2,…,p)为原来变量 xi和 xj的相关系数。根据 R得到12个影响因素之间的相关性。

(3)根据步骤(2)得出的矩阵求解对应的特征根和特征向量。首先求解特征方程|λI-R|=0的特征根 λi(i=1,2,…,p),并且按其大小顺序排列,即 λ1≥λ2≥…λp≥0;然后求出其对应的特征向量 ei(i=1,2,…,p),结果如表3所示。

表1 上海市吞吐量的12个影响因素

表2 影响因素标准化结果

表3 各成分的特征根,贡献率和累计贡献率

表4 主成分负荷

由表4中可以看出GDP、第一、二、三产业值和人口总额在第一主成分中的负荷较大;铁货物运输量在第二主成分的负荷较大。因此得出关键因子为GDP、第一、二、三产业值、人口总额和铁货物运输量。

2.2 神经网络

2.2.1 BP网络结构

采用Matlab建立预测模型,输入神经元数为6个,隐含层为一层,激励函数为tansig,隐含层的神经元个数根据比较法最终选取为11个 (隐含层神经元个数为11个时,网络的预测值达到最佳),输出层的激励函数为purelin,输出层的神经元个数为1个,即为预测的年港口货物吞吐量。

2.2.2 GRNN网络结构

GRNN网络结构是通过激活神经元来逼近函数,实现输入矢量的函数值由某一领域内的神经元矢量对应的函数值映射而逼近。结构如图1所示。

图1 GRNN网络结构模型

2.2.3 训练网络极其仿真结果

将前15组数据作为样本进行输入,对BP而言:采用Levebberg-Marquardt优化方法的训练函数trainlm对网络进行训练;权值的学习函数设为learngdm,且学习率为0.01;性能目标函数设为mse;训练的次数为1 000。对GRNN而言:输入层的神经元数等于输入样本数,其权值等于输入向量的转置IW=pT,阈值 b=[-log(0.5)]1/2/spread,其中spread为径向基函数的扩展系数,此处扩展系数取值为0.1(小一点的扩展系数可以更好地拟合数据);第二层神经元数也等于输入样本数,其目标向量为T,无阈值向量,同样不需要训练;隐含层采用高斯变换来控制隐含层的输出,从而抑制输出单元的激活。

采用样本训练好的网络,以2009年和2010年的数据作为仿真数据进行测试,其测试结果如表5所示。

表5 实验结果

2.3 实验结果分析

从表5中可以看出,基于PCA的BP网络和GRNN网络在货物吞吐量预测中应用具有很好的拟合效果,相对误差都在5%内,且基于GRNN网络的预测结果明显优于基于BP网络的预测结果。此外,还可以看到:(1)预测结果受到样本的大小的影响,当样本数量增多时,其预测效果更优;(2)PB神经网络的预测模型具有不稳定性;(3)GRNN神经网络的预测模型具有稳定性。

通过仿真得到的误差值验证了模型的可用性和模型的拟合能力。使用主成分分析有效地建立了互不相关的因子,减少了网络的复杂性,同时减小了落入局部区域的概率;对于函数的拟合,BP网络表现出较好的拟合效果,而GRNN网络在预测方面的应用要优于BP网络。

但仍存在一定的缺陷:(1)未考虑突发因素的影响,只用于相对稳定的预测中;(2)对于BP网络中的隐含层,没有一种优异方法直接确定;(3)得到误差与预想的误差存在一定的界限。因此,本文下一步的目标是将神经网络与其他预测分析技术相结合,以便更好地减小误差。

[1]陈涛焘,高琴.港口集装箱吞吐量影响因素研究[J].武汉理工大学学报:信息与管理工程版,2008(6).

[2]徐金河.基于主成分分析法的港口吞吐量内在影响因素研究[J].水运工程,2010(1).

[3]王晨光,相秉仁,谢少斐,等.基于主成分分析的 BP神经网络在药品销售预测中的应用 [J].药物生物技术,2009(4).

[4]龙训建,钱鞠,梁川.基于主成分分析的BP神经网络及其在需水预测中的应用[J].成都理工大学学报,2010(2).

[5]王文才,王瑞智,孙宝雷,等.基于广义回归神经网络GRNN的矿井瓦斯含量预测[J].中国煤气层,2010,(1).

[6]陈婷婷,陈漪翊.基于BP神经网络的港口货物吞吐量预测[J].计算机与现代化,2009(10).

猜你喜欢

吞吐量货物港口
聚焦港口国际化
中国港口,屹立东方
港口上的笑脸
逛超市
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
惠东港口
2014年1月长三角地区主要港口吞吐量
进出口侵权货物刑事执法之法律适用