基于神经网络的上海港口货物吞吐量预测研究
2015-12-29栾玲
栾玲
基于神经网络的上海港口货物吞吐量预测研究
栾玲
影响港口货物吞吐量的因素有很多,各因素之间、各因素与吞吐量之间存在着复杂的非线性关系。神经网络可以通过学习和训练掌握变量之间的非线性关系并进行预测。通过选取影响港口吞吐量的7个主要因素,采用滞后期和非滞后期两种训练方法,分别使用BP和RBF神经网络对样本进行训练并预测,并比较两种方法下BP和RBF神经网络在吞吐量预测中的差异。结果显示,两种方法中RBF神经网络都表现出比BP神经网络较高的收敛速度和较小的训练误差,但预测准确度小于BP神经网络。而滞后一期的训练方法提高了收敛速度,降低了训练误差,但同时预测准确度降低了。
BP和RBF神经网络;吞吐量;预测
一、引言
港口货物吞吐量是衡量港口生产经营活动的直接指标,预测港口吞吐量不仅有助于确定投资规模和策略,更有助于科学的规划港口布局,带动整个经济的发展。预测一个港口货物吞吐量的方法有很多,例如:时间序列法、回归分析法、指数平滑法、主成分分析等。由于货物吞吐量是一个中期指标,时间序列法预测的结果带有短期趋势性,难以考虑其他影响因素的作用,而回归分析法局限于线性分析,指数平滑法参数的确定需要主观经验判断,主成分分析需要主成分的累计贡献率达到较高值并有明确的经济解释。人工神经网络是基于人类大脑结构对复杂的信息系统进行理解和学习的原理,通过接受用户提交的样品,不断修正输出值与真实值的差异,直到训练达到成功。神经网络广泛的应用于聚类分析,信号分类,识别和预测等。本文在滞后期和非滞后期两种样本训练方法下,采用BP和RBF神经网络模型对影响因素和货物吞吐量之间的非线性关系进行学习和训练,并做出预测。
二、BP神经网络和RBF神经网络基本原理
(一)BP神经网络
BP神经网络一种由隐含层的多层前馈型网络,吐过网络的输入节点数为M,输出节点数为L,则此神经网络可看成是从M维欧式空间到L维欧式空间的高度非线性映射。其结构包含输入层、隐含层和输出层,数据通过输入层的神经元节点逐层传输,每个节点的权值由激活函数和阀值决定。如果输出层不能得到期望值,则将误差返回,修正各层神经元的权值,直到误差达到最小。
由于BP学习算法属于全局逼近,因为具有良好的泛化能力,但收敛速度较慢,可能出现局部极值,隐含层的节点数难确定。
(二)RBF神经网络
与BP网络相比,同样是前馈型网络,但RBF网络采用局部逼近法,且输入层到隐含层变换是非线性的,隐含层到输出层变换是线性的,能避免反复迭代,因此收敛速度快。隐含层的激活函数是一种局部分布的、对中心店径向对称衰减的、非负非线性函数,但中心向量和宽度难以确定,较BP泛化能力弱。
(三)BP网络和RBF网络的比较
两种神经网络的差异主要体现在以下几个方面。
表1 BP网络和RBF网络的比较
三、基于神经网络的上海港口货物吞吐量预测
根据已有文献对沿海港口货物吞吐量的影响因素研究,以上海港为例,概括性的选取了货物吞吐量、GDP、第二产业增加值、公路货运量、铁路货运量、水路货运量、固定资产投资等7个因素。2000-2012年的数据作为输入量,相应期间的货物吞吐量为输出量。
(一)滞后一期训练和非滞后期训练的样本确定
本文采用两种样本训练方法。一种是将2000-2010年的11组数据作为训练样本,2011-2012年的两组数据作为测试样本;另一种是选一年滞后期,训练样本为:2000-2009年的10组影响因素数据作为输入量,2001-2010年的10组吞吐量数据位输出量,测试样本为:第一次预测2001-2010年的10组影响因素数据为输入量,预测2002-2011年10组吞吐量,第二次预测2002-2011年10组影响因素数据为输入量,预测2003-2012年10组吞吐量数。
(二)数据来源和预处理
数据均来自国家统计局年度数据。为了消除量纲的影响,将每一个影响因素下的时间序列进行归一化处理,公式为:
Xit为第i项影响因素在时间t的值,Xi,max,Xi,min为第i项影响因素在时间t的最大值和最小值,Xit为归一化后的值。而之后预测得到的数据再通过postmnmx()函数反归一化处理,便于与真实值比较。
四、预测及结果
本文根据经验,将BP网络隐含节点数设置为与输入层节点数也就是样本的维数一致,为7,RBF网络遵循2M+1(M为输入层节点)的方法设置为15。所有输出节点都为1。
方法一:无滞后期训练和预测
表2 方法一训练和预测结果
从方法一的预测过程可以看出,RBF网络训练收敛的速度十分迅速,精度也很高,只需要10次就可以达到的误差;而BP网络则要迭代60次才能达到的误差。但从预测结果来看,BP网络的准确度要高于RBF网络,相差约9倍。
方法二:滞后一期训练和预测
表3 方法二训练和预测结果
从方法二的预测过程可以看出,RBF网络和BP网络的收敛速度和精度的差异明显缩小,都可以进过6次左右的迭代达到以下的误差。从预测结果看,两者的预测精度较方法一都降低,而且BP网络比RBF网络精度略高。
五、结语
总体来看,虽然RBF网络在训练速度方面具有明显的优势,但BP网络网络预测精度较高,且滞后一期的样本训练方法虽然能够较快达到误差要求,但预测值偏差也增大。因此,BP网络在港口货物吞吐量预测方面仍然是一种比较精确的方法,RBF网络和BP网络各有优势,在不同问题的研究中会表现出不同的预测效果,关键是要经过多次试验和经验的累积,找到一种适应于特定问题的方法。但网络神经预测只能进行一期或两期的预测,预测期越长,误差会加大,该问题有待于在今后的研究中改进。
[1]Shaowu CHENG,Ji XU,Qiu MU.A Terminal Departure Passenger Traffic Prediction Method Based On The R BF Neural Network[C]// COTA.Proceedings of the 14th COTA International Conference of Transportation Professionals.China:Elsevier,2014:14-22.
[2]刘建林,徐国平.基于神经网络技术的干散货运价指数预测[J].大连海事大学学报,2006,32(2):67-70.
[3]李国勇.神经模糊控制理论及应用[M].北京:电子工业出版社, 2009:11-173.
[4]苏凌.基于径向基函数神经网络的港口吞吐量预测研究[D].上海:上海海事大学,2006.
栾玲,女,山东潍坊人,上海海事大学经济学院产业经济学硕士研究生,研究方向:航运经济与金融。
F552
A
1008-4428(2015)01-13-02