基于GM(1,N)及神经网络的崇左铁路货运量预测
2015-05-16韦冬丽
林 洁,韦冬丽
(广西交通职业技术学院,广西 南宁 530021)
0 引言
2010年至今,南崇经济带立足于原有经济及地理优势,通过近几年的发展逐渐建成连接中国与东盟的重要物流通道和贸易纽带。2015年两会期间,广西地区的建设发展被赋予“形成21世纪海上丝绸之路和丝绸之路经济带有机衔接的重要门户”的重要意义。崇左作为通道上的重要节点,物流产业将面临巨大的挑战,日益膨胀的货运量需求也为南崇经济带的铁路运输发展提供了良好契机。因此对于近年的铁路运量预测及分析将为高铁建设及地区物流业发展提供重要依据。
近年来,在铁路货运量预测领域主要有两方面分析方法。(1)利用灰度预测等现代数学方法预测,如万骞在相关问题研究中利用灰度GM(1,1)模型与马尔科夫链相结合的方法预测铁路货运量区间[1];游庆山利用压缩感知的灰度理论模型获得航空季度货运量及货运量走势[2]。(2)也有较多学者采用智能算法分析货运量,如李萍在基于GA-BP模型的铁路货运量预测中利用GA及BP神经网络优化规划算法[3],得到GA-BP神经网络模型,预测精确度较高。由于近年来崇左地区铁路运量的变化受到地区产业结构调整及政策导向影响较大,简单利用历史运量数据预测而不考虑其他因素影响,预测结果准确性可能较差。因此本文首先利用GM(1,N)灰度预测模型,充分考虑经济发展等因素对运量的影响,对铁路运量的上限进行预测;其次通过BP神经网络,建立崇左铁路货运量预测分析模型,神经网络模型将充分模拟实际情况进行学习,从而准确预测铁路货运发生量。
1 影响崇左铁路运量因素分析
通常情况下,铁路货运量受到国民经济发展水平、国民经济产业结构、大宗工业品产量、交通运输结构、国内经济政策等因素的影响[4]。崇左位于南崇经济带腹地中心,毗邻南宁吴圩机场空港经济区,是越南入境货物周转的第一站。南崇经济带建立伊始,崇左通过产业结构改革等措施成功发展物流、旅游等第三产业,进出口运量大幅度增加。与此同时,经过地区的投资建设也使得铁路运输线路的固定资产投资增加。因此崇左-凭祥线路出口到东盟线路的运量更多地受到进出口贸易总量、第三产业比重两方面的影响。因此在模型建立过程中,选取如下影响因素作为决策变量:区域年生产总值GDP、年进出口贸易总额、年第三产业生产总值、固定资产投入。
选取崇左市2003-2013年的历史数据,如表1所示:
表1 崇左基本历史数据表
2 预测模型
2.1 GM(1,N)预测模型
多维灰模型GM(1,N)通常作为分析模型而不用来预测,但是当必须要对多因子系统进行整体全面的分析时,通常也会使用。模型建立过程首先要求对决策因子空间@GMF(1N)进行归一化处理,即:
其中Xi=TXi,X1为决策目标,Xi为决策因子,并且满足可接近性。利用归一化矩阵建立微分形式的白化模型,即:
最后利用最小二乘法求解参数辨识包,即:
pN=(BTB)-1BTyN,其中:
最后,通过评估预测误差生成最优化模型,常见的模型有GM(1,N,D)和GM(1,N,exp)两种。本次模型建立后,通过误差评估,选择GM(1,N,D)进行预测时结果较为精确,模型形式为:
2.2 BP神经网络预测模型
BP神经网络智能算法近年常用于预测领域,由于误差反向传播使得预测结果精确,实用性强。BP神经网络由输入层、隐含层和输出层组成,层与层之间的结点全互联,同层之间的结点相互独立,呈放射状拓扑结构。通过不断计算与误差反馈,当学习循环次数或误差精度达到要求时,算法停止得到结果。本文采用有导师学习的学习方法,利用matlab实现算法,具体过程如下:
(1)权值初始化;
(2)依次输入N组学习样本,每组样本含有多个决策因子;
(3)依次计算各层的输出:Xi,Yk,其中j=0、1、……、n;k=0、1、……、m-1。N 为输入层,m 为输出层;
(4)求各层的反传误差:
(5)如果计算次数未达到N,返回第二步继续进行;如果计算完毕转⑥。
(6)按照误差修正权值及阈值。
(7)按照修正后的权值及阈值继续计算,直到学习次数达到要求或误差收敛。
3 预测结果分析
3.1 GM(1,N)预测结果及误差分析
GM(1,N)预测模型利用最小二乘法求解模型,得到参数辨识包即:
由于模型求解前进行了数据归一化处理以及模型的白化,因此参数辨识包并不能反映决策因子与决策目标之间的关系。根据式(1)可得2003-2013年的预测运量及误差,同时利用模型及2014年基本数据可以得到2014年的预测运量。具体预测运量及误差见表2:
表2 GM(1,N)灰度预测模型预测运量及误差表
通过表2不难发现,2007-2013年的预测值均大于实际值,结合实际政策分析,主要有以下几个因素:(1)由于对于数据进行AGO处理,所以系统的灰度有所减弱;(2)也是极为重要的一个因素,基础建设等其他外部原因抑制了铁路运量的增加。2007年南崇经济区划定后,由于产业结构的明显转变,物流园区的划定,货运总量有明显上升的趋势,但是由于多方面因素的限制,使得铁路发生的实际运量受到限制。这一因素在预测过程中也得以体现,2007年后的预测值逐步上升,直到2012年后决策因子变化趋于平缓,预测运量才得以下降。换言之,如果铁路运量能够保证充足的供给,2007年后铁路货运量应该与预测值保持一致,随崇左货运总量稳步上升,但由于基建等多方面因素影响,实际运量并没有上升甚至出现下降,从而与预测值产生误差过大。
综上所述,模型2014年预测结果能够为最后的预测结果提供区间上限,即如果其他因素配套的情况下,2014年的铁路运量应该能达到1 000.23万吨。
3.2 BP神经网络模型预测结果及误差分析
BP神经网络预测模型利用matlab7.0实现算法,激活函数采用正切S型函数,设置训练次数为5 000,目标精度为1e-5,为防止模型收敛速度过慢,调整学习速度为0.05,误差变化图及预测值与实际值的对比如图1所示。误差接近目标精度,模型基本稳定收敛,与实际拟合程度很高。预测结果与误差分析见表3及图1:
表3 BP神经网络预测模型预测运量及误差表
图1 BP神经网络学习误差变化图及预测值图
通过表3可以看出,预测模型通过多次学习误差收敛,因此预测值稳定且准确,根据matlab7.0自行生成的BP神经网络学习误差变化图(见图1),能够判断预测结果与实际值几乎完全拟合,误差<0.01且保持稳定,即2014年铁路货运发生量应为799.78万吨。
4 结语
本文通过两种方法预测,得到预测运量区间。主要得出以下两个结论:(1)通过预测模型预测并分析相关实际因素,2014年崇左地区铁路预测货运发生量为799.78万吨,最高能达到1 000.23万吨。因此崇左—凭祥到达越南口岸的运输基础实施应加紧建设,从而满足日益快速增长的货运需求。(2)BP神经网络预测模型与实际数据拟合程度极高,且模型稳定,可根据模型及2015年规划基础数据对崇左地区运量进行稳定预测,预测结果将具有极高的参考价值。
接下来可以进一步考虑,完善近年的基本数据并建立完善的评价体系,对预测过程进行评价及验证,进一步修正模型提高预测准确率。
[1]万 骞.基于灰色-马尔可夫链的铁路货运量预测研究[J].铁道勘测与设计,2014(3):55-59.
[2]游庆山.基于压缩感知的灰色理论模型及其在航空货运量预测中的应用[J].成都理工大学学报,2014(5):651-656.
[3]李 萍.基于GA-BP模型的铁路货运量预测[J].兰州交通大学学报,2014(6):203-207.
[4]宋光平.铁路货运量预测方法研究[D].北京:北京交通大学,2007.
[5]邓聚龙.灰理论基础[M].武汉:华中科技大学出版社,2002.