APP下载

宁波港集装箱吞吐量预测模型的选择

2013-10-11薛俊强

华东经济管理 2013年5期
关键词:宁波港吞吐量残差

薛俊强

(宁波广播电视大学 经济管理系,浙江 宁波 315016)

一、研究背景

近年来,宁波港集装箱吞吐量快速增长,2011年完成1451.2万标准箱,增长11.6%,稳居大陆港口第3位,世界港口第6位。宁波港集装箱业务的发展,极大地促进了宁波经济和浙江经济发展。在浙江省十二五规划中提出:宁波要发挥产业和沿海港口资源优势,推动宁波—舟山港口一体化发展,建设先进制造业、现代物流和能源原材料基地,打造现代化国际港口城市和长三角南翼经济中心。宁波十二五规划明确提出:宁波要在十二五期间,达到集装箱吞吐量2000万标箱,全面建成现代化国际港口城市。

因此,对宁波港集装箱吞吐量进行科学预测,对确定其今后港口的投资规模、泊位选址和经营策略等方面,都将起到极为重要的作用。

在以往的研究当中,学者们分别采用了关联因素预测法、GM(1,1)灰色模型、三次指数平滑模型对宁波港集装箱吞吐量进行预测。徐剑华(2004)[1]通过关联因素预测法,预测“2010年宁波港集装箱吞吐量达到640万~700万标箱(TEU)”,然而2010年宁波集装箱实际吞吐量是1300.4万标箱,预测误差率50%左右(历年宁波港集装箱吞吐量见表1)。姜集闯(2005)[2]基于GM(1,1)模型的预测最大误差率28.2%,最小误差率7.9%。徐俊(2006)[3]依据灰色系统理论,采用灰色预测模型GM(1,1)对宁波港集装箱吞吐量进行预测,预测结果与实际值最大误差率达到41.8%。张云康(2008)[4]运用GM(1,1)模型和三次指数平滑模型进行预测,预测结论是:2007-2010年宁波港集装箱实际吞吐量分别是872.9万、1102.6万、1378.8万、1710.7万标箱,与实际值对照比较,平均误差率为:14.7%。张维朋(2012)[5]基于GM(1,1)和三次指数平滑的组合模型,对宁波港集装箱吞吐量进行预测,预测结论是:2011年宁波港吞吐量1583.5万标箱,预测误差率9.1%。

关联因素预测法常用于对变量发展趋势的定性研究,其在定量预测中的准确度无法获得保证。灰色预测模型GM(1,1)的优点是对数据样本数量要求少,对随机变量分布形态不作要求,因此许多学者纷纷用之进行预测研究。然而它只适用于原始数据具有良好光滑性能的情况,当灰微分方程dx(1)/dt+ax(1)=b的a值较大时,误差较大[6]。三次指数平滑法将过去的所有历史数据进行加权使用,因此对于时间序列变化平缓时进行预测,才具有较高的精度。但宁波港集装箱吞吐量连续近20年的快速增长,使得三次指数平滑法预测准确率较低。

那么有没有一种模型能对宁波港集装箱吞吐量进行准确度高的预测呢?本文将进行探索和尝试。

表1 历年宁波港集装箱吞吐量

二、理论背景

宁波港集装箱吞吐量是一个时间序列,自身有一定的发展趋势(见图1),因此本文尝试运用时间序列预测模型对其进行研究。时间序列预测模型主要有简单平均法、加权平均法、指数平滑法、自回归移动平均模型(ARMA)、差分自回归移动平均模型(ARIMA)等。在这些模型当中,简单平均法、加权平均法、指数平滑法由于将全部时间序列数据赋予一定权重进行分析预测,预测的滞后性较为显著;ARMA模型要求研究对象是平稳的;当某一经济变量为非平稳时,须采用ARIMA模型。

图1 宁波港集装箱吞吐量时间走势图

ARIMA模型全称为差分自回归移动平均模型(Autore⁃gressive Integrated Moving Average Model,简记 ARIMA),是由美国统计学家Box和英国统计学家Jenkins于20世纪70年代初提出的一个著名的时间序列预测方法,所以又称为Box-Jenkins模型[7]。ARIMA(p,d,q)模型是ARMA(p,q)模型的一般形式,ARMA(p,q)模型要求变量必须平稳,当变量中不仅包含白噪声因素,还包含随机游走因素时,ARMA(p,q)模型不再适用,这时就要用到ARIMA(p,d,q)模型。ARIMA(p,d,q)模型首先将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归,从而建立模型。

ARIMA(p,d,q)模型的形式:

设Yt是d阶单整序列,即Yt~I(d)。

其中,C为常数,Ut是个白噪声过程,α为自回归模型的系数,是待估参数,β为移动平均模型的系数,也是待估参数。p和q分别是自回归模型和移动回归模型的滞后阶数。

ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。

三、建立模型和检验模型

(一)建模过程

(1)检验宁波港集装箱吞吐量序列(以下简称container序列)的平稳性。根据自相关函数和偏自相关函数图以及ADF单位根检验其方差、趋势和其变化规律,对序列的平稳性进行识别。

(2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,直到序列平稳。

(3)建立模型,进行参数估计,检验是否具有统计意义。

(4)进行假设检验,诊断残差序列是否为白噪声。

(5)利用已通过检验的模型进行预测分析。

(二)数据来源

本文数据来源于《中国港口年鉴》(1999-2011)、《宁波统计年鉴》2011,详见表1。

(三)建立模型

本文运用EVIEWS 6.0软件对数据进行统计分析。

1.序列平稳性检验

对container序列、container的自然对数序列(lncontain⁃er)、lncontainer序列的一阶差分序列(dlncontainer)、二阶差分序列(d2lncontainer序列)依次进行单位根检验(ADF检验法),得到输出结果如表2。

表2 序列单位根检验结果

2.模型定阶

由表2可知,lncontainer是2阶单整的,即:lncontain⁃er~I(2),因此针对 lncontainer序列建立 ARIMA(p,2,q)模型。接下来确定滞后阶数p和q。首先对d2lncontainer序列进行自相关函数检验,检验结果见表3。

表3 d2lncontainer序列自相关函数检验结果

3.建立最优ARIMA模型

从表3可以看出,自相关系数(AC)和偏相关系数(PAC)的变化没有一个稳定的规律,但能初步判断两者都从第7阶后出现截尾。只靠直观判断是不够准确的,必须要依据Akaike information Criterion和Scharz Criterion准则[8]的筛选,根据p和q的取值组合,进行49组①ARIMA(p,2,q)[p=1,2,3,4,5,6,7;q=1,2,3,4,5,6,7]建模尝试,并经过残差自相关检验(LM检验法)、参数显著性检验(t统计量检验)、残差正态性检验(JB统计量检验法),最后找到最优p、q值,分别为p=4,q=4。因而建立最优模型为:ARIMA(4,2,4)。模型的输出结果见表4。

表4 ARIMA(4,1,4)模型输出结果

4.系数显著性检验

由表4可见,在10%的置信水平下,只有AR(1)、AR(2)、MA(4)通过了系数显著性t检验;其他系数和常数项都没有通过,应该从模型方程中剔除。

5.残差正态性检验

对方程残差进行正态性检验,得到输出结果如图2,JB统计量对应概率值大于10%的置信水平,因而回归方程残差服从正态分布。

图2 模型正态性检验结果

6.残差序列自相关检验

对建立的ARIMA(4,2,4)模型,采用拉格朗日乘数(Lagrange Multiplier)检验法,对模型的残差序列进行自相关检验,检验结果见表5。

表5 ARIMA(4,2,4)模型的残差序列自相关检验

由表5可知,得到的F-statistic和Obs*R-squared对应的概率值(Probability)分别是0.734373、0.401098,均大于10%的显著性水平,表明残差序列不存在自相关。

综上所述,最后得到ARIMA(4,2,4)模型的回归方程式:

D2LNCONTAINERt=-0.660714 D2LNCONTAINERt-1-0.753932 D2LNCONTAINERt-2+εt+0.893096εt-4

四、模型的预测

利用建立的模型进行预测,得到输出结果如图3。

图3 ARIMA(4,2,4)模型预测结果

图3中实线代表的是预测值,上下两条虚线提供了2倍标准差的置信区间。从图3可以看到,Theil不相等系数为0.276,表明模型的预测能力较好;而对它的分解表明偏倚比例接近于0,方差比例也较小,说明模型较好地模拟了实际序列的波动。

利用该模型,预测得到2010-2013年的D2LNCONTAIN⁃ER,又根据差分反推计算,得到:

CONTAINERt=eD2LNCONTAINERt×(CONTAINERt-1)2×(CONTAINERt-2)-1

进而计算出2010-2013年CONTAINER的预测值。其中2010-2011年的CONTAINER实际值是已知的(见表1),因此可以将预测值跟实际值进行比对,得到预测误差率(见表6)。

表6 利用ARIMA(4,2,4)模型预测2010-2013年的宁波港集装箱吞吐量

五、结束语

(1)模型预测精度评价。从表6可知,模型对2010-2011年宁波港集装箱吞吐量进行预测,误差率分别为-5.71%、2.19%,预测精度较高。因此笔者有理由相信模型对未知的2012-2013年的吞吐量进行预测,也会有较好的预测精度。

(2)模型预测精度较高的原因分析。模型之所以预测精度较高,源于四个方面:第一,采用的ARIMA模型适合对宁波港集装箱吞吐量进行预测;第二,本文建立模型方程采用的数据样本完整,所包含的信息量较大;第三,建模过程中,本文尝试建立了49组模型,依据AIC和SC准则、方程残差自相关检验要求、正态性检验要求、参数显著性检验要求等多重筛选原则,找到最优p、q值,从而建立最优ARIMA(4,2,4)模型;第四,模型成功通过了多种检验,估计参数和方程显著,稳定性优越,同时模型残差符合正态分布,且为白噪声。

但需要特别指出的是,本文所采用的ARIMA模型在预测短期的时间序列发展变化时精度较高,但随着时间的延长,其预测效果将会减弱。这一点也是困扰其他预测模型的重要问题。究其原因,其实比较容易说清楚。随着未来时间的延伸,影响被研究变量发展变化的外部扰动因素可能会出现不可测度的激增,“蝴蝶效应”或许显示出影响事物发展变化的强大力量[9]。

(3)宁波港集装箱吞吐量增速放缓。模型预测2012年、2013年宁波港集装箱吞吐量分别为1504.30万、1601.15万标箱,同比增长3.66%、6.44%,从本文截稿时宁波市统计局公布的2012年前7个月的港口统计数据也似乎印证了模型的预测。结合前几年的数据,不难看出,2009年以来的这段时间宁波港集装箱吞吐量持续保持缓慢增长,世界经济的疲软加之中国经济的结构性转型,使宁波港集装箱吞吐量很难继续保持以前的高速增长,预计宁波港正处在由粗放式到集约式发展的过渡时期。而如何顺应内外部经济发展的趋势来完成宁波港的转型升级,这是需要进一步研究的重要课题。

(4)对策建议。为应对宁波港集装箱吞吐量随后低速增长的形势,宁波港集装箱业务的发展也要转型升级。宁波港要构建“三位一体”港航物流服务体系的大目标,着力构建大宗商品交易平台、海陆联动集疏运网络、金融和信息支撑系统“三位一体”的港航物流服务体系,高水平建设我国大宗商品国际物流中心和“集散并重”的枢纽港,培育海洋经济发展的核心竞争力。①构筑大宗商品交易平台。推进大宗商品交易中心和重要能源资源储运中心建设,进一步提升贸易现代化水平和国家能源安全保障能力。积极建设大宗商品交易中心。以建设大宗商品国际物流中心为目标,建设宁波生产资料交易服务平台,设立石油化工、矿石、煤炭、粮油、建材、工业原材料、船舶等交易区,引导发展流通加工、分拨配送、国际采购、转口贸易等增值服务,推进形成综合性大宗商品交易中心,增强抵御国际市场风险的能力。②优化完善集疏运网络。完善进港航道、锚地、疏港公路铁路和重要枢纽等集疏运网络,实现多种运输方式的无缝对接,完善港口物流供应链。扩大宁波港集团集装箱无线射频识别(RFID)试点范围,实现多种运输方式数据共享,提高多式联运水平。加大扶持力度,促进水运交通基础设施建设和多式联运发展。③强化金融和信息支撑。加快港航服务领域的金融创新,提升电子口岸信息系统,增强港航物流的服务能力,提高服务水平,完善航运物流信息系统。加快宁波—舟山港电子数据交换(EDI)系统与企业专用物流信息系统有机对接,建设“数字港”。

注 释:

① 因为p和q各有7种取值,组合起来就有49种p、q的组合,所以在此建立49组ARIMA(p,2,q)模型。

[1]徐剑华,杜桂玲.宁波港集装箱吞吐量预测与分析[J].集装箱化,2004(12):20-23.

[2]姜集闯.基于GM(1,1)模型的宁波港国际集装箱吞吐量预测[J].技术经济与管理研究,2005(5):15-19.

[3]徐俊.宁波港集装箱“十一五”期间发展规模研究[D].上海:上海海事大学,2006.

[4]张云康.组合预测模型在宁波港集装箱吞吐量预测中的应用[J].中国水运,2008(8):36-38.

[5]张维朋.组合预测模型在宁波港口集装箱吞吐量的预测研究[J].科技通报,2012(5):42-45.

[6]熊岗.灰色预测模型的缺陷及改进办法[J].系统工程,1992(11):19-20.

[7]G P E Box,G M Jenkis.Time Series Analysis:Forecastingand Control[M].San Francisco:San Francisco Press,1970:112-137.

[8]高铁梅.计量经济分析方法与建模[M].北京:清华大学出版社,2009:189-190.

[9]钟云霄.混沌与分形浅谈[M].北京:北京大学出版社,2010:14-19.

猜你喜欢

宁波港吞吐量残差
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
宁波港货物吞吐量雄踞全球港口榜首11年
海上丝路
——宁波港
基于递归残差网络的图像超分辨率重建
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
宁波港拟吸并舟山港
平稳自相关过程的残差累积和控制图