基于灰色马尔科夫模型的上海港集装箱吞吐量预测
2020-04-26汤天辰上海理工大学管理学院上海200093
汤天辰,李 林 (上海理工大学 管理学院,上海 200093)
0 引言
随着各国经贸合作的不断深入,集装箱运输凭借其巨大的经济效益和社会效益,已成为国际间贸易运输的主要方式。港口之间的竞争日益表现为以集装箱吞吐量为核心指标的综合实力的竞争。集装箱吞吐量的合理预测对制定发展战略、建设基础设施、维护日常运营等具有重要意义[1]。
目前,集装箱吞吐量的预测方法主要分为线性回归分析法、灰色预测法、指数平滑法[2]、马尔科夫链预测法、BP神经网络法等[3]。其中指数平滑法需要大量的原始数据作为基础,一般用来进行短期预测;线性回归分析法计算复杂,对数据完整性要求较高;BP神经网络法样本数据需求量大,训练时间长。而港口集装箱吞吐量是一个受国家政策、社会经济、地理环境等多种关联因素影响的复杂系统,各因素的影响程度很难用数字进行量化,具有明显的非线性和动态性特征[4]。单一的预测方法由于其自身在适用范围上存在局限,导致预测精度不高,所以将不同的预测方法进行组合,构建成新的组合预测方法。本文根据灰色预测法所需数据量小,对关联因素要求低,适用于中长期预测的特点以及马尔科夫链预测法可以揭示系统在不同状态区间内转移的规律,对波动性数据能准确预测的特点,建立灰色马尔科夫模型,充分发挥各自优势,从而提高港口集装箱吞吐量预测精度[5-6]。
1 灰色马尔科夫预测模型
1.1 灰色GM( 1,1)模型
灰色GM( 1,1)模型首先对原始序列进行累加,作均值并建立数据矩阵,然后利用最小二乘法得到预测模型,最后将模型计算结果还原得到预测结果。其建模步骤如下:
(1) 建立原始序列
(2)对原始序列进行一次累加生成新序列
(3)对累加后的序列作均值并建立数据矩阵B和Y
(4)利用最小二乘法得到待辨识参数a与u的值
(5)建立灰色GM (1,1)预测模型
(6)还原序列得到原始数据的预测值
1.2 马尔科夫链模型
利用马尔科夫链模型对灰色GM (1,1)模型的预测结果进行修正,通过对相对误差的状态进行划分,建立状态转移概率矩阵,确定转移概率最大的数所在列为未来的状态区间,最后再取状态区间的中间值对预测值进行修正。其步骤如下:
(1) 状态划分
相对误差是一个随时间呈上下波动趋势的非平稳随机过程,按照误差范围和样本数量,将其划分为n个状态区间,每个区间可以表示为其中e1i和e2i分别代表区间的最小限制和最大限制。状态区间通常划分为3~5个为宜。
(2)建立状态转移概率矩阵
(3) 预测值修正
对相对误差的状态区间Ei取中间值并结合灰色预测值得出灰色马尔科夫模型的预测公式为:
当灰色预测值高于实际值时,式(8)中的符号取正;当灰色预测值低于实际值时,符号取负;当灰色预测值与实际值较为接近(相对误差≤0.02)时,不予以修正。
1.3 模型精度检验
(1) 平均相对误差
(2) 后验差比值
(3) 小概率误差
表1 模型精度等级划分表
2 上海港集装箱吞吐量预测
2.1 灰色GM (1,1)模型预测
选取《上海统计年鉴》中2003~2017年进出港国际标准集装箱吞吐量(万TEU) 作为原始数据(见表2),对未来5年数据进行预测。
表2 上海港2003~2017年进出港国际标准集装箱吞吐量 单位:万TEU
(1) 由表2建立原始序列
(2)对原始序列作一次累加得到新序列
(3)对累加后的序列作均值并建立数据矩阵B和Y
(4)利用最小二乘法求出待辨识参数a与u的值
(5)建立GM (1,1)预测模型
利用Matlab软件计算出上海港2003~2017年集装箱吞吐量的灰色预测值(见表3)。预测结果表明:灰色GM(1,1)模型的预测值呈递增趋势,其中2004年和2005年的相对误差最大,分别为-0.3548和-0.1546。最后预测出2018~2022年集装箱吞吐量分别为4 394.6754万TEU、4 653.5980万TEU、4 927.7755万TEU、5 218.1069万TEU、5 525.5439万TEU。
表3 上海港2003~2017年集装箱吞吐量灰色预测值
(6)灰色GM (1,1)模型精度检验
根据表3得到平均相对误差为0.07216,后验差比值为0.25834,小概率误差为1。查表1可知该模型的精度等级为Ⅲ级(合格),可以应用于集装箱吞吐量的预测,但是模型精度不高,需要对模型进行优化以提高准确性。
2.2 马尔科夫链模型预测
(1) 状态划分。按平均值将2003~2017年的相对误差分别划分为)四个状态,其划分结果见表4。
表4 上海港2003~2017年集装箱吞吐量状态划分表
(2)建立状态转移概率矩阵。由式(7)求出一步状态转移概率矩阵:
(3) 预测值修正。通过式(8)对2003~2017年上海港集装箱货物吞吐量灰色预测值修正。如2004年的灰色预测值为1 971.7779,其状态处于E1,计算出经过马尔科夫链模型修正后的预测值为=1 521.3015。同理可以计算出其余年份的灰色马尔科夫预测值(见表5)。由表5可知灰色GM (1,1)模型中相对误差最高的2004年和2005年经马尔科夫链模型修正后其误差为-0.0453和0.0205,分别下降了0.3095和0.1341。
表5 两种模型预测结果对比表
(4) 2018~2022年集装箱吞吐量预测。由表4可知2017年上海港集装箱吞吐量处于状态E3,则初始状态转移向量V0=(0,0,1,0 )。可计算出2018年的状态转移向量所以2018年吞吐量在状态E3和E4的概率都为1/2。对E3和E4两个状态取中间值,得到2018年的预测量为4 398.0180万TEU,同理可以求出2019~2022年的预测值分别为4 929.7242万TEU、5 220.1703万TEU、5 527.7288万TEU、5 853.4079万TEU。
(5)灰色马尔科夫模型精度检验。利用马尔科夫链模型修正后的平均相对误差从0.07216下降到0.02188;后验差比值从0.25834下降到0.08347,小概率误差保持不变,均为1。查表1可知该模型的精度变为Ⅱ级(良好),说明相较于单一的灰色GM (1,1)模型,灰色马尔科夫模型的预测精度更高。
2.3 两种模型对比
由图1可以看出灰色预测模型的预测值呈一条相对平滑的递增曲线,只体现了集装箱吞吐量的长期增长趋势,对于数据波动性较大的年份(如2009年)无法反映实际情况。而灰色马尔可夫模型的预测值与实际值较接近,不仅能体现吞吐量变化的总体趋势,还能反映数据的波动情况,表明其适用于随机波动性较大的预测对象。
3 结论
利用灰色马尔科夫模型对上海港集装箱吞吐量进行预测,可以帮助监测和研究未来的变化趋势,有助于制定港口发展战略、规划港口物流园区及建设基础设施。可以得出如下结论:(1)灰色GM (1,1)模型是一种长期趋势预测模型,在数据波动性不大的前提下,预测精度良好,同时马尔科夫链模型又能对波动性数据预测具有较高准确性,更加接近实际值,因此灰色马尔科夫预测模型的精准度要高于灰色GM (1,1)模型。(2)通过先前的实例预测可以看出该组合模型具有良好的预测效果,今后可将其推广运用到其他方面的预测。(3) 利用该组合模型进行预测仍存在一定的不足。集装箱吞吐量受许多关联因素的综合影响,如世界贸易波动情况、区域经济发展水平、市场供需平衡等,本文并未考虑对影响集装箱吞吐量的关联因素进行定性分析。如果存在对原始数据影响较大的因素,可在定性分析的基础上将其量化,再对预测结果进行修正,使结果具有更高的可靠性与准确性。
图1 上海港集装箱吞吐量增长趋势图