APP下载

港口吞吐量的典型因素预测模型

2018-07-04汤斯敏兰培真朱经君

上海海事大学学报 2018年2期
关键词:吞吐量典型聚类

汤斯敏, 兰培真, 朱经君

(1.集美大学海上交通安全研究所,福建 厦门 361021;2.交通安全应急信息技术国家工程实验室集美大学分实验室,福建 厦门 361021;3.安徽中澳科技职业学院国际商务系,合肥 230000)

0 引 言

近年来我国港口发展迅猛,随着国家政策和战略计划的进一步推进,影响港口吞吐量发展的因素越来越多。[1]为进一步支持港口发展规划与决策制定,很有必要研究一种既能充分考虑众多因素的影响又能适当简化预测模型的港口吞吐量预测方法。为此,迫切需要研究合适的港口吞吐量影响因素分析方法,以建立科学有效的港口吞吐量预测模型。

现今常用的港口吞吐量预测方法主要有时间序列法、趋势外推法、回归分析法、灰色预测法、神经网络法、支持向量机法、马尔科夫法等。程文忠等[2]提出了基于支持向量机理论的港口吞吐量预测模型;戴霖等[3]应用马尔科夫模型对港口吞吐量进行了预测;范莹莹等[4]将由主成分分析法得到的GDP作为参数引进带外加输入的非线性自回归模型(nonlinear autoregressive exogenous model,NARX 模型),建立了上海港集装箱吞吐量预测模型;朱小檬等[5]提出了时间序列-因果关系组合法预测国内海港中长期集装箱吞吐量;XIE等[6]在最小二乘支持向量回归(least square support vector regression,LSSVR)模型的基础上提出了3种组合预测方法;GENG等[7]提出了一种港口吞吐量预测模型,该模型应用混沌有效遗传算法(chaotic efficient genetic algorithm,CEGA)优化参数,克服了参数投影寻踪回归(parameter projection pursuit regression,PPPR)中参数测定的难题;HUANG等[8]提出了投影寻踪回归-遗传编程(projection pursuit regression - genetic programming,PPR-GP)方法对青岛港集装箱吞吐量进行预测。

针对港口吞吐量影响因素越来越多的实际情况,目前对港口吞吐量预测的研究成果中还没有既能综合考虑众多因素的影响又能控制预测模型中自变量个数的有效预测方法。为此本文应用系统聚类法确定影响港口吞吐量的典型因素,再应用多元线性回归分析法,以典型因素作为自变量,建立港口吞吐量的典型因素预测模型。这样既能综合考虑众多因素的影响,又能结合实际情况和预测需求对影响因素类别进行调整,以控制预测模型的自变量个数,使预测模型难度适中可控。通过对厦门港集装箱吞吐量的实例分析,验证模型的有效性,为港口未来吞吐量预测和规划提供参考。

1 港口吞吐量的典型因素预测模型

1.1 影响港口吞吐量的典型因素确定

港口吞吐量的预测受众多因素的影响,这些影响因素的特征有些相近,有些却完全不相关。在进行港口吞吐量预测时,如何兼顾众多因素的影响又不因影响因素过多而增加预测难度从而影响预测精度,一直是港口吞吐量预测的难点。系统聚类法正适用于解决这类型难题。根据港口吞吐量预测的目标和影响因素的特征,定义影响因素间的相似程度度量标准,将各影响因素按照相似程度大小逐一归类,相似度越大则越优先聚合,直到所有的影响因素都聚合完毕,形成一个表示影响因素间亲疏关系的系统聚类图。根据系统聚类图可得到彼此独立且具有代表性的影响因素作为典型因素。系统聚类过程如下:

(1)数据准备。假设港口吞吐量的影响因素有m个,X=(x1,x2,…,xm)T,各影响因素取n年的观测值,Xi=(xi1,xi2,…,xin),i=1,2,…,m,xij表示第i个影响因素第j年的观测值。为避免各影响因素值对度量单位的依赖,需对观测值进行Z-Score标准化处理[9]。

(1)

(2)确定影响因素间的相似度。各影响因素间相似度的度量标准为欧氏距离[9]。

(2)

(3)类间相似度的确定。设Gp和Gq为已聚类合并的两类影响因素,则定义类间相似度[9]:

xi∈Gp,xk∈Gq, 1≤hp,hq≤m

(3)

式中:Dpq2为Gp和Gq两个类别中两两因素之间的平均平方距离;hp和hq分别为类Gp和类Gq中的影响因素个数。

(4)影响因素的聚类。应用系统聚类法中的组内联接法进行聚类。由式(2)计算各影响因素之间的距离,将距离最小的两个影响因素合并成一个新类,其余各影响因素独自成类;根据式(3)计算类与类之间的距离,并将距离最小的两类进行合并,形成一个新类;重复进行类间距离的计算及类的合并,直到所有影响因素合并成一个大类为止;最后根据系统聚类过程生成表示影响因素间亲疏关系的系统聚类图。

(5)典型因素的确定。根据实际需要并结合系统聚类图来确定影响因素的分类数,得到彼此独立且具有代表性的影响因素类别。在各影响因素类别中分别选取一个总相似距离L值最小的影响因素作为典型因素代替其余影响因素。

与xi为同类影响因素

(4)

式中:Lxi为影响因素xi的总相似距离;h为该类中影响因素的个数,1≤h≤m。

1.2 港口吞吐量典型因素预测模型建立

多元线性回归分析法能考虑到多个因素对港口吞吐量的影响,与系统聚类法结合能有效地对港口吞吐量进行预测,提高港口吞吐量的预测精度。设定影响港口吞吐量的典型因素为x1,x2,…,xl,应用多元线性回归分析法建立典型因素预测模型为

y=β0+β1x1+β2x2+…+βlxl+ε

(5)

式中:y为港口吞吐量;βi为待定参数,i=0,1,…,l;ε为随机干扰项,服从正态分布。

2 模型应用——以厦门港集装箱吞吐量为例

2.1 厦门港集装箱吞吐量影响因素分析

厦门港集装箱吞吐量的影响因素可分为宏观因素和微观因素:宏观因素包含世界经济发展趋势及政策、海峡西岸经济区的建设、经济发展水平、对外贸易规模、城市需求能力等;微观因素包含港口体制改革、管理模式改革、管理因素、生产力布局、集装箱机械设备、集装箱运作模式、集疏运能力、基础设施、腹地经济水平、港口竞争力等[10]。考虑到厦门港在两岸三通、海峡西岸经济区、东南国际航运中心、自由贸易区、21世纪海上丝绸之路核心区等规划和建设进程中的优势和发展,厦门港腹地经济发展水平会不断提高,对外贸易规模会不断扩大,海铁联运量会逐年提高,集疏运能力会不断加强。综上考虑,选取对厦门港集装箱吞吐量有较大影响的因素,见表1。

表1 厦门港集装箱吞吐量的重要影响因素

2.2 影响厦门港集装箱吞吐量的典型因素确定

通过查阅历年厦门经济特区统计年鉴及相关统计资料,收集了表1中影响因素2005—2016年的统计数据。原始数据过多,故不在文中一一列举。

为消除各原始数据量纲差异的影响,根据式(1)进行数据标准化处理,得

(6)

由式(2)和(3),通过影响因素与影响因素、类与类之间的相似度计算和类的合并,得到影响因素的系统聚类图,见图1。结合厦门港集装箱吞吐量的实际情况和预测需求,以纵向直线在图1上左右平移,将直线停在横坐标17时,可确定3类影响因素,此时与直线有交点的每根横线所对应的影响因素就是一类,即其横线左端包含的各个影响因素就是此类的成员。具体分类结果见表2。

图1 厦门港集装箱吞吐量影响因素的系统聚类图表2 厦门港集装箱吞吐量影响因素的分类结果

类别划分第1类第2类第3类影响因素x5x10x1,x2,x3,x4,x6,x7,x8,x9,x11,x12,x13

根据式(4)计算第3类影响因素中各因素的L值, 得到Lx1=1.803,Lx2=5.745,Lx3=1.810,Lx4=2.136,Lx6=1.914,Lx7=5.008,Lx8=2.495,Lx9=2.026,Lx11=3.171,Lx12=7.850,Lx13=1.919。经比较可知,影响因素x1的L值最小,因此确定第3类影响因素中的典型因素为腹地GDP值。因为该类中各因素的特征有较大相似性,对预测对象的贡献率基本一致,所以经计算选出的腹地GDP值能充分代表该类中其余因素对港口吞吐量的影响。

综上所述,可确定影响厦门港集装箱吞吐量的典型因素为港口固定资产投资总额、海铁联运量和腹地GDP值。经系统聚类分析后得到的这3个典型因素彼此独立且具有代表性,能综合代表其余因素对厦门港集装箱吞吐量的影响。

2.3 典型因素预测模型的建立

2005—2016年厦门港集装箱吞吐量、腹地GDP值、港口固定资产投资总额和海铁联运量4个方面的统计数据见表3。

表3 2005—2016年厦门港4个方面的统计数据

根据式(5),将腹地GDP值、港口固定资产投资总额和海铁联运量这3个典型因素作为自变量,应用多元线性回归分析法[9]建立厦门港集装箱吞吐量的典型因素预测模型:

(7)

2.4 模型检验与误差分析

根据多元线性回归统计检验,模型(7)的调整R2(调整决定系数)为0.998,且F统计量的P值(概率值)小于0.01。这表明该预测模型的拟合度较好,并通过了F检验,因变量与自变量之间存在真正的线性关系,因此该预测模型具有较高的有效性。其检验数据见表4。

表4 预测模型相关检验数据

模型(7)的误差分析结果见表5。由表3可以看出2009—2012年厦门港的港口固定资产投资总额和海铁联运量出现突变,这种突变导致了2009—2012年厦门港集装箱吞吐量预测值出现较大误差。但预测模型计算得到的平均相对误差为5%,这表明该预测模型具有较高的预测精度。

为预测2017—2019年厦门港集装箱吞吐量,先应用GM(1,1)预测模型[11]预测典型因素在2017—2019年的数值,再将相关预测值代入模型(7),经计算可得2017—2019年厦门港集装箱吞吐量的预测值,见表6。

表5 厦门港集装箱吞吐量预测结果误差分析

表6 2017—2019年厦门港集装箱吞吐量预测值 万TEU

从表6预测结果可得到,2017年厦门港集装箱吞吐量将达到1 031万TEU,突破全年千万标箱的关口,未来3年的集装箱吞吐量将以7%的增速平稳增长。近年来厦门市投入大量资金重点扶持内贸集装箱航线、国内国际中转枢纽等,并进一步完善中欧班列和开展海铁联运,海铁联运量持续增加,保证了厦门港集装箱吞吐量稳定增长的势头。

3 结 论

通过系统聚类法将特征相似的影响因素放在同一类,将特征不同的影响因素放在不同的类,可得到彼此独立且具有代表性的港口吞吐量典型影响因素。这样既减少了影响因素的个数,简化了预测模型,又不丢失对港口吞吐量有重要影响的因素,保证了预测结果的有效性,克服了传统单一因素预测模型的弊端。通过对厦门港集装箱吞吐量进行实例应用,验证了港口吞吐量典型因素预测模型具有较高的有效性和预测精度,准确反映了厦门港集装箱吞吐量变化的实际情况。腹地GDP值、港口固定资产投资总额和海铁联运量等3个典型因素与厦门港集装箱吞吐量的发展密切相关,今后可作为厦门港集

装箱吞吐量预测和规划建设的一个重要参考,但仍需进一步对这三个典型因素的预测方法进行细化研究。

参考文献:

[1] 张丽君, 刘佳骏. 中国沿海港口吞吐量内在影响因素研究[J]. 中国水运, 2008, 8(10): 18-19.

[2] 程文忠, 任凤香, 周宣赤. SVM在九江港吞吐量预测中的应用研究[J]. 物流工程与管理, 2012, 34(9): 61-64. DOI: 10.3969/j.issn.1674-4993.2012.09.026.

[3] 戴霖, 黄浩, 黄倩盈, 等. 基于马尔科夫模型的港口吞吐量预测[J]. 水运管理, 2014, 36(3): 18-22. DOI: 10.13340/j.jsm.2014.03.005.

[4] 范莹莹, 余思勤. 基于NARX神经网络的港口集装箱吞吐量预测[J]. 上海海事大学学报, 2015, 36(4): 1-5. DOI: 10.13340/j.jsmu.2015.04.001.

[5] 朱小檬, 栾维新, 朱义胜. 基于时间序列-因果关系结合法的中国海港集装箱吞吐量中长期预测[J]. 大连海事大学学报(社会科学版), 2014, 13(5): 1-5.

[6] XIE Gang, WANG Shouyang, ZHAO Yingxue,etal. Hybrid approaches based on LSSVR model for container throughput forecasting: a comparative study[J]. Applied Soft Computing, 2013, 13(5): 2232-2241.

[7] GENG Jing, LI Mingwei, HONG Weichiang,etal. Port throughput forecasting by using PPPR with chaotic efficient genetic algorithms and CMA[C]//2015 IEEE International Conference on Systems, Man, and Cybernetics. Kowloon, China, 9-12 Oct 2015. IEEE, 2015: 1633-1638. DOI: 10.1109/SMC.2015.288.

[8] HUANG Anqiang, LAI Kinkeung, LI Yinhua,etal. Forecasting container throughput of Qingdao Port with a hybrid model[J]. Journal of Systems Science & Complexity, 2015, 28(1): 105-121. DOI: 10.1007/s11424-014-3188-4.

[9] 韩明. 应用多元统计分析[M]. 上海: 同济大学出版社, 2013.

[10] 林连. 厦门港集装箱吞吐量预测研究[D]. 武汉: 武汉理工大学, 2009.

[11] 姚天祥, 巩在武. 灰色预测理论及其应用[M]. 北京: 科学出版社, 2014.

猜你喜欢

吞吐量典型聚类
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
《圆》典型易错题
40年,我们宣传推介的典型经验
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
几类典型题的解题技巧