APP下载

基于主成分分析法的港口物流网络研究
——以宁波舟山港为例

2022-02-19胡荣郑颖

科学技术创新 2022年1期
关键词:原始数据宁波港口

胡荣 郑颖

(南京航空航天大学金城学院,江苏 南京 211156)

1 概述

港口作为水路运输的重要组成部分,在提供传统货物装卸、中转等服务的基础上,依靠其独特的地理位置、装备设施、仓储等优势,已逐渐发展立体化、枢纽型交通运输网络。通过仓储运输、商业贸易、工业生产和社会服务等功能,港口实现了物流、商流、资金流、技术流、信息流的汇集,在物流服务中的地位和作用逐渐提高。对港口物流网络进行合理评价研究则可以在一定程度上揭示港口物流的不足,从而不断完善港口物流的发展。

目前,已有很多学者针对港口物流的各个方面建立评价模型,从而揭示目标港口物流的优缺点,辅助决策。国内学者杨健[1]等利用港口物流投入、产出指标,结合数据包络分析建立了C2R 模型,定量分析港口物流生产力效率,为港口物流效率的提高提供了有效的建议;陈继红[2]等根据硬件基础实力和软环境服务能力,结合灰色关联模型,实现了对沿海港口物流综合服务能力的评价,有助于我国沿海城市物流服务环境的建设。

宁波舟山港以浙江省宁波市和舟山市为依托,位于中国大陆中部海岸线、“长江经济带”的南翼,“丝绸之路经济带”于宁波舟山港和“21 世纪海上丝绸之路”相汇集。宁波舟山组合港的成功将进一步实现我国港口资源优化配置和港口管理体制改革。因此,对其物流网络展开研究分析具有必要性。本文以现有港口物流理论为基础,利用主成分分析法,在宁波舟山港、上海港、天津港、大连港、连云港之间建立港口物流网络评价模型,应用于宁波舟山港,为宁波舟山港提供决策服务。

2 主成分分析法原理

主成分分析在统计分析中应用广泛,适用于人口统计学、地理系统分数量地理学等。它将数量较多的多维变量通过线性变换综合为较少数个重要变量,且保留了原始数据绝大多数信息。

3 评价模型建立步骤

3.1 评价指标制定

本文综合考虑了影响港口物流网络内部环境和外部环境发展的多种因素,同时这些因素能够在各港口间客观地进行横向比较,从而客观评价港口物流网络。本文选取了2016-2019 年的多组数据(数据来源于历年《中国统计年鉴》和各地区统计年鉴),如表1 所示,最终将影响因素分为2大类、3 个一级指标、10 个二级指标,分别为反映港口物流生产规模的货物吞吐量、集装箱吞吐量、货物吞吐量增速、集装箱吞吐量增速;反映港口物流硬件设施基础的码头长度、码头泊位数、万吨级泊位数;反映港口腹地经济环境的港口城市GDP、港口城市进出口总额、交通运输、仓储、邮电业务总额。

表1 宁波舟山港物流网络评价指标

3.2 数据预处理

这里所收集到的数据量纲不同,表现为他们之间存在数量级或计量单位的差异,因而各个变量之间不具有综合性,这样会对结果造成大幅度影响,或因计量单位不统一导致计算结果不具有现实意义[3]。

因此,本文首先需要先对数据进行标准化处理,即无量纲化处理,用线性函数将原始数据线性化的方法转换到[0,1]的范围,以便消除各个指标间量纲和数量级的影响,归一化公式如下:

其中,Xnorm为归一化后的数据,X 为原始数据,

Xmax、Xmin分别为原始数据集的最大值和最小值。

该方法实现了对原始数据的等比例缩放。变量U1、U2、U3、U4、U5、U6、U7、U8、U9、U10归一化后对应变量为X1、X2、X3、X4、X5、X6、X7、X8、X9、X10。

3.3 确定主成分的数量

本研究中采用的方法论是一种基于主成分分析的方法论,根据采集到的10 项二级指标通过SPSS 软件进行主成分分析,得到如表2 结果。

从表2 可以看出,第一个主成分包含了全部64%的信息,第二个主成分包含了全部18%的信息,前2 个主成分累计贡献率已经达到81.921%,大体上涵盖了所有的指标信息。因此,选择前两个主成分即可解释关键问题。

表2 总解释方差

3.4 确定综合评价函数

确定两个主成分的特征向量,公式如下:

通过与归一化后的数据相乘得出两个主成分的表达式分别为:

主成分分析法通过线性变换将数据转变到一个新的坐标系中。根据方差最大理论,投影维度是K 维变量空间中在最小二乘意义上最接近数据的线,这条线穿过平均点。将每个数据投影的第一大方差在第一个坐标上,即第一主成分,第二大方差在第二个坐标上,即第二主成分。

从表3 可以看出第一主成分(简称F1)对所有变量均具有载荷,且集装箱吞吐量、万吨级泊位数、码头泊位数、港口城市外贸进出口总额这些指标的载荷绝对值均在0.9 以上,在第一主成分得分较高;而第二主成分(简称F2)主要反映了货物吞吐量和货物吞吐量增速两个指标的信息。

表3 成分矩阵

3.5 综合评价结果

将各港口标准化后的数据带入上述各方程,可得2019 年各港口的各主成分得分,如表4 所示,以及综合得分和排名,如表5 所示。

表4 2019 年各成分得分

表5 2019 年综合评价得分及排名

通过各主成分得分和综合评价结果可知,2019 年各港口物流网络排名依次为上海港、宁波舟山港、天津港、大连港、连云港。并且根据原始数据与综合评价结果结合分析,可以帮助各港口做出物流网络的优化决策。

3.6 方差分析结果

图1 为根据调查和采样点港口位置分区的PCA 得分箱线图:(a)PC 1;(b) PC 2 。在箱线图中,横穿方框的线代表中位数。箱子的上下两侧显示了上四分位数(Q3)和下四分位数(Q1)。 晶须延伸到由Q1+1.5(Q3-Q1) 和Q3+1.5(Q3-Q1)定义的区域内的最低和最高观测值。超出这些限制的单个点为异常值,用星号绘制。

图1 PCA 得分箱线图

箱线图1(a)显示了一个虚构的数字的物流网络评价指标。从该图中,我们可以看到物流网络评价指标从每个集合的最大值延伸到最小值,显示了这两个极端之间的范围大小,例如,港口5(连云港)在PC 1 是个短框,意味着它们的数据点始终围绕中心值徘徊; 港口1(宁波舟山港)归属于范围大、分布广类型,即数据较为分散。其次,在5 个不同港框架的中线(每组的“中间”值)皆位于其他四个框架之外,则组之间可能存在差异,可以很好地区分不同指标。反之,箱线图图1(b)出现了很多长框意味着有更多的可变数据。与此同时,港口1、4、5 的中线都位于相互框之间的重叠范围内,我们将不得不采取另一个步骤来得出关于它们的组的结论。

4 结论

本文将多元统计学中的主成分分析法应用于港口物流网络的评价问题,通过将与原有的多维变量简化为少数综合变量,对宁波舟山港、上海港、大连港、天津港、连云港2016-2019 年的10 项指标进行分析,得出了各港口物流网络排名。结果表明,2019 年宁波舟山港的现有水平和综合实力稍逊于上海港,但未来的发展潜力巨大。由此,为了提高宁波舟山港的物流网络水平,应加大对基础设施的资源投入,建立海铁联运、疏港铁路等相结合的交通网络。

影响港口物流发展的因素众多,而在现实生活中,部分影响因素具有不确定性,无法用具体数值描述,不能直接和定量指标一起进行运算。因此我们可以考虑采用模糊评价方法,将定性指标量化更全面地评价港口物流网络的发展,作者将在未来的研究中对该方法进行深入探讨。

猜你喜欢

原始数据宁波港口
聚焦港口国际化
中国港口,屹立东方
《威海港口》
一图读懂宁波
港口上的笑脸
拖起明天的希望
聚焦·宁波
论航空情报原始数据提交与应用
对物理实验测量仪器读数的思考
喜相迎