基于大数据的全球汽车船运力分布及需求分析
2023-03-31陈书航张健豪王新波张哲熙
陈书航,张健豪,王新波,2,张哲熙,韩 懿
(1.中远海运科技股份有限公司,上海 200135;2.上海交通大学 船舶海洋与建筑工程学院,上海 200240)
0 引 言
汽车船是专门用来运输汽车的船舶[1],目前主要有纯运汽车的汽车船(Pure Car Carriers, PCC)和混运汽车与卡车的汽车船(Pure Car and Truck Carriers, PCTC)2种[2]。在汽车船出现之前,通常采用普通货船运输汽车,其装卸通过起重机完成。20世纪50年代,随着车辆运输需求的不断增加,普通货船逐渐无法满足汽车装载需求,同时对运输汽车的船舶的安全性的要求不断提高,这促使Wallenius航运公司开发了专门运输汽车的船舶[2]。近年来,随着新能源车的快速发展,汽车运输量的不断增加,汽车船的需求不断增大,利用航线分析汽车船的运力市场具有重要意义[3-4]。本文运用船舶自动识别系统(Automatic Identification System, AIS)数据进行分析,发现汽车船的抵达港口存在重复循环的情况,这表示汽车船存在固定的航线。若进一步对AIS数据中的汽车船航线进行分割并统计其数量,则可得到汽车船的航线分布和运力部署情况。本文采用动态规划算法[5-6]对纯汽车船航线进行分割,并统计航线分割结果,判断汽车船运力市场的分布范围,为汽车船的国际贸易情况分析(从国际贸易区到国家港口)提供一个由浅入深的视角。AIS数据是汽车船航线统计的数据来源,而动态规划算法是常用的航线分割方法,可为汽车船航线分割提供支撑。得到汽车船的运力分布情况之后,进一步分析其市场运力需求,限于篇幅,选取小范围的数据进行分析。通过对采用动态规划算法得到的航线分割结果进行分析,发现日本在汽车船市场中占据较大份额,因此选取日本作为研究对象。进一步采用AIS数据计算日本各港口的汽车运输量,得到汽车运输量在日本的离散分布情况。由于汽车运输量大标志着汽车船运力需求高,假设汽车运输量分布可看作汽车船运力需求分布。此外,为得到连续的汽车船运力需求分布,运用莫兰指数证明汽车运输量在日本境内具有空间相关性,并采用克里金插值法对日本境内的汽车运输量进行插值预测。
1 研究方法
目前有关航线分割的研究较少,且主要集中在集装箱船航线分割方面[6]。本文基于船舶AIS动态数据和动态规划法,按贸易区级、国家级和港口级等3个层级对汽车船航线进行分割,其中:贸易区级包含21个节点[7];国家级包含197个节点;港口级包含2 307个节点。贸易区级航线按联合国地理区划列表划分;国家级航线按世界现有国家总数划分;港口级航线按近3 a汽车船途经港口的AIS数据划分。本文参照文献[6]中的动态规划算法,将其运用到汽车船航线分析中。航线分割完毕之后,采用排列组合方法去除重复的航线(形成相同环线的航线),并统计各航线上的船舶航行次数,由此分析汽车船在国际贸易中的运力分布。得到各航线上的船舶航行次数(即得到全球运力分布)之后,进一步对汽车船市场的运力需求进行分析。限于篇幅,本文选取航行次数较多的国家,即对汽车船运力影响较大的国家作为研究对象,采用克里金插值法对其汽车船运力需求进行分析,得到对汽车船运力影响力较大的国家的汽车船运力需求分布情况。克里金插值法的应用前提是预测空间具有相关性,广泛应用于降雨量分析[8]、健康分析[9]、环境污染分析[10-12]、温度预测[13]和土壤分析[14]中。基于莫兰空间相关指数显著,将克里金插值法应用于汽车运输量分析中,最终从所得数据中得到汽车船需求分布情况。
1.1 基于动态规划法的航线分割
分割航线的前提是从AIS数据中提取汽车船的航线轨迹。AIS数据中包含所有船型的数据,因此首先需从其中将汽车船数据提取出来。为此,先选出“船型代码”表示为“汽车船”的船(vessel_sub_type=60910),再将AIS数据中“载货能力描述”包含“汽车”且不包含其他载货类型(如“拖车”“卡车”和“粮食”等)作为进一步筛选的条件。此为汽车船提取步骤,由此便能使AIS数据中只保留汽车船的数据。随后提取船舶的航线轨迹。AIS数据中包含船舶的起始港和目的港信息,本文提出起始港,由于下一港口的起始港即为上一港口的目的港,因此可将起始港序列看作船舶的航线轨迹顺序,此为汽车船舶航线轨迹提取步骤。
航线分割步骤如下:
1) 将AIS数据中船舶经过的二级贸易区(或国家、港口)作为序列,若经过港口A、港口B、港口C、港口B、港口A、港口C、港口B、港口C、港口A、港口C,则得到航线序列[‘A’,‘B’,‘C’,‘B’,‘A’,‘C’,‘B’,‘C’,‘A’,‘C’]。
2) 统计序列中不重复的元素(港口)作为航线分割的字典,即[‘A’,‘B’,‘C’]。
3) 按顺序选取字典中的元素作为航线分割的起点和终点,对航线序列进行分割。若对‘A’进行分割,则得到‘A B C B A’、‘A C B C A’和‘A C A’等3段航线;若对‘B’进行分割,则得到‘B A B’、‘B C B’、‘B A C B’和‘B C A C B’等4段航线;若对‘C’进行分割,则得到‘C A B C’、‘C B A C’、‘C B C’和‘C A C’等4段航线。
4) 选取每次分割得到的航线长度最大的值,对‘A’分割得到[‘A B C B A’]的长度为5,对‘B’分割得到[‘B C A C B’]的长度为5,对‘C’分割得到[‘C B A C’]的长度为4。为保证航线的不重复性满足要求,选取长度最小的分割结果,即此航线采用‘C’进行分割。
1.2 重复航线处理
航线之间可能存在重复的情况,如‘A B C D E’与‘D E A B C’为同一条航线,只是起点和终点不同。本文采用以下方法消除重复航线:
1) 排除首尾港口相同的情况(如‘A B C D E A’),即得到首尾不重复的航线。将该航线不重复的元素作为字典,并从0开始按顺序对该字典赋值,例如对[A B C D E]赋值,可得到[0 1 2 3 4]。
2) 按该字典对所有航线赋值,对[D E A B C]赋值,可得到[3 4 0 1 2]。
3) 任意选取2条已赋值的航线,挑选出2条航线数值最大的值作为序列的首项,其余元素按顺序排列,即2条航线将以[4 0 1 2 3]和[4 0 1 2 3]输出。若2个输出的序列相同,则表示2条航线为同一条航线。若航线中包含不止1个最大值,则2条航线同时去除该最大值,再按上述方法比较,循环比较即可完成对所有航线重复情况的检测。
1.3 普通克里金插值法
分割航线并处理重复航线之后可得到汽车船的全球运力分布情况,从中选取对汽车船运力分布影响较大的国家进行空间量化分析,得到国家级的汽车船运力需求分布情况。本文假设汽车运输量在空间上均匀分布,通过莫兰指数验证节点与节点之间的空间相关性,采用克里金插值法进行量化分析。
克里金插值法的应用前提是预测空间具有相关性。本文采用莫兰指数验证空间相关性,其定义[15]为
(1)
克里金插值法是以结构分析和变异函数理论为基础,在一定范围内对区域化变量进行无偏最优估计的方法[16-17],其定义[18]如下。
假定在位置s1,…,sn处存在一组随机数据组Z≡(Z(s1),…,Z(sn)),其中sn∈D,D⊂Rd,满足
Z(s)=μ+δ(s),s∈D
(2)
式(2)中:δ(·)为零均值随机过程;μ为常数。协方差函数C(s,u)≡cov(Z(s),Z(u)),其中s,u∈D。
(3)
最优线性无偏预测值M可由最小化均方预测误差得到,即
(4)
根据拉格朗日乘数法,最优估计值λ′为
λ′=(c+(1-c′C-11)((1′C-11)-11)′C-1
(5)
式(5)中:1为元素全为1的n×1向量;c≡(C(s0,s1),…,C(s0,sn))′为n×1向量,C≡(C(si,sj))为n×n矩阵,其第(i,j)个元素为C(si,sj)。
Z(S0)的最优线性预测值为
Z*(s0)=c′C-1Z+(1-c′C-11)(1′C-11)-1(1′C-1Z)
(6)
此时μ的估计值为μ=(1′C-11)-11′C-1Z。
Z(S0)的均方预测误差为
E(Z(s0)-Z*(s0))2=C(s0,s0)-c′C-1c+(1-c′C-11)2(1′C-11)-1
(7)
2 结果分析及验证
基于AIS数据,从贸易区、国家和港口等3个维度对全球汽车船航线进行分割。通过这3个维度的分析发现日本对汽车船国际贸易的影响较大。进一步采用克里金插值法分析日本的汽车运输量分布,从而揭示其汽车船需求分布情况,其中日本汽车生产地位置数据来源于Marklines[19]。
2.1 贸易区航线分割结果
根据地理位置,将贸易区划分为远东、地中海、西北欧、波斯湾和东南亚等地。贸易区航线分割结果见图1,所取数据来源于2020—2022年的AIS数据。贸易区级别的航线分割提供了一个宏观的视角,可发现远东、西北欧、地中海、东南亚和美东等贸易区的汽车船内贸运输量较大(分别超过6万艘、超过2万艘、近2万艘、近1万艘和近5 000艘),更细致的运力分布需从国家级别的航线分割中获取。
2.2 国家级航线分割结果
图2为国家级航线分割结果。由图2可知,日本、中国、美国、意大利和韩国等国家的汽车船内贸运输量较大(分别近4万艘、近1万艘、超过6 000艘、超过5 000艘和超过4 000艘)。为进一步分析全球汽车船运力分布情况,需对港口级别的航线进行分割。
图1 贸易区航线分割结果
图2 国家级航线分割结果
2.3 港口级航线分割结果
按运输的车辆数将汽车船分成0~<2 500辆(小型汽车船)、2 500~5 500辆(中型汽车船)和大于5 500辆(大型汽车船)等3种船型,并进行港口级航线分割,得到对应不同船型的运力分布情况,结果见图3~图5。
图4 中型汽车船港口级航线分割结果
图5 大型汽车船港口级航线分割结果
1) 由图3可知,小型汽车船的运力主要分布在日本,多数分布在日立、钏路、鹿儿岛、西之表、苫小牧、敦贺和博多等日本城市;
2) 由图4可知,中型汽车船的运力主要分布在欧洲、中国和新加坡等区域,多数分布在泽布吕赫(比利时)、明朗赫姆(英国)、都柏林(爱尔兰)、广州、上海外高桥、天津、大连、上海和新加坡等地;
3) 由图5可知,大型汽车船的运力主要分布在日本、北美洲、欧洲和新加坡等区域,多数分布在丰桥、新加坡、泽布吕赫和名古屋等地。
结合大中小型汽车船的运力分布可知,日本在汽车船国际贸易市场中具有很大的影响力,该结果也可从国家级航线分割结果中得出,因此本文选取日本作为进一步分析的对象。
2.4 日本境内汽车船运力需求分析
汽车运输量通过AIS数据计算得到,汽车生产地的位置信息从Marklines[19]中获取。通过观察日本汽车船流量分布图(见图6)可知,日本的汽车船流量主要分布在爱知县、东京沿海区域和宫城县,其次分布在福冈县和北海道县。图6中的黑点为日本汽车生产地分布(圆锥形为日本港口分布),可看出日本的汽车船流量分布与汽车生产地分布具有极强的关联性,大部分汽车生产地靠近爱知县、东京沿海区域、宫城县、福冈县和北海道县。爱知县主要是丰田汽车的生产地;东京沿海区域主要是日野、日产和本田汽车的生产地;宫城县主要是丰田东日本的生产地;福冈县主要是丰田九州、大发九州和日产九州的生产地;北海道县主要是丰田北海道的生产地。这些地区对汽车船运力也有较大的需求。
图6 日本汽车船流量分布图
在Arcgis pro中对汽车运输量进行全局莫兰指数计算,结果为0.82(pvalue=0.03,pvalue<0.05表明关系显著),即汽车运输量具有空间相关性,可采用克里金插值法进行量化分析。图7为日本汽车运输量插值图。从图7中可看出,爱知县是日本汽车运输量最大的县,其次是东京沿海区域。此外,日本中部地区的港口贸易活动明显好于日本北部和日本南部,因此该地区的汽车船需求量较大,而南北部的汽车船需求量较少。图8为基于克里金插值法的合理性交叉验证结果,标准化均方根值为0.967,标准化误差较小,克里金插值法对汽车运输量的拟合结果较好。
为进一步验证日本汽车运输量(汽车船运力需求量)计算的合理性,将汽车船运车量计算值与Choice宏观数据[20]相对比,结果见图9。由图9可知,本文的运车量计算值与宏观数据的变化趋势相吻合,验证了本文对汽车船运车量估计的合理性,即验证了本文对日本汽车船运力分布预测的合理性。
图7 日本汽车运输量插值图
a) 测量值与预测值关系图
b) 标准误差与测量值关系图
图9 宏观数据季度指数归一化值与经AIS运算得到的季度运车量归一化值对比
3 结 语
基于AIS数据,发现小型汽车船的运力主要分布在日本境内,中型汽车船的运力主要分布在欧州、中国和新加坡等地,大型汽车船的运力主要分布在日本出口到西北欧、北美洲等地和日本境内。由全球的汽车船运力分布统计结果可知,日本的境内外出口对汽车船行业有很大影响,其主要出口地位于爱知县、东京沿海区域、宫城县、福冈县和北海道县。日本的汽车生产地大多靠近其出口港,且日本中部地区对汽车船的需求量明显高于南北部地区,该结论符合业务逻辑,汽车运输量计算值与宏观数据相吻合。未来在对汽车船运力需求分布进行研究时,可将研究区域由日本境内扩大至日本周围(包括中国、韩国等国家),对远东地区的汽车船运力需求进行量化分析。