APP下载

中国航线网络结构的多层性分析

2020-06-30徐开俊吴佳益

复杂系统与复杂性科学 2020年2期
关键词:廉价航空公司航线

徐开俊,吴佳益,杨 泳,梁 磊

(中国民用航空飞行学院飞行技术学院,四川 广汉 618307)

0 引言

交通运输业是经济和社会发展的中坚力量,航空运输已成为交通运输业不可或缺的重要部分,对航线运输网络的研究也就显得尤为重要。Amaral等[1]利用复杂网络理论研究了全球航空运输网络,并发现该网络是无标度的小世界网络,存在幂律下降的度分布和介数分布。此后,利用复杂网络理论对世界各地区的航空运输网络研究相继发表[2-5]。这些研究反映出了大区域性的航空类网络的一些共有特征,例如双段幂律分布、小世界特性、度负关联性等。但在这些研究中的航线运输网络被认为是单层的网络,其中机场之间的所有连接被认为是等同性质的。

最近的研究指出,将现实系统抽象为单个网络,这样的研究具有一定的弊端,其中一个主要限制因素就是现实系统的多层性[6,7]。Wenbo Du[8]和Oriol Lordan[9]等人按照“K-核分解”法,将航线网络分解为核心、桥和边缘三层,深入研究了中国和欧洲航线网络的网络特性。Cardillo等人[10]建立了以航空公司为分层依据的多层网络模型,研究了几种拓扑特征参数在层与层之间合并的过程中的发展情况。结果表明,欧洲航空多层网络的拓扑特性与其网络的多层性密切相关。Richard Klophaus[11]等人以各航空公司联盟为一层的依据建立了全球的航线多层网络,评估了3个航空联盟的鲁棒性。Liang Dai[12]等人利用多层航空网络理论研究了1979—2012年间东南亚航线网络,研究了核心、桥及边缘三层随时间波动的关系,并将其研究结果联系到了航空公司规模以及地区经济发展。航线运输是一个多层网络,每层网络是由各航空公司单独管控。由于航空公司间运营航线的独立性和相互影响性,仅建立单层的网络模型并不能较好反映整个航线运输网络的状态,并且可能导致忽略网络中的一些重要细节。此外,航线多层网络的几个重要结构特性,如全球效率,连通系数和网络极化,还没有相继引入研究。建立中国航线多层网络(Chinese Airline Multilayer Network)能够为中国航线网络的研究提供新思路。

本文将深入研究中国航线多层网络的拓扑特性。首先以航空公司作为中国航线网络的分层依据,进行建模分析,再对多层网络的聚合过程进行仿真,最后进行相应的仿真结果分析。此外,我们还比较了大中型航空公司和廉价航空公司相对应的两种主要类型层的不同聚合过程,分析它们对中国航线多层网络属性的不同贡献。

1 复杂网络度量参数

1.1 单层网络度量指标

p(k)表示网络中度值为k的节点在整个网络中所占的比例,作为复杂网络的关键特征,度分布通常用于表征现实复杂系统的结构特征和动态特征。在本文中,度分布用于反映CAMN中所有机场的分布规律和结构异质性程度。

聚类系数C是复杂系统网络的重要属性。它量化了节点之间形成三角形的趋势,即与同一节点相连接的两个节点连接在一起的概率。节点的聚类系数定义为:

(1)

其中,ei是节点i的邻节点之间实际连接边数,ki是节点的度。聚类系数C=∑i∈NCi/N,其中N是网络中节点的总数。聚类系数能宏观反应三角模体的密度[13],我们用它来估计在CAMN中进行长度为3的周转型往返运输概率。

平均最短路径长度〈L〉是网络中所有节点对之间的最短路径的平均长度,即:

(2)

其中,N是网络中节点的总数,dij是从节点i到节点j的最短路径长度。平均最短路径长度可以测量网络中节点对之间的间隔,在航线运输网络中,它可以用于量化乘客从出发地到目的地旅行时应乘坐的平均航班数量。为避免计算过程中出现两节点不连通的情况,本文先计算各连通子图中的〈L〉。

为了避免当较多节点间不连通时计算出现的偏差,本文采用了另一个关于路径长度的属性——全局效率E,它能反应现实交通网络的传输效率[14]:

(3)

E的值越大,网络传输效率越高。在网络完全连接的情况下,效率达到最大值E=1。

最大连通子图相对大小G=N′/N可以测量网络的连通度[15]。在本文中可以利用他评估一个特定航空公司(或他们的组合)提供的最大覆盖范围,越大的覆盖范围能更好地满足运输要求。

上述特征参数主要对应于节点的度,实际上节点的介数也是网络的重要属性,特别在网络动力学方面,因此本文引入了介数相关的特征参数。网络极化率π[16]可以表征网络的负载均匀性,这对网络的鲁棒性具有很大的影响[17]。网络极化率定义为:

(4)

其中,Bmax是网络中节点介数最大的值,〈B〉是网络平均介数。π的值越小,网络越均匀。在本文中,网络极化率用于衡量CAMN的负载均匀性。由于介数也与最短路径长度有关系,为避免节点不连通的情况,我们分别计算各连通子图中的π。

以上这些拓扑结构参数在模糊方法建模、证据理论的数据挖掘和人工智能网络建模等当前热门研究中都必不可少[18-19],接下来我们将研究CAMN的上述结构特性。

1.2 多层网络度量指标

(5)

总度数和传统单层网络的节点度相比,它不仅反映了某机场在航空网络中的重要性,更能反映某机场在各个航空公司的运营网络中的重要程度。

oi值高的机场仅能表征这个机场在整个航空公司的运营中的重要程度,但不能表示它对于每一航空公司都重要,有可能有它在某些航空公司层里的ki值很低。为了量化各机场oi总度在各层的分布情况,总度分布参数Pi的引入很有必要[20]:

(6)

Pi为[0,1]中的值,它测量节点i的度值是均匀分布在M层之间还是主要集中在一层或几层中。当机场i所有的航线都由某一航空公司单独运则Pi=0,而仅当机场i在M个航空层中的航线数量完全相同时Pi=1。通常Pi的值越大,机场i在CAMN的参与性越均匀。

2 建模仿真过程

2.1 网络模型建立

中国航线运输多层网络(CAMN)的数据来自于中国民航数据公司提供的2018年中国春运期间2月1日到3月1日国内外近30万条计划航班信息,航线数据包括48个国内航空公司运营的国内航线和中国跨境航线。由于近年来国际航线已占到中国民航运营航线三分之一的规模,我们在选取国内航班的同时,也考虑到了中国的跨境航线[21-22]。在CAMN中,机场作为节点,两机场间的航线作为边,利用Python编程,辅助Networkx复杂网络库、Matplotlib绘图库、Numpy科学计算包等工具建立398个节点4 609条边的无权无向的多层网络。

(7)

(8)

图1展示了部分单层网络可视图,图2为多层网络构建示意图。

图1 某3个航空公司单层网络可视图Fig.1 Single layer network view of some three airlines

图2 多层网络(CAMN)模型示意图

2.2 聚合过程仿真

投影聚合演示如图3,X=48层网络可视图如图4,图中节点大小与度值成正比。

图3 网络聚合示意图Fig.3 Network aggregation schematic

图4 第X=48层CAMN网络可视图

在CAMN聚合仿真的基础之上,我们尝试着将航空公司分为两个主要类型:一个是呈中心轴辐式网络结构的大中型航空公司(由18个的大中型航空公司层组成,包含368个节点、4 553条边),另一个是点对点网络结构的廉价航空公司(由30个廉价航空公司层组成,包含252个节点、980条边)[10,25]。我们按照同样的方式,分类聚合后对比仿真结果,发现了一些有价值的结论。

3 仿真结果和分析

3.1 网络多层性分析

为了分析网络总体特征,我们首先从多层网络理论的角度,建立了M=48的中国航空运输多层网络(CAMN)模型,并绘制累积度分布函数如图5所示。

图5 节点累积度分布图

图5中横坐标表示机场总度值,纵坐标表示总度不小于此横坐标(总度值o)的概率。CAMN总度值服从双段幂律分布,这表现出机场间在航线运输作用上的异质性:少数的机场承担着较多的航线运输任务,而大部分的机场的航线并不多。我们可以从机场总度统计图(见图6)和Pi分布图(见图7)中进一步研究那些运输任务重的少部分机场。

总度值前五的机场分别是:PEK(北京首都机场)、KMG(昆明长水机场)、PVG(上海浦东机场)、CKG(重庆江北机场)和CTU(成都双流机场)。并且这些机场Pi值均大于0.85,它们在48个单层网络中的度值分布均匀,由此可以看出,国内大多数航空公司在这5个机场都有航线运营且运营数量较多。

图6 节点总度统计图

图7 Pi分布图

3.2 CAMN聚合仿真

首先,我们分析了复杂网络的关键性质:累积度分布p(k)。图8a显示了通过合并不同数量的层(X=1,12,24,36,48)而创建的4个聚合网络度分布图。可以看出,所有展示的层中都呈现异构分布特征并服从无标度网络的双段幂律分布特征,表明这些聚合网络都是由少数的度值大的节点和大量度值低的节点组成,这和多层网络呈现的特征一致。

图8 CAMN拓扑特征演变

图8b中可以看出,聚类系数C的值总体随着X的增加而增加,这表明更多的层合并导致连续有新的节点之间形成三角形,更多的航空公司合作将为旅客提供更多的长度为3的往返旅途选择。

图8c中可以看出,当X<6时,平均最短路径长度L大幅度增加,这与各层中最大连接子图之间大部分点和边不相连接有很大关系。当X>6时,新增层中新节点缓慢增加,已存在节点间新产生的边迅速增加,导致L随X增加而缓慢减小。图8d中表示网络全局效率E随X增长的关系,从中可以看出E和L有很大的关系。L是先急速上升再逐渐减小,而E是先急剧下降再逐渐平稳增加。这意味着更多成规模性的航空公司相互合作,乘客可以更有效率地运输,但并不是所有的航空公司间合作都会提升效率。

从图8e可以看出,最大连通子图比率G随着X的增加而增加。这表明随着更多航空公司层的合并,可达目的地机场数量也增加。特别是前十层合并时,G的值增加更为显著。当将10个随机选择的层合并在一起时G的均值已达60%,也就是说网络所涉及的机场覆盖率已达到60%。

图8f中,我们可以看到π的值会随着X的增加而增加,表明随着更多层被合并在一起,CAMN变得越来越不均匀。值得注意的是当X>42时,π的值的范围骤然变小,这是因为航空网络本身就由于地缘政治关系,负载不均匀[26],当运营范围各不相同的航空公司层合并到一定量时,这个特点显得异常明显。

从上述仿真结果可以看出,CAMN的结构特性中,其高聚类系数和短平均最短路径长度在多层网络聚合后较为明显,呈现为“小世界网络”。

3.3 分类别仿真对比

图9a和b分别显示了大中型和廉价航空公司聚合层的度分布p(k)。图中廉价层分布衰减相对较快且不连续,这表明廉价航空公司中度高的机场比大中型航空公司少。

图9 网络拓扑特征演变对比图

图9c显示了聚类系数C分别与大中型航空公司和廉价航空公司的层数X的关系,大中型航空公司层的C值大于廉价航空公司。这意味着大中型航空公司层有更多的节点形成三角形,也就是说,大中型航空公司承担着更多的长度为3的往返航班。

图9d显示大中型航空公司层的平均最短路径长度L总体呈下降趋势,这与欧洲多层航空网络的研究中有明显差异[10]。这是因为中国的大中型航空公司拥有大量的机场覆盖范围,它们之间的聚合使节点间新的边迅速增加而新的节点增加较为缓慢,廉价航空公司层和CAMN表现出一样的趋势。

图9e描绘了网络全局效率E与大中型、廉价航空公司的层数X之间的关系。大中型航空公司层的E值大于廉价航空公司层的值,反映出大中型航空公司的客运转移效率高于廉价航空公司。

大中型航空公司和廉价航空公司的层数X与最大连通子图比率G的关系如图9f所示。大中型航空公司的G值大于廉价航空公司的值,这意味着大中型航空公司拥有比廉价航空公司更多的可达目的地。

图9g显示了大中型和廉价航空公司的网络极化π和层数X之间的关系。能看出大中型航空公司层的π值更大,意味着相比之下的廉价航空公司的网络更加均匀。轴辐式结构网络本身相比点对点式结构更不均匀,因此大中型航空公司的π值大于廉价航空公司的值。

通过比较大中型层和廉价层,我们可以得出它们在CAMN中的不同作用:CAMN是个小世界网络,即拥有高聚类系数和短平均最短路径长度,且这一特性主要由大中型航空公司层导致;另一方面,大中型航空公司相对应的网络具有更高的乘客转移效率,更多的可达目的地和更高的连通性,但同质性低于廉价航空公司网络。

4 结论

我们利用航空公司对应为每个单层的方法广泛探索了中国航空运输多层网络(CAMN)的聚合演变特征和整体结构特性。仿真结果表明:1)CAMN总度值呈现幂律分布,总度值高的五大机场不仅承担着较多的航线任务并且总度值在各航空公司间分布均匀。2)CAMN呈现高聚类系数、短平均最短路径长度和大量的可达目的地集合特征是在各航空公司网络层逐步聚合中形成的。3)大型和廉价航空公司对CAMN的拓扑特征有不同的影响。其中,小世界现象主要由大型航空公司引发,而廉价航空公司可以使网络更加同质化。

本研究探究了中国航线网络拓扑特征形成机理和多层航线网络的内在特性,将有助于更好地认识中国航线运输网络和规划未来航空市场结构。我们将在以后的研究中将航班频率、座位数或地理距离作为权重因素,对中国航线运输多层网络进行更进一步分析,为优化航线和航空管理提供更好的支撑。

猜你喜欢

廉价航空公司航线
航空公司的低成本战略及其实施对策探讨
IATA上调2021年航空公司净亏损预测
(21)新航线
廉价月饼
太空新航线
太空新航线
航空公司客票直销的现状与分析
当人才变得廉价