春运期间中国航空网络拓扑结构实证分析*
2019-07-01徐开俊李珊珊吴佳益
杨 泳 徐开俊 李珊珊 吴佳益
(中国民用航空飞行学院 广汉 618307)
0 引 言
航空网络中节点间的航线连接显然既不属于完全规则连接,也不是完全随机连接,属于复杂网络的典型实际应用.复杂网络已经成为研究具有复杂特性的航空网络的最有效工具,在航空网络的负载特性、级联失效特性、路径优化及抗毁性特性等方面得到广泛研究和运用[1-2].
目前,借助复杂网络理论提供的统计特征指标,如度分布、平均最短路径、介数、最大连通子图、聚类系数等,对世界航空网络、北美航空网络和中国航空网络均进行了理论及实证研究,并取得了有影响力的工作.Guimera等[3]从复杂网络的拓扑结构研究出发,证实世界航空网络和北美航空网络是小世界网络,存在幂律下降的度分布和介数分布,且发现最中心的机场不一定是介数最大的节点;曾小舟等[4-5]对国内航空网络进行了实证分析,中国国内航空网络是服从双段幂率度分布的小世界网络,且网络出现以度值较大的机场为中心的群体结构; Zhang等[6-7]均针对国内航路网络与航线网络进行了实证对比分析,Bagler等[8-9]对印度航空网络进行了实证分析.
虽然这些理论和实证研究做出了许多有影响力的工作,但鲜有针对中国春运期间的航空网络进行实证研究,针对相关性方面的实证研究目的和结论也相差较大.本文针对春运期间中国航空网络的拓扑特性、度-度相关性、度-介相关性、度-聚相关性等问题进行研究,其结果可为后续进一步对中国航空网络的网络结构优化和规划建设提出科学性的合理建议.
1 复杂网络结构特征量
1.1 度和度分布
度在不同的复杂网络中所代表的具体含义不同,对于航空网络而言,节点机场度值大小直接表示机场通航航线的多少.一般情况下,某个机场的度值越大,则该机场在整个航空网络系统组织中的作用和影响也越大,反之亦然.网络中度的表示一般用平均度
(1)
p(k)=N(k)/N
(2)
(3)
式中:ki为机场i的度;N为网络机场数;N(k)为网络中度值为k的机场数.网络的平均度
1.2 聚类系数
聚类系数也是网络结构的一个重要属性,节点聚类系数表征该节点的邻居节点之间连通的概率,而网络平均聚类系数
机场节点的聚类系数可以定义为
(4)
(5)
式中:ki为机场i的度;ei为机场i的邻居机场直接连接航线的条数.
1.3 介数
介数在航空网络中能够反映机场或某条航线在网络中的影响力,可以分为机场节点介数和网络航线边介数.机场节点i的介数可以定义为
(6)
式中:nab为从机场a到机场b之间的最短路径的数量;nab(i)为从机场a到机场b的所有最短路径中经过机场i的航线数.
1.4 度-度相关性
度-度相关性指标描述的是节点之间根据度值作为相互之间连接的选择偏好性,通常通过比较度为k的近邻节点度和计算网络的同配性系数进行分析.机场i所有邻近节点j的近邻平均度定义为
(7)
将网络中度为k的所有节点N(k)的邻节点的knn,i进行平均得到“度为k的节点近邻平均度”,为
(8)
式中:ki为机场i的度;V(i)为机场i的邻近机场集合;ki为机场i的度;N为网络机场数;N(k)为网络中度值为k的机场数.
网络同配系数能够刻画网络中所有机场度倾向性的互连模式,是广泛使用的节点度相关性指标,可以定量刻画网络的同配混合性,它定义为
(9)
式中:M为网络中机场总边数;ji和ki分别为第i条航线连接的两个机场的度.从同配系数的定义满足-1≤r≤1:当r<0时,度大的机场倾向于和度小的机场建立航线,此时的网络是度-度负相关的,即航空网络是异配网络;而当r=0时,网络为中性网络;当r>0时,网络中度大的机场倾向于与度大的机场相连,度小的机场倾向于和度小的机场相连,此时的网络称为同配网络,或者说网络是度-度正相关的.本文中FCAN网络r为-0.43,表明网络整体呈现度-度负相关性.
2 网络构建及分析
2.1 数据来源及网络构建
复杂网络是由许多表示个体的节点和表示个体之间关系的连接边组成,航线网络的节点由机场组成,而边由直飞的航线组成.本文研究最新基础统计数据来源于民航数据通讯公司,统计了2018年1月22日—2月22日之间所有国内民用航空航空公司实际执飞的所有起点和终点均位于国内的直飞航线数据.
整个春运期间中国国内航空网络(festival chinese airline networkx, FCAN) 包含226个机场构成的节点,2 479条实际航线构成的边,而所有相关机场节点的经纬度是借助电子飞行包(EFB)查询各个机场ARP点获得.数据经过收集、统计、分析、整理后,利用Python编程,辅助Networkx复杂网络建模工具、Matplotlib绘图库、Numpy科学计算包等工具构建中国航空网络,网络结构图见图1.
图1 CAN网络结构图
2.2 拓扑特性分析
利用Python编程计算FCAN网络的度分布及机场节点的度分布、累积度分布及重要指标的散点图,见图23.
图2 FCAN分布图
图3 机场度值和介数统计
图2为FCAN的度分布及累积度分布,横坐标k为度值,纵坐标p(k)为该度值对应的机场数占整个FCAN网络中机场总数的概率.由图2可知,FCAN网络的度/累积度分布均符合幂律分布规律的,说明网络具有典型的无标度特征.进一步观察FCAN网络的度/累积度分布图,反映出FCAN节点服从双段幂率分布,绝大部分机场度值小于22,而度值大于22的机场仅占机场总数的20%,且分布在度值22145的广大范围内.
图3为显示FCAN网络中各机场节点度和介数的值分布情况,由图3可知,FCAN网络中有相当大部分机场的度和介数为0的孤立支线机场,而度值较大或运输能力强的航线占比较少,说明我国航空运输潜力还有待进一步挖掘.
2.3 相关性分析
图4为FCAN网络所有机场介数-度值分布关系,由图4a)可知,介-度呈现较明显的指数相关性,但乌鲁木齐机场ZWWW哈尔滨太平机场ZYHB介数明显较大,因为ZWWW机场是西北航空枢纽和中转中心,而哈尔滨作为东北的重要航空枢纽和中转中心,近年来经济发展和航空运输均呈现迅猛发展;由图4b)可知,介-度在总体正相关趋势下,在度值较小时呈现出较大的“波动性”,这与文献[7]世界网络表现出相似的特性.
图4 机场介数-度相关性分布图
图5为FCAN网络的聚类系数-度相关性.由图5a)可知,聚类系数与度的关系可以近似表示为c(k)~k-α,说明网络具有明显的层次性,即航空网络可以按照某种规则划分为明显的层;由图5b)可知,在大部分区域(k>10)内,FCAN具有明显的聚-度负相关性,说明度小的城市比度大的城市更倾向于集聚成团,而(k<10)时由于大部分孤立机场的存在使得聚类系数保持在常量1.0附近.
图5 机场聚类系数-度相关性分布图
图6为FCAN网络的近邻节点平均度knn(k)-度相关性.
由图6可知,当k>10时呈现明显的负相关性,说明度大的节点倾向于连接度小的节点;但当度值较小k<10时,knn(k)并无明显规律,几乎是常量,这与文献[3]对北美航空网络的研究结果相似,区别在于Barrat的研究结论显示趋势拐点在于度值k=30附近,笔者认为这主要是由于航线网络的规模和连通性共同决定.能否进一步将这种拐点的度值用于表征不同经济发展水平国家的航运能力及网络规模,还需要进行大量的实证资料和更深入的研究.
3 结 束 语
FCAN网络是具有较短的平均路径长度和较大的聚类系数的小世界网络,即节点度/累积度分布均满足双段幂律分布规律的,度值大于28的机场仅占机场总数的20%左右,具有典型的无标度特征.介-度总体呈现较明显的指数相关性,在度值较小时呈现出较大的“波动性”;聚-度相关性表明网络具有明著的层次性且在大部分区域(k>10)内网络呈现明显的聚-度负相关性,即表明度小的城市比度大的城市更倾向于集聚成团;近邻节点平均度kn,n-度相关性表明,当k>10时呈现明显的负相关性,但度值较小(k<10)时,kn,n几乎是常量.