机场离场交通流拥堵实证与混合预测建模
2022-09-29王思敏杨磊王宇驰徐蕾
王思敏,杨磊,王宇驰,徐蕾
(1.南京航空航天大学民航学院,江苏 南京 211106;2.民航江苏空管分局人力资源部,江苏 南京 211113)
引言
目前,离场交通流高峰时段严重拥堵已成为制约大型繁忙机场运行效率和服务品质的关键问题,主要表现为机位推出等待、离场航空器时走时停、跑道头长时间等待、离场航空器滑行时间过长等显隐式特征[1-2]。局部微观层面显现出场面热点区域运行冲突,整体宏观层面为流入交通量超出系统交通服务水平导致场面网络交通滞留度的上升[3]。离场交通流宏观基本图(Macroscopic Fundamental Diagram of Departures,MFD-D)通过建立场面网络交通量和起飞率之间的统计关系,直观表征了网络供需动力学关系,是刻画场面交通集聚行为的重要度量[4]。准确建模和预测场面MFD-D构型有助于理解场面拥堵机理,对于优化航班时刻编排,动态调度场面资源和提升机场空地协同保障效率具有重要意义。
场 面 拥 堵实 证 方 面,Simaiakis[5]基于 历 史 数 据研究了场面离场滑行航班量、跑道容量对于随后一段时间内起飞率的影响,并据此定义离场交通饱和状态N值,作为控制航班推出率的参考阈值,以求在保证容量利用率的前提下尽可能减少场面拥堵。Yang等[4]首次提出场面交通流基本图概念,分别实证了滑行链路流量、密度、速度之间的基本关系,以及不同进场率下离场需求与起飞率之间的非线性关系形态,从中观和宏观两个层面探讨了场面网络交通流特征。
场面拥堵建模方面,虽然离场需求与起飞率之间的关系模型及预测方法鲜有报道,但现有研究将航空器滑行时间建模等效于起飞率预测问题,形成了宏微观仿真、多元线性回归、排队论、机器学习等方法体系。仿真方法需输入综合系统参数,包括机场布局、运行规则、航班计划等,通过模拟场面上每一架航空器的运行状况,得到详细运行信息。主流商 业 仿 真 工 具 如SIMMOD[6],TAAM[7]和AirTop等。Dou等[8]提出了分别集成LMINET,TAAM与SIMMOD的模型,并对组合模型的性能数据进行了对比,其中包括进离港滑行延误与无扰滑行时间。Wang等[9]人根据SIMMOD仿真得到的信息,计算平均出发延误和到达延误,通过统计分析对机场系统能力进行了评估。李斌等[10]在机场地面滑行路径优化研究中,基于AirTop仿真软件对不同优化方案下的运行状况进行模拟,通过仿真得到的进离港滑行时间对优化效果进行评估。由于仿真模型需要考虑航空器运行过程中的每一个细节,制定精确的运行规则,建模综合成本较高。回归模型主要通过分析滑行时间与特征变量的相关性,使用不同回归方法进行预测。Matthew等[11]分析了滑行时间的一些主要影响因素,如场面交通量、滑行距离和停止次数等,并分别使用线性回归和对数回归模型预测滑行时间,比较发现线性模型较对数线性模型具有更高的精确度。Clewlow等[12]系统分析了影响滑行时间的主要因素,包括航空器在离港过程中起飞和着陆的航空器架次,提出了多元线性回归模型,并考虑天气状况、跑道配置、时刻等因素提出了多项式回归模型。然而,恒定不变的参数并不能很好地描述场面交通流运行的动态性和复杂性。排队模型广泛应用于早期滑行时间研究中,HusniIdris等[13]提出了一个排队模型,通过预测航空器滑出过程中的跑道队列变化,建立了队列长度与滑行时间的映射关系,没有考虑航空器之间在滑行过程中的相互作用与影响,预测性能有所提高但并不明显。机器学习近来在滑行时间领域受到广泛关注,主要采用支持向量机、随机森林和XGboost等算法。Balakrishna等[14]采用一种基于非参数强化学习的方法来研究滑行时间预测的准确性,并在坦帕国际机场(TPA)的实例研究中证明了模型具有较高的预测精度。另外,Khadilkar[15-16]提出了一种实时预测航空器滑行时间的概率模型,将滑行道看作若干链路,将航空器在该链路停车次数建模为离港航空器数量的函数,从而将航空器在滑行链路中的滑行时间建模为一个随机变量,以期提升预测的可解释性,相较于排队论和线性回归模型的精度有所提升。Li等[17]建立了时空环境深度学习的离港航班滑行时间预测模型,该模型由时间流子模型、空间子模型和环境子模型三部分组成,预测结果R2可达0.9以上,Li等人在时间流子模型中考虑了航空器数量和机场容量为变量,但航空器数量需已知预测航空器起飞时间条件下才能获得,机场容量也被其简单视为参考航班起飞前n分钟 的航 班 起 降次 数 之 和。Yin等[18]在HusniIdris队列网络基础上发展了场面宏观时空拓扑概念,建立以进离场航班的机位和跑道时间为基础的场面交通态势指标,分别采用线性回归、支持向量机和随机森林三种机器学习方法,验证结果表明随机森林模型预测精度明显优于其他模型。Du等[19]基于Yin提出了场面交通态势指标,开展了相似历史场面交通场景提取,建立了基于深度学习的滑行时间预测方法,极大提升了预测精度。赵征等[20]同样采用文献[18]中的场面交通态势指标,将XGboost算法应用于航空器滑行时间预测领域,以广州白云国际机场为对象进行实验,验证结果表明进离港滑行时间预测精度有显著提升。上述研究的关键问题在于,研究中所采用的场面交通态势指标是以航班实际起飞时间作为重要参量,与所需解决的问题相悖,即用已知的滑行时间构建场面态势指标,并用于滑行时间预测,无法直接支撑运行实践。
总体来说,仿真方法主要以理想场景为基准开展评估,建模成本高且难以融入复杂随机影响;多元回归和排队模型可以直观刻画影响滑行时间的重要参量,但预测精度往往难以满足支撑航班精细运行需求;机器学习方法可以显著提升预测性能,但往往存在模型透明度和稳定性不高等问题,难以为场面运行效率提升提供明确的优化方向。另外,机器学习和回归方法并未能强化跑道容量对于滑行时间的影响,直接将预测的滑行时间转化为起飞时间和单位时间起飞率往往出现超出跑道服务能力和终端区走廊口容量的情况。虽然机器学习与深度学习预测方法具有高精度,但其模型参数是在已知起飞时间的条件下才能获得,对于实际运用没有任何意义。因此,如何协调提升离场滑行时间预测模型的精度和可解释性水平成为目前亟待解决的关键问题。
鉴于此,考虑滑行时间建模与MFD-D建模之间的共性与差异性,兼顾离场交通流拥堵建模预测精度和可解释性能,本文以浦东国际机场(Pudong International Airport,ICAO代码:ZSPD)为研究对象,实证分析了MFD-D特征及其最佳采样时间;在此基础上,将滑行时间分解为无扰滑行时间、跑道头排队时间和滑行过程中避让冲突延误时间,集成回归分析、非稳态排队论和机器学习方法,提出一种模型和数据双重驱动的混合建模方法,“自下而上”聚合预测离港交通流宏观拥堵状态。
1 基础数据
本文以ZSPD为研究对象,开展离场交通流宏观基本图实证分析和建模研究,所涉及的基础数据主要包括物理结构、场面运行规则、历史航班计划等三大类数据。①物理结构主要包括机场跑道、滑行道和机位及其连通关系,如图1(a)所示。机场共有四条平行跑道,停机位365个,本文将以各机位与起飞跑道之间的滑行网络开展滑行时间建模。②场面运行规则主要包括跑道运行方式、同方向放行间隔标准等,是跑道队列建模的主要参考。ZSPD采用平行隔离运行模式,其中35R/17L和34L/16R跑 道 用 于 离 港,35L/17R和34R/16L跑 道用于进港;机场空域离港点7个,如图1(b)所示,其中NXD,PIKAS和SASAN对 应35R/17L跑 道;BOLEX,HSN,LAMEN和ODULO对应34L/16R跑道,相同离港点连续起飞间隔不小于2.5 min。③历史航班计划选用2019年全年数据,共有航班503800个,信息包含航班号、机位、跑道、离港点、计划和实际轮档时间、实际起飞和落地时间等,部分数据如表1所示。
表1 部分实际运行数据
2 离场交通流宏观基本图(MFD-D)实证分析
定义离场流宏观基本图(MFD-D)是指场面网络瞬时占用率N(t)(即处于离场滑行状态的航空器数量)与未来一段时间内跑道离场吞吐量(即起飞率Tn(t+dt))之间的统计关系。其中,N(t)为t时刻场面上正在离港的航空器数量,起飞率Tn(t+dt)表示时段(t+dt-n,t+dt-n+1,...,t+dt,...,t+dt+n)内 的单位时 间 起飞航空器数量,其中dt为采样时间间隔,n为采样时间跨度。
以2019年历史数据为基础,在dt≥n前提下,标定起飞率采样时间间隔和跨度的最佳组合,如表2所示,即不同n和dt选择下N(t)和Tn(t+dt)的pearson相关系数。显然,当n=10,dt=11时,pearson相关系数为0.936,N(t)与Tn(t+dt)相关性最高,从而浦东机场MFD-D为任意t时刻瞬时占用率和未来21 min内跑道起飞率之间的统计关系,如图2所示。本文后续分析与建模均采用该最佳采样参数。
总体上,机场场面交通运行分为三种状态,即A点之前:自由态;A点-B点:拥堵形成态;B点之后:拥堵蔓延态。其中,当场面航空器数量较少时,在滑行过程中航空器间相互影响和跑道系统容量限制基本可以忽略,自由态场面离港需求与起飞率呈线性关系;随着离场需求的持续增加,滑行过程中的潜在冲突与跑道容量限制作用逐渐显现,起飞率逐步逼近跑道容量极限,呈现偶发的航班时走时停和跑道头等待等交通滞留现象,起飞率增长速率明显放缓;到达B点之后延误主要来自因跑道系统或终端区服务能力饱和造成的跑道头排队等待,起飞率达到容量极限,进一步增加离港航空器数量将导致场面拥堵加深。
据此,本文将延误分为两类:由于跑道容量限制产生的延误(跑道拥堵)和由于滑行冲突所导致的延误(网络拥堵)。为提高离港交通流拥堵模型的可解释性,实现从滑行时间角度“至下而上”模拟MFDD,本文将滑行时间解构为无扰滑行时间(Free-flow Taxiing Time,FTT)、跑 道 排 队 时 间(RunwayQueue Time,RQT)和避让冲突延误时间(De-Conflict Time,DCT)三个微观参量,以此分别刻画场面跑道拥堵与网络拥堵,即:
3 模型数据融合的离场交通流拥堵建模
本文提出了一个交互式混合模型框架,如图3所示。首先,对航空器无扰滑行时间进行建模,以无扰滑行时间近似作为航空器从停机位推出滑行到跑道头的时间,以此获取航空器到达跑道队列时间,依据非稳态跑道队列模型对航空器排队时间进行求解,将无扰滑行时间与排队时间之和近似作为航空器滑行时间,获取与滑行过程有关网络态势参量,据此训练滑行网络延误模型得到航空器滑行网络延误时间;再以无扰滑行时间与滑行网络延误时间作为航空器从停机位推出滑行到跑道头所需时间,重新计算排队时间;最后由三部分之和得到预测总滑行时间。
3.1 无扰滑行时间建模
无扰滑行时间定义为最佳运行条件下的滑行时间,即在航空器从停机位推出到起飞的过程中,不存在由拥堵、天气和其他因素造成的延误[21],在本文中近似为当航空器推出时场面离场航空器为零架的滑行时间。因此,建立离港航班滑行时间与该航班推出时场面正在离港的航空器数量之间的线性回归方程:
式中τ(i)为航空器i的实际滑行时间,N(i)为航空器i推出时场面上正在离港的航空器数量,e(1),e(2),...,e(n)服从均值为0的正态分布,p0和p1为线性回归拟合参数。无扰滑行时间为:
图4为机位为90、跑道为16R的线性回归图,其τFTT=10.31。特别地,对于一些数据量较少的机位,当其回归无意义时,令其无扰滑行时间为相同或相邻机坪区域内全部数据的回归结果。
3.2 非稳态跑道队列建模
3.2.1 排队论模型
跑道系统是限制机场吞吐量的主要瓶颈,当航空器到达跑道头时若跑道被占用,则不得不在跑道口等待形成排队队列,为估测航空器排队等待时间,本文提出一个排队模型,将每条跑道看作单服务器,定义λ(t)为到达率即单位时间内到达跑道头的航空器数量,μ(t)为服务率即单位时间内跑道可服务的航空器数量,并且提出以下假设[22]:
1.航空器服务时间变量服从爱尔兰分布;
2.航空器到达跑道的到达过程是一个泊松过程;
3.将每条跑道看作一个单服务器;
4.跑道头等待的航空器服从先到先服务原则;
5.上游无限的等待空间;
6.跑道有无限的航空器会到达。
假设1将在4.1.2节进行讨论。对于假设2~6:航空器的到达是随机且独立的,则在不同时间区间上到达的航空器数量是相互独立的,且有两个或两个以上航空器同时达到跑道头的概率是很小的;另外航空器的到达数量仅与时间区间的长度有关,该过程恰好满足泊松过程的特点[23]。浦东国际机场虽然有两条离场跑道,但两条起飞跑道独立运行,且当航空器从停机位推出时起飞跑道已知,可将数据按跑道分类,将跑道看作单服务器分别对排队时间进行求解,每个服务器具有独立的服务率μ和爱尔兰阶数k;先到先服务原则是基于只要航空器进入队列排队就很难再超过已经在队列中排队的航空器这一事实;在场面极度拥堵的情况下,整个机场场面都可作为排队队列的等待空间;虽然任意时刻场面的航空器数量是有限的,但对于整个机场系统来说航空器数量是无限的。
符合上述六个假设的排队系统为M/Ek/1/∞/∞系统,表示到达的间隔时间服从负指数分布,服务时间服从爱尔兰分布,单服务台、系统容量为无限、顾客源为无限、排队规则为先到先服务的排队模型[24]。以5 min为间隔,计算航空器排队时间,传统排队论研究大多的是当服务率大于到达率的情况,即服务强度小于1,否则会导致队伍无限长而无法达到稳态。虽然在一个较长的时间段内服务率是大于到达率的,但是如果以较小时段进行分析,在大型繁忙机场实际运行过程中,尤其在高峰时刻,必定会出现单位时间内到达率大于服务率的情况,此时传统排队论不再适用。Griffith等[25]研究了关于瞬态M/Ek/1系统的求解方法,提出了明确的解析式来计算排队时间,即:
式中t为以5 min为一时段,航空器到达排队队列时的时间;a为t=0开始时正在排队的航空器数量;μ为该时段内的跑道服务率;λ为该时段内的航空器到达率;k为服务时间的爱尔兰分布阶数于是有:
3.2.2 简化模型
在实际流量管理过程中,对问题的求解速度要求很高,否则将不能为实时应用提供及时和可靠的结果。然而,采用非稳态排队论方法对航空器排队时间进行求解是非常耗时的,于是基于排队的累积行为,本节提出一种近似的求解方法:
式中N(t)为t时段开始时机场场面上所有正在离港的航空器数量,Q(t)为t时段开始时在跑道头排队的离场航空器器数量,R(t)为t时段开始时还未到达跑道头排队的正在离场的航空器数量,T(t)为t时段内起飞的航空器数量,C(t)为t时段内跑道可供起飞的航空器数量,P(t)为t时段内推出的航空器数量。
结合式(6)和式(8)得到:
由此,可以得出任意时刻在跑道头排队的航空器数量,以推出时间加上无扰滑行时间近似作为航空器到达跑道头的时间,如在t时刻开始预测航空器滑行时间,根据历史数据,可知在t时刻跑道头有Q(t)架航空器在排队,将需要预测的数据按到达队列时间进行排序,则第一架航空器到达时在跑道头排队的航空器数量即为该航空器的排队长为:
下一架到达跑道头的航空器排队长为:
以此类推,得到每架航空器的排队长,则排队时间为:
3.3 滑行网络延误建模
由于机场场面滑行过程的复杂性,对于式(1)中第三部分滑行道干扰延误τDCT很难准确估计,因此采用随机森林法对这部分延误进行预测。根据图5所示时空网络图,特征变量定义如表3所示[18]。其中,输入特征变量为SIFIs,SCFIs,AQLIs,SRDIs;输出变量为τDCT。与文献[18]不同的是,对于需要已知起飞时间的特征变量,起飞时间由下式近似给出:
表3 特征变量定义
式中Toff为近似起飞时间,Tout为实际推出时间。
这种方法弥补了直接采用随机森林进行预测最大的弊端,即用已知起飞时间计算特征变量进而预测滑行时间的悖论,有效提升了模型的实用性。
4 模型性能分析
4.1 关键参数标定
4.1.1 无扰滑行时间
无扰滑行时间主要取决于滑行距离,即停机位到跑道头的距离。将浦东国际机场2019年离港航班实际运行数据按停机位和跑道进行OD分类,使用3σ准则,即-τ-3σ≤τ≤-τ+3σ剔除异常数据,进而对全部OD对建立滑行时间与场面离场航空器数量之间的线性回归方程,得到无扰滑行时间集合。
4.1.2 排队系统爱尔兰分布阶数
跑道服务时间为航空器在跑道滑跑时间与尾流间隔时间两部分之和,但由于历史数据中没有记录每架航空器起飞时跑道占用时间与尾流间隔时间,无法直接得到跑道平均服务时间。当跑道系统高负荷运作时假设跑道头一直有航空器在排队,则起飞间隔时间可看作服务时间,进而分析服务时间分布。由图2可知N*为24时跑道系统处于饱和状态,将数据按跑道分类,筛选N≥24的数据,得到相邻航班起飞时间间隔并近似为跑道服务时间。图6为35R跑道采用爱尔兰分布对航空器服务时间进行拟合的结果。不同跑道服务时间分布阶数如表4所示。
表4 爱尔兰分布阶数
其中阶数k为:
4.1.3 跑道服务率
由浦东机场跑道构型可知,尽管运行模式为隔离运行,但存在航班滑行穿越同一侧跑道的情况,进离港容量之间仍然存在一定的相互影响。采用基于分位数回归的机场历史高峰服务能力评估方法[26],浦东机场容量包络线如图7,8所示。可知35R(17L)跑道最大服务率为7 AC/15 min,34L(16R)跑道最大服务率为8 AC/15 min。当35L(17R)着陆率大于9架/15 min,35R(17L)的15 min跑道服务率下降一个架次;当34R(16L)着陆率大于6架/15 min,34L(16R)的15 min跑道服务率下降一个架次。即跑道服务率如下式所示:
另外,除跑道容量限制外,机场空域所有离场点通行能力均为2 AC/5 min,近似看作飞往同一离港点的起飞时间间隔不小于2.5 min。本文使用此时间间隔对预测起飞时间进行修正。需要说明的是,若机场受到外围流量控制限制,仍然可以将限制转化为同方向最小起飞时间间隔。
4.2 模型性能对比
模型1:基于排队论的离场航班滑行时间预测模型[22],与混合模型相同,将滑行时间解构为无扰滑行时间、排队等待时间与滑行道干扰延误时间三部分,无扰滑行时间预测采用线性回归模型,排队时间预测采用3.2节所述非稳态排队论模型与简化模型两种。在滑行道干扰延误时间预测部分,简单将延误时间看作与场面正在滑行离港航空数量相关的量,即:τDCT=αR(t),并直接拟合系数α。
模型2:基于随机森林的离场航班滑行时间预测模型[18],采用无扰滑行时间估计航空器起飞时间,以估计表3中特征变量,将航空器滑行时间作为目标值,使用随机森林法进行直接预测。
模型3:本文提出的混合模型,与模型1不同之处在于滑行道干扰延误时间采用随机森林法进行预测,将无扰滑行时间与排队时间之和作为起飞时间获取特征值。
使用浦东国际机场2019年实际运行数据应用上述三种模型。其中2019年7月运行数据为测试集,其余数据为训练集。首先,将模型1与模型3中排队时间分别采用非稳态排队论模型(Model 1-Q,Model-S)与简化模型(Model 3-Q,Model 3-S)预测,对预测单架航空器滑行时间误差进行对比,如表5所示。可以看出在模型1中,排队时间预测采用排队论方法精度稍高但差别不大。模型3中,简化方法较排队论方法的3 min与5 min精度分别提高了11.6%与8.7%,这可能是由于模型中预测的航空器到达队列过程并不服从泊松过程。后续模型性能对比分析中模型1中排队时间计算采用非稳态排队论预测,模型3中则采用简化方法。
表5 单个航空器滑行时间误差
总体而言,模型1相较模型2精度更高但差别不大,三种模型平均误差都很低,从其余指标分析,可以更直观看出模型3明显优于其他两种模型,其中平均绝对误差减少了约3 min,误差在3~5 min之内的占比相较于另两种模型都提高了30%~40%。
图9~12均为7月10日一天数据的预测结果。图9中可以看出三种模型都能大致预测滑行时间涨落变化。图10~12为各个模型预测滑行时间与实际滑行时间的对比。模型1中散点均匀分布在直线y=x两侧但较为分散,模型2在滑行时间20 min附近有明显分解,即当实际滑行时间较小时散点多在直线上方,预测滑行时间偏大;当滑行时间较大时散点绝大部分在直线下方,预测滑行时间偏小,正负误差互相抵消,这也是其平均误差小但平均绝对误差大的原因。模型3中散点均匀且集中的分布在直线两侧,在不同拥堵程度下均有稳定的性能,预测绝对误差最小。
图13为 基 于2019年7月1日 至2019年7月31日运行数据的三种方法MFD-D预测结果。其中,误差条(图13中的“I字线”)为起飞率标准差,模型1与模型3三阶段起飞率误差均在0.02 AC/min以下,但在拥堵形成态中模型3预测精度更高,误差为0.0029 AC/min。在由自由态进入拥堵形成态并转至拥堵蔓延态过程中,模型2起飞率预测误差逐渐增大,三个阶段误差分别为0.0236,0.0253和0.0485 AC/min。特别地,当交通流进行拥堵状态时,基于随机森林的起飞率预测值大大高于跑道容量,预测结果的可解释性和合理性较弱。图14为三种模型15 min起飞率误差条形图,三种模型起飞率误差在2 AC/15 min之内均在80%以上,其中模型3预测精度最高,其次是模型1,模型3误差为0占39.81%,相比模型1与模型2分别提高了10.17%和14.32%,模型3误差在2 AC/15 min以上仅占6.34%,另两种模型均在15%以上。
表6为不同拥堵状态下的平均起飞率(AC/min)与平均滑行时间(min)。相对而言模型3预测结果最接近实际数据。在自由态阶段三种预测模型相差不太,随着拥堵状况加深,模型1与模型2预测精度逐渐下降,在拥堵蔓延态阶段,模型1与模型2平均滑行时间误差分别为2.19 min和5.49 min,模型3误差则为0.54 min;模型1与模型2平均起飞率误差为0.0131 AC/min和0.0485 AC/min,模型3则为0.0059 AC/min。
表6 不同拥堵状态下的航空器数量与平均滑行时间
5 结论与展望
本文根据MFD-D将离场交通流描述为三种状态:自由态、拥堵累积态和拥堵蔓延态,并据此将场面延误分为跑道拥堵和网络拥堵两类,采用“自下而上”方式采用滑行过程中的无扰滑行时间、容量限制排队等待时间和避让冲突延误时间三个微观参量来刻画MFD-D,进而提出了一种离场交通流拥堵预测混合模型。基于2019年浦东国际机场运行数据验证结果表明,相较于另两种基准模型,数据模型双驱动的混合离港交通流拥堵预测模型具有显著优势,滑行时间预测精度提高了约3%~40%,15min起飞率预测精度提高了10%~20%。
本文提出的混合离港交通流延误预测模型,对于机场运行管理具有重要意义,可为机场航班时刻编排提供战略层面的效果评价,也可为运行过程中进离场航班管理提供决策依据。特别是对滑行时间的解构保证了模型的可解释性,在实际运行中可以动态监控滑行时间构成要素及其影响因子的变化,从而有针对性地制定精准优化调控措施。考虑本模型计算准确性和高效性,有望纳入机场场面资源优化调度决策中,降低不确定环境下场面调度的复杂性。