APP下载

空中交通延误预测研究综述

2022-03-11王春政胡明华

系统工程与电子技术 2022年3期
关键词:空中交通航班机场

王春政, 胡明华, 杨 磊,*, 赵 征

(1. 南京航空航天大学民航学院, 江苏 南京 211106; 2. 国家空管飞行流量管理技术重点实验室, 江苏 南京 211106)

0 引 言

近年来,随着空中交通需求量的增加,国内外空中交通系统均面临巨大压力,由此造成了严重的空中交通延误。据民航局统计,2015-2019年间,全国客运航班平均正常率为75.71%,平均延误时间为18 min,其中2015年客运航班的正常率仅为68.33%,平均延误时间超过20 min。根据美国交通运输统计局统计显示,同时期的美国主要航司的航班准点率也仅为79.99%。虽然受新冠疫情影响,全球空中运输出现下滑趋势,延误率出现短暂下降。但随着疫情的恢复,国内外航空业逐渐回暖,空中交通需求仍具有强劲增长势头。因此,航班延误问题仍是未来一段时间内所面临的重要挑战。

航班延误影响旅客行程的同时,还对国民经济造成巨大损失。据统计,2013年航班延误给我国间接造成约3 500亿元的经济损失;2007年美国由于航班延误造成的经济损失约33亿美元。此外,空中延误的发生还造成了额外的燃油消耗,增加的碳排放量亦加重了环境负担。缓解延误,降低延误损失成为空中交通管理中亟待解决的问题。

虽然空中交通服务能力下降引发的容需不平衡造成了不可避免的延误的发生。但空中交通管理者在准确获知未来延误信息的情况下,提前部署空中交通流量管理策略,则可有效降低延误损失。此外,通过探明容量波动引发系统延误的变化,可为战略阶段部署基础设施提供有效支撑。因此延误预测对于指导战略规划和战术运行均具有重要意义。

空中交通系统由机场、航空公司、空中交通管制单位等实体组成,属典型复杂系统,其内部各元素的交互作用构成了系统的非线性聚合的动力学特征。空中交通系统的复杂属性给延误预测问题带来挑战。为此大量学者应用多种方法展开延误预测问题的研究。Sternberg等回顾航班延误预测研究现状,但仅对延误预测方法做出划分,缺乏关键方法必要的方法阐释与对比。刘博等结合国内研究现状,亦对航班延误问题进行了综述,但在方法上,仅考虑了统计推断、仿真与建模和机器学习方法3种方法,缺乏部分关键研究方法的系统性分析,未对各种方法包含的模型进行纵向对比。罗凤娥等仅对基于数据挖掘的延误预测方法进行了综述。鉴于研究快速发展的趋势,因此有必要结合国内外最新研究成果,系统性深入回顾空中交通延误预测研究现状,纵横向分析其方法特点,从而洞见研究趋势,辨明未来研究方向。

为此,本文应用分类学方法,从预测延误的类型以及延误预测方法等方面展开综述。第1节阐述了延误的生成与传播机理,第2节对目前研究中的预测的延误类型进行划分,第3节对比分析了国内外延误研究预测方法,第4节总结了空中交通延误预测研究趋势,并结合各类算法的特点探讨了未来发展趋势,最后对本文进行总结。

1 延误的产生与传播

一般而言,航班延误的研究对象侧重于重个体航班的延误水平,而空中交通延误除了涵盖个体航班的延误外、还包括了以机场(对)、航路、或航空公司等为单位的延误状况。但空中交通延误仍然由其运行的航班所引发。为明确规范两个术语的使用,本文根据使用场景,适应性选择了不同的表达方法。

航班延误通常定义为计划起飞到达时间与实际起飞到达时间的差值。作为衡量空中交通系统运行性能的关键指标,一般将15 min作为划分航班延误的延误依据,即航班晚于计划15 min起飞或到达时,视为航班起飞到达延误。

空中交通系统属于多方参与、资源共享的典型复杂系统,多种原因造成了空中交通延误的发生。如图1所示,根据延误统计结果,可将延误归因为天气、航空公司、空管(含流量原因)等几类主要原因。一方面机场容量易受天气影响,恶劣气象条件造成机场容量下降,导致容需不平衡,引发航班延误。另一方面,航路上的恶劣气象条件会导致总飞行时间门到门时间延长,增加了到达延误发生的概率。此外,研究表明慢发天气对延误也存在不同程度的影响。当飞行量超过区域或终端区扇区保障能力时,为保障空中交通的整体流动性,实时空中交通管制措施的实施造成了部分航班的延误。

图1 航班延误因果图Fig.1 Cause and effect diagram for flight delays

除空中延误因素影响外,地面等待策略的实施以及地面保障资源的限制,可能增加额外航班地面服务时间,造成地面延误。地面等待策略是指当航班到达机场容量下降后,不能在指定时段为航班提供到达服务时,通常在出发机场实施地面等待,从而将空中延误转化为地面延误,以减小延误损失。此外,廊桥机位(近机位)等地面资源的缺乏以及场面交通流的拥堵将使航班产生附加的滑行时间或服务保障时间,进而产生航班延误。除上述因素外,维修或机组等航空公司自身资源管理问题导致航班难以按时起飞时,亦造成了航班延误。

天气、航空公司、空管(流量)、机场保障等原因引发航班产生初始延误后,由于航班之间的连接性以及航空器、机组、机场等资源的共享性,致使延误再次传向下游航班,造成了延误传播现象。延误传播成为空中交通延误的另一主要因素。在航班计划制定阶段,航空公司一般会通过增加其计划飞行时间与周转时间,利用缓冲区吸收航班的延误。但当延误过大,超出缓冲区负载时,后续航班将发生难以避免的延误。另外,就系统层面而言,航司与机场在提升自身资源利用率的同时,降低了系统的鲁棒性,致使出现小范围的延误不断扩大,形成“雪球效应”,加剧了延误在空中交通网络内的传播。

2 延误预测类型

依据不同指标,对空中交通延误预测涉及的类型进行划分有助于系统性理解延误类型的差异,采用针对性方法展开基于目标导向的延误预测研究。本文根据延误结果的数值类型,将延误分为连续型延误与分类型延误;根据预测对象的差异,将延误预测类型分为个体延误与聚合延误;根据延误预测对象的时间尺度,将延误分为战术型延误和战略型延误。

2.1 连续型/分类型延误

在航班延误相关定义中,航班延误一般以15 min为界限进行划分,即实际起飞/到达时间超过计划起飞/到达时间15 min时,视为航班起飞/到达延误。延误预测研究中,数值延误以连续型数值作为延误输出变量,分类延误是按照延误相关等级作为输出变量。

连续型延误输出结果精细程度较高,能够为机场、航空公司与空管部门协同决策,实施精细化策略提供必要信息支撑,从而降低延误损失。由于航班延误受多种复杂因素的影响,难以实现数值延误的绝对性精确预测。在数值延误预测研究中,一般采用均方根误差(root-mean-square error,RMSE)和平均绝对误差(mean absolute error,MAE)衡量延误预测精度。

(1)

(2)

式中:分别表示延误的预测值与实际值。由式(1)和式(2)可见,MAE对所有误差给出相同的权重,而RMSE对绝对值较大的误差给出的权重大于绝对值较小的误差对应的权重。MAE与RMSE在衡量模型性能时具备不同的优势,采用多种指标综合对比分析的方法更能客观度量模型性能,但当预测误差预计服从高斯分布时,RMSE更能体现模型整体精度。

相对于连续型延误变量而言,分类型变量对于理解延误程度更具直观表现形式。正确率常作为衡量分类型延误模型的性能指标。在建模过程中,合理分类设置延误等级阈值对理解延误程度以及衡量模型精度至关重要。一方面延误分类结果要根据实际运行的需要,保证分类结果的易理解性。另一方面,分类结果对预测精度具有重要影响。尤其在不平衡数据集中,合理分类是保证客观衡量预测结果的重要前提。例如在二分类延误预测问题中,假设延误数据集占10%,即使预测精度达到90%,依然难以直接认定预测模型具有较高的预测精度。目前分类型延误预测研究中,多采用15 min,30 min,60 min 作为二分类问题的延误阈值。

此外,为使预测结果与空中交通系统的随机性因素相融合,部分学者重点考虑系统的不确定性特征,展开了概率型延误估计的相关研究。其预测结果为对应延误量级下的概率值。

2.2 聚合/个体延误

根据延误的主体携带者,可将延误分为个体延误与聚合延误。具体而言,个体延误以单个航班为对象,聚合延误以单/多个航司、机场、机场对乃至整个空中交通系统为统计对象。

在空中交通运行中,旅客与航司通常更加关注个体航班的延误程度。乘客会视航班延误程度,对未来行程做出规划。单个航班的延误程度,对整个公司后续的运行具有重要意义。航空公司会权衡航班延误与取消的经济损失、社会影响等,以便对未来运行做出决策。在协同决策运行条件下,这些决策结果将直接或间接影响与其共享资源的航班运行。但考虑到空中交通中各要素的交互作用,资源共享,即使以单个航班为预测对象,仍然需要考虑整个系统内个体的运行状态以及环境状态,以保证预测精度。

虽然聚合延误是系统主体内的航班个体综合作用的结果,鉴于空中交通系统的复杂性,涉及众多要素,很难精确预测单体航班延误状况,由此产生了以聚合延误作为响应变量的相关研究。虽然聚合延误忽视了主体内个体航班的微观差异,但其模糊式的处理方式使得建模过程更容易聚焦影响延误的主要因素,简化建模过程与问题复杂度。预测结果有利于空中交通管理者和参与者整体理解系统性延误演化趋势。

2.3 战术型/战略型延误

战略流量管理是指在运行前一周至数月所采取的措施,战术阶段是在运行当日采取的方案和措施。本文沿用“战略”“战术”在空中交通流量管理中所表示的时间范围含义,指代延误预测的时间尺度,将延误类型分为战术型延误和战略型延误。

战术型,又可称实时型延误,预测时间一般为2~8 h,其研究更加注重气象条件等外界环境波动对系统运行的影响。预测结果对指导流量控制决策,制定减少延误、取消和其他成本的策略具有重要意义。由于战术延误预测及时性需求,对模型的运行时间具有较高要求。因此,当模型运行长达数小时,则难以满足战术阶段的流量管理需求。

当考查系统基础设施和内部要素变动引起网络运行的变动时,常以可能导致的延误时间作为系统性能的重要度量指标,此时的延误可称为战略型延误。尽管战略阶段规划的运行方案还未执行,但在一定程度上可预见部分延误的发生。航班时刻分配是战略流量管理阶段最常用的规划手段。在航班时刻制定过程中,常以航班延误作为关键的优化目标。此外,战略型延误估计对探明新增机场/跑道、改善空域结构引发的系统整体性能影响方面具有重要参考意义。

3 研究方法

空中交通网络系统的复杂特点保持了延误预测问题的开放性。研究目的、面向对象与问题特点促进多种方法应用于空中交通延误预测问题。综合国内外研究文献,如图2所示,可将主要研究方法分为基于历史数据的延误预测方法、运筹学方法以及复杂网络方法3类。

图2 空中交通延误预测方法分类Fig.2 Classification of air traffic delay prediction methods

3.1 基于历史数据的预测方法

空中交通系统每日运行产生大量数据,包括航班运行时间节点、气象信息等。海量运行数据的支持为应用传统机器学习、深度学习、概率模型等方法研究空中交通的复杂延误现象提供了可能,丰富了空中交通延误预测手段。

3.1.1 传统机器学习方法

机器学习是人工智能和模式识别领域的共同研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。传统机器学习的研究方向主要包括决策树、随机森林、贝叶斯学习等方法,其中贝叶斯网络和随机森林被大量应用于空中交通延误预测。

贝叶斯网络是表示一组随机变量之间的概率关系图形,主要由有向无环图和概率表组成。贝叶斯网络为表达子系统的内部行为和子系统之间的相互联系提供了一种简洁方式,成为研究复杂系统中多种因素相互依赖性的重要工具。通过贝叶斯网络与传统统计方法相结合时,可以利用条件独立性假设,为预测或分类问题提供更准确的估计,为分析系统微观和宏观层面的现象提供了可能。2005年,为分析网络节点的延误传播作用,Xu等构建了最早的贝叶斯机场网络模型。该模型基于芝加哥奥黑尔国际机场(简称为ORD)、纽约拉瓜迪机场(简称为LGA)和亚特兰大杰克逊国际机场(简称为ATL) 3个机场构建,数据来源于美国联邦航空管理局,包含了2003年11月-2004年1月的航班运行数据。模型基本结构如图3所示。

图3 基于贝叶斯网络的机场延误传播图Fig.3 Airport delay propagation graph based on Bayesian network

模型纳入天气、时间、航班数量对ORD的影响,由此产生的起飞延误输入至一定时间后的ATL延误节点。网络图的右下方基于类似原理构建。分析结果表明,ORD和LGA的延误分别经过1.75 h和2.5 h后传播至ATL,并且ORD对ATL的影响远远高于LGA。虽然模型仅考虑了美国国家空域系统(national airspace system,NAS)中的3个机场与简化的影响因素(天气、取消航班的数量),但其结果所呈现的直观、清晰的延误传播效应为后续基于贝叶斯网络的延误分析提供了引导。

此后,Xu等利用贝叶斯网络分析了延误因素与各航段延误的影响以及各航段延误之间的内部作用关系,并研究了机场对航空运输系统中传播的延误的“弹性”,确定了机场延误吸收的能力取决于计划的周转时间(特别是地面缓冲时间),并比较了不同机场的延误吸收水平在机场延误传播的程度差异。李俊生等利用贝叶斯网络,以北京首都机场为中心节点,研究了其与国内其他网络节点的延误传播效应。曹卫东建立了优化算法与贝叶斯相结合的延误预测模型,通过与传统结构算法对比表明改进贝叶斯网络模型的有效性。刘玉洁利用贝叶斯网络探索了航班延误预测中的运行时间与精度问题,并提出了改进的贝叶斯网络模型,预测结果表明网络的预测准确率和运行速度均可得到有效提升。近年来,吴薇薇等利用贝叶斯网络模型分析了航班运行条件与航班延误的关系,并基于此开展航班计划优化研究。Wu等阐述了延误传播模型的重要作用,并指出现有基于延误传播树的研究主要聚焦于单个航空器或两个机场间的延误传播,未考虑乘客连接;并且延误传播树与延误乘子模型中独立同分布的假设不符合实际情况。基于此,Wu等人重点考虑了资源连接,包括航空器、机组等以及乘客连接,结合延误传播树与贝叶斯网络建立了延误传播模型。模型主要用于探讨航空公司网络的延误传播效应,重点分析配置资源对延误的影响。聚焦于空中交通网络中单个节点的运行细节,Rodríguez等考虑气象、航班信息、机场构型等因素,建立了基于机场节点的贝叶斯网络到达延误和拥堵预测模型,旨在提升进港排序辅助决策系统运行效能。实验结果表明到达过程的饱和水平、当日时间以及气象状况将影响机场延误水平。虽然贝叶斯网络能够有效分析网络传播效应,但在构建过程中需要大量先验性知识。基于小规模探索分析时,尚且包括众多复杂变量与预处理过程,因此扩展至全网进行系统性研究时,其繁杂变量的处理过程给实际执行带来挑战。

如图4所示,随机森林组合多棵决策树做出预测,其中每棵树均基于随机向量的一个独立集合的值产生,是一类专门为决策树分类器设计的组合方法。将分类树替换为回归树,将类别替换为每个回归树预测值的加权平均,能够将随机森林分类算法转化应用于回归问题。研究表明,随机森林算法的预测误差能够收敛到泛化误差,从而有效避免过拟合的产生。在应用中,随机森林能够自动生成变量的重要度,对训练数据中的异常值具有低敏感性特征,当变量数量多于样本数时仍能够发挥良好的性能。

图4 随机森林示意图Fig.4 Schematic diagram of random forest

2014年,Rebollo等通过事先定义的系统延误状态,综合考虑了时空解释变量,通过随机森林分类和回归算法实现了NAS中关键机场对的延误预测。算法中的解释变量由分类变量和连续变量构成。在建模过程中,分别利用Kruskal-Wallis参数方差分析检验和多重比较检验以及随机森林算法自身评估类变量和连续变量与延误的相关性。检验分析后,形成如图5所示的时空解释变量。

图5 随机森林算法解释变量Fig.5 Explanatory variables applied to random forest algorithm

其中,时间变量中的当日时间为一天中整数时刻,属于分类变量;星期为含有7个类的分类变量;月份则划分为1~5月,6~8月,9~11月和12月三类。空间变量中,NAS延误状态为事前通过k均值聚类算法获得的6类延误状态;不同的延误状态对该日的影响程度不同,该日与前日延误状态用于解释延误的原因,该日延误状态假设为已知量,前日延误状态还包含了延误的时延性。针对100个机场对的延误预测测试中,分类算法被解释变量以60 min为延误阈值进行划分。预测结果显示:在分类型延误预测中,两小时预测区间的精度为81%;在连续型延误预测,即回归建模中,误差为21 min。

Belcastro等定义延误阈值后,考虑了机场对,计划到达时间,以及两个机场前后数小时的天气特性,包括天气特征,能见度,湿度,风向,风速等因素,测试了C4.5、支持向量机(support vector machine, SVM)、随机森林、随机梯度下降、朴素贝叶斯、逻辑回归等分类算法预测单个航班延误时的性能,结果表明随机森林在精度与召回率方面呈现出优越性能。另外,为充分发挥数据预处理对于提升算法性能关键作用,Belcastro等人采用随机欠采样方法处理了不平衡数据集问题。Choi等应用决策树、随机森林、自适应提升、k近邻算法,考虑航班计划与气象信息,预测了航班二值延误(准点或延误)情况,并重点分析了航班计划、气象、采样技术的应用对算法性能的影响。通过十折交叉验证结果表明,随机森林在上述算法中具有最高的预测精度。Gui等考虑了广播式自动相关监视系统数据、气象条件、航班计划、机场信息等,应用随机森林算法构建了单个航班延误的分类和回归模型,并验证了随机森林回归在解决过拟合问题时优于长短期记忆网络算法的特性。综上,虽然随机森林算法在预测性能方面具有显著优势,尤其随机森林算法的重要度输出,给理解延误诱发因素提供了直观度量与分析方法。但由于其基于数据的固有特性,即对历史数据的高度依赖性,致使空中交通发生大尺度变化时,如大型机场开航,历史数据量的缺乏致使其难以应用。

此外,郭野晨风等考虑了气象因素,引入简化的天气影响交通指标,分别采用多元线性回归和反向传播(back propagation,BP)神经网络对国内两个机场进行了延误预测。为表征延误与其影响因素的高度非线性关系,Xu等利用多元自适应样条回归方法构建了全美34个业务发展伙伴关系机场的聚合延误预测模型。相关变量以15 min内的统计量为基础,实验结果表明模型能够有效预测机场的延误生成和延误吸收值。徐涛等将延误航班量作为延误等级,基于增量式排列SVM算法对机场航班延误预警进行预测,验证结果表明算法能够满足在线预警要求。罗赟骞等在利用相空间重构理论分析航班延误时间的基础上,结合预测航班的下游机场的历史运行数据与预测日的上游机场的航班运行数据,采用SVM回归(SVM regression, SVR)方法构建航班延误预测模型,实验表明融合差分进化算法的模型能够有效预测航班延误。除航班起降机场因素外,罗谦等针对机场群延误问题,重点考虑了航空信息网络内其他机场因素的影响,采用SVR方法建立了延误预测模型。陈海燕等将上游延误作为当前延误状态,将其他不确定因素引起的延误作为随机延误,建立了航班延误状态空间模型,为构建动态数据驱动的航班延误预测系统提供了模型基础。何洋等在挖掘出机场单位小时流量对航班延误影响的基础上,利用洛杉矶机场与上海浦东机场的航班运行数据训练了SVR模型和多元线性回归模型。实验结果表明,SVR模型能够更为准确地预测航班延误趋势。与单一预测方法不同,王语桐等将SVR和线性回归相结合,开发了航班延误组合预测模型,并验证了模型的有效性。

3.1.2 深度学习方法

深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征。目前,深度学习在图像识别、语音识别、机器翻译等各种机器学习任务中都取得了显著的进步。受这一模式巨大成功的启发,已有部分研究者尝试将深度学习算法应用于空中交通领域的数据分析问题中。近年来,深度学习算法作为机器学习的延伸,也被应用至空中交通延误预测研究。2016年,Kim等研究了深度学习模型在空中交通延误预测任务中的有效性。通过基于深度学习范式的多模型结合,建立了长短时记忆循环神经网络(long short-term memory recurrent neural network,LSTM-RNN)架构用于预测分类的航班延误。模型纳入了航班数据、天气数据等,并在美国多个机场进行了测试,结果证实在深度学习的延误预测中,预测精度随着结构的加深而提高。传统神经网络通常借助1-N编码方法处理名义变量,此方法有可能引发多重共线性的产生,从而降低算法性能。为解决此问题,Khanmohammadi等提出了一种多级输入层人工神经网络(multi-level input layer neural network,MLILNN)用于预测航班延误。网络训练时将时间、航班信息、延误原因作为解释变量。在纽约肯尼迪机场的实验结果表明,MLILNN在预测误差和训练神经网络模型所需的时间方面都优于传统的反向传播方法。航班延误是由多种复杂因素导致,为提供预测精度考虑大量因素时,将产生高维数据,处理不当时易引发维灾难,降低模型性能。聚焦于此问题,Yu等提出了一种深度信念网络(deep belief network,DBN)和SVR结合的方法(DBN-SVR)用于预测航班延误。在DBN-SVR模型中,DBN主要用于提取对航班延误有实际影响的主要因素,降低输入维数,消除冗余信息,其输出作为SVR模型的输入,从而生成航班延误的预测值。模型以北京首都机场为实例进行验证,结果表明航路状况和机场拥挤程度等新因素的纳入对航班延误预测的准确性具有重要意义。为实现最新航班数据的有效利用,王慧等通过动态设置训练集,建立了三层神经网络模型,能够实现单个航班的有效预测。吴仁彪等结合卷积块注意力模块(convolutional block attention module, CBAM)与压缩网络(CondenseNet)建立了CBAM-CondenseNet航班延误预测模型,实现了航班延误等级预测。

3.1.3 概率模型

概率模型是对随机现象的数学表示,由其样本空间、样本空间中的事件以及与每个事件相关的概率定义。在延误预测研究中,概率模型一般输出延误等级的概率值。2008年,Tu等提出了一种结合非参方法与混合分布模型的航班起飞延误估计算法。模型未直接考虑天气状况、需求变动、航空公司等因素,而将诸多因素简化为季节趋势、日变化模式和随机残差3个变量。在非参方法中,利用平滑样条方法估计航班延误的季节和日变化趋势;混合分布模型用于估计残差。模型如下所示:

(,)=()+()+

(3)

式中:(,)表示航班在季节、时间的延误值;()表示延误的季节趋势;()表示日变化模式;表示随机误差。利用混合分布函数对参数拟合后,可计算航班的延误概率。在丹佛机场的测试中,该模型具有良好的拟合优度和模型参数选择的鲁棒性。Boswell等通过概率密度函数表达延误类别,使用状态转移矩阵验证了前后序航班之间延误传播效应。模型能够通过条件概率模型,在给定前序航班延误值的情况下计算航班的取消概率。为对美国航班延误进行全面表征以及延误分布对比分析,Mueller等汇总全美机场的历史延误数据,讨论了航空器、航空公司营运、程序变化及流量对应航班延误影响。通过最小二乘法调整数据的均值和标准差,实现了离场延误和到达延误的有效拟合。实验结果表明航班离场延误服从泊松分布,而到达延误则服从正态分布。在Wong等提出的生存模型中,分析气象、航班计划等因素对航班延误的影响,结果输出包含了各因素对延误的贡献程度以及延误航班的恢复可能性,但未给出航班延误预测值。

如表1所示,上述基于历史数据的延误预测算法呈现出不同优势。总体而言,目前仍缺乏一种行之有效的统一框架为复杂的空中交通延误预测提供方法参考。但在面对海量历史数据时,根据研究需求,采用多种方法对比试验是产生高精度预测结果的有效方式。

表1 基于历史数据的延误预测方法总结

3.2 运筹学方法

基于深度学习/神经网络的算法能够实现延误预测,并且在一定程度上能够达到可观的精度,但由于各变量间隐含的表示关系,使得相互作用效应难以理解,黑箱属性的使预测结果缺乏可解释性。因此,在实际应用研究中,提出了大量基于仿真与排列理论的运筹学方法。

国家空域系统性能分析工具(national airspace system performance analysis capability,NASPAC)是MITRE CAASD开发的最早的NAS仿真模型之一,NASPAC的核心部分基于离散时间仿真模型开发,主要功能为通过计算延误,探明容量限制区域,分析新建机场、跑道关闭、新增航班等要素调整后的系统性能,模型结构如图6所示。

图6 NASPAC 框架图Fig.6 Architecture of NASPAC

模型主要考虑了机场,进离场点,航路扇区,流控区等空间容量,其中机场容量由包络方法进行设置,过点时间根据航空器性能与常用航路进行计算。数据输入后,由预处理模块生成NAS描述文件和系统需求文件。NAS描述文件用于表达NAS系统的空间属性,需求文件表明系统目标。两者相结合后输入至离散事件仿真模型,通过捕捉空中交通控制网络内单个航空器的行程,分析系统层面问题。此外,MITRE CAASD还开发了详细政策评估工具(detailed policy assessment tool,DPAT),其功能与NASPAC类似。DPAT将NAS概念化为一个容量受限的资源网络,由机场、航路扇区和航路点组成。与NASPAC不同的是,DPAT在航路部分主要基于排队理论构建,通过服务时间表示航空器的空间位置移动。在机场容量设置中,DPAT采取了与NASPAC一致的方法。LMI与NASA基于排队网络合作研发了LMINET,其中包含了美国64个机场,终端雷达进近管制扇区以及航路中心管制扇区。在模型中,各站点服务时间均是通过排队获得。与NASPAC和DPAT不同,LMINET详细考虑了航班在地面滑行、最小周转时间。模型中所有过程均是通过排队模型实现,机场容量在模型中由帕累托边界获得,并通过服务率发挥作用。由于LMINET没有纳入航空器行程信息,使其难以精确输出单个航班的延误状况、捕捉其延误传播效应。为弥补LMINET在延误传播和航班延误预测方便的不足,Long等开发了LMINET2。LMINET2详细考虑了航空公司控制中心和空中交通管理者可能的运行策略调整、地面等待程序等。在解决航班周转时间和航行时间时,分别采用了分位数设置方法和“计划时间减去缓冲时间”方法。模型通过排队理论输出机场聚合延误,然后根据航班计划,计算单个航班延误。同样基于排队论,Pyrgiotis等在Odoni等多年研究的基础上,构建了近似网络延误(approximate network delays,AND)模型。AND由排队引擎和延误传播算法两个子模型构成。其中,排队引擎是一个随机动态排队模型,主要用于计算单个机场的延误;延误传播算法主要用于更新航班时刻表及实时容量,从而发挥网络中延误传播的功用。

此外,Fleurquin等基于Agent构建基于数据驱动的全美机场网络延误模型。由于模型的系统参量设置中采用了事前标定方法,其功能主要局限于延误传播效应分析,而无法应用于面向战术的实时延误预测。为此,王春政等结合数据挖掘与复杂系统建模方法,构建基于Agent的机场网络延误预测模型。与上述Agent架构不同的是,该模型中的关键参数通过数据挖掘方法获得,并详尽考虑了天气、航空公司等主要延误因素。

总结上述延误预测工具、方法特点如表2所示。在构建过程中,以机场容量为代表的关键参量设置是各种模型所需考虑的关键问题。在预战术/战术流量管理阶段,更具时效性的参数是保证模型预测性能的关键。但在现有研究中,仅部分模型简单考虑了气象条件等环境变量。具体而言,机场容量仅就目视与仪表气象条件做出区分。同样为仪表气象条件下的机场容量,在实际运行中的不同天气特征下仍然存在较大差异,因此在容量参量标定时仍存进一步细化的空间。此外,基于航空器性能的过程时间设置方法虽然能够在一定程度上确保飞行时间精度,但由此带来的巨大计算时间消耗显然不适用于战术流量管理阶段的及时性需求。另外,基于排队过程的方法难以区分各航空器性能造成的差异。虽然部分方法探索了计划时间中的缓冲量级,能够将各航班视为差异化对象,但此方法显然缺乏天气等动态因素的考虑。因此,除建模方法外,有必要探索参数设置对模型预测性能的影响,从而进一步提升在战术阶段预测的准确性。另外,AIRTOP、SIMMOD、TAAM等工具亦常用于空中交通流量管理中,与上述模型不同,这些工具中考虑了更细致的网络构建与航空器性能,其功能主要侧重于容量评估以及考查由新技术引发系统性能改变。因此,当纳入个体交互作用,面向空中交通网络进行延误预测时,长达数小时或数天的执行时间使得输出结果在战术层面的空中交通流量管理中缺乏时效性。

表2 基于运筹学方法的延误预测方法总结

3.3 复杂网络理论

除上述方法外,近年来以传播模型为代表的复杂网络理论被逐渐用于空中交通延误相关研究中。2016年,Baspinar等基于传染病模型建立了机场延误传播模型和航班延误传播模型,分别用于计算机场之间和航班之间的延误感染率和恢复率。虽然模型能够在一定程度上探索延误传播规律,但单纯的传染率参数,难以定量、直观分析航班受传播的延误影响后的延误程度。武喜萍等结合负荷容量级联失效模型和传染病模型建立了空中交通延误传播模型,并通过北京首都机场、广州白云机场以及深圳宝安机场验证了模型的有效性。张兆宁等从网络层面出发,面向大面积航班延误问题,利用传染病模型建立了航班延误传播模型,通过2018年冬春航季发生的大面积延误的实例验证表明,模型能够预测大面积航班延误的发生。

4 总结与展望

目前空中交通延误研究多采用机器学习、概率模型、建模与仿真以及排队理论方法。经典机器学习、深度学习和概率模型方法能够有效涵盖气象状况、航空公司特性、流量变化趋势等复杂特性,在计算时间和精度方面展现了一定的优势。但深度学习等算法的黑箱属性,使得预测效果缺乏可解释性,应用于高风险决策的空中交通系统中时存在挑战。此外,其高度基于历史数据的固有特征,使得无法探索运行环境发生重大变化时的影响。虽然航班延误演化虽然具有一定的随机特征,但在服务能力等基本参数确定的情况下,具有高度可确定性,这也是应用建模与仿真以及排列理论广泛探索空中交通延误的关键前提。但目前基于建模与仿真以及排队理论航班延误研究难以直接精细化考虑气象条件等环境因素影响。虽然建模仿真在实际应用能够涵盖系统的交互特征,但在时变环境下,难以发挥有效性能。此外,高度抽象的微观建模方法,造成长达数小时的计算时间消耗,难以满足战术级空中交通流量管理实时性需求。而实际战术流量管理阶段,考虑实际运行环境,精准把控透明化的航班延误信息是管理者做出智慧决策的关键。

本文针对空中交通延误预测方法论中的上述问题和近年来的研究趋势,面向高精度、实时性以及可解释性等应用需求的研究目标,对空中交通延误预测的未来研究及发展方向做出如下展望。

(1) 基于网络的中观建模。复杂系统在缺乏中央控制的组件情况下,依靠简单的操作规则产生复杂的集体行为、精细的信息处理及自适应过程,并由此产生系统的涌现效应。空中交通网络系统属于典型复杂网络系统。空管部门、航空公司、机场等异构实体的交互产生了复杂动力学现象。全网络观的建模思想是保证实体交互作用得以充分实现,延误预测输出有效的关键环节。在全网运行条件下,尤其以中美为代表的大型航空网络,基于航迹等层面的微观建模造成的运行时间消耗难以满足战术管理需求。而基于宏观的预测难以适应精细化管理的需求。因此,有必要根据实际需求,权衡模型复杂度与结果有效性,探索中度抽象层级的中观建模在空中交通延误预测中的应用。

(2) 可解释性机器学习的应用。针对空中交通延误众多诱发因素,机器学习算法能够综合融合气象条件、航空公司策略、流量变化趋势等变量,使研究者将主要工作部署在模型参数的调节方面,简化了建模复杂度,并验证展现了高精度、高速度等优越性能。但在基于历史数据的航班延误预测算法中,深度学习等部分算法缺乏有效解释性,限制了其在空中交通系统中的应用。因此,有必要深入研究以树模型为代表的可解释性机器学习模型在空中交通延误中的研究,增强算法在面向动态环境变化,信息缺乏条件下的预测能力,从而为基于延误的运行决策提供可靠的信息支撑,实现人机交互的和谐运行场景。

(3) 机器学习与运筹学方法的结合。空中交通系统的复杂性产生了非线性动力学特征。在缺乏有效解析模型的参与下,建模仿真方法为探索系统性航班延误提供了适用性手段。有效的参数输入是利用仿真、排队理论等运筹学方法,复现空中交通动力学的关键。但空中交通运行除受内部运行因素影响外,还受外部气象条件制约。天气的变动性特征,使得机场容量等空中交通系统关键参量具有时变特性,且受外部扰动的量级差异呈现出跨度广泛的分布特征。这种参数时变特性增加了运筹学方法精确预测实时环境下的航班延误的挑战性。与直接利用机器学习算法航班预测延误不同,数据挖掘与中观仿真建模相融合,利用机器学习中的算法优势对系统参量进行估计,为运筹学方法提供有效的参数输入,不仅可增加使用单一机器学习方法的可解释性,而且对揭示空中交通延误内在机理,感知动态运行环境变化,推演复杂条件下延误演化规律具有重要意义。

5 结束语

本文在对空中交通延误预测类型分类的基础上,总结了基于历史数据的方法、运筹学方法以及传染病模型为代表的复杂网络理论在空中交通延误预测领域的研究成果,详解介绍了代表性算法的实现过程,分析了各种算法的实现效果及特点。总体而言,空中交通的复杂性仍使延误预测问题保持开放性。为此,本文总结了研究趋势,并提出了未来空中交通延误预测的发展方向。

猜你喜欢

空中交通航班机场
机场罢工
全美航班短暂停飞
山航红色定制航班
山航红色定制航班
山航红色定制航班
如何避免GSM-R无线通信系统对机场电磁干扰
打着“飞的”去上班 城市空中交通路网还有多远
面部识别使机场安检提速
最有创意的机场
空中交通防撞系统(TCAS Ⅱ)的排故与维护