基于分位数回归的机场容量评估
2016-08-30翟文鹏陈梵驿金嗣博
翟文鹏, 陈梵驿, 金嗣博
(中国民航大学 空中交通管理研究基地, 天津 300300)
基于分位数回归的机场容量评估
翟文鹏, 陈梵驿, 金嗣博
(中国民航大学 空中交通管理研究基地, 天津 300300)
对北京首都国际机场航班运行的历史数据进行了统计分析,建立了进离场小时架次及时间的三维数据结构,并利用DBSCAN算法进行聚类分析;在消除“噪点”的基础上,利用改进后的分位数回归算法生成分时段的具有95%概率的机场小时运行能力包线。仿真结果表明,各个时段的机场进离场架次具有一定的时间特性和差异:8点到10点处于离港早高峰,离港小时架次远大于进港小时架次;10点到22点进离港航班较为均衡,机场全负荷工作;其他时间段航班小时架次未达到最大容量值。
机场容量; 延误; 分位数回归; 聚类分析
0 引言
当前,国内外空中交通流量需求旺盛,不少大型机场的容量已饱和,航班延误问题较为突出,提升航班正点率是迫切需要解决的问题。而机场改扩建工程耗时长、投资大,因此对机场现有容量进行科学合理的评估,提高机场容量利用率,有助于航班时刻资源优化和机场延误水平降低[1]。
常见的机场容量评估方法主要有仿真模型法、数学模型法和实证研究法。其中,仿真模型法能够逼真地模拟机场的运行情况,主要用于跑道容量评估;但目前多集中在对跑道容量的评估问题中,同时需要丰富的空管专业知识,特别是场面运行专业知识。李雄等[2]应用Simmod仿真软件针对不同典型构型平行跑道及常用跑道运行模式,分别对跑道极限容量和实际运行容量进行了仿真研究。高伟等[3]通过建立双跑道容量计算模型,并应用Simmod软件仿真两种方式评估机场跑道容量极限。该方法与数据计算模型所得的容量差异率不超过2%。数学模型法得到的评估结果仅是理论计算值,是宏观的容量评估,缺乏对细节的考虑,例如没有考虑空域环境对机场容量的影响,通用性较差。张洪海等[4]建立了机场进离场容量和时隙协同配置的多目标优化模型,考虑了机场容量的动态性和航班间的相互影响,可以动态充分利用进离场容量。卢朝阳等[5]假设机场到达流特性符合正态分布或韦布尔分布,采用T系统推导跑道容量,论证得到的跑道容量符合现实情况。实证研究方法通过对机场日常运行情况的观测,利用统计方法获得机场跑道容量的统计规律,通过对机场进离场航班运行态势的统计分析得到机场容量的评估结果。王飞等[6]应用k-means算法和SOM神经网络的混合聚类算法确定机场典型容量样本,评估机场容量。国内外关于分位数回归的应用主要集中在经济方面,鲜有用于交通领域。文献[7]率先提出了将分位数回归算法应用到容量包线中,对机场群进离场容量进行了评估。
目前,国内外基于历史统计数据的机场容量评估方法,均未考虑大型枢纽机场由于不同时段的运行情况差异而导致的机场运行能力的变化,且未能对高峰小时进离港架次进行评估。本文构建了具有时间维度的进离场小时架次,采用聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)[8-9]对进离场态势进行了统计与分析。另外,本文将分位数回归模型[10]改进后应用于机场容量评估问题中,发掘了分位数回归在解决容量包线问题方面的优越性,得出了具有一定概率分布的容量包线,使得最终得到的容量评估结果更加符合实际的运行情况。
1 容量评估方法
传统的聚类方法需要预先对簇的个数进行预设,不能保证精确度。本文选择DBSCAN算法来处理所研究的数据集,能够根据密度对数据进行聚类,且对簇的个数和形状没有要求,而且能够发现“噪点”(进离场小时架次出现次数少的点)并将其分离,从而可以从大量的原始数据中获得若干个时间段的容量簇,减少这些“噪点”对于容量评估的影响,提高容量评估的精确度和合理性[11-12]。此外,传统的聚类方法只需沿着聚类分析点的外边线进行描绘就可获得机场的极限容量评估值,以此作为机场容量标准并不准确、科学。多个时段的实际容量低于极限容量评估值,同时没有考虑不同时段进离场航班需求。因此,需要将时间信息加入到待处理数据中,从而完成包含时间信息的三维数据聚类分析。采用DBSCAN聚类方法将进离场航班进行分析后,可获得不同时间段进离场航班各自的容量区间,但并不能获得准确时间区间的容量情况。因此,需要进一步应用分位数回归对聚类分析获得的几个主要区间分别进行分析,并以95%概率的容量而非极限容量进行评估,可获得满足机场实际运行的容量,避免由于实际容量小于极限容量从而造成不正常航班。由于进港航班架次是非负整数且为有限值,故容量包线的潜在分段点也是有限的,意味着容量包线线段覆盖了所有进港航班架次的极小值。因此,分位数容量包线可描述为:
(1)
对于给定的τ分位数分段系数(αk,βk)的评估过程,涉及到以下线性规划问题,目标函数为:
(2)
约束条件为:
(3)
(4)
式(3)定义了来自观测值y的分位数函数的绝对偏差,式(4)保证了分段斜率的凹性。
2 仿真结果及分析
利用传统的基于历史统计数据的容量评估方法得到的机场容量包线,仅为对机场运行能力上限值的评估。然而运行能力在满足一切内外条件下才能达到机场容量上限,出现的次数极少,不能作为容量评估值,否则在大部分时间段运行能力低于极限能力的情况下,将出现大量航班延误。本文拟用基于DBSCAN聚类方法对首都机场实际运行中大量、长期的运行数据进行分析,样本来自首都机场2013年3月至10月的进离港航班数据。采用本文所提出的DBSCAN聚类分析方法对其进行聚类后,得到的结果如图1所示。图中未划入各区域的点为噪点,即进离场架次统计值出现次数较少的点,需要去除,为下一步基于分位数回归提供有效数据。另外,高峰小时容量是制约机场运行能力的重要指标,对于航班时刻的分配和实际运行中航班调配都具有重要作用,关系到机场资源和航班时刻的利用效率。聚类分析得到的5个核心区域分别用数字区分,即进离场航班运行在5个主要的区间内,从而获得了不同时间段进离场航班各自的容量区间,为下一步通过分位数回归评估容量包线奠定了基础。
图1 进离港小时架次聚类结果Fig.1 Clustering results of arrival and departure per hour
对上述5个时间段的起降架次范围进行分位数回归,结果如图2所示。
图2(a)为0点到6点进离港小时架次,对应图1中的区域1,该时段进离港架次较少,共30架次;图2(b)为6点到8点进离港小时架次聚类的结果,对应图1中的区域2,该时段离场航班逐渐增多,共48架次;图2(c)为8点到10点进离港小时架次聚类的结果,对应图1中的区域3,该时段处于早高峰,大量航班离场,少量航班进场,共82架次;图2(d)为10点到22点进离港小时架次聚类的结果,对应图1中区域4,该时段进离场架次较为均衡,机场全负荷工作,共106架次;图2(e)为22点到24点进离港小时架次聚类的结果,对应图1中区域5,该时段大量航班进港过夜,共66架次。
3 结束语
本文针对首都机场进离港小时架次进行统计数据分析,将历史统计进离港小时架次与时间结合构成三维数据并进行DBSCAN聚类分析。本文方法避免了数据噪声点的干扰,充分发挥机场运行能力和降低航班延误,使得容量评估更加合理。该算法为繁忙机场分时段小时容量评估提供了数据分析及容量评估手段,为航班时刻资源合理分配提供了依据。下一步将以航班延误作为指标之一对进离港小时容量进行评估。
[1]Barnhart C,Belobaba P,Odoni A R.Applications of operations research in the air transport industry[J].Transportation Science,2003,37(4):368-391.
[2]李雄,李冬宾,卫东选.机场典型平行跑道容量仿真分析[J].计算机应用,2012,32(9):2648-2651.
[3]高伟,傅炜.基于相关进近模式的双跑道容量计算及仿真[J].科学技术与工程,2014,14 (4):108-112.
[4]张洪海,胡明华.CDM ADGDP机场容量与时隙协同配置[J].系统工程理论与实践,2010,30(10):1901-1908.
[5]卢朝阳,赵新灿.基于到达流特性的跑道容量分析[J].南京航空航天大学学报,2011,43(1):30-34.
[6]王飞,徐肖豪.随机GHP模型中机场容量混合聚类算法[J].交通运输工程学报,2011,11(1):64-68.
[7]Ramanujam V,Balakrishnan H.Estimation of arrival-departure capacity tradeoffs in multi-airport systems[C]//Proceedings of the 48th IEEE Conference on Decision and Control.Shanghai:IEEE,2009:2534-2540.
[8]刘大有,陈慧灵,齐红,等.时空数据挖掘研究进展[J].计算机研究与发展,2013,50(2):225-239.
[9]王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328.
[10]Kim M O.Quantile regression with varying coefficients [J].The Annals of Statistics,2007,35(1):92-108.
[11]邓敏,刘启亮,王佳缪,等.时空聚类分析的普适性方法[J].中国科学:信息科学,2012,42(1):111-124.
[12]Wang M,Wang A P,Li A B.Mining spatial-temporal clusters from geo-database[C]//Li X,Zaïane O R,Li Z H.Advanced Data Mining and Applications:Vol 4093.Xi’an:Springer Berlin Heidelberg,2006:263-270.
(编辑:李怡)
Evaluation of the airport capacity based on quantile regression
ZHAI Wen-peng, CHEN Fan-yi, JIN Si-bo
(Research Base for Air Traffic Management, CAUC, Tianjin 300300, China)
3D data structure of the arrival-departure hour sorties and time were established based on the statistical analysis of the historical data of capital airport flight operation, and proceeded the cluster analysis with DBSCAN algorithm. The airport hour operation capacity envelope with 95% probability was generated by using quantile regression algorithm on the basis of eliminating "noise". Simulation results show that the arrival and departure sorties of the airport has certain amount of time characteristics and differences: at 8:00-10:00 am in the morning rush, departure hour sorties are far greater than arrival hour sorties; at 10:00 am-22: 00 pm, arrival and departure flights is relatively balanced and full load working at the airport; other times flight hour sorties reduced and have not reached maximum capacity.
airport capacity; flight delay; quantile regression; clustering analysis
2015-09-29;
2016-01-25; 网络出版时间:2016-04-22 09:52
国家自然科学基金资助(41501430,71571182,U1333116);国家空管科研课题基金资助(GKG201405002);中央高校基本科研经费资助 (ZXH2012M003);中国民航大学科研启动基金资助(2012QD02X);大学生创新创业训练计划基金资助 (201410059082);教育部人文社科青年基金资助(14YJC630185)
翟文鹏(1985-),男,天津人,讲师,博士,研究方向为空中交通规划与管理。
V355.1
A
1002-0853(2016)04-0086-04