基于灰色关联逼近理想解排序法的航班时刻表评估
2022-02-28张天赐万莉莉王倩彭秋萍
张天赐, 万莉莉, 王倩, 彭秋萍
(南京航空航天大学民航学院, 南京 211106)
随着民航业快速发展,航班延误问题日益凸显,其根本原因是航空公司旺盛的时刻需求和机场有限的容量之间的不平衡。民航局在制订航班时刻表时,虽然考虑了航空公司的时刻需求和机场的容量之间的平衡,但实际运行中可能出现各种情况造成机场容量下降,以至于不能满足航空公司旺盛的时刻需求,进而导致航班延误等情况的发生。对航班时刻表执行过程中可能发生的航班延误等情况进行预测,并以此作为指标评估航班时刻表,可以得知制作的航班时刻表的优劣程度,进而指导航班时刻表的优化,对缓解机场的容需矛盾,减少航班延误,具有重要意义。
目前对航班时刻表评估的研究还在起步阶段,Lambelho等[1]首次对航班时刻表评估展开研究,使用机器学习算法预测航班延误并以此作为指标,使用基于帕累托面的方法评估航班时刻表。但在实际运行中,航班时刻表样本较少,基于帕累托面的方法只有在指标间满足特定条件时,才能区分航班时刻表之间的优劣关系,具有一定的局限性。
航班时刻表评估指标尚无行业规范,但中外学者从航班延误、滑行时间等方面对航班时刻表展开了较多研究,为评估指标的选取与计算奠定了基础。Wang等[2]发现航班延误和滑行时间对航班时刻表中航班轮档时间设置都有较大影响;Kim等[3]使用递归神经网络和天气相关特征对美国几个机场航班延误进行分类;冯霞等[4-5]提出了一种场面交通状况衡量指标及基于该指标的无障碍滑出时间计算模型,并基于K最近邻和支持向量回归,构建了离港航班滑出时间预测模型;Choi等[6]利用随机森林和天气相关特征对航班延误进行分类;Diana[7]预测了飞机的滑行时间,并使用不同的机器学习方法测试了多个案例;周洁敏等[8]利用随机森林特征选择模型筛选21个重要特征,引入正则化L1、L2范数,建立弹性神经网络预测模型,对航班落地延误时间进行预测;Klein等[9]用天气条件作为特征来进行机场航班延误预测;Chen等[10]使用多标签随机森林分类算法分析航班延误的传播;徐海文等[11]基于航班时刻表数据,建立了离港延误时间预测模型;张舜尧等[12]从航空公司的角度建立了航班延误预测模型,并以此为基础建立了航班时刻表优化模型,模型可有效减少航班延误。
以上研究都是对航班时刻表中的航班延误或者滑行时间进行预测或建立优化模型等,从单方面对航班时刻表进行研究,还没有学者综合考虑航班延误、滑行时间等因素的影响对航班时刻表进行评估,而且现有的评估方法具有一定的局限性,亟须提出一种普适性更强的航班时刻表评估方法,为航班时刻表优化做铺垫。因此,现对航班时刻表评估展开研究,首先,基于现有评估指标集,引入滑行时间评估指标,从航班延误和滑行时间两方面选取4个评估指标;其次,由于航班时刻表中航班延误和滑行时间在航班执行前是未知的,采用分类算法预测航班延误和滑行时间,并以此计算评估指标;最后,使用灰色关联逼近理想解排序法(technique for order preference by similarity to an ideal solution-grey correlation, TOPSIS-GC)对多个航班时刻表的性能进行比较并进行优劣排序。
1 评估指标
对执行前航班时刻表的评估问题进行研究,由于对航班时刻表执行时的气象条件、空域结构等外部条件是未知的,所以只针对航班时刻表进行研究,故做出如下假设:①不考虑雷暴、冰雹等恶劣天气的影响;②认为航班时刻表在执行时的终端区空域结构、停机位、滑行道、管制策略等外部条件与评估时一致,未发生改变。
现有评估指标集包含预测的进港延误和离港延误百分比两个评估指标[1],同时航班延误和滑行时间对航班轮档时间设置都有较大影响[2],且目前对航班延误和滑行时间预测的研究已经比较成熟,评估指标的计算精度可以得到保证,所以从航班延误和滑行时间两方面选取了4个评估指标。
1.1 航班延误
航班延误指航班实际进港挡轮档/离港撤轮档时间晚于计划进港/离港时间超过15 min的情况,反之为航班准点。准点率可体现航班时刻表的整体延误情况,选取进港准点率和离港准点率作为航班延误评估指标。
(1)进港准点率是航班时刻表中进港准点的航班在进港航班中的比例,公式为
(1)
式(1)中:IA为航班时刻表进港准点率;NAO为航班时刻表中进港准点航班数量;NA为航班时刻表进港航班数量。
(2)离港准点率是航班时刻表中离港准点的航班在离港航班中的比例,公式为
(2)
式(2)中:ID为航班时刻表离港准点率;NDO为航班时刻表中离港准点航班数量;ND为航班时刻表离港航班数量。
1.2 滑行时间
滑行时间分为滑入时间和滑出时间,滑入时间即航班着陆接地到挡轮档所经过的时间,滑出时间即航班撤轮档到起飞离地所经过的时间。当航班的滑入/滑出时间在机场地面滑行时间标准以内为滑入/滑出时间可靠,否则为不可靠。为体现航班时刻表的整体滑行时间可靠情况,选取滑入可靠性和滑出可靠性作为滑行时间评估指标。
(1)滑入可靠性是航班时刻表中滑入时间可靠的航班在进港航班中的比例,公式为
(3)
式(3)中:II为航班时刻表滑入可靠性;NIO为航班时刻表中滑入时间可靠的航班数量。
(2)滑出可靠性是航班时刻表中滑出时间可靠的航班在离港航班中的比例,公式为
(4)
式(4)中:IO为航班时刻表滑出可靠性;NOO为航班时刻表中滑出时间可靠的航班数量。
2 基于分类算法的评估指标预测
由于航班时刻表是在航班执行前制订的,其评估指标不能直接得到,所以使用分类算法对航班时刻表中每个航班的延误和滑行时间可靠情况进行预测,进而计算评估指标。
2.1 分类算法
分类预测算法,首先输入包含特征和标签(类别)的训练数据;然后通过学习,找到特征与标签间的关系,即映射。所以说分类预测模型是求取一个从输入变量(特征)到离散的输出变量(标签)之间的映射函数。在此当输入有特征而无标签的未知数据时,可以通过映射函数预测未知数据的标签。
2.2 评估指标分类预测模型
构建了进行航班延误和滑行时间可靠性预测的特征集,采用实数编码、三角函数变换和目标编码3种方法进行特征编码[1],如表1所示。
表1 数据特征描述Table 1 Data feature description
与目标编码方法相结合的特征:以航班延误预测为例,基于该航班延误的概率对字段Airline进行编码,例如,总共有3个国航的航班,其中有2个航班准点,则航空公司国航编码为2/3=0.67。
根据选择的数据特征,使用LightGBM算法对航班时刻表中每个航班的进港延误、离港延误、滑入时间可靠性和滑出时间可靠性进行预测,并根据式(1)~式(4)计算评估指标。
3 评估方法
根据评估指标,使用TOPSIS-GC法对多个航班时刻表的性能进行相对比较。与同一航季制订的多个航班时刻表相比,可以选出更优的航班时刻表;与其他航季已执行的航班时刻表相比,可以体现制订的航班时刻表的优劣程度。航班时刻表评估流程如下。
步骤1对n个待评估的航班时刻表的4个评估指标,构建原始数据矩阵为
(5)
式(5)中:xij为第i个航班时刻表的第j个评估指标,i=1,2…,n,j=1,2,3,4。
步骤2构建参考数据行。
X0=[x0(1),x0(2),x0(3),x0(4)]
(6)
式(6)中:x0(1)、x0(2)、x0(3)、x0(4)为各评估指标的参考值,高优指标的参考值为最大值,低优指标的参考值为最小值。
步骤3计算原始数据矩阵X各指标行与参考数据行对应元素的差值的绝对值|x0(j)-xij|。
步骤4根据|x0(j)-xij|计算原始数据矩阵X各指标与参考数据行中对应元素的关联系数,计算公式为
(7)
式(7)中:ξij为第i个航班时刻表的第j个评估指标与参考数据行对应元素的关联系数;ρ为分辨系数,在(0,1)内取值,若ρ越小,关联系数间差异越大,区分能力越强,通常ρ取0.5。
计算结果构成的关联系数矩阵为
(8)
步骤5由关联系数矩阵Zij中各列的最大值构成最优方案,各列的最小值构成最劣方案,即
Z+=(ζmax1,ζmax2,ζmax3,ζmax4)
(9)
Z-=(ζmin1,ζmin2,ζmin3,ζmin4)
(10)
步骤6计算各航班时刻表与最优方案距离和与最劣方案距离,公式为
(11)
(12)
步骤7计算各航班时刻表与最优方案的相对贴近度,公式为
(13)
式(13)中:Ci为第i个航班时刻表与最优方案的相对贴近度,Ci越大,表示该航班时刻表越好。
步骤8根据航班时刻表与最优方案的相对贴近度进行排序,Ci越大,航班时刻表排名越靠前。
4 实例分析
北京首都国际机场是中国三大门户复合枢纽之一,世界超大型机场,交通量在高峰时期接近100架次/h,其日高峰量接近2 000架次,位列全国第一。而越繁忙的机场,其反映出来的问题也更加全面,故选取北京首都国际机场作为典型机场进行分析。将2019年冬春、夏秋航季的航班时刻表与2017、2018年已执行的航班时刻表进行相对性能比较,以评估2019年执行前航班时刻表的优劣程度。
4.1 基于分类算法的评估指标预测
使用北京首都国际机场2017年和2018年冬春、夏秋航季的4个已执行的航班时刻表数据作为训练数据,2019年冬春、夏秋航季执行前的航班时刻表数据作为预测数据。
4.1.1 LightGBM算法建模
应用Python中的sklearn和lightgbm工具包完成LightGBM算法的调参、训练及测试。训练集与测试集数据比为4∶1,采用五折交叉验证进行参数调优。预测航班是否延误、滑行时间是否可靠为二分类问题,所以参数application设置为binary,boosting设置为gbdt。使用工具包中的GridSearchCV函数完成参数调优过程,最佳参数下,重复进行3次实验后,训练集和测试集预测准确率如表2所示。
进港延误、离港延误和滑出时间可靠性的预测准确率达到了0.78以上,滑入时间可靠性的预测准确率达到了0.9,说明使用LightGBM算法可以较为准确地预测评估指标。
表2 LightGBM算法验证集和测试集预测准确率Table 2 Prediction accuracy of verification set and test set of LightGBM algorithm
4.1.2 评估指标
使用表2中的最佳参数预测后,由式(1)~式(4)预测得到2019年航班时刻表的评估指标;2017年和2018年航班时刻表评估指标直接计算获得,6个航班时刻表评估指标如表3所示。
表3 2017—2019年的6个航班时刻表评估指标Table 3 Six flight schedule evaluation indicators from 2017 to 2019
4.2 TOPSIS-GC法评估
根据表3中的评估指标,将2019年航班时刻表与2017年和2018年航班时刻表进行相对性能比较,评估结果如表4所示。
表4 TOPSIS-GC法评估结果Table 4 Evaluation results of TOPSIS-GC
2019年冬春航季航班时刻表,在进港准点率、离港准点率、滑入可靠性和滑出可靠性4个方面表现均最好,排名处在第一位。前四个航季的已执行的航班时刻表评估结果逐步上升,这表明了北京首都国际机场在2017—2018年期间,制定的航班时刻表越来越适合机场的发展,机场的运行保障能力逐步加强,航班不正常情况逐渐减少,保持着良好发展的态势。2019年的两个执行前的航班时刻表与2017年和2018年的4个航班时刻表相比,各项评估指标均有较大提升,评估结果排名在前两位,航班时刻表制定的更加合理,但两个航班时刻表的进港准点率分别为0.719 6和0.834 1,还有较大提升空间,可以考虑从提升进港准点率的角度对航班时刻表进行优化,以进一步提升2019年两个航班时刻表的合理性,减少潜在的航班不正常情况。
4.3 方法对比分析
为探究航班时刻表的最佳评估方法,使用基于帕累托面的方法对航班时刻表进行评估,并与TOPSIS-GC法进行对比,结果如表5所示。
表5 两种方法排序结果对比Table 5 Comparison of sorting results of two methods
表5中,两种评估方法对2018年和2019年的4个航班时刻表的排序完全相同,但在2017年冬春和夏秋航季的两个航班时刻表的评估中,由于指标变化较小,不能满足各项指标均优于另一个航班时刻表的条件,基于帕累托面的方法无法评价两个航班时刻表之间的优劣关系,而TOPSIS-GC法可以明显地区分两个航班时刻表之间的优劣关系,避免了基于帕累托面的方法在样本较少时无法区分航班时刻表优劣的问题,这表明TOPSIS-GC法对航班时刻表评估的普适性更强。
4.4 使用不同评估指标对比分析
为验证添加滑行时间指标对评估结果的影响,使用TOPSIS-GC法,将添加滑行时间指标前后的评估结果进行了对比。
图1为添加滑行时间指标前后的评估结果均方差对比,仅使用航班延误指标的评估结果均方差为0.353,添加滑行时间指标后评估结果均方差为0.369。对多个航班时刻表的性能进行相对比较,评估结果的均方差越大,表明航班时刻表间的差异越大。与仅使用航班延误指标相比,添加滑行时间指标后,评估结果均方差由0.353提高到了0.369,这说明添加滑行时间指标后,能更好地体现航班时刻表之间的差异性,提高了TOPSIS-GC法对航班时刻表的优劣区分能力。
图1 添加滑行时间指标前后TOPSIS-GC法评估 结果均方差对比Fig.1 Comparison of mean square deviation of TOPSIS-GC evaluation results before and after adding taxiing time index
5 结论
针对航班时刻表评估问题,使用LightGBM算法对评估指标进行预测,提出了TOPSIS-GC法评估航班时刻表,以北京首都国际机场为例证明了方法的有效性。
(1)相较于现有研究从航班延误方面选取评估指标而言,考虑航班时刻表在航班延误和滑行时间两个方面的表现,引入滑入可靠性、滑出可靠性两个新的评估指标,能够更加全面地根据航班运行特性进行评估,提高了TOPSIS-GC法对航班时刻表的优劣区分能力。
(2)提出了TOPSIS-GC法评估航班时刻表,对多个航班时刻表进行相对性能比较。TOPSIS-GC法避免了基于帕累托面的方法在样本较少时不能有效评估航班时刻表的问题,具有更强的普适性。
(3)只选择了航班延误和滑行时间两方面的指标,进一步研究可以从航空公司效益和机场容量等方面增加指标,使评估更加全面。