民航订座需求预测算法综述
2020-01-05赵烜
赵烜
摘 要:收益管理对于航空公司而言至关重要,订座需求预测是实现收益精细化管理的重要手段,直接影响航空公司对未来市场的把控。准确预测订座需求,可以增强航空公司市场竞争力。面对目前收益管理软件较难适应国内市场,对未来订座预测不准确的现状,深入分析国内外研究成果,探讨几种主流订座需求预测模型优缺点,并介绍每个模型在民航订座领域的适用性,最后给出结论及下一步研究方向。
关键词:收益管理;订座需求;预测模型;机器学习;组合模型;研究综述
DOI:10. 11907/rjdk. 201348 开放科学(资源服务)标识码(OSID):
中图分类号:TP312文献标识码:A 文章编号:1672-7800(2020)011-0279-03
Review of Civil Aviation Reservation Demand Forecasting Algorithms
ZHAO Xuan
(School of Mathematics, Shandong University, Jinan 250100, China)
Abstract: Forecasting reservation demand is an important means for airlines to achieve refined revenue management, and it directly affects airlines control over the future market. Accurate prediction can enhance the market competitiveness of the airline. Facing the situation that the current revenue management software is difficult to adapt to domestic market and could not forecast future reservation accurately, this paper deeply analyzes the domestic and foreign research,discusses the advantages and disadvantages of several mainstream reservation demand forecasting models, and introduces the applicability of each model in the field of civil aviation reservation. Finally, the conclusions and possible research direction in the future are given.
Key Words: revenue management; reservation demand; prediction model; machine learning; combined model; literature review
0 引言
目前,国内民航业发展迅速,各航空公司在保障安全飞行的同时,不断引进飞机,扩大机队规模,导致航司之间的竞争异常激烈,热门航线通常有几家航司共飞。占据市场优势、收益精细化管理是各家航司实现发展的重要手段,科学、严密、高效的收益管理策略将助力航空公司在竞争中胜出。收益管理系统通过对客流量的预测进行舱位控制,确定舱位最佳组合,然后进行收舱、放舱操作,以达到收益最大化目的。订座需求预测是收益管理的重要组成部分,其受诸多因素影响,比如数据本身错综复杂,内在规律难以确定,既有线性特征关系,又有非线性特征关系,同时也受重大事件、天气、节假日、季节等因素影响,对预测模型建立带来巨大困难。目前,行业内常用手段是利用国内外收益管理软件包含的一些常规预测算法,将数据导入预测模块,简单预测后进行可视化分析。这些算法通常基于传统统计学理论知识而建立,对于客源稳定、竞争不激烈甚至独飞航线的预测效果较好,基本可以满足航班管控需求。由于国内航空不同于國外市场,本土公司较多、市场复杂,各航司之间的竞争也日益激烈,基于简单统计计算往往准确性不高、误差较大。针对此现状,本文研究多种主流预测模型在旅客订座中的应用,并分析模型预测效果,给出合理使用建议。
1 传统模型
传统模型采用经典统计学理论知识,通过待预测日期与某些日期之间的内在关系,建立特定模型进行预测分析。在进行订座数据预测时,常用的传统预测算法包括:增量法[1]、ARIMA模型、回归分析法。
增量法是目前使用较为广泛的预测订座需求算法,已被收益管理软件PROS采用,可分为古典增量法、改进增量法。预测原理是根据航班历史订座成长趋势数据,计算未来航班订座潜在增量,加上当前已产生的订座数据,将其作为最终预测结果。计算公式如式(1)所示。
BKDn=BKDn0+δBKD (1)
其中,BKDn表示待预测订座数,BKDn0表示当前订座数,δBKD表示产生的订座增量。古典增量法与改进增量法的区别是改进增量法采用了未离港航班订座数据,将订座大区间划分为更小区间,在每个小区间上计算一个增量,然后进行累加。但是,这两种算法并无本质区别,都是利用特定历史航班日期的订座数据规律,经过统计计算,对未来航班的可能增量进行预测。增量法原理较为简单,容易实现,可用于客源稳定市场的短期预测,算法鲁棒性较弱,对于竞争激烈、客源不稳定航线预测误差较大。
ARIMA模型是最为常用的时间序列预测模型,在各行业应用良好。该算法描述了待预测值与滞后值、随机误差项之间的线性关系,即使用有限个历史订座数据以及订座误差的线性组合,也能够较准确捕捉线性关系。模型计算公式如式(2)所示。
BKDt=k=1pαkBKDt-k+k=1qμkρt-k+ρt+c (2)
其中,p表示自回归系数,q表示滑动平均数,BKDt-k表示t-k时刻订座数,ρt-k表示残差,αk、c表示待定系数。
文献[2]—文献[4]以月度为维度,研究ARIMA模型在民航订座预测中的应用,得到较为准确的预测结果。文献[5]以年度为单维度,采用ARIMA(2,2,1)模型对客运量进行分析,得到较好拟合效果,可用于短期预测。上述研究均是基于月度或者年度数据,基数较大,数据稳定性较好,能够得到较高预测精度。然而,如果以天为维度,将会影响模型稳定性。此外,ARIMA模型仅能描述数据之间的线性关系,在近似非线性关系方面准确性不高。对于客源波动较小的航线,往往能够得到较为准确的预测结果;反之,对于波动较大的航线,预测误差较大。
回归分析法是一种比较经典的预测算法,通过已知历史数据及影响因素建立一元或多元回归模型,选择拟合效果最好的模型进行未来订座数据预测。蔡文婷等[6]基于多元线性回归模型、多元对数回归模型对航空客运量进行建模分析,得到预测相对误差小于0.1%的结果,但其仅仅考虑了数据序列内部关系,并未引入社会、经济、政治等因素的影响;李维等[7]通过分析影响客流量的各种因素,建立偏最小二乘回归模型,分析经济发展、对外开放等6个因素的影响效果,但并未深入分析各种因素的影响程度大小。
回归分析法数学模型选取是一项较为困难的任务,通常经过反复实验才能得到准确性较高的模型。此外,回归模型建立需综合考虑多种因素影响,并对各种因素进行主成分分析、因子分析,挑选主影响因素,最终才能有效提高模型预测准确度。
2 机器学习模型
近年来,随着大数据、人工智能的快速发展,以及计算机运算能力的提升,机器学习算法在各行各业都有重要应用。基于机器学习的模型预测采用留出法等数据划分技术,将历史订座数据分为训练集和测试集,在训练集上通过模型自主学习、自我优化得到泛化能力强的模型,最终选择出在测试集合中表现最好的模型。机器学习模型建模、预测过程如图1所示。
模型通过自主学习得到最佳的权重参数组合,其准确性决定了模型性能。目前,常用的权重参数更新方法是误差逆向传播法(BP),称为BP神经网络,如图2所示,通过误差的反向传播,确定各环节权重参数的最优组合。
航空公司数据库中保存大量旅客订座数据,充分利用庞大的数据资产,采用机器学习技术进行有价值的数据分析,是众多学者研究的方向。演克武等[8]通过建立支持向量机模型对客流量进行预测,得到相对误差均小于BPANN和线性回归算法;Yang等[9]分别采用随机森林、支持向量机、神经网络模型对北京至三亚的客流量进行预测,得到随机森林预测精度更高的结果;王子位[10]构建LSTM网络预测民航流量,预测精度高于线性回归、GM(1,1)算法。
上述研究成果仅仅依靠顺序时间序列建立预测模型,即待预测订座数只受相邻时间点订座数据影响,没有考虑民航业的季节性、周期性。为此,王兴云等[11]通过对历史数据的主成分分析,得到一种考虑时间间隔的BP神经网络模型,此模型分析了节假日、季节等影响因素,其预测速度、精度均高于传统增量法、回归法。
目前研究中,从数据序列本身出发,可以利用大量历史数据挖掘数据之间的内在关系,建立优于传统模型的预测算法,但是均未引入除数据序列本身之外的特征属性,有效的特征提取有助于提高机器学习的准确性及泛化能力。在订座预测领域,旅客搜索热度数据、大型会议数据、天气数据等都是影响出行的重要特征,研究基于此类特征工程的机器学习算法对旅客订座预测至关重要。
3 组合模型
组合模型预测的概念最早于1969年提出,Bates等[12]通过简单统计方法进行权值确定进而提高其精度。根据不同预测模型特点,以及各自存在的问题,组合模型成为一种较为普遍的预测方法[13-15]。其思想是先利用若干个单项模型进行预测,然后根据不同模型预测结果及误差建立更加准确的组合模型,流程如圖3所示。
组合模型预测订座数统一表示如式(3)所示。
BKD=k=1nαkBKDk (3)
其中,BKDk表示各单项模型预测值,αk表示对应权重。组合模型对各单项模型预测误差的容忍度较高,通过权重组合可以减小单项模型预测偏差。权重参数的确定方法决定模型预测精度,常用优化方法包括标准差法、最小误差平方和法、最小绝对误差法等。
张千露[16]通过指数平滑法、灰色预测法、ARIMA建立组合分析模型,结果显示组合模型更加适用于中期预测;杨新渥等[17]建立指数平滑模型、灰色预测、线性趋势外推法的组合模型,对珠三角区域的民航运输量进行分析。这两种组合模型方法可以较为准确地捕捉线性关系,对于非线性关系较强的数据序列预测效果较差。
为了克服上述研究缺陷,许多学者测试了不同组合模型的预测效果。尧姚等[18]利用ARIMA在线性预测以及BP神经网络在非线性预测方面的优势,建立组合模型,得到优于ARIMA模型的预测效果;王翠[19]讨论灰色理论和RBF神经网络优缺点,综合利用各自优势,建立了灰色—RBF模型。实验结果显示,组合模型在历史数据拟合及计算简便性上都有较好表现;文献[20]—文献[21]分别采用不同组合模型建模预测,得到较高预测精度。
上述组合模型研究成果虽然在一定程度上达到了较高精度,但是建立过程依赖于单个模型,还需通过解决优化问题计算权重参数,导致复杂度增加、耗时较长。此外,权重参数选择方法是模型建立的关键,不合适的权重组合反而会使组合后的模型误差进一步扩大,参数优化策略依然是值得研究的方向。
4 结语
本文选择民航订座预测常用算法,参考国内外研究成果,对各算法优缺点进行分析。①传统模型过程简单、容易操作,大部分都可以通过现有软件模块实现,比较适合非技术人员使用,但是其预测能力有限,很难精准捕捉数据信息所蕴含的复杂非线性特征,并且预测之前一般需要先确定好使用模型,容错性较低;②机器学习模型理论复杂,操作繁琐,需通过大量实验确定超参数设置,一般需根据新产生的数据反复训练模型,并且技术门槛较高,需要通过专业学习,不适合非技术人员直接使用,但是模型确定后,利用模型预测未来订座数据的流程较为简单,准确性也较高;③组合模型可以利用不同模型的优势,得到优于各单项模型的结果,模型组合过程较为困难,需要选择合适的组合方法,建模复杂性依赖于所采用的单项模型。
从目前研究成果可以看到,对于某个固定日期的订座数据预测已有较为丰富的模型,订座成长过程分析预测模型可能是未来研究方向。此外,目前还没有较为稳定的预测模型,下一步将重点研究模型稳定性。
参考文献:
[1] HEUREUX E. A new twist in forecasting short-term passenger pickup[C]. Proceedings of the 26th Annual AGIFORS Symposium,1986:234-247.
[2] 王婷. 民航客运量的ARIMA模型与预测[J]. 五邑大学学报(自然科学版),2007,21(1):42-46.
[3] 黄若冰. 基于ARIMA模型的中国民航客运量预测[J]. 环球市场,2016,24(6):103.
[4] 王蓉. 基于ARIMA模型的我国民航客运量时序分析[J]. 兰州石化职业技术学院学报,2019,34(1):18-20.
[5] ZHAO X,ZHAO H. Empirical analysis and predictions of civil aviation passenger traffic based on ARIMA model[C]. Qingdao:3rd International Conference on Machinery, Materials and Information Technology Applications,2015.
[6] 蔡文婷,彭怡,陈秋吉. 基于多元回归模型的航空运输客运量预测[J]. 航空计算技术,2019,49(4):50-53.
[7] 李维,肖红专. 基于偏最小二乘回归的民航客运量预测与分析[J]. 科学技术创新,2017,21(26):45-46.
[8] 演克武,朱金福. 基于支持向量机回归算法的航空公司客流量预测研究[J]. 企业经济,2010,31(3):89-91.
[9] YANG H T,LIU X.Predictive simulation of airline passenger volume based on three models[C]. Internation Conference of Pioneering Computer Scientis-ts. Engineers and Educators, 2018:350-358.
[10] 王子位. 基于长短期记忆网络的民航流量预测方法[J]. 数字通信世界,2018,160(4):264-272.
[11] 王兴云,樊玮,吴桐水,等. 基于BP神经网络的航班需求预测模型[J]. 中国民航大学学报,2004,22(6):44-49.
[12] BATES J M,GRANGER C W J.The combination of forecasts[J]. Journal of the Operational Research Society,1969,20(4): 451-468.
[13] RAPACHDE,STRAUSSJK.Forecasting US employment growth using forecast combining methods[J]. Journal of Forecasting,2008,27(1):75-93.
[14] 郭建利,程蕾,孙博超,等. 基于ARIMA-SVM的煤炭价格预测及实证研究[J]. 煤炭经济研究,2016,416(2):12-16.
[15] 袁磊. 基于ARIMA-LSSVM混合模型的股指预测研究[D]. 哈尔滨:哈尔滨工业大学,2015.
[16] 张千露. 组合预测在我国民航客运量预测的應用[D]. 武汉:华中师范大学,2018.
[17] 杨新渥,王翩然. 基于组合预测的民航运输量分析——以珠三角地区为例[J]. 数学的实践与认识,2019,49(8):301-309.
[18] 尧姚,陶静,李毅. 基于ARIMA-BP组合模型的民航旅客运输量预测[J]. 计算机技术与发展. 2015,25(12):147-151.
[19] 王翠. 基于灰色理论和RBF神经网络民航客运量预测方法研究[D]. 北京:北京交通大学,2008.
[20] CHENG L.Combined forecasting of civil aviation passenger volume based on ARIMA-regression[J]. International Journal of System Assurance Engineering and Management,2019,10(5):945-952.
[21] BAI D D,WEI J Y. The combined forecasting model based on wavelet analysis in the application of the civil aviation passenger traffic[C]. International Conference on Social Science,2015:2401-2404.
(责任编辑:孙 娟)