APP下载

基于PSO-BP 算法的联盟航线市场份额预测

2020-03-08朱金福

华东交通大学学报 2020年1期
关键词:市场份额航空公司航线

陈 娴,朱金福,刘 月

(南京航空航天大学民航学院,江苏 南京211106)

国际航线网络竞争日益加剧,为适应全球合作趋势,一些航空公司选择加入航空联盟,航空联盟是两家及两家以上航空公司通过航线网络协同、联盟销售、资源共享、联合采购等合作方式,在不增加资源投入的前提下,实现自身业务范围拓展及经济价值提升的重要手段。 联盟合作形式主要有联运、联营、投资参股,其中联营的合作方式有代码共享、包租舱位、常旅客计划、市场营销合作、特许经营等[1]。 本文所涉及的联盟合作产品为代码共享产品,代码共享是指航班使用两家或多家航班代号,而实际仅由一家航空公司承运的合作方式,实际执行航班的一方通常称为运营方,另一方称为伙伴方或市场方。

一家航空公司主要承运门户机场之间的国际航线运输任务,无法运输其他国家/地区内部航线。 受到双边管制的约束,任何一家航空公司都无法单独的将旅客送往其他国家非门户机场。 国际航线网络资源分布不均,各国对国际航线市场的准入、运营、退出都有着严格的控制,以保护本国航空公司的整体利益,且由于航空公司运力资源有限,一家航空公司无法将旅客运送到世界各地。 航空联盟的出现解决了航空管制的壁垒,联盟合作成为了各航司拓展航线网络、提高航线市场份额的重要手段,也为民航旅客全球出行提供安全、便捷、快速的“无缝隙”服务。 2018 年航线数据显示,三大联盟——星空联盟、天合联盟、寰宇一家总共占有全球客运市场超过60%的市场份额。

航空领域常用的市场份额预测方法:服务质量指数(quality of service index,QSI)模型、航班频率“S 曲线”市场份额模型、离散选择模型。 Gregory(2003)[2]采用集计多项Logit 模型,以产品服务评分、路径衔接质量、航空公司市场占有率、机票价格、机型等为自变量预测航线产品市场份额。Coldren(2004)[3]又考虑到不同航线路径产品的潜在竞争程度不一,采用广义极值模型(GEV 模型)从出发时间、承运人、服务产品质量三方面描述产品竞争程度。 Judit(2018)[4]在预测航空旅客路径市场份额时进一步考虑多机场交通的便利性、起飞到达机场的延误情况、枢纽机场偏好等机场因素。 Marc(2016)[5]利用QSI 模型以巴塞罗那——东亚航线为例说明新飞机引进能改变非枢纽二级机场在长航线市场中的地位。国内胡皓月[6]通过双层QSI 模型建立航线市场份额预测模型,赵晓松[7]考虑联盟变量的影响,但他们在研究航线市场份额时采用线性回归模型来拟合指标系数,误差较大。

1 问题描述

联盟协同效应是指联盟后两个或两个以上的航空公司的总体效益大于各个航空公司独立运营效益之和。联盟航线合作的协同价值表现为合作干线上旅客流量的增加,通过联盟合作产生多个合作产品(代码共享的航班及航班组合),这些合作产品所带来的航空公司市场份额增加的汇总就是联盟国际航线协同价值。

从航空公司和合作伙伴航线关系角度划分,航空联盟可以分为三种类型:互补型航空联盟、平行型航空联盟以及混合型航空联盟。 随着航空公司航线网络的不断扩张和航空联盟合作关系的进一步深入, 联盟关系最终都会朝着混合型航空联盟发展。 图1 为典型混合型联盟航线示意图,本航空公司与合作伙伴航空公司在相互重合的部分干线上进行平行联盟合作,且通过互补联盟合作各自增加了3 个以远点,6 条新的销售路径,在已有的航线市场上如A-Hub1 通过代码共享也可以拓宽销售渠道增加市场份额。

联盟国际航线运输产品,由联盟内合作伙伴一体化运作,但各航节的运输任务由合作伙伴分别承运。 联盟环境下航线产品是某一OD 对市场中航班或航班组合形式,与传统的航线市场份额相比,联盟背景下航线产品数量繁多,旅客在选择航班时,会充分比较OD 对市场中可行的产品,他们更愿意直飞产品。 联盟合作产品由于行李直挂、贵宾厅共享、常旅客计划里程积分、统一的服务等便利可提升旅客的乘机体验。 为更好的计算联盟合作产品在OD 对市场中的市场份额,通过对OD 产品市场份额影响因素如航班频率、起飞时刻、中转时间、距离绕航率、联盟合作关系等分析,建立了联盟背景下航线市场份额预测的QSI 模型。

2 模型建立

2.1 指标选取及分析

以中国东方航空公司中美国际航线市场为例, 选取CKG—JFK、TAO—SFO、XIY—LAX、SZX—SFO、CKG—LAX、CKG—SEA 等OD 对市场, 共810 个航线产品为研究对象, 数据来源于2018 年中美航线市场OD 对数据(包括OAG 航班计划数据、航空联盟表、代码共享航班表、MIDT 数据等)。 通过OD 产品生成模块(Connection Builder)确定符合中转衔接、绕航率等要求的合作产品。 借鉴达美航空QSI 模型行业指标,结合联盟合作产品的实际情况,初步选择的影响因素如下:

1) 航班频率:路径产品中各航段频率的最小值,商务旅客更注重航班频率。

2) 机型座位数:大机型舒适性高,OD 路径各航段机型座位数最小值。

3) 航空公司服务:根据skytrax 星级用分值(0~10 分)表示,分值越大,服务越好。

4) 中转次数:记录OD 路径中航班衔接的中转次数。

5) 中转时间:记录OD 路径中航班衔接的总中转时间。

6) 总行程时间:记录OD 路径中旅客行程花费总时间。

7) 航线竞争程度:用赫斯曼——赫芬达尔指数(HHI)计算各OD 对市场产品竞争程度:HHI=S12+S22+S32,其中S12、S22、S32分别为同一航空公司中转、不同航空公司中转、其他方式三种航线产品市场份额。

8) 联盟合作关系:联盟合作关系评分,分值越大,联盟合作越紧密。

9) 距离绕航率:用OD 对航线产品总飞行距离与同一OD 对最小飞行距离比值表示。

10) 出发时间偏好:表明每一个航线产品对潜在旅客的吸引程度,根据调查得到不同时间段旅客的选择偏好,用分值(0-10 分)表示。

为描述联盟合作产品与一般联运产品在常旅客计划服务、航班延误后的服务补救、行李直挂等中转服务、销售网络拓展方面对于服务质量指数(QSI 值)的影响,引入联盟合作关系指标,联盟合作关系指标由常旅客计划、销售网络、服务补救、中转服务4 个细分指标按照权重综合计算得到。 依据路径种类和合作方式为每一航线产品合作关系评分。 根据航线产品的实际情况将合作方式分为仅国内段代码共享、有航班衔接的代码共享、无双边合作,按路径种类分为直航、同公司中转、同一联盟不同公司中转、不同联盟不同公司中转、合资企业。设计调查问卷并回收有效问卷198 份,其中8 份问卷由中国东方航空公司负责国际事务的专家进行评分,在实际计算指标及指标权重结果时,8 份专家评分问卷结果比重为1∶5。 反馈后的结果显示,各项评分结果较为集中,因而选择旅客选择每项指标结果的众数作为该项指标的评分结果,如表1 所示。 联盟合作关系的总得分取4 项指标评分结果平均值。

表1 联盟合作关系指标评分结果Tab.1 Score results of alliance cooperation relationship

考虑到不同的起飞时刻对旅客的吸引力不同,将一天24 小时每隔一小时划分一个时间区间,共划分为24 个区间,让旅客对各航班时刻区间进行评分,了解旅客对出发时刻的偏好,调查得到的数据显示,评分最高的时间区间为10:00 至10:59,18:00 至19:59。

为进一步了解各影响因素与市场份额间的相关程度, 表2 给出了各指标与市场份额的相关性分析结果。根据分析结果剔除在0.01 水平显著不相关的影响因素航班频率、起飞时间偏好指标,考虑到国际航线市场航班频率较低且飞行时间较长,起飞时刻对于旅客的吸引力不强,因此剔除相关性较弱的这两个指标具有合理性。 最终选择建立QSI 模型的8 项指标分别为(1)机型座位数X1,(2)航空公司服务X2,(3)中转次数X3,(4)中转时间X4,(5)总行程时间X5,(6)航线竞争程度X6,(7)联盟合作关系X7,(8)距离绕航率X8。

表2 各指标与市场份额相关性分析Tab.2 Correlation analysis between indicators and market share

2.2 QSI 模型

采用QSI 模型通过对影响旅客选择航线产品的诸多因素分析,应用系数量化每个OD 产品的“质量”。对于任意OD 对,将每一个产品的QSI 值表达为机型座位数X1、航空公司服务X2、中转次数X3、中转时间X4、总行程时间X5、航线竞争程度X6、联盟合作关系X7、距离绕航率X8等8 个指标的函数。

式中:Qi为第i 个合作产品的QSI 值;X1,X2,…,X8为上述影响产品服务质量的因素;F 为影响因素与因变量QSI 值间的函数关系。

式中:Mi为第i 个航线产品的市场份额;Qi为第i 个合作产品的QSI 值,j 为第j 个航线产品,J 为该OD 对市场所有的航线产品集合。

使用QSI 模型进行航线产品市场份额预测的关键是建立各影响因素与QSI 值之间的函数关系,为反映各影响因素与QSI 间是否为线性关系,进一步采用810 个合作产品样本绘制各影响因素与QSI 值间的矩阵散点图,由图2 可知,距离绕航率与行程总时间呈正相关,航线中转产品在中转次数相同时中转时间仍有较大差异,QSI 值与距离绕航率负相关,与机型座位数呈正相关,与行程总时间、中转时间呈负相关。 除行程总时间外,其余影响因素与QSI 值间均为非线性关系,因此初步认定QSI 值与影响因素间为非线性关系。

以机型座位数、中转时间、联盟合作程度为自变量,QSI 值为因变量,采用多元线性回归方法拟合参数,结果显示R 方和调整后的R 方分别为0.399,0.387,模型拟合效果不佳。 因此,确定各影响因素与QSI 值间为非线性函数关系,下文将进一步采用粒子群算法与神经网络拟合QSI 值与8 个指标间的非线性函数关系。

图2 各影响因素与QSI 值矩阵散点图Fig.2 Matrix scatter plot of various factors and QSI

2.3 基于粒子群算法与BP 神经网络的市场份额预测

常用的可表达因变量与自变量间非线性关系的方法主要分为两类,一类是参数法,包括非线性回归、指数平滑法、趋势外推法等,另一类是非参数法,包括神经网络法、支持向量机法等,参数法需要首先根据实际数据做出散点图,再由散点图确定变量间函数的类型,最后通过数据拟合函数关系式的未知参数。 无论多元线性回归或者是指数平滑法都需要预先确定函数类型, 而联盟航线市场份额预测问题由于影响因素多,无法直接确定QSI 值与指标间的函数类型,因此采用参数法不可行。 非参数法中的支持向量机方法虽然在解决小样本、高维度以及非线性方面有一定的优势,但其对于大规模样本难以实施,而国际航线市场中OD 产品路径众多,因此为很好的解决大样本数据间的非线性拟合问题,考虑使用人工神经网络方法。

你是否经常遇到这样的情况:快递送货到家,自己却在单位上班无法签收,或是快递已到楼下,而自己5分钟前已飞奔在路上。这样的尴尬场景在有了速递易、丰巢柜等快递柜后有了很大改善。

人工神经网络(ANN)在理论上可实现任何非线性映射,BP 神经网络是一种按误差逆传播算法训练的典型多层前馈型神经网络[8],基于粒子群算法与BP 神经网络的市场份额预测基本思想:以机型座位数、联盟合作程度、航空公司服务等8 个影响因素作为输入数据,产品的服务质量指数值为输出数据,通过输入与输出数据的机器学习,自适应调节网络权值与阈值,使得网络输出的QSI 值与期望输出的QSI 值均方误差最小。

BP 神经网络训练的关键在于初始权值的选取以及隐含层节点个数的确定。为解决BP 神经网络收敛速度的问题,通过粒子群算法追随当前搜索到的最优值来找到全局最优值优化神经网络初始权值,减小神经网络陷入局部极小值的可能性,具体算法步骤如下:

1) 样本数据预处理:为减少由于数据量纲差异而造成的误差,通过MatlabR2016a 工具箱中mapminmax函数将不同量纲的8 个指标数据全部转化到[0,1]。

2) BP 神经网络结构的确定:8 个指标对应输入层节点数为8, 网络输出为OD 对路径产品的QSI 值,输出层对应1 个节点。 隐含层分别设置节点数4,5,6,7,8,9,10,15。 激活函数分别选择双曲正切S 型函数tansig,S 型对数函数logsig对比训练误差。 图3 为选择不同的隐含层节点数与激活函数的网络训练误差,通过不断的试验最终确定最优的隐含层节点数为7、 隐含层激活函数采用S 型对数函数logsig。 训练算法采用Levenberg-Marquardt 算法(trainlm)。

图3 隐含层节点数与激活函数误差Fig.3 Error of different implicit layer node number and activation function

3) 粒子群算法的参数设置及粒子群位置初始化: 在n 维搜索空间内随机初始化m 个运动粒子的位置及位置,每一个粒子代表一个可行解,设第m 个粒子的位置、速度分别为Xi=(Xi1,Xi2,…,Xin)T,Vi=(Vi1,Vi2,…,Vin)T,个体极值为Pi=(Pi1,Pi2,…,Pin),全体极值为Pg=(Pg1,Pg2,…,Pgn)。 在本文的算例中初始化粒子数M=40,本文中BP 神经网络结构为8—7—1,其中8 为输入的指标个数,7 为隐含层最优神经元个数,1 为输出数据维度,则设置空间维度为网络权值数与阈值数的和,具体计算搜索空间纬度n=(8+1)×7+(7+1)=71,由于本例中BP 神经网络的初始权值与阈值在[0,1]之间,所以PSO 算法中的初始集也设置在[0,1]之间,设置最大循环迭代次数为400。

4) 粒子的位置与速度更新:粒子在空间内运动时通过计算个体极值与全体极值更新粒子位置,粒子速度及位置更新公式如下

式中:k 为当前迭代次数;wstart,wend分别为初始和终止权重值;kmax为最大迭代次数;k 为当前迭代次数。 在空间内,需要将粒子的速度限定在[-vmax,vmax]范围内。 在本文中采用自适应时变策略的学习因子,分别设置c1为2.5~0.5 线性减小,c2为0.5~2.5 线性增加。

5) 计算粒子的适应度值:选用BP 神经网络训练的均方误差作为适应度函数,计算每一粒子的适应度值,寻找空间内个体最优及全局最优。

式中:f 为适度度值,yfacti为第i 个航线产品的QSI 实际值,yi为BP 神经网络预测得到第i 个航线产品的QSI值,n 为航线产品的总样本数。 最终算法将停止在适应度值最低的粒子位置上。

6) 迭代终止条件判断: 全局最优值达到了预设的精度或者迭代次数达到设定的最大迭代次数则迭代终止,否则转到第四步更新粒子的位置及速度。

7) 将粒子群算法得到的最优值代入BP 神经网络的初始权值进行神经网络的二次训练与学习,最终建立联盟背景下基于粒子群算法与BP 神经网络的QSI 模型。

3 预测结果及分析

对于联盟背景下国际航线市场份额问题,随机选取中美市场由中国的非枢纽门户机场至美国非枢纽门户机场航线、 中国非枢纽门户机场至美国门户机场航线, 选取CKG—JFK、TAO—SFO、XIY—LAX、SZX—SFO、CKG—LAX、CKG—SEA 等OD 对市场,共810 个航线产品为研究对象,其中80%的航线产品数据用于QSI 模型的网络训练,10%的航线产品数据作为测试数据,10%的产品数据用于实际预测。 表3 给出其中的一部分网络训练数据便于参照,810 个航线产品数据中576 个为联盟合作产品, 联盟合作关系指标能较好区分联盟合作产品与一般联运产品在服务质量上的差异。

在联盟背景下中美航线市场份额预测的算例中, 经过220 次迭代,PSO 算法得到最优适应度值10.5953,与不使用粒子群算法相比,神经网络的训练次数由589 次减少为42 次,有效地避免了神经网络陷入局部极小值。 图4 为采用PSO—BP 神经网络预测值与实际值的对比图, 图中为圆原点折线为PSO—BP神经网络预测输出值,十字折线为实际QSI 值,从预测结果中来看,预测值与实际值的基本波动趋势一致。但有些合作产品计算出来的QSI 值还存在一定的误差,分析产生误差的原因影响服务质量指数的因素中未考虑机票价格因素。同一航线产品机票价格随时间波动大,而价格数据属于商业机密难以获得,因此在QSI值计算时存在误差。

实验分别采用PSO—BP 神经网络、BP 神经网路与线性回归对比实验, 结果表明PSO—BP神经网络预测精度较高, 神经网络训练误差2.6×10e-4,达到训练的误差要求。经计算, BP 神经网络绝对误差为3.21,线性回归的绝对误差为4.98, 粒子群算法与神经网络结合的绝对误差为1.01。 为进一步论证联盟背景下航线产品市场份额的预测, 加入联盟合作关系指标的合理性,分别采用机型座位数X1,航空公司服务X2,中转次数X3,中转时间X4,总行程时间X5,航线竞争程度X6,联盟合作关系X7,距离绕航率X8等8 个指标为输入数据与机型座位数X1, 航空公司服务X2,中转次数X3,中转时间X4,总行程时间X5,航线竞争程度X6,距离绕航率X7等7 个指标为输入数据。 使用PSO-BP 神经网络方法进行对比实验,实验结果表明加入联盟合作关系绝对误差由4.69 减少为1.01。 进一步分析原因若不引入联盟合作关系,对于联盟合作产品的预测QSI 值与QSI 实际值相比偏小, 因此使用PSO—BP 神经网络预测航线市场份额且考虑引入联盟合作关系指标具有较高的精度。

图4 PSO-BP 测试结果对比图Fig.4 Testing results comparison of PSO-BP

式中:MAE 为绝对误差;ei为预测QSI 值与实际QSI 值间的误差;n 为样本数目。

采用训练完成的PSO-BP 算法预测中美市场深圳至旧金山航线路径产品的市场份额,表4 是各航线产品实际市场份额与预测市场份额的对比结果,预测的结果误差均控制在1%,PSO-BP 算法预测联盟背景下航线市场份额可用于航空公司航线市场份额的预测,为进一步提高预测精度,可以在模型预测结果的结果上,由航空公司工作人员根据实际的运行数据及经验进一步的修正航线市场份额。

表4 SZX-SFO 航线市场份额预测结果对比Tab.4 Market forecasting of SZX-SFO

4 结论

基于联盟背景下国际航线市场合作产品的特征, 补充达美航空提出的用于市场份额预测的QSI 指标,通过大量的联盟数据分析机型座位数、航班时刻、航班频率、航线竞争程度、联盟合作关系、中转时间、总行程时间等多个指标对服务质量指数的影响, 建立了联盟背景下航线市场份额预测指标体系。 为了改变QSI模型依靠人工经验以及采用简单的线性回归确定系数的现象,精确拟合指标与航线产品市场份额间的非线性关系,采用BP 神经网络完成输入指标与QSI 值间的非线性映射。 为解决BP 神经网络初始权值确定的随机性造成网络陷入局部极小值的问题,在BP 神经网络的基础上加入粒子群算法,极大的提高了预测精度,结果表明基于PSO-BP 算法的QSI 模型为联盟航线市场份额预测提供有效的方法。

猜你喜欢

市场份额航空公司航线
航空公司的低成本战略及其实施对策探讨
IATA上调2021年航空公司净亏损预测
(21)新航线
通信芯片市场份额 有望超越计算机芯片
太空新航线
太空新航线
航空公司客票直销的现状与分析
内地市场份额接连下滑,联想手机怎么了?
2013年1-9月全国商用车市场销售统计图表
第二季度服务器销售额创13年新低