基于竞争的区域机场群旅客吞吐量预测方法
2021-11-18王京元邱远仕周亚琦
王京元,邱远仕,周亚琦,2
(1.深圳大学 土木与交通工程学院,广东 深圳 518060;2.杭州市综合交通运输研究中心,浙江 杭州 310000)
航空运输是区域经济发展的重要推动力,旅客吞吐量是机场规划、运行管理的重要依据和衡量机场运营水平的主要指标,其相关研究已受到了持续关注。诸多学者从相关性视角提出了多种机场吞吐量预测方法,包括回归分析、马尔科夫链模型,以及基于灰色理论、神经网络、遗传算法等的现代优化预测方法[1-4],但大多是根据单一机场的历史数据或社会经济等关联因素进行预测[5-6]。随着高铁的建设发展和机场数量的不断增加,民航与高铁及机场间的竞争日渐激烈,给机场旅客吞吐量预测带来了挑战[7]。目前的相关研究多聚焦在航空和高铁的竞合及多机场竞争下的旅客选择行为。日本与欧洲较早引入竞争关系,构建民航与高铁选择模型,并研究二者的优势范围[8-9]。随着高铁网的快速建设,国内学者对此也进行了多维度探讨,栾维新等[10]建立了高铁与机场客流竞争的双层规划模型,李冬梅[11]、左战杰[12]等利用Logit效用理论分析高铁与民航旅客的方式选择行为及客流分担率,都旨在探究航空和高铁竞争的优势时空阈值。美国作为航空最发达区域,Harvey[13]早在1987年就利用多项Logit模型对旧金山湾区航空旅客到发机场的选择行为特征进行研究。Pels等[14]和Hess等[15]相继利用两级嵌套Logit模型和交叉嵌套Logit模型研究多机场系统竞争,结果表明:交叉嵌套结构比简单的嵌套模型有显著改进,其性能优于多项Logit模型。近年来,国内学者在借鉴国外研究成果的基础上,对我国典型区域多机场系统进行研究。赵凤彩等[16]的研究结果显示,多项Logit模型对多机场系统需求预测具有一定的适用性,但预测精度较低。舒严娇[17]建立了多机场系统竞争下的巢式Logit机场选择模型,并对苏南(硕放)机场进行实证分析,预测结果表明考虑区域内机场间竞争关系模型的预测误差较小。种群生态学理论[18]和重力模型[19]也被尝试用于区域多机场竞争下的旅客吞吐量预测。综上表明:在高铁成网的当下,机场吞吐量的预测必须考虑高铁等交通方式的竞争;并且,对于区域多机场系统,必须同时考虑机场间的竞争。所以,仅考虑一个方面,甚至孤立地采用单一机场因素的方法,都会使预测产生偏差。巢式Logit(Nested Logit,简称NL)模型对此表现出优越的适用性。
基于此,文中探讨民航与高铁及机场间的双重竞争,提出区域机场群吞吐量的预测方法。从随机效用理论视角,探究出行者选择决策机理,构建双重竞争下区域机场群内出行者选择决策的Nested Logit模型及机场吞吐量的预测方法流程,并进行参数估计、模型标定及示例应用。
1 多机场选择决策机理
旅客出行决策行为具有复杂性和多样性,在竞争影响机制下,根据效用理论,出行者会从可用的备选出行方式中,选择个人效用最大化的出行方式[20]。结合机场群具体出行需求行为进行分析:首先,旅客面临多种交通运输方式的选择,主要指航空、铁路、水运、公路等的选择,特别是航空与高铁的选择;其次,旅客在选择航空出行的情况下,又会面临机场选择。简而言之,区域机场群的竞争包含航空与高铁的竞争,以及机场群内部多机场间的竞争,都需同步考虑。
1.1 民航与高铁的竞争
随着机场加密和高速铁路网的快速发展,在一定时空范围内的城际出行中,高铁与民航业的竞争越来越激烈,旅客会根据个人经济水平及偏好等重新选择出行工具,由此导致了各种运输方式的客流分担率发生变化[21]。
不同运输方式有其固有的运营特点,客运方式属性客观存在,不以人的意志或个人选择行为而改变。运营属性主要表现在能够满足不同旅客在城际间的出行需求,并且不同客运交通方式的运营属性不同,其在技术、服务、经济等方面也各具优势,文献[12]从快速性、经济性、安全性、舒适性、便捷性、准时性等方面对高铁和民航的运营属性做了较全面的定量研究,如表1所示。参照已有研究成果,文中将快速性、经济性、方便性和舒适性4个指标作为影响旅客城际出行方式选择的主要因素,计算竞争机制下民航与高铁的客流分担率。
表1 民航与高铁各影响因素量化情况
1.2 机场群内的竞争
《全国民用机场布局规划》(发改基础〔2017〕290号)提出大力发展机场群,目前我国主要城市群已逐步形成多机场系统。由于排队拥挤和服务质量下降,中小型机场有机会接收大型枢纽机场“流失”的客流,逐渐打开与周边机场相互协作竞争的局面,机场间独立性特征的不同决定了机场核心竞争能力的差异。在多机场系统中,影响旅客选择机场的关联因素是多方面的,主要包括航班情况、航班频率、始发地到达机场成本(时耗/费用)、机场服务质量、候机时间、飞行时间等显著影响因素。此外,不同机场所处环境不同,其影响因素的显著性系数也会表现不同[22]。综合相关研究,文中选取始发地到达机场的时间、始发地到达机场的费用以及候机时间作为机场选择的初选变量。
2 机场选择模型与吞吐量预测
选用双层巢式选择模型(NL)来表征竞争下的机场选择行为,将民航与地面交通运输方式的选择作为第一层选择枝,多机场间的选择作为第二层选择枝。
2.1 Nested Logit模型原理
Nested Logit选择模型是离散选择模型的一种,离散选择模型是基于效用最大和随机效用两个概念建立起来。当旅客进行出行方式选择时,一般会根据其个人的经济收入情况、出行特征、交通运输方式客观属性中可观测到和不可观测到的特征进行选择,从可供选择的出行方式中选择个人效用最大化出行方式[23]。
效用最大理论是决策者选择行为的理论基础,一般地,假设决策者n选择方案i的效用Uin可表示为
Uin=Vin+εin(i∈Cn)
(1)
式中:Vin为效用函数的可观测项,εin为效用函数的不可观测项,Cn为可供决策者n选择的所有选项集合。
效用函数确定后,基于决策者总能够理性选择效用最大的选项,决策者n选择方案i的概率可表示为
Pin=Prob(Ujn-Vjn>εjn-εin,i≠j,∀j∈Cn)
(2)
由于Pin服从累积分布,假设随机向量εn的联合概率密度函数为f(εn),其积分形式可表示为
(3)
式(3)中I(Vin-Vjn>εjn-εin)为指示性函数,当括号内的项为真时,概率结果等于1;否则,等于0。在具体研究分析中,效用函数的定量关系表达式会根据模型中不可观测因素的假设不同(即对概率密度分布函数f(εn)的分布假设不同)而产生差异。文中选用Nested Logit模型,随机效用项服从广义极值分布,密度函数为
(4)
2.2 基于竞争的双层Nested Logit模型
NL模型是由多个多项离散选择模型(MNL模型)构成的多层树状结构,每一独立层中的选择枝都具有相关性。因而NL模型与MNL模型可以看作是包含和被包含的关系。NL模型的分层原则:将属性相似的选项并列放在同一层级选择枝,将属性特征相同的选项放在同一个选择枝巢内,属性类型不同的选项放在不同层级的选择枝。鉴于此,文中将民航与地面交通运输方式的选择作为第一层选择枝,多机场选择作为第二层选择枝,模型结构如图1所示。
图1 基于竞争的双层Nested Logit模型框架
目标机场被选择的计算概率公式为
(5)
式中:PAin为决策者n最终选择目标机场概率,P(i|A)n为决策者选择民航出行时在多个机场选中目标机场概率,PAn为决策者n选择民航出行概率。
2.3 吞吐量预测流程
机场旅客吞吐量的预测流程(见图2)可大致分为两步骤:首先,圈定目标机场的有效辐射范围,通过构建出行方式选择模型计算出在该范围内选择民航方式出行的旅客比例;其次,对选择民航出行的旅客进行需求再分配,通过构建多机场决策选择模型计算出腹地城市航空市场的占有率;最后,求出目标机场旅客吞吐量。
图2 预测方法流程
1)圈定机场辐射范围。根据手机用户数据识别航空出行客流,定义讫点在机场范围内且到达机场后的当天和第二天无出行活动为航空出行客流算法,以此识别机场客源地。科学界定机场辐射范围,避免以行政区划作为单位或以车程时间和航空距离作为标准直接定义有效覆盖范围,从而导致预测结果虚高问题。
2)数据收集和样本采集。搜集以下几类数据:民航与高铁的服务属性(经济性、快速性、安全性等),再根据实际调查情况进行量化取值;辐射范围内各机场的相关数据,即某地到达机场的时间和费用、机场平均候机时间等;采用线上线下调研方式收集决策者个人选择机场的相关数据。从旅客的个人属性、出行需求等方面分析决策者出行行为特征,并将问卷数据整理成所需形式。
3)构建双层Nested Logit预测模型。确定影响决策的关联因素,定义效用函数,构建Nested Logit预测模型;基于极大似然函数原理,利用TransCAD软件对整理好的调查数据进行处理分析,估计模型参数,求解出民航需求量及需求量在各机场之间的分配比例。
4)计算目标机场的旅客吞吐量。机场辐射范围需求总量乘以航空出行方式比例,再乘以选择目标机场的旅客出行比例,即为目标机场旅客吞吐量。
3 参数估计及模型标定
3.1 效用函数
鉴于文中特性变量的选择,两层选择枝的效用函数为
VA=μ1XAn1+μ2XAn2+μ3XAn3+μ4XAn4
(6)
Vi|A=θ1X(i|A)n1+θ2X(i|A)n2+θ3X(i|A)n3
(7)
Vi=Vi|A·VA
(8)
式中:XAn1,XAn2,XAn3,XAn4分别为快速性、经济性、方便性、舒适性;μ1,μ2,μ3,μ4为各属性因素的权重系数;X(i|A)n1为平均候机时间;X(i|A)n2为到达机场的地面交通时间;X(i|A)n3为到达机场的地面交通成本;θ1,θ2,θ3为待求参数。
具体变量选择情况如表2所示。
表2 基于竞争的NL模型特性变量选择
3.2 样本数据处理
为标定模型参数,通过简单随机抽样法调查旅客出行选择行为,共回收问卷553份(线下375份,线上178份),其中有效问卷493份。基于模型标定需要,笔者将个人单次出行作为基本单位进行数据整理,如表3所示(选取其中10份样本数据为例)。
表3 个人出行选择结果数据整理
3.3 参数估计
将整理好的样本数据导入TransCAD中,再对各属性的模拟值进行标定,结果如表4所示。
表4 模型运算结果
取95%的置信度,当|tk|>1.96时,说明选取的特性变量是影响选择结果的重要影响因素。反之,当|tk|<1.96时,说明选取的特性变量不是影响选择结果的关键影响因素,剔除此变量对选择结果影响不大,将该特性变量去除后需要重新标定模型参数,再重复上述步骤进行检验。根据模型运行结果可知参数t值的检验结果如表5所示。
表5 t值检验情况
可见,各参数t值检验结果绝对值均大于1.96,因此,最终确定具有显著性影响特性的变量为:经济性、快速性、方便性、舒适性、始发地到达机场的时间、始发地到达机场的费用、机场平均候机时间。
1)估计选择枝A构成的MNL组合随机效用函数为
VA=0.175 3XAn1-0.336 8XAn2+
0.403 6XAn3+0.084 3XAn4
(9)
2)估计选择枝i构成的MNL组合随机效用函数为
Vi|A=-0.253 1X(i|A)n1-0.405 3X(i|A)n2-
0.089 7X(i|A)n3
(10)
4 实例应用
珠三角区域密集分布着多个机场,基础设施及飞行区建设等级普遍较高,能充分满足旅客出行方式选择的多样性,但由于机场之间的辐射区域存在重合及高速铁路网的密集建设,加剧了机场与高铁以及临近机场间的客源竞争,给机场客流量的准确预测带来难度。以2017年深圳机场旅客吞吐量为预测对象,在充分考虑竞争影响机制的情况下,论证双层巢式离散选择模型在机场旅客吞吐量预测中的可行性。
4.1 圈定深圳机场辐射范围
根据手机电信用户的日出行轨迹(由电信提供的包含手机用户出行时间、起讫点坐标、行程距离等数据,提取出用户的出行轨迹信息),利用算法描述的“定义讫点在机场范围内、且到达机场后的当天和第二天无出行活动为航空出行客流”,识别机场客源地。分析结果如图3所示:深圳宝安机场辐射范围基本覆盖广州、佛山、深圳、中山、惠州、东莞、江门、珠海、肇庆共9个珠三角城市;深莞惠出行集中程度较高,其中深圳的市域出行强度最高。
图3 深圳宝安机场对珠三角(各市)服务覆盖范围
4.2 辐射范围内城际出行需求总量
通过查阅广东省统计年鉴以及珠三角9市的统计公报[24],整理了2013—2018年珠三角9市城际旅客出行总量及水运与公路的客流总量。由于近几年统计路径与往年存在差异,在统计数据完整和数据可说明的情况下,基于广东省内2017年城际出行OD数据处理分析公开结论,直接选取机场辐射区域(珠三角9市)的城际出行发生量作为旅客出行需求总量。
4.3 方式选择预测结果
由于文中重点研究机场竞争能力对旅客出行决策的影响,在民航与高铁的竞争中两种运输方式各有优势运距,基于运营属性量化分析结论,选取民航与高铁的最大竞争运距为1 000 km,根据表1计算得到运输方式的运营属性量化情况,汇总如表6所示。各地民航出行比例预测值如表7所示。
表6 民航与高铁主要影响因素量化情况汇总
表7 2017年辐射区旅客民航和高铁出行比例预测值
以深圳市始发旅客到达深圳宝安机场为例,地面交通所需时间约为0.67 h,所需费用约为25元,则深圳市民航出行快速性指标为4.32,经济性指标为0.525,舒适性指标为2.1,方便性指标为3.75。将以上数据代入第一选择枝算式(9)中,可得
Vsz=0.175 3×4.32-0.336 8×0.525+
0.403 6×2.1+0.084 3×3.75=1.744
同理,分别求出各市效用值后,再代入式(11)中,求出各地区选择民航出行的旅客需求预测值
(11)
4.4 机场选择预测结果
将深圳宝安机场及周边机场的平均候机时间、各个城市到达各机场的地面运输平均所需成本及地面交通运输平均所需时间代入到上述选择枝效用函数式(10)中,得到每个城市到达各机场的效用值Vi|A。如深圳市始发旅客到达深圳宝安机场所需平均时间约为0.67 h,所需费用约为25元,平均候机时间约为1.2 h,算得
V2|A=-0.253 1×0.67-0.405 3×25-
0.089 7×1.2=-10.41
同理,分别求出各市到达各机场的效用值后,再代入式(12),求出各地区民航出行旅客中选择各机场出行的比例,算式为
(12)
4.5 目标机场旅客吞吐量
表8中各地选择各机场的民航旅客预测比例乘以表7中各地民航出行需求量,即可得到各地前往各机场的旅客需求量,具体分布情况如表9所示。
表8 2017年珠三角各城市选择各机场出行的比例值
表9 2017年珠三角各城市选择各机场出行的旅客吞吐量预测值 万人次
将选择深圳宝安机场的各地旅客需求量求和,得到深圳宝安机场的年旅客吞吐量。表10为使用NL选择模型预测出的各市将深圳宝安机场作为出发或到达的机场吞吐量。
表10 2017年辐射区内各城市旅客从深圳宝安机场到发客流量预测值 万人次
上述分析表明NL模型对预测竞争下的机场吞吐量具有较高精度。模型参数的标定对模型预测结果至关重要,而样本数量及所获取样本数据能否真实反映决策者出行行为在很大程度上决定了参数的标定。随着样本量的增加和覆盖性的改善,文中预测结果的精度将进一步提高。同时,计算过程表明:机场综合竞争实力除了与机场自身运营状态有关,还与机场所依托城市交通及机场陆侧地面交通的发展有关。从旅客个人出行选择预测结果可以看出,机场与地面交通方式的衔接程度对机场的吸引力存在正相关影响。
5 结 语
高铁分担民航客流的影响已不容忽视,区域的联动发展和民航的普及正带动大规模机场群的快速形成,仅考虑单一机场要素的预测方法已无法适应区域内多机场系统旅客吞吐量的预测需要。文中尝试同步引入民航与高铁的竞争及区域内机场间的竞争,选用Nested Logit模型构建竞争环境下机场群旅客吞吐量预测方法。
结果表明:NL模型在表征双重竞争关系方面有更好的竞争性,且能同步预测机场群内所有机场的旅客吞吐量,提高预测结果的可信度。