基于二分类 logistic 回归模型的特殊情况背景下民航旅客 出行意愿影响因素分析
2022-05-23章宗骞
章宗骞
“大创计划”资助,项目编号:IECAUC2021054。
摘 要:特殊情况下在全球造成了广泛影响,为民航业的发展带来了一定的阻力,为研究突发公共卫生事件风险下影响民航旅客出行意愿的因素,通过网络问卷调查回收相关数据,进行数据统计分析,在了解在不同发展阶段,旅客选择航空出行意愿的基础上,运用二分类logistics回归模型,分析研究旅客在发展的不同时期选择航空出行的影响因素。研究结果表明:收入、职业、航空出行频率、对卫生事件的恐惧程度和对卫生事件防控措施的了解程度在的不同阶段对航空出行选择有显著影响,而机上服务质量对航空出行选择有正影响。大部分影响因素指向了旅客的个人属性,所以航空公司应更加关注旅客的分类,有针对性地开展营销策略,才能吸引更多旅客选择民航出行。
关键词:突发公共卫生事件;航空出行;二分类logistics回归模型;民航旅客;影响因素
引言:突发公共卫生事件,对全世界人民的生产生活产生了不同程度的影响。而考虑到航空旅客运输的本质就是实现人的位移,运输过程中不免有人员的聚集与接触,虽然机场与航空公司都积极响应防控,但航空出行的需求还是产生了一定的萎缩。据交通运输部统计,2020 年春节期间全国日均发送旅客人次较2019年同期下降 82.3%[1];2020年一月份运输总周转量(吨)、运输旅客量(人次)、运输货物量(吨)分别同比下降4.9%、5.3%、9.8%,近15年来第一次出现客货运负增长的状况;2021春节假期期间全民航运输旅客数量357万人次,较2020年春节假期下降45.16%,较2019年春节假期下降71.64% 。同时,在后疫情时期,情况不断反复,对旅客的出行意愿带来很大的影响。所以,探究突发公共卫生事件背景下,影响旅客出行意愿的因素是有必要的,基于主要因素及因素的影响程度,制定恢复民航旅客出行信心的策略,可以支撑民航运输市场的恢复。
一、二分类logistic模型
在旅客出行方面,logistic回归的二分类模型主要用于分析影响旅客出行行为的因素,并判断这些因素对出行行为的影响程度大小[2]。
二、数据调查及样本分析
1. 数据来源
数据的收集采用网络问卷调查的方式。问卷在接受部分受访者修改建议后发放,问卷充分考虑受访者心理、环境等因素,剔除答题时间过短等无效问卷后,有效问卷共计360份。
2.影响因素选取
考虑骆晨[4]等人的相关研究,并结合民航旅客运输的实际情况,本文选取的影响民航旅客出行意愿的因素主要有性别(X1)、年龄(X2)、收入(X3)、职业(X4)、最高学历(X5)、一般航空出行目的(X6)、舱位等级(X7)、航空出行频率(X8)、对公共卫生事件的恐惧程度(X9)、对公共卫生事件防控措施的了解程度(X10)、票价(X11)、机上服务质量(X12)、机场服务质量(X13)、航班历史准点率(X14)、时刻(X15)、机上舒适程度(X16)、航空公司品牌(X17)、退改签政策(X18)、机场通达性(X19)、飞机的易感程度(X20)、机场与航空承运人的防控措施(X21)、疫苗接种情况(X22)。
3.样本分析
旅客的个人属性、心理因素和环境因素等是影响其是否选择航空出行的重要变量及模型建立的基础,主要对受访者的个人属性做区分。
参与本次调查的对象中男性较多,占55%。不同年龄段对航空出行的态度有所不同,18-30岁人群比例最高,占45.8%,其次是30-45岁人群,占44.1%。
个体的职业和收入对航空出行的选择有较大的影响,据调查结果,大多数为企事业单位职工,占64.7%,其次是公务员,两者累计百分比约为79.2%,其它还有学生、私营职业者、退休人员等;收入在5000-10000元的人群最多,占44.7%,其后是2500-5000元的人群,两者累计百分比约为73.3%,紧接是10000元以上人群,三者累计百分比为95.0%。
最高学历被预先划分为三类,专科及以下、本科和硕士及以上,分别占25%、56.7%、18.3%。一般航空出行目的根据常见种类预先划分为四种,本别是求学、旅游度假、公务出行和探亲访友,依次占0.6%、63.3%、13.3%和22.8%。
問卷调查显示,约有17.8%的旅客在选择航空出行时会选择折扣经济舱,约有60.8%的旅客会选择全价经济舱,有17.5%的旅客会选择商务舱,剩下的3.9%的旅客会选择头等舱。
通过对问卷结果的初步分析,本次调查收到了来自不同年龄段、不同学历、不同职业、不同收入群体的问卷,覆盖面广、数量较多,能够为后续建模分析提供良好基础。
4.问卷信效度分析
问卷信度分析的结果反应问卷的可信度与可靠性,主要的评价指标为克朗巴哈系数(Cronbach's α),该系数在0.7-0.8 时表示量表具有相当的信度,达到0.8-0.9 时说明量表信度非常好[5]。本研究问卷的克朗巴哈系数为0.746,表明题目之间具备一定的内部一致性
问卷效度分析是指问卷问题正确性的程度,一般使用因子分析法测量,采用KMO值或者P值检测。问卷的KMO值为0.814>0.8,Bartlett球形检验的P值为0.000<0.01,表示问卷数据适合进行因子分析。
5.二分类Logistic模型假设检验
在使用Logistic回归模型前,本研究涉及的所有变量(包括自变量与应变量)均应满足基本假设,所以需对本研究所涉及的变量进行符合Logistic模型假设检验,其中包括连续自变量与因变量的logit转换值之间的线性检验和自变量之间的多重共线性检验。
(1) 连续自变量与因变量的logit转换值之间的线性关系检验
连续自变量与因变量的logit转换值之间的线性关系检验,本研究选用 Box-Tidwell方法,将连续自变量与其自然对数值的交互项纳入回归方程,进行线性关系检验[6]。根据2.1部分的设计,本研究的连续自变量一共有15个,即X8(航空出行频率)-X22(疫苗接种情况),通过Excel计算15个变量的自然对数,与其各自的原有数值得交互项纳入回归方程中进行检验,检验使用软件IBM SPSS 22,检验结果如表1:
航空出行频率(X8)、对公共卫生事件的恐惧程度(X9)、对公共卫生事件防控措施的了解程度(X10)和航空公司品牌(X17)的交互作用P值<0.05,说明这些变量与因变量logit转换值间没有线性关系,为更好的反应这些因素对旅客是否选择航空出行的影响,在后续研究中将X8、X9和X10转化为分类变量引入回归模型,使用虚拟变量的方式进行处理;航空公司品牌(X17)将不再列入后续研究中。
(2)多重共线性检验
容忍度(Tolerance)或方差膨胀因子(VIF)可以用来诊断自变量之间的多重共线性。因该检验在IBM SPSS 22中操作过程较为简单而不做展示。在本研究中,容忍度(Tolerance)均大于0.1,方差膨胀因子(VIF)均小于10,所以不存在多重共线性。
三、 结果与分析
1. 回归结果
为了更准确了解旅客的出行意愿,本文分别分析了突发公共卫生事件刚出现、突发公共卫生事件造成严重影响、突发公共卫生事件稳定以及突发公共卫生事件反复等四个阶段下旅客的出行意愿特征。以突发公共卫生事件反复阶段为例,将旅客是否会在突发公共卫生事件反复时期选择航空出行作为应变量,X1-X22(除X17已被剔除)作为自变量进行二分类logistic回归。回归模型的拟合结果如表2所示。
另外,在本研究中,Omnibus 检验中P =0.000<0.05,即模型总体有意义。将自变量重新引入模型后的回归模型进行预测,预测正确率为70.4%,比没有自变量只有常数项时的51.7%高了18.6%。
自变量对因变量的影响是是否有统计学意义,即是否有显著性影响,可通过回归系数的P值来反映。一般认为,当P<0.05时有意义。二分类logistic回归方程的部分结果(本文中只将P<0.05的自变量列出)如表3所示:
此外,在突发公共卫生事件刚刚出现时,最高学历、航空出行频率、不同舱位等级、对公共卫生事件的恐惧程度和机场与航空承运人的防控措施的P值小于0.05,为显著性因素;在突发公共卫生事件严重阶段,年龄、收入、最高学历、出行目的、航空出行频率、对公共卫生事件的恐惧程度、票价、机场服务质量、时刻、机上服务质量、退改签政策和飞机的易感程度P值小于0.05,为显著性因素;在突发公共卫生事件平稳时期,航空出行频率、舱位等级、对防控措施的了解程度、机场服务质量的P值小于0.05,为显著性因素。
2.结果分析
以突发公共卫生事件反复阶段为例,进行结果的详细分析。
(1)收入与航空出行选择
在本研究中,收入是四分类变量,拟合模型中所有变量P=0.000<0.05,对照的3个变量对航空出行选择有显著影响。收入在2500-5000元的相对于2500元以下的航空出行选择发生比变化0.340倍,发生比降低66%;收入在5000-10000元模型拟合中P=0.012,EXP(B)=0.274,表明收入在5000-10000元的群体对航空出行选择有显著性影响,收入在5000-10000元的相对于2500元以下航空出行选择发生比变化0.274倍,发生比降低72.6%;同理可知,收入在10000元以上的相对于2500元以下航空出行选择发生比变化0.294倍,发生比降低70.6%
该分类变量的结果表明,随着收入的增加,可能存在着航空出行选择先减少后增加的趋势。随着收入的增加,更多的出行会是公务出行,即使在突发公共卫生事件有所反复的背景下,公务出行的可变程度还是远小于休闲出行。
(2) 职业与航空出行选择
在职业的划分中,本研究划分了5各组别,在拟合模型中,以学生作为参照组,企事业单位、私营职业者和退休人员的P值大于0.05,这三个职业群体对航空出行选择影响不显著。
公务员相对于学生航空出行选择发生比变化提高2.075倍,发生比增加107.5%。公务员相较于学生而言,不仅有更多的出行需求,而且会有更多的公务出行需求(出差),所以航空出行选择的发生率更高。
虽然其它职业群体以学生为参照群组没有显著影响,但是通过回归系数可以看出,在突发公共卫生事件反复的背景下,企事业单位、私营职业者和退休人员的航空出行选择发生率都要高于学生,这也与实际相符合。
(3) 航空出行频率与航空出行选择
航空出行频率是四分类变量,包括0次、1-3次、4-6次和7次及以上,拟合模型中所有变量P=0.000<0.05,对照的3个变量对航空出行选择有显著影响,且1-3次EXP(-3.568)=0.028,4-6次EXP(-3.549)=0.029,7次及以上EXP(-3.051)=0.047,可以看出,在突发公共卫生事件反复的背景下,原先年航空出行次數越多的群体,仍然选择航空出行的发生率越高。
(4)对公共卫生事件的恐惧程度与航空出行选择
在恐惧程度的划分中,共界定出不恐惧、较不恐惧、一般恐惧、恐惧和非常恐惧五个组别,在拟合模型中,以不恐惧群体为参照群体,非常恐惧的P值大于0.05,相对于不恐惧的群体,非常恐惧对航空出行选择的影响不显著。
而较不恐惧、一般恐惧与恐惧的群体在模型拟合中P值小于0.05,相对于不恐惧的群体对航空出行选择有显著影响。三者间的乃至后四者间的相互关系还需进一步统计分析。
(5)对公共卫生事件防控措施的了解程度与航空出行选择
对公共卫生事件防控措施的了解程度按照程度不同划分为五个分类,只有比较了解组别相较于不了解组别对航空出现选择有显著影响,且EXP(-0.882)=0.414,比较了解组别相对于不了解组别航空出现选择发生比降低59.6%。有受访者反映经历过登机前被告知是3天居家隔离但落地后却被告知是集中隔离14天,这明显属于“不了解”组别而选择了航空出行后计划受到影响。
(6)服务质量与航空出行选择
机上服务质量是连续变量,拟合模型中P=0.012<0.05,说明机上服务质量对航空出行选择有显著影响,回归系数=0.187,说明在突发公共卫生事件反复的背景下,机上服务质量越好,航空出行选择发生率越高。
机场服务质量也属于连续变量,拟合模型中P=0.001<0.05,但回归系数为负,这与预期和实际有些出入,在排除共线性问题后,应考虑本题设计问题,故不再详细讨论。
3.突发公共卫生事件不同阶段影响因素分析
在突发公共卫生事件刚刚出现的时期,影响因素与突发公共卫生事件反复阶段相差较小,有最高学历、航空出行频率、不同舱位等级、对公共卫生事件的恐惧程度和机场与航空承运人的防控措施。
而到了突发公共卫生事件造成严重影响的时期,旅客关注的因素明显增加,新增有票价、时刻、机上服务质量、退改签政策和飞机的易感程度等因素,反映了出行需求、突发公共卫生事件影响与政策三者之间的矛盾。
在突发公共卫生事件平稳,大部分时间无本土新增的时期,航空出行频率、舱位等级、对防控措施的了解程度和机场服务质量,体现了突发公共卫生事件对切实有出需要的旅客造成了影响,而这些旅客十分关心防控措施政策。
四、结语
旅客在突发公共卫生事件背景下对航空出行选择的影响因素主要有收入、职业、航空出行频率、对公共卫生事件的恐惧程度、对公共卫生事件防控措施的了解程度、机上服务质量等,且在不同时期有不同的体现。在突发公共卫生事件反复时期,票价、时刻等因素对旅客选择航空出行影响较小,而在突发公共卫生事件造成严重影响的时期票价、时刻等因素又成为了旅客重点关注的因素。
(1)突发公共卫生事件反复的背景下,在一定收入范围内,随着收入的增加,存在航空出行选择先减少后增加的趋势。
(2)在突发公共卫生事件反复的背景下,公务员、企事业单位职工等不同职业者对航空出行选择的发生率都高于学生群体,其应源于学生的出行刚需都小于其它职业群体。
(3)在突发公共卫生事件反复的背景下,原先年航空出行频率越高的群体,仍然选择航空出行的发生率较高。
(4)对突发公共卫生事件较不恐惧、一般恐惧和恐惧的群体相较于不恐惧的群体,航空出行选择的发生率会降低。
(5)对各地(尤其是目的地)公共卫生事件防控措施更较了解的群体,在选择航空出行时会更加谨慎(大多偏向取消出行)。
(6)机上服务质量是回归模型少数的可控因素,其对航空出行选择的发生率有正向影响。
由结果可知,大部分因素集中在旅客的个人属性上,年龄、收入和选择的舱位等级等,所以在做好对旅客的分类基础上,保证旅客关注的客观因素,如票价、时刻等,能有效提升经济效率。
参考文献:
[1]哈亿辉,蒋宇星.新冠肺炎疫情下中国旅游业的挑战和机遇[R].香港:埃森哲战略, 2020. HA Yi-hui, JIANG Yu-xing. Challenges and Opportunities of China's Tourism Industry Under the COVID-19 Epidemic[R].Hong Kong: Accenture, 2020.
[2]王玉潇,刘汇,赵天成.低碳旅游出行选择行为机理及实证研究[J].科技经济市场,2019(03):134-137.
[3]丹尼尔·A·鲍威斯,谢宇. 分类数据分析的统计方法[M]. 任强,巫锡炜,穆峥,译. 2版. 北京:社会科学文献出版社,2009.
[4]骆晨,董青,姚擎,张海荣,王倩茹.突发公共卫生事件持续期居民中长距离出行方式选择行为研究[J].交通运输系统工程与信息,2020,20(06):57-62.DOI:10.16097/j.cnki.1009-6744.2020.06.007.
[5]张文彤,董伟.SPSS 统计分析高级教程[M].北京:高等教育出版社, 2004. ZHANG Wen-tong, DONG Wei. SPSS Statistical Analysis Advanced Course[M].Beijing: Higher Education Press(HEP),2004:364.
[6]劉强,张一桥.基于二项分类Logistic回归模型的我国居民体育锻炼参与影响因素的研究[J].体育科技文献通报,2021,29(12):162-164+189.DOI:10.19379/j.cnki.issn.1005-0256.2021.12.049.