基于购票行为数据的城际铁路乘客市场细分研究
2021-12-05区嘉乐程碧荣许玉滢
区嘉乐,程碧荣,许玉滢
(五邑大学 轨道交通学院,广东 江门 529020)
随着城市间综合运输客运市场竞争加剧,城际铁路面临巨大的竞争压力.因此,通过分析不同类别乘客的出行行为特征,精准细分城际铁路乘客市场,对提高城际铁路服务品质及市场占有率有着重要意义.近年来,运输市场细分方面取得了不少研究成果.市场细分模型方法有很多种类[1-8],这些方法中以聚类分析较为普遍,但聚类分析得出的结果往往受聚类中心及输入数据顺序的影响,分类结果时好时坏,难以推广应用.而在概率分布与对数线性模型基础上引入因子分析与结构方程形成的潜在类别模型,可以处理分类数据,并采用极大似然估计法进行参数估计,能精准计算合适的类别数量,具有分类结果稳定、便于实际应用等特点,近年来得到广泛应用[9-10].客运市场细分研究虽已取得不少成果,但由于不同细分问题所具有的细分变量不同,潜在类别方法在城际铁路客运市场细分研究仍较为缺乏.本文以江门市城际铁路乘客为调查对象,通过调查问卷获取乘客的属性信息,利用潜在类别分析对城际铁路乘客市场进行细分,掌握购票行为数据下不同类别乘客的出行行为特征规律,据此对城际铁路客运产品的票价策略进行相应调整.
1 调查数据获取与分析
交通行为调查主要包括行为调查和意向调查两个方面.文献[11]表明,仅采用行为调查或意向调查得到的模型明显要劣于两种调查方法相结合的模型.在模型的参数化中,同时利用行为调查和意向调查所收集到的数据,更能够呈现数据的完整性.因此,为了更全面地获取乘客的属性特征和购票行为数据,本文采用以行为调查为主、意向调查为辅的调查方法.
为更好地掌握城际铁路乘客的群体特征,保证调查问卷目的明确、层次合理,问卷内容主要包含以下 3个部分:1)乘客的个人属性,主要包括乘客的性别、年龄、税前月收入、受教育程度等信息;2)乘客的出行属性,主要包括乘客的出行目的、出行费用、交通出行费用敏感度、准时性敏感度、舒适性敏感度和便捷性敏感度等;3)乘客的购票行为,主要包括乘客的购票方式、提前购票时间、购票时选择的出行日期、购票次数等.调研时间为2021年4月1日~4月5日,调研对象为江门市城际铁路旅客,共发放调查问卷520份,回收有效问卷505份.结果如表1所示.
表1 调查数据统计结果
调查结果分析主要包括乘客个人属性分析、乘客出行属性分析和乘客购票行为分析 3部分.借助 SPSS软件进行乘客属性间交叉分析,得到其分布规律.主要结论如下:乘坐城际铁路出行的乘客以年轻人和中年人为主(44岁及以下);车票费用仍是大部分乘客最为重视的因素;在交通方式选择方面,城际铁路对乘客的吸引力较低,在运输市场中的竞争地位较低.
2 城际铁路乘客潜在类别分析
潜在类别分析是一种基于类别变量与潜在变量观念相结合,对研究数据进行多样化统计分析的工具.在各个外显变量始终存在局部独立的情况下,通过使用尽可能少的潜在变量代替外显变量在不同水平下的概率分布[10].
2.1 外显变量选取
外显变量的选取对潜在类别分析模型影响重大,决定了乘客市场细分结果的合理性.根据调查结果,乘客个人属性、出行属性和购票行为数据分布较分散,因此将乘客的性别、年龄、税前月收入、受教育程度、出行目的、出行费用、购票方式、提前购票天数、出发日期、购票次数等变量选入外显变量.
2.2 模型适配性检验
潜在类别分析的适配性检验是探索最佳潜在类别数目的过程.本文利用Latent GOLD软件进行潜在类别分析模型适配性检验,将期望最大算法和牛顿—拉夫森算法结合使用[12],即在参数估计的初期使用期望最大算法进行计算,接近收敛时使用牛顿—拉夫森算法,这种组合的优势是期望最大算法在参数估计时不受初始值影响,具有稳定性,且牛顿—拉夫森算法迭代次数少、速度较快.
研究最佳潜在类别数目时,从模型的适配性指标、适配度统计量G2和各潜在类别的可解释性进行综合考量.CAIC指标和BIC准则指标越小,其模型的拟合度越高.在此基础上,还对模型的两个外显变量进行适配度研究,从而判断两个外显变量是否相互独立.若变量间不存在显著的解释残差,则其间关联性可以被潜在类别数目模型充分解释,由此进一步检验潜在类别数目的合理性.
在模型的拟合度指标中,从第一潜在类别开始,逐渐增加潜在类别数目,直至潜在类别数目达到5.LL是对数似然值,BIC、CAIC指标可根据其LL的数值进行计算,各拟合度指标如表2所示.
表2 模型适配性检验结果
BIC、CAIC、LL、 G2的数值随着潜在类别数目的增加而减少,LL、 G2的数值呈现单调递减的关系,且始终未见最低值.当潜在类别数目为3时,BIC和CAIC指标的数值分别为10 156.114 7、10 214.114 7,取值达到最小值.当BIC、CAIC指标数值越小,表明模型的拟合程度越高.潜在类别数目继续增加时,BIC和 CAIC指标的数值增加,模型的拟合优度未见明显改善.从模型的拟合度指标看来,类别数目为 3的潜在类别分析,其拟合指标具有最小的 BIC和 CAIC指标数值:BIC=13736.459 3,CAIC=3920.619 9,模型满足数据的拟合要求.因此,从模型的适配性指标进行考虑,倾向于选择保留潜在类别数目为3的潜在类别分析.
在适配度统计量 G2中,表3数值是潜在类别数目为3时两个外显变量间适配度统计量 G2的数值,以性别和年龄为例,df=(2-1)× (5-1)=4,其自由度是性别和年龄的水平数减 1的乘积.在显著水平0.05下,G2=0.2851<9.488,故性别与年龄变量之间没有显著的解释残差,其间关联性可以被潜在类别数目为3的模型充分解释.经过统计分析,整体上外显变量间在显著水平0.05下,不存在明显的解释残差,3个类别的潜在类别分析模型适配较好,能够维持变量之间的局部独立性,不需要再增加潜在类别数目来解释外显变量之间的关系.
表3 外显变量间的适配度统计量结果
在各潜在类别的可解释性中,当潜在类别数目从3类增加到4类时,如图1和图2所示,发现存在两组稳定的潜在类别——潜在类别数目为3的第2组与潜在类别数目为4的第3组,潜在类别数目为3的第3组与潜在类别数目为4的第4组,这两组在条件概率的分布上基本一致,即潜在类别数目为4的第1组和第2组是由潜在类别数目为3的第1组分离出来的.
图1 潜在类别数为3时的第2组和第3组的条件概率
图2 潜在类别数为4时的第3组和第4组的条件概率
在潜在类别数目为4的潜在类别分析中,第1组和第2组的条件概率曲线在整体上十分相似.从各个条件概率看来,只有年龄、出行费用、以互联网为购票方式、购票次数的条件概率分布差异比较明显,但其他属性的条件概率差别不大,尤其是以性别、税前月收入、受教育程度、以旅游、商务和其他为出行目的、以代售点为购票方式、提前购票天数、出发日期的条件概率,条件概率在数值上接近相等,如图3所示.通过上述的观察和对比,第1组和第2组之间整体上的区别不大,因此将第1组和第2组归纳为同一个潜在类别,即选择潜在类别数目为3的潜在类别分析更具合理性.
图3 潜在类别数为4时的第1组和第2组的条件概率
经过上述分析,模型的适配性检验、外显变量间的适配度统计量G2、各潜在类别的可解释性都倾向于选定保留潜在类别数目为3的潜在类别分析,因此最终选择包含3个潜在类别数目的模型作为本文潜在类别分析的最优模型.
2.3 参数估计与分类计算
分类计算是将所有被观测的样本分类到适当的潜在类别的过程,论文选用莫代尔分配法,通过观察后验概率的数值大小,每个样本都会被归类到后验概率最大的潜在类别.在潜在类别的分类中,根据莫代尔分配法的原理,每个样本都会被归类到贝叶斯后验概率最大的潜在类别.以第一个乘客为例,其属性特征为:性别男、年龄段在20岁及以下、税前月收入在4 000元及以下、拥有高中以下学历、以旅游为出行目的、出行费用是自费、提前4至7天通过互联网购买城际铁路的车票、预期在非工作日出发、每个月购票的次数在2次及以下.这位乘客被分配到3个类别的贝叶斯后验概率分别为0.756 9、0.243 0、0.000 0,根据莫代尔分配法的原理,从后验概率的结果可以看出,该乘客属于第一类别的后验概率最大,因此这位乘客被归纳到第一潜在类别(第 1组).以此类推,直至最后一个乘客被分配完毕.3组的潜在类别概率和不同水平下的条件概率如表4所示.
表4 模型参数估计结果
2.4 分类误差计算
理论上的分类结果是以贝叶斯理论为基础的,潜在类别分析的分类效果并不完全准确,潜在类别概率与实际分配概率存在一定的误差.在潜在类别分析理论的细分结果上,实际分配概率可以根据各个潜在类别乘客所在潜在类别的观测次数进行累计求和,得到各个潜在类别所占比重,与潜在类别概率进行对比[13],如表5所示.在本次被调查的乘客样本数下,其实际分配率分别为61.39%,23.37%,15.25%,分类结果的整体分类率达到97.300 3%,具有较高的合理性.
表5 模型参数对比
3 城际铁路乘客市场细分
3.1 各客运子市场命名
通过潜在类别分析将被调查的乘客群体划分为3个类别,结合参数估计结果,根据其条件概率的差异,将3个客运子市场分别命名为年经周末休闲型、经济计划混合型和高端商务型,各类别特性概括如表6所示.
表6 城际铁路乘客潜在类别细分种类和概论
3.2 票价策略建议
票价的高低关系到城际铁路的营收.借鉴日本新干线铁路、德国高速铁路、法国高速铁路运营现状,汇总常见票价策略及其特点,如表7所示.
表7 常见票价策略及其特点
针对以上票价策略分析,可对城际铁路各客运子市场提出有针对性的票价策略建议,以增强城际铁路在运输市场中的竞争力,如表8所示.
4 结论
本文以江门市城际铁路乘客为研究对象,通过调研获取乘客个人属性及购票行为数据,建立潜在类别模型并对城际铁路客运市场进行细分.研究结果表明,江门市城际铁路客运市场可分为年轻周末休闲型、经济计划混合型和高端商务型.本文的研究可为铁路运输部门开发个性化客运产品和优化票价策略提供决策支持.城际铁路运输部门可根据各客运市场特征制定有针对性的票价策略,满足乘客的个性化需求,以增强城际铁路在运输市场中的竞争力.