基于混合回归模型的客运专线旅客市场细分研究
2014-09-06钱丙益陈崇双
钱丙益,帅 斌,陈崇双,李 静
(1. 西南交通大学 交通运输与物流学院,四川 成都 610031;2. 西南交通大学 数学学院,四川 成都 610031)
为满足城际间日益增长的旅客运输需求,快速客运网络的覆盖范围进一步延伸,国内客运市场的竞争将更加激烈,买方效应也将更加突出。面对这种形势,我国客运专线公司可以借鉴航空业,以及美、 法、 德、 英等国家铁路公司的经验[1-2],采用收益管理的方法,在充分发挥客运专线快速、节能优势的前提下显著提高运营收益,并确立客运专线在客运市场中的主导地位。
收益管理核心理念是在合适的时间,以合适的价格将适当数量的产品销售给合适的顾客,实现收益的最大化[3]。收益管理是在市场细分[4],以及对细分市场分析和预测基础上,确定最优定价或存量控制策略。因而市场细分是应用收益管理实现收益最大化的前提和关键。就客运专线而言,市场细分是指根据旅客的经济社会特性、出行需求、购买偏好、购买行为等方面的明显差异,将整个市场划分成若干个不同类型旅客群体的过程,使各个旅客群体都有各自独特的特征。因此,结合武广客运专线旅客满意度调查数据,采用混合回归模型对客运专线旅客市场细分进行研究。
1 调查设计与数据搜集
1.1 调查设计
客运专线产品有多个属性,如安全、舒适、速度、准点、价格等。旅客不同,偏好不同,对产品属性重要性的评价也不同,这种权重的差异性正是旅客需求差异的核心所在。相比于旅客的经济社会特征和出行需求特征,旅客的产品属性偏好对其购买行为所起的决定性作用更直接、更精确和更具可预测性。因此,选择产品属性权重作为客运专线旅客市场细分标准。
在专家访谈和因子分析的基础上,选择安全(X1)、舒适(X2)、速度(X3)、频率(X4)、准点(X5)、价格(X6)、便捷(X7)共计7项客运专线产品属性体现旅客属性偏好差异。同时,选择满意度体现旅客对客运专线产品的总体评价。满意度随7项属性的变化而变化,而且为客运专线收益管理所重点关注的内容,因而可以将满意度作为因变量,客运专线产品属性作为自变量。这2类变量的取值可以由旅客按照百分制评分获得。
除产品属性和满意度之外,问卷还包括对旅客性别、年龄、职业、个人月收入等经济社会特征,以及出行目的、到站方式、周乘动车次数、费用来源等出行需求特征的调查。
1.2 数据搜集
2010年12月28 日—2011年1月5日,对武广客运专线旅客进行了问卷调查,主要包含5个工作日和4个休息日,涉及武汉站、岳阳东站、长沙南站、衡阳东站、郴州西站、韶关站、清远站、广州南站8个车站。调研采用分层抽样的方法,分车次随机选取旅客进行面对面问卷调查,共发放问卷5600份,收回5367份,有效问卷5337份,回收有效率为95.31%。
2 混合回归细分模型构建
混合模型最早出现于19世纪末期,其最大特点是能够利用密度函数来描述数据的同质性和异质性[5-6]。随着计算机计算速度的提高和期望最大化算法(Expectation-Maxization Algorithm,EM)的提出等,混合模型得到了极大的复苏,应用领域更加广泛[7]。
混合回归模型是在混合模型的基础上发展起来的,并在市场细分中得到广泛应用。借助混合回归模型,实现图形模式的有效识别,验证了该模型在数据挖掘和模式识别中的可用性[8];另外,还分别实现了笔记本电脑和百货商店市场的有效细分[9-10]。以上研究成果表明,混合回归模型是市场细分的一种有效方法。
式中:βk为回归模型截距,表示由安全、舒适、速度、频率、准点、价格、便捷以外的其他客运专线产品属性对第 k 类旅客的满意度所产生的影响;Xh=(Xh1,Xh2,…,Xh7)为由问卷调查得到的第 h 名旅客对各个产品属性评价值构成的向量;θk=(θk1,θk2,…,θk7)T为回归模型系数向量,表示第 k 类旅客对各个产品属性的权重;εk为残差值,服从均值为0、方差为的正态分布。记 Yh的密度函数为 gh,在给定 βk,θk和 σk时,其条件密度函数为 f(Yh| βk,θk,σk),则根据全概率公式,二者之间关系为
公式⑵为一个典型的混合回归模型。该模型共有10K 个参数,包括 K 个比例系数、K 个截距、7K 个回归系数和 K 个方差。为此,采用极大似然法对其估计,得到 H 名旅客的似然函数为
相应的对数似然函数为
由于 EM 算法简单稳定、易于实施,而且通过多个初始值的设定,可以保证在最大值上收敛,是目前混合回归模型参数估计常用的一种方法[11-12]。采用 EM 算法对公式⑷进行估计。
估计出 ρk,βk,θk和 σk(1≤k≤K)后,根据贝叶斯原理,由公式⑸即可以计算出第 h 名旅客属于第 k 种类型的概率 phk,进而采用无重叠分配的方法,将每名旅客分到相应的类型中。
在判定旅客种类个数时,通常采用贝叶斯信息标准(Bayesian Information Criterion,BIC)和赤池信息标准(Akaike Information Criterion,AIC),计算公式为
研究选取规则为当两者都达到最小时所对应的值即为细分的旅客种类个数。
3 模型结果分析
3.1 客运专线旅客市场细分
借助统计软件 R 中的 Flexmix 程序包,对 K 取2~9的8个模型分别进行估计,同时对每个 K,均采用30个不同的初始值进行重复计算,表1列出了各个模型的 BIC 值和 AIC 值。由表1可以看出,K 取4最合适,此时模型中各个参数的估计值如表2所示。
表1 旅客种类个数及对应的 BIC 值、AIC 值
表2 模型参数估计值
由表2可知,第1类旅客认为最重要的产品属性是准点、频率和速度3项,因而可以将其称为效率型旅客。第2类旅客认为价格是最重要的属性,因而将其称为经济型旅客。第3类旅客最看中舒适、安全和便捷,因而将其称为休闲型旅客。对于第4类旅客而言,各产品属性的重要性差异不大,因而将其称为体验型旅客。
由此表明,不同类型的旅客对客运产品的不同属性具有不同的偏好,这种外在的差异性是由其内在的经济社会特征和出行需求特征决定的。为此,利用关联分析对旅客性别、年龄、职业、个人月收入等经济社会特征,以及出行目的、到站方式、周乘动车次数、费用来源等出行需求特征进行分析。
3.2 不同类型旅客经济社会特征分析
不同类型旅客经济社会特征如表3所示。由表3可以看出,在性别方面,客运专线旅客市场中男性旅客居多,其中效率型和休闲型的男性旅客超过总体比例。另外,不同种类旅客的性别比例不等,尤其以效率型旅客性别比例差距最为悬殊。
在年龄方面,效率型、经济型和体验型旅客中80% 左右在26~45岁之间;而休闲型旅客中,18岁以下和56岁以上2个年龄段旅客人数都较少,加起来不到10%,18~25岁、26~35岁、36~45岁、46~55岁这4个年龄段上的人数分布较为均匀。
表3 不同类型旅客经济社会特征 %
在职业方面,客运专线旅客中企事业单位人员和个体经营者居多,二者合计占总样本超过60%。相比于总样本,效率型旅客中公务员和企事业单位人员二者的比重明显高于平均水平;经济型旅客中,工人、农民和学生这3类旅客所占的份额全部高于总体平均水平;休闲型旅客中,企事业单位工作人员和个体经营者所占份额均超过30%,而且离退休人员的比重增加得较为明显;体验型旅客中,工人、农民和离退休人员的比重有所增加。
在个人月收入方面,不同种类旅客之间差异明显。效率型旅客中约70% 个人月收入在1500~5000元之间,1501~3000元、3001~5000元2个收入水平区间上的旅客比重均高于总体水平;休闲型旅客中,超过70% 的旅客月收入在5000元以上,5001~8000元、8000元以上2个区间旅客比重均明显高于总体水平;经济型和体验型旅客中,个人月收入在5000元以下的旅客占总样本90%以上。
3.3 不同类型旅客出行需求特征分析
不同类型旅客出行需求特征如表4所示。
从表4可以看出,从出行目的来看,效率型旅客主要集中于因公出差和个体经商,约占89%,二者分别超出总体样本26和4个百分点;上学和旅游的比重较小,分别比总样本少4.3% 和11.6%。经济型旅客中,外出务工的旅客最多,比总样本高了15个百分点;上学旅客的比重与总样本相比增加了约11个百分点,达到了15.6%。休闲型旅客中,以因公出差为目的的旅客约占40%,相比于总样本少了近7个百分点;旅游和探亲访友的旅客各占20%以上,相比总样本前者增加了12.1%,后者增加了6.7%;上学和外出务工的比重非常小,二者之和还不到1%。体验型旅客中,旅游和探亲访友的旅客比重稍大,相比总体翻了1倍左右;因公出差和上学的比重相差不大,均在14% 左右;个体经商的旅客比重最小,不到4%;与总样本相比,上学的旅客比重明显增加,接近10个百分点。
表4 不同类型旅客出行需求特征 %
旅客到车站选择的交通方式,主要集中于公共交通、出租车和私家车,选择这3种交通方式的旅客比例接近90%,选择公家车和铁路车站换乘的旅客较少,而选择步行和自行车的旅客极少。对比而言,效率型旅客更倾向于选择出租车,经济型、休闲型和体验型旅客则更倾向于选择公共交通。
乘客每周乘动车组列车次数方面,效率型旅客的频率最高,约1周5次;休闲型旅客的频率次之,约1周2次;经济型和体验型两类旅客的频率最低,1周不到1次。
车费来源方面,效率型旅客以公费居多,经济型、休闲型和体验型旅客都以自筹居多。
4 结束语
目前,我国高速铁路建设在一定程度上缓解了旅客出行难的局面,与此同时,旅客的需求结构更趋于多样化和合理化,国内客运市场的竞争也日益激烈。在如此的市场基础和市场竞争环境下,收益管理具有明显的应用优势和实用效果。以此为出发点,结合旅客问卷调查数据,利用混合回归模型,将武广客运专线旅客市场细分为4种类型,并借助关联分析分别对各种类型旅客的经济社会特征和出行需求特征进行了分析,为制定科学的客票差别定价和席位控制策略、开展收益管理理论研究和实践应用提供参考依据。
:
[1]Smith B C,Leimkuhler J F,Darrow R M. Yield Management at American Airlines[J]. Interfaces,1992,22(1):8-31.
[2]田 原,黄四民,李济坤. 收益管理在欧美铁路中的应用[J]. 中国铁路,2008(6):63-66.
[3]Yeoman I,Ingold A,Kimes S E. Yield Management:Editorial Introduction[J]. Journal of the Operational Research Society,1999(50):1083-1084.
[4]Smith Wendell. Product Differentiation and Market Segmentation as Alternative Marketing Strategies[J]. Journal of Marketing,1956(21):3-8.
[5]Titterington D M,Smith A F M,Makov U E. Statistical Analysis of Finite Mixture Distributions[M]. New York:Wiley,1985.
[6]McLachlan G J,Basford K E. Mixture Models:Inference and Applications to Clustering[M]. New York:Marcel Dekker,1988.
[7]Wedel M,Wagner K. Market Segmentation:Conceptual and Methodological Foundations [M].2nd ed.Boston:Kluwer Academic Publisher,2000.
[8]马江洪,葛 咏. 图像线状模式的有限混合模型及其EM算法[J]. 计算机学报,2007,30(2):287-296.
[9]王 高,黄劲松,赵子君,等. 应用联合分析和混合回归模型进行市场细分[J]. 数理统计与管理,2007,26(6):941-950.
[10]谢 赞,王 高,李 飞. 混合回归模型在百货商品市场细分中的应用. 数理统计与管理,2009,28(2):225-231.
[11]Blimes J. A Gentle Tutorial of the EM Algorithm and Its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Model[R]. Berkeley:International Computer Science Institute,1998.
[12]茹诗松,王静龙,淮晓龙. 高等数理统计[M].2版. 北京:高等教育出版社,2006.