基于贝叶斯网络的公交停靠站服务质量改善策略研究
2018-08-29刘建荣
刘建荣
(华南理工大学土木与交通学院 广州 510640)
0 引 言
随着经济的发展,我国城镇化和机动化快速发展,城市越来越拥堵,根据高德地图,2017年第一季度,我国已有28个城市的延时指数超过1.5.机动化的发展造成了交通拥堵、温室效应、空气污染等大量问题.为缓解此类问题,迫切需要发展公共交通.根据文献[1]可知,乘客对于公共交通的满意度与公交分担率之间正相关,即乘客对公交满意度的提升能够促进公交分担率的增长.作为公交系统的重要组成部分,公交站台的满意度对公交服务的整体满意度有显著影响[2],而公交站台的满意度与公交站台服务质量显著相关[3-5].
由于服务的无形性、服务的生产与消费同时进行等特点,服务质量与有形的产品质量之间存在巨大的差异[6],因此,尽管存在公交服务质量应该从乘客的主观感知还是利用公交的客观指标进行评价的争论,从研究现状来看,大部分关于站台服务质量的研究基于乘客的主观感知展开的.文献[7-11]均是从乘客的主观感知研究车站服务质量.此外,文献[12-14]采用站点覆盖率、等待时间等客观指标研究站台服务质量.从站点类型来看,大部分研究涉及到的是铁路站点、地铁站点,涉及到公交站点服务质量的文章极少.对于车站服务质量的影响因素,大部分研究认识应包括时间特性、环境、时间特性、安全性等特征.
总体而言,目前对于公共交通站点服务质量的研究存在以下几个问题:①对于站点服务质量影响因素与公交站点满意度的关系尚不明确,即不清楚满意度的各个影响因素的权重;②服务质量影响因素众多,为改进公交站点满意度,应如何确定各个影响因素的优先次序,目前尚不明确.基于以上背景,本文基于贝叶斯网络,对常规公交服务质量进行研究,以确定常规公交满意度的各个影响因素对乘客满意度的影响大小,在此基础上,基于乘客评价,确定公交服务质量的改善策略.
1 贝叶斯网络
贝叶斯网(Bayesian networks)将复杂的联合概率分布分解为一系列相对简单的模块,从而大大降低概率推理的复杂性.作为标准朴素贝叶斯模型的改进树扩展朴素贝叶斯模型(TAN)允许每一个预测变量除了依赖于目标变量之外,还依赖于其他预测变量,由此增加分类的准确度.在TAN模型中,联合概率分布为
(1)
式中:属性变量Ai的父节点π(Ai)不仅包括类别变量C,也可能包括其他属性变量.
由于TAN模型不要求局部独立假设成立,因此模型的分类效果一般比朴素贝叶斯网络更好,能够增加分类的准确性[15].
2 问卷设计
分析已有论文对于各种类型站点、停靠站的服务质量影响因素,结合公交停靠站的特点,本文将公交停靠站服务质量分为可达性、信息、时间、环境、投诉等几大类,每一类中分别包含若干影响因素.具体见表1.
表1 公交停靠站服务质量影响因素
此外,为分析出行者的个人属性对公交停靠站总体满意度的影响,还调查了出行者的使用公交频率、收入、出行目的、性别、对所要乘坐的公交线路熟悉与否、到达公交站点的方式、是否使用智能手机搜寻车辆信息、是否拥有私家车等基本信息.其中使用公交车频率分为2次及以下/周、3次及以上/周两种情形;出行目的分为回程、日常需要、娱乐、上班四种情形;收入以5 000元/月为界限,分为两类;到达公交站方式分为:步行、自行车、公交、地铁、其他等类型.调查于2017年5—7月进行,调查选择在天气良好的工作日,共调查得到有效样本596份.
3 数据分析
3.1 影响因素相对权重分析
为分析表 1中所列的15个影响因素和出行者的个人属性对出行者的影响,在贝叶斯网络分析中,影响因素包括1~14和出行者的个人属性.贝叶斯网络采用TAN模型,参数学习方法中的,对于较小的数据集,存在模型过度拟合的风险以及出现大量零计数的可能性,因此,本文对小单元格计数进行贝叶斯调整,通过应用平滑来减少任何零计数以及不可靠的估计结果带来的影响,从而解决过度拟合的风险等问题.通过TAN学习,得到模型的总体的总体正确率为81.04%,模型的整体拟合度较好.根据TAN模型分析,各影响因素的相对权重见表 2.其中相对权重为归一化的权重,即各影响因素的相对权重之和为1.
表2 影响因素权重
注:使用公交出行的频率,分为高频率(3次/周及以上)和低频率(2次/周及以下);收入,分为低收入(5 000元/月以下)和中高收入(5 000元/月以上);出行目的,分为回程、日常需要、娱乐、上班;职业,分为学生和工作群体;熟悉程度为是否熟悉所要乘坐的公交线路;方式为到达公交站台的方式,分为步行、自行车、公交、地铁、其他;APP为是否使用智能手机APP获取实时信息;私家车为是否拥有私家车.
由表2可知,仅使用公交出行的频率对公交站台总体满意度有较大影响.有鉴于此,有必要根据使用公交频率,对出行者进行分类.针对高频率公交使用者和低频率公交使用者,分别利用贝叶斯网络进行数据分析.对低频率组和高频率组出行者分别利用TAN进行数据分析,得到低频率组、高频率组的整体正确率分别为87.5%和83.5%,正确率高.低频组和高频组中各影响因素的相对权重见表 3.
表3 低频率组和高频率组影响因素相对权重对比
由表3可知,逆序表示影响因素的相对权重是从大到小排列,即1表示相对权重最大.根据表3数据,对于低频率组乘客而言,最重要的4个影响因素分别是 12(挡雨、遮阳设施、座位等设施)、 6(等车时间)、 7(可靠性)和 1(站台周边步行环境);对于高频率而言,最重要的4个影响因素是 13(站台安全)、 9(站台噪声)、 8 (换乘便捷性)、 4 (公交车到达实时信息).从相对权重来看,低频率组和高频率组对于站台影响因素权重的评价有较大不同.
3.2 影响因素满意度分析
为分析公交乘客对于1~14的每一个影响因子的评价,对于低频组和高频组,分别计算每一个影响因子的平均满意度,具体见表 4.
表4 影响因素满意度
由表 4可知,顺序表示满意度按从小到大顺序排列.低频率组最不满意的4个影响因素依次是:4(公交车到达实时信息)、9(站台噪声)、14(投诉系统)、6(等车时间).高频组与低频组类似,也是对这4个影响因素最不满意.
3.3 IPA模型
为综合分析应如何改善共享自行车服务质量,应综合考虑服务质量中各影响因子的权重以及满意度.根据表 3~表4的相关数据可知,权重的变化范围为0~0.11,而影响因子满意度从2.5~3.8,二者的范围差异较大.为此,为消除数据变化范围导致的差异,需要对二者进行归一化处理.在不满意度归一化及相对权重归一化的基础上,建立综合考虑满意度及权重的IPA(importance performance analysis)模型:
(2)
式中:IPi为第i个影响因子的综合评价指数;Si为第i个影响因子的平均满意度.
由式(2)可知,综合评价指数即考虑了权重,也考虑了不满意度,而且消除了权重和不满意度量纲的影响.IPi的数值越大,表明使用者认为影响因子i越重要,或者对影响因子i越不满意.综合表 3~4的数据以及式(2),可以得到低频率组、高频率组和样本整体的IP值见表 5.
表5 影响因素IP值对比
由表5可知,IP逆序是指IP按从大到小顺序排序,顺序越靠前,表明越需要改进.对于低频率组,最需要改进的6个影响因素分别是: 12(挡雨、遮阳设施、座位等设施)、 6(等车时间)、 4(公交车到达实时信息)、 7(可靠性)、 1(站台周边步行环境)、 13(站台安全);而对于高频率组而言,最需要改进的6个因素分别是: 9(站台噪声)、 13(站台安全)、 4(公交车到达实时信息)、 8(换乘地铁便捷性)、 14(投诉系统)、 12(挡雨、遮阳设施、座位等设施).
低频率组乘客与高频率组乘客均认为挡雨、遮阳设施、座位等设施、公交车到达实时信息、站台安全需要改进,因此在提高公交服务质量中,应首先关注站点实时信息板的安装、遮阳挡雨棚的安装、座位的安装以及改善公交站台的安全性,如不能将站台与机动车道设置于同一水平面,站台宽度应当得到保证等.此外,低频率组与高频率组对公交满意度影响因素的关注重点也有部分不同,低频率组乘客认为等车时间、可靠性、站台周边步行环境需要改进.高频率组认为站台噪声、换乘地铁便捷性、投诉系统需要改进.鉴于站台噪声、换乘地铁便捷性一般较难改善,因此着眼于改善公交的投诉系统.
4 结 束 语
本文利用贝叶斯网络研究了公交站台满意度的影响因素,根据分析发现出行者使用公交频率对公交站台满意度有较大影响.为此,将出行者分为低频率组与高频率组,分别分析两个群组的公交站台影响因素的权重及满意度.分析发现,对于低频率组乘客而言,最重要的4个影响因素分别是挡雨、遮阳设施、座位等设施、等车时间、可靠性、站台周边步行环境;对于高频率而言,最重要的4个影响因素是站台安全、站台噪声、换乘便捷性、公交车到达实时信息.而两个群组均对公交车到达实时信息、站台噪声、投诉系统、等车时间最不满意.基于影响因素的权重以及满意度,本文建立了IPA模型,通过IPA模型发现,在公交服务满意度的改善中,应优先改善挡雨、遮阳设施、座位等设施、公交车到达实时信息、站台安全.
本文主要利用调查地点为广州市中心区,调查时间为天气良好的工作日.由于广州地处华南地区,高温多雨天气所占比例较大,因此在未来的研究中,可考虑分析不利天气情况下,出行者满意度的影响因素对满意度的影响,并与天气良好情况下进行对比分析,以提高不利天气情况下,出行者的使用公家的满意度.