APP下载

基于IPSO−XGB的城市轨道交通车站服务质量评价

2019-04-26蒋琦玮吴小兰冯芬玲李万

铁道科学与工程学报 2019年4期
关键词:服务质量轨道交通车站

蒋琦玮,吴小兰,冯芬玲,李万



基于IPSO−XGB的城市轨道交通车站服务质量评价

蒋琦玮,吴小兰,冯芬玲,李万

(中南大学 交通运输工程学院,湖南 长沙 410075)

针对城市轨道交通车站服务质量评价体系不够完善和指标赋权方法较单一的现状,结合当前乘客消费理念及出行习惯,构建基于乘客感知的初始评价指标体系。应用改进粒子群算法(IPSO)与极端梯度提升树(XGB)的混合算法IPSO-XGB计算各指标权重,结合乘客满意度,形成IPA矩阵,得到最终的评价结果,并进一步精简评价指标体系。以长沙地铁五一广场站为例,用分类误差率衡量算法优劣,对车站服务质量进行评价,并将其结果与分类回归树、神经网络等评价算法进行对比。研究结果表明:本文提出的IPSO-XGB评价算法的分类误差率最小,可降至3.85%。

城市轨道交通车站;服务质量评价;IPSO−XGB;IPA矩阵分析;赋权

截止到2017年底,我国城市轨道交通运营总里程达5 033 km,同比增长21.5%。目前,国内外城市轨道交通服务质量评价大多以运营线路为评价单元,将全线所有车站和列车到发情况一同评价。这种评价模式没有考虑到不同车站设施配备和员工服务的区别,难以得到准确的评价结果。因此,轨道交通车站应作为一个独立的整体进行评价。公共交通服务质量评价常用方法可分为2类:一类是定性和定量相结合的评价模型,如层次分析法、模糊综合评价等,另一类是定量评价模型,如神经网络、树模型等。Quadros等[1]应用层次分析法对巴西基础交通设施的标准优先级进行了评估;鞠蓓等[2]应用模糊综合评价模型对铁路客运网站的服务质量进行了综合评价。上述模型容易受决策者的主观影响,难以得出较为客观的结论。杨国元等[4]建立了BP神经网络(BPNN)求解模型,对客运服务质量进行综合评价,并与模糊综合评价法进行对比[3];Machado-León等[4]使用分类回归树模型(CART)和满意度-重要性矩阵(IPA矩阵),对阿尔及尔市内3种轨道交通的服务质量进行评估。相比定性与定量相结合的评价模型,这些模型通过发掘数据间的内部关系,可以客观准确的对不同指标进行赋权,避免了主观认识对结果的影响。以上定量评价模型中,决策树模型应用较为广泛,但存在过拟合的缺陷。极端梯度提升树(XGB)算法作为集成学习中的一种优化算法,可以避免该问题,目前已在不少方面得到应用[5−7]。XGB算法参数较多,以往文献中应用的手动调参[8]、随机搜索[9]和网格搜索[10]等方法搜索速度较慢且难以找出较优参数组合。而粒子群算法(PSO)具有搜索速度快、调整参数少、易于实现的特点,适合用于多参数优化问题。因此,在结合当前乘客消费理念及出行习惯的基础上,构建基于乘客感知的城市轨道交通车站初始评价指标体系。利用经过改进粒子群算法优化后的XGB评价模型(IPSO-XGB)计算各指标权重,结合乘客满意度,形成IPA矩阵,得出城市轨道交通车站的评价结果。

1 城市轨道交通车站服务内容

乘客对车站的满意度由车站向乘客提供的各项服务的总体感知所决定,具体包括服务设施、服务人员、服务环境、票务服务和延伸服务等内容。按照乘客进站−(购票)−安检−过闸−候车−乘车−下车−(换乘)−出站等大致流程,站内服务设施依次有:步行通道、自助售票机、安检仪器、检票闸机、电梯扶梯、候车座椅、应急设施、广播设备、屏显装置和标志标识等。与普通车站相比,在换乘站中,部分乘客多一道换乘程序。而在整个换乘过程中,对乘客影响最大的因素是换乘标识,因此在对换乘站进行评价时需对该指标进行特别考虑。一般情况下,乘客能够自主乘车,但若乘客需要充值、购票,或对车站结构缺乏了解,则需要工作人员的帮助才能乘车。因此,服务人员的效率、态度和实际在岗情况等会影响乘客对车站的总体感知。此外,包括卫生状况、空气质量、客流秩序、安保状况等在内的服务环境也是乘客感知的一个重要方面。

票务服务是车站客运工作的重点,除了传统的兑零和自助售票服务外,车站还应考虑乘客的新生需求,及时拓展票务服务的形式及内容。例如,随着移动支付的兴起,越来越多的出行者不再携带现金,而目前大多数城市轨道交通票务系统尚不支持移动支付,给乘客带来了较大不便。此外,现行车票种类单一,轨道交通可以推出更多的车票形式,例如3日票和月票等其他票种,以满足不同乘客的出行需求。

延伸服务常包含站外乘车指引和站外换乘距离等内容,但仍需要考虑一些更加实际的问题。轨道交通大多建于城市公交之后,如果公交系统和轨道交通的密钥体系不同,持公交卡的乘客在乘坐轨道交通时就会面临‘刷卡不互通’和‘充值不互通’的问题。一般来说,‘充值不互通’的情况更为常见,结合前文提到的票务服务中支付方式的缺陷,更多乘客的出行将会受到此因素的制约。这无疑增加了乘客的进站难度和出行时间,甚至会导致部分乘客流失。

综上,从乘客感知的角度出发,基于服务设施、服务环境、服务人员、票务服务和延伸服务5个方面,形成了轨道交通车站初始评价指标体系,如表1所示。

表1 城市轨道交通车站服务质量评价指标体系

2 研究理论与方法

2.1 XGB理论概述

在XGB中,目标函数由损失函数和正则项 组成:

通常情况下,二阶近似可以加快实现目标函数的优化。因此将式(3)展开为:

其中:gh代表损失函数的一阶导数和二阶导数。

2.2 IPSO算法

PSO是由Eberhart等[12]提出的一种并行式启发式算法。为了避免粒子陷入局部最优,需对其中的惯性权重和学习因子等参数的取值进行设置。现有研究中惯性权重有以下几种变化形式:线性递 减[13]、非线性递减[14]、自适应动态改变[15]等。其中非线性递减又可进一步分为凹函数递减和凸函数递减。凹函数具有初期下降速度快,末期下降速度慢的特点,更加吻合理想情况下惯性权重的变化趋势。戴文智等[14]提出采用惯性权重对数递减的方法,但其对数调整因子的取值范围过广,寻优较为繁琐。因此可延用其对数递减的思想,并按式(5)对变化规则进行修改,并将改进后的粒子群算法称为IPSO算法:

式中:s和e分别是寻优初期和末期的惯性权重,取值分别为0.8和0.3;为底数(0<<1),取值为0.1;为当前迭代次数,为最大迭代次数。由于靠近自变量取值范围左端的值可能大于s,故将此部分惯性权重设为定值,为s。

2.3 IPSO优化XGB算法流程

Step 1:初始化XGB算法的参数。XGB参数可分为通用参数、提升参数和目标参数3种。而其中的提升参数运用IPSO来确定,所以主要是对通用参数和目标参数进行初始化。如将“num_class”设为7,将“eval_metric”设为“merror”。将所有数据按照8:2的比例分为训练样本和验证样本。

Step 2:初始化IPSO的参数。确定粒子个数、学习因子、粒子维度等参数。

Step 3:初始化粒子的位置和速度。随机生成一个种群粒子p0(,,,,),其中是学习因子“eta”,寻优范围是[0.000 1, 0.3];是最大深度“max_ depth”,寻优范围是[1, 20]且为整数;是提升次数“num_round”,寻优范围是[1, 100]且为整数;是子样本抽样率“sub_sample”,是列抽样率“colsample_bytree”,它们的寻优范围为[0.5, 1]。粒子速度为迭代步长的0.1倍。

Step 4:确定适应度函数。运行step 1−step 3对应程序,达到训练次数后得到XGB的训练样本输出值和验证样本输出值。由于样本数量较多,XGB模型对训练样本几乎可以达到100%的正确分类,因而适应度函数仅由验证样本的分类误差决定。则粒子p的适应度值fit定义为:

Step 5:计算每个粒子的适应度值,直到适应度值小于设定的下限值或达到设定的迭代次数,得到最小适应度值对应的参数取值。保存该参数设置下生成的树模型,并记录分类误差及指标重要性。

2.4 IPA矩阵

IPA(Importance-Performance Analysis)矩阵由Martilla等于1977年提出[16],该方法以指标重要性为横坐标,表现性为纵坐标,重要性和表现性的总体平均值为交叉点,将各指标按此规则绘制在一个二维矩阵中。因此IPA矩阵包括4个象限,各象限的分布与直角坐标系相同,第1至第4象限依次为竞争优势区、急需改进区、次需改进区、继续维持区。IPA矩阵能够简单、直观分辨各指标的服务质量感知情况和指标的重要程度,从而方便决策者确定指标改进的缓急程度。

3 实例应用

3.1 问卷设计及调查

本文以长沙市城市轨道交通1号线和2号线的换乘站——五一广场站为例,对其展开服务质量调查。问卷内容分为3部分:第1部分是根据表1中的3级指标对应设计出30个问题,采用李克特7级量表让受访者对各指标的满意度进行评价;第2部分同样采用7级量表,让受访者给出对五一广场站的综合评价;第3部分收集乘客基本信息,包括受访者的性别、年龄、出行频率和所选用的票卡形式。

此次调查采用站内随机调查和网上调查2种方式,对于站内调查,时间选择为某一天的7:00~23:00,调查地点选择在五一广场站不同进(出)口站共计6处,确保问卷可以覆盖五一广场站不同区域的乘客。对于网上调查,为防止受访者年龄集中化及工作性质单一化,将网上问卷通过各种社交软件分发给不同年龄段及不同工作性质的调查人群。此次调查中,站内和网上分别收集到312份和392份调查问卷,其中有效样本分别为300份和350份。样本中男女乘客比例接近1:1;18~30岁年龄段的乘客占43.5%,是地铁的主要客流;每周乘坐3~4次地铁的乘客最多,占比30%;相对于地铁储值卡或单程票,使用公交储值卡的乘客最多,占比42%;69.08%的乘客对车站综合满意度在5分以上。运用SPSS19.0对整理后的数据进行信度检验,得到二级指标的克朗巴哈α信度系数如表2所示。

表2 2级指标信度分析

由表2可知,所有2级指标的克朗巴哈信度系数都大于0.8,因此问卷有较高的可靠性。

3.2 模型应用

实验数据在python3.6的环境下进行处理,将3级指标得分作为输入变量,受访者对车站的综合评价作为输出变量。在程序运行过程中,通过调整IPSO算法中迭代次数和粒子个数等参数,可使验证样本的分类错误率降低至3.85%。在机器学习中,即使分类错误率相同,每次训练结果中不同指标权重仍然会发生变化。为了减少误差,特选取该分类错误率下的50组运算结果,依次对每个树模型进行权重归一化,再计算各指标对应的权重平均值。图1是某一组运算结果,由图1可知,在130个验证样本中,除第36,70,74,123和125这5个样本外,其余样本均被准确评价。

本次问卷调查中各指标满意度均值及权重如表3所示,从表3可知,满意度得分最高的指标是1,得分最低的指标是1。权重最大的指标是10,权重最小的指标是6。

为了更全面的对车站进行评价,应将指标权重与乘客满意度结合起来构成IPA矩阵。根据2.4节中IPA矩阵的绘制原理可知,五一广场站服务质量IPA矩阵的交叉点为3级指标的满意度均值4.922和权重均值0.033。接着根据表3作出满意度−重要性图,如图2所示。

图1 IPSO-XGB验证样本评价

由图2可知,位于竞争优势区的指标均离交叉点较近,具体包括:47,14,2,4,4和4表明这些指标即便位于竞争优势区,但仍有较大的提升空间。这与此次服务水平调查中总体满意度均值不足5分相吻合。该区域未包含票务服务()相关的任何3级指标,侧面表明票务服务急需改进。

表3 3级指标满意度及权重

图2 车站服务质量IPA矩阵

位于急需改进区的指标较多:1011,1,32,4,1和2。其中1偏离交叉点最远,表明该指标应该着重改善。主要原因有如下2点:1) 长沙轨道交通于2014年4月29号开通了首条地铁线路,并发行了地铁储值卡,但此前长沙公交公司于2012年4月1日发行的“湘行一卡通”可以乘坐地铁,因此符合问卷调查中地铁乘客持公交储值卡占比最大的结果。而“湘行一卡通”不能在地铁站内充值,因此受此项影响的乘客较多。2) “湘行一卡通”只能在指定充值点进行付费充值,每次充值均需缴纳2元的服务费,这既给乘客带来了不便,也增加了乘客的成本。11位于急需改进区的原因主要是地铁行车间隔较长,且站内座椅数量较少。以1号线为例,平峰行车间隔为7′38″,高峰行车间隔为6′32″。此外,早晚时分站内部分座椅暂停服务。

位于次需改进区的指标均为服务设施()中的3级指标,具体有:2,3,5,8和13。上述5项指标中满意度得分最低的是8,这与乘客乘车习惯有一定关系,一般来说,乘客倾向于在电、扶梯终点处附近候车,而应急设施多摆放在扶梯墙面侧方。此外,安检作为乘客进站的必经程序之一,通道有限且安检仪传送带速度缓慢,均加剧了此处拥堵,增加了乘客出行时间成本。而五一广场站是去往长沙市两大火车站的换乘站,各进站口采用的是低安检台,符合大多数乘客的心理预期,因而使得2得分较3高。

位于继续维持区的指标最多,具体有:1,6,9,12,3,4,1,1,3和3,上述指标可以分为3类:1) 城市轨道交通的主要乘坐者是通勤人员,他们出行路径固定,对车站各种信息较为了解,因而如6和3等指标的优劣对大部分乘客没有显著影响;2) 乘客在不同车站均能感受到的无差异优质服务,如1,9,12和1;3) 有些指标属于车站服务质量规范中明确规定的且易于评判和整改,比如3,4和1等。

由于继续维持区的各种指标具有满意度高,重要性低的特点,为了使评价指标体系更为精炼,减少调查难度,故可将维持区的指标舍去,将各2级指标对应的3级指标的权重再次归一化,形成最后的评价指标体系和权重。结果如表4所示。

3.3 模型对比

表5对比分析了以下几种模型的评价结果,其中CART,BPNN和XGB 3种算法均采用默认参数进行测试,实验结果表明,XGB模型的分类错误率最低,体现了该模型的优越性。CART模型分类错误率最高是因为树模型固有的过拟合缺陷,而XGB模型较好的避免了这一缺陷,因此极大程度的提高了准确率。其次BP神经网络需进行2次归一化运算,对服务质量评价这种离散型数据而言,也会影响模型的评价结果。

表4 五一广场站服务质量评价指标及权重

表5 不同模型分类错误率对比

而PSO-XGB和IPSO-XGB 2种优化算法的分类错误率较XGB均有明显降低,其中IPSO-XGB模型的结果最优。这说明PSO算法已经实现了对XGB模型的优化,而改进后的IPSO算法能对XGB模型进一步优化。表明IPSO算法达到了优化目的,IPSO-XGB模型在离散型数据方面有较强的适 应性。

4 结论

1) 相对于随机搜索和网格搜索优化XGB相关参数而言,利用IPSO算法进行自动寻优的方法避免了因随机性和枚举不完全而遗漏最佳参数组合的风险;与CART和BPNN等评价模型相比,IPSO- XGB模型精度更高。

2) 通过对长沙五一广场站的实例分析可知,利用IPSO算法对XGB模型进行参数寻优,可使验证样本的分类误差由12%降低至3.85%,可见IPSO算法实现了对XGB模型参数的优化,从而验证了IPSO−XGB模型赋权的合理性和精确性。

3) 运用IPSO−XGB模型和IPA矩阵对五一广场站进行服务质量评价,得出影响车站综合满意度的主要指标为公交卡站内充值受限、候车座椅的数量和舒适度、车站客流秩序、站外交通卡充值、兑零便利性和出站口信息全面性。

[1] Quadro S G R, Nassi C D. An evaluation on the criteria to prioritize transportation infrastructure investments in brazil[J]. Transport Policy, 2015(40): 8−16.

[2] 鞠蓓, 陈维亚. 基于用户感知的铁路客运网站服务质量评价[J]. 铁道科学与工程学报, 2017, 14(1): 184−189. JU Bei, CHEN Weiya. Evaluating web site service quality of railway passenger transport from the perspective of users’ perception[J]. Journal of Railway Science and Engineering, 2017, 14(1): 184−189.

[3] 杨国元, 史天运, 张秋亮. 基于BP神经网络的铁路客运服务质量评价研究[J]. 交通运输系统工程与信息, 2016, 16(5): 33−38, 44. YANG Guoyuan, SHI Tianyun, ZHANG Qiuliang. Railway passenger service quality evaluation based on BP neural network[J]. Journal of Transportation Systems Engineering and Information Technology, 2016, 16(5): 33−38, 44.

[4] Machado−León J L, Oña R D, Baouni T, et al. Railway transit services in Algiers: Priority improvement actions based on users perceptions[J]. Transport Policy, 2017(53): 175−185.

[5] Torlay L, Perrone-Bertolotti M, Thomas E, et al. Machine learning–XGBoost analysis of language networks to classify patients with epilepsy[J]. Brain Informatics, 2017, 4(3): 1−11.

[6] XIA Y, LIU C, LIU N. Cost-sensitive boosted tree for loan evaluation in peer-to-peer lending[J]. Electronic Commerce Research & Applications, 2017(24): 30−49.

[7] XIA Y, LIU C, LI Y Y, et al. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring[J]. Expert Systems with Applications, 2017(78): 225−241.

[8] Bergstra J, Bengio Y. Algorithms for hyper-parameter optimization[C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2011: 2546−2554.

[9] Ilievski I, Akhtar T, Feng J, et al. Efficient hyperparameter optimization of deep learning algorithms using deterministic RBF surrogates[J]. AAAI, 2017: 822− 829.

[10] Hutter F, Hoos H H, Leyton-Brown K. Sequential model-based optimization for general algorithm configuration[C]// Learning and Intelligent Optimization, International Conference, Lion 5, Rome, Italy, 2011.

[11] CHEN T, Guestrin C. XGBoost: A scalable tree boosting system[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2016: 785−794.

[12] Eberhart R, Kennedy J. A new optimizer using particle swarm theory[C]// Proceedings of the Sixth International Symposium on Micro Machine and Human Science. Nagoya: IEEE Press, 1995: 39−43.

[13] LIU P. Some geometric aggregation operators based on interval intuitionistic uncertain linguistic variables and their application to group decision making[J]. Applied Mathematical Modelling, 2012, 37(4): 2430−2444.

[14] 戴文智, 杨新乐. 基于惯性权重对数递减的粒子群优化算法[J]. 计算机工程与应用, 2015, 51(17):14−19. DAI Wenzhi, YANG Xinle. Particle swarm optimization algorithm based on inertia weight logarithmic decreasing[J]. Computer Engineering and Applications, 2015, 51(17): 14−19.

[15] Valdez F, Vazquez J C, Melin P, et al.Comparative study of the use of fuzzy logic in improving particle swarm optimization variants for mathematical functions using co-evolution[J]. Applied Soft Computing, 2017, 52: 1070−1083.

[16] Martilla J A, James J C. Importance-performance analysis[J]. Journal of Marketing, 1977, 41(1): 77−79.

Quality evaluation of urban rail transit station based on IPSO-XGB

JIANG Qiwei, WU Xiaolan, FENG Fenling, LI Wan

(School of Traffic and Transportation Engineering, Central South University, Changsha 410075, China)

In view of the imperfect evaluation system of urban rail transit station service quality and the single way of index weighting,combined with current passenger consumption concepts and travel habits,this paper proposed an initial evaluation index system based on passenger perception, and then calculated the weight of each indicator by using the hybrid algorithm of improved particle swarm optimization (IPSO) and extreme gradient boosting tree (XGB), named IPSO-XGB. In combination with passenger satisfaction, an IPA matrix was formed to obtain the final evaluation results and further simplify the evaluation index system. Taking the Wuyi Square Station of Changsha Metro as an example, the classification error rate was used to measure the pros and cons of the algorithm, evaluated the service quality of this station, and compared the results with the classification regression tree and neural network. The experimental results show that the classification error rate of the IPSO-XGB evaluation algorithm proposed in this paper is the smallest, which can be reduced to 3.85%.

urban rail transit station; service quality evaluation; IPSO−XGB; IPA matrix analysis; weighting

10.19713/j.cnki.43−1423/u.2019.04.034

U121

A

1672 − 7029(2019)04 − 1097 − 08

2018−06−07

国家重点研发计划先进轨道交通专项资助项目(2018YFB1201402)

冯芬玲(1973−),女,河北邯郸人,副教授,博士,从事交通运输规划与管理研究;E−mail:FFL0731@ 163.com

(编辑 蒋学东)

猜你喜欢

服务质量轨道交通车站
轨道交通产品CE认证论述
门诊服务质量管理的实践研究
城市轨道交通投融资模式分析
城市轨道交通投融资模式分析
车站一角
新媒体环境下图书馆阅读推广服务质量的提高
论如何提升博物馆人性化公共服务质量
基于传感器数据采集的快递服务质量分析
PPP模式在我国轨道交通建设中的应用
在北京,一个车站的治理有多难