基于BP神经网络的城市公交服务质量影响因素主成分分析
2015-11-09陈廷照曾明华华东交通大学土木建筑学院江西南昌33003华东交通大学轨道交通学院江西南昌33003
张 兵,陈廷照,曾明华(.华东交通大学 土木建筑学院,江西 南昌 33003;.华东交通大学 轨道交通学院,江西 南昌 33003)
基于BP神经网络的城市公交服务质量影响因素主成分分析
张兵1,陈廷照1,曾明华2
(1.华东交通大学 土木建筑学院,江西 南昌 330013;2.华东交通大学 轨道交通学院,江西 南昌 330013)
为改善城市公交服务质量,根据乘客服务质量问卷调查数据分析,运用主成分分析方法对公交服务质量影响因素进行降维处理,把15个影响变量提取为8个主成分变量。在此基础上,运用MATLAB7.0建立影响因素主成分与公交服务质量认可度的BP神经网络模型,在不同参数下进行试验和比较,计算出模拟数据下公交服务质量认可度折减影响系数均方差为0.000 957,表明该模型所选参数值可以用于评估公交服务质量的影响因素分析。最后,根据权值和阀值计算得出影响城市公交服务质量的关键因素为公交车内拥挤程度、驾驶员服务态度和首末班车时间,其影响程度分别为53.09%、32.02%和30.36%。研究结论可以为城市公交服务质量改善提供依据并明确重点改进的方向。
城市公交;服务质量;公交认可度;主成分分析;BP神经网络
第1卷 第1期|2015年2月
0 引言
优先发展城市公共交通,通过改善公共交通的服务质量吸引公交出行者,将是解决城市交通拥挤问题的关键之一。目前,在公共交通服务质量因素研究方面,主要有结构方程模型法、概率模型法和多元统计分析法等。例如,Juan deOña等提出结构方程模型(SEM)方法可用于描述服务,揭示潜在的方面与整体服务质量之间的关系[1]。Luigi dell′Olio等通过概率模型模拟用户感知的巴士交通服务质量,为运营公司提供有价值的信息,提高公交服务质量,吸引更多乘客使用交通工具[2]。在国内,很多学者从不同角度对公交服务质量进行了分析,例如黄婷等从乘客的角度出发,研究了公交的有效性、出行时间和费用、舒适便利性、安全及风险舒适便利性等,提出了公交站点、公交路线和公交系统的评价指标,建立了人性化服务质量评价体系[3];马飞等借鉴SERVPERF服务质量分析方法,从乘客感知角度设计了公交车服务质量的5维度影响因素测量模型,研究城市公交车服务质量的影响因素及作用机理[4];彭昌溆等应用改进的SERVQUAL模型结合Logistic模型,对宜昌市公交乘客感知服务质量的影响因素进行了研究[5]。
由于城市公交服务质量影响因素众多,相互干扰较大,因此,为了保证因素分析的有效性,将主成分分析法(Principal Component Analysis,PCA)与BP神经网络模型结合用于分析城市公交服务质量影响因素,即先采用主成分分析方法对调查数据进行降维,并在保证数据丢失最小原则下,简化神经网络拓扑结构,在不同参数下进行仿真和比较,确定合适的神经网络参数,建立比较精确的权值网络模型,提高了建模质量。
1 城市公交出行基本信息特征分析
1.1样本统计分析
本文以南昌市为实证研究对象,选择22路、232路和703路公交车进行跟车调查,并随机抽取南昌市15个公交停靠站点进行驻站调查。本次问卷调查共发放280份问卷,有效问卷236份,问卷有效率为84.2%。通过利用频率分析法对调研对象进行总体特征分析,包括性别、年龄、受教育程度、职业、收入、交通工具、乘坐公交频率等12项,并得到基本信息统计表(如表1所示)。通过表1可以看出,年龄在18~45岁区间的人群是公交出行的主要群体,而教育程度对公交出行的影响不大。通过对职业和出行目的分析发现,乘坐公交车出行的群体主要为公司员工和学生,而个体工商户和政府职员主要使用私家车出行,这也反映了一般乘坐公交车出行的多为中低收入群体。
表1 问卷调查基本信息表
为获取公交服务质量影响因素,选取公交首末班车时间、候车时间、出发地距公交站台的距离、候车环境、行车速度、车况、车内卫生状况、服务态度、拥挤程度、乘坐的舒适性、安全性、线路的安排、线路的换乘便利、公交站提供的交通信息及票价满意度等作为变量进行问卷调查。调查问卷采用里克特5级量法,用“1~5”表示被调查者对题中所陈述内容的认同程度。其中,1代表“非常不满意”,2代表“比较不满意”,3代表“无意见”,4代表“满意”,5代表“非常满意”。利用SPSS19.0软件统计分析,得出乘客最不满意的指标为公交车拥挤程度,其均值为1.96;其次为候车时间和候车环境,均值为2.86;而乘坐舒适性的均值为2.77,表现为比较不满意。
1.2公交服务认可度分析
利用SPSS19.0统计分析软件对公交服务质量的认可度进行分析,结果如表2所示。从表2可以看出,与人们心中理想的公交服务质量相比,乘客对现状公交服务质量认可的均值仅为2.79,存在较大的差距。而对于其他4项问题,认可度的均值在3.5左右,说明被调查者基本上认可当前的公交服务,但认为在公交服务的改善上还需要做出很大努力。
表2 公交服务质量认可度分析表
2 公交服务质量数据信度分析与因子分析
2.1信度分析
通过信度与效度的检验,可以了解分析结论是否合适、得当,并作为改善修正的根据,可避免做出错误的判断[6]。根据被调查者的调查时间和调查内容,本文采用内在信度分析,选择常用的Cron⁃bach′sα系数法。信度系数越大,表明测量的可信程度越大。一般认为,0.60~0.65为不可信;0.65~ 0.70为最小可接受值;0.70~0.80为相当好;0.80~ 0.90为非常好。
Cronbach′sα信度系数为:
根据公式(1),得到Cronbach′sα系数如表3所示,其中信度系数为0.767,在0.70~0.80之间,可以得出该调查问卷数据的内在信度是比较理想的。
表3 可靠性统计量
2.2基于主成分的因子分析
因子分析的目的是寻求变量的基本结构,简化观测系统,减少变量维度,用少数变量来解释所研究的复杂问题。在因子分析之前,应判断变量之间的相关关系是否适合进行因子分析[8]。
(1)因子分析的前提条件
因子分析要求变量之间应存在较强的相关关系。采用KMO(Kaiser-Meyer-Olkin)检验和巴特利特球度检验(Bartlett Test of Sphericity)方法对原有变量之间的相关性进行研究。一般情况下,KMO>0.9表示非常适合因子分析;0.8<KMO<0.9表示适合因子分析;0.7<KMO<0.8表示基本适合因子分析;0.6<KMO<0.7时,因子分析的效果很差;当KMO<0.5时,则不适宜做因子分析。巴特利特球度检验是假设相关系数矩阵是一个单位阵,如果统计量值比较大,且其相对应的相伴概率值小于用户指定的显著性水平,拒绝原假设,认为适合做因子分析;反之,接受原假设,不适合做因子分析[7]。由表4的KMO检验和巴特利特球度检验可以看出,本次调查数据的KMO值为0.774,大于 0.7,巴特利特球度检验值为558.391,显著性为0,小于0.05,分析结果非常显著,说明变量有较高的相关性,因此本次调查数据适合做因子分析。
表4 KMO和Bartlett检验结果
(2)基于主成分的因子分析
主成分分析是将原来众多的具有一定相关性的指标,重新组合成一组新的互不相干的综合指标来代替原来指标,用较少的主成分得到较多的信息量[8]。即将P个原始指标向量X1,X2,…,Xp做线性组合,得到综合指标向量:
其中,Fi与Fj(i≠j,i,j=1,…,p)互不相关,即Cov(Fi,Fj)=0。F1称为第一主成分,在F1所含信息不足条件下寻找第二主成分F2,第三主成分F3,…,第p主成分Fp。
在提取综合变量时,一般要满足大于70%的贡献率,经过SPSS19.0软件统计分析,选取基本特征值为0.8,旋转后,各主成分的特征值及累计贡献率如表5所示。其中,第1个主成分为车内卫生状况;第2个主成分为线路安排和公交站提供的交通信息;第3个主成分为公交车首末时间的安排;第4个主成分为车内的拥挤程度;第5个主成分为公交车运行速度;第6个主成分为乘客候车时间;第7个主成分为公交车的运行安全性;第8个主成分为驾驶员的服务态度。8个主成分的累计方差贡献率达到72.753%,表示因子分析的结果能较好地代替原始变量。
表5 方差解释表
3 基于BP神经网络的公交服务质量因素分析
BP(Back Propagation)神经网络的工作过程通常由两个阶段组成:一个阶段是学习期,各计算单元状态不变,根据计算结果和模型识别修改各连接权值;另一阶段是工作期,各连接权值固定,计算各单元的状态变化,以求达到稳定状态[9-10]。因此,为确定城市公交服务质量中的主要影响因素,可以采用BP神经网络模型对问卷调查数据进行训练学习,从而确定当达到稳定状态时,各个影响因素的固定权值。
由于公交服务质量高低与乘客对公交服务质量的认可度存在较大关联性,因此基于公交服务质量认可度分析表,将相关程度较高的指标1与指标2重新定义为y1,将指标3、指标4和指标5重新定义为y2。在此基础上,将调查数据根据旋转成分矩阵表计算236个样本的主成分值,对应公交服务质量认可度值,将其分配为8组,将前5组数据用于训练,剩余3组数据用于预测验证其绝对误差值。公交服务质量影响因素主成分及认可度分组如表6所示。
表6 公交服务质量影响因素主成分及认可度分组值
在自适应(Adaptive)强化学习训练的过程中先后选用不同的激活函数模型,反复调整学习率以及权值,最终确定激活函数均选用正切S型tansig函数:
使用MATLAB软件进行BP神经网络计算,将主成分分析提取的8个主成分作为BP神经网络输入层,将对公交车服务质量的认可度作为输出层,即以y1和y2作为BP神经网络的输出层,则该BP神经网络有8个输入层、2个输出层、13个隐含层。经过计算,模拟数据的方差为0.000 957,小于目标值0.001,满足学习精度要求,即该模型所选参数值符合要求。运用BP神经网络模型输出训练的结果方差如图1所示。
图1 模拟方差
通过对后3组数据的预测,得出y1的相对误差的平均值为0.001 2,y2的相对误差的平均值为0.057 0,均小于0.1。
通过训练得到的权值和偏差矩阵如下:
xi和yi之间的相关度Rij:
得到xi对yj的影响程度Fij:
根据以上数据,计算得出:
根据输入分量xi(i=1,2,…,m)对应的神经元与隐含层神经元K(K=1,2,…,P)之间的连接权WKi之和∑WKi越大,xi系统的影响越大;隐含单元k与输入分量yi的连接权Wjk之和(Wjk)越大,系统响应输出yi就越灵敏[11-12]。因此,根据计算结果可以看出,对公交服务质量认可度yi相关度最大的依次是第4、第8和第3主成分,其影响程度分别为53.09%、32.02%和30.36%,说明对公交服务质量影响的所有因素中,公交车的拥挤程度(第4主成分)、驾驶员服务态度(第8主成分)和首末班车时间(第3主成分)对公交服务质量认可程度起到关键作用。因此,上述3个因素也是今后提高城市公交服务质量的主要改善方向。
4 结论
在公交服务质量调查问卷数据分析基础上,通过因子分析将15个变量降维到8个相互独立的影响因子,通过MATLAB软件建立以tansig函数作为激活函数的BP神经网络模型,计算出两组偏置值与权值矩阵以评估公交服务质量因素与公交服务认可度之间的影响程度。在此前提下,通过权值矩阵以及偏置值计算出相应的公交服务质量认可度折减影响系数的均方差达0.000 957。因此,该模型可以用于评估影响公交服务质量认可度的影响因素分析。同时,计算结果表明,对城市公交服务质量影响程度较大的因素主要有公交车内拥挤程度、驾驶员服务态度及首末班车时间安排。
[1]Juan de Oña,Rocíode Oña,Laura Eboli,Gabriella Mazzulla. Perceived Service Quality in Bus Transit Service:A Structur⁃al Equation Approach[J].Transport Policy,2013(29):219-226.
[2]Luigi dell′Olio,Angel Ibeas,Patricia Cecı′n.Modelling Us⁃er Perception of Bus Transit Quality[J].Transport Policy, 2010(17):388-397.
[3]黄婷,焦海贤,李秀丽.基于乘客观点的公交服务质量评价体系及方法研究[J].重庆交通大学学报,2008,7(5):781-784.
[4]马飞,孙启鹏,王炼,等.基于SERVPERF的城市公交车服务质量影响因素研究[J].交通运输系统工程与信息,2013,13(2):153-157.
[5]彭昌溆,周雪梅,张道智,等.基于乘客感知的公交服务质量影响因素分析[J].交通信息与安全,2013,31 (4):40-44.
[6]时立文.SPSS19.0统计分析[M].北京:清华大学出版社,2012.
[7]陈建宏,刘浪,周智勇,等.基于主成分分析与神经网络的采矿方法优选[J].中南大学学报:自然科学版,2010,42(5):1967-1972.
[8]朱林波.主成分分析法在城市交通可持续发展评价中的应用[J].西华大学学报,2013(1):63-66.
[9]陈君,李聪颖,丁光明.基于BP神经网络的高速公路交通安全评价[J].同济大学学报:自然科学版,2008,36 (7):927-931.
[10]闻新.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003.
[11] 赵云凌,陈琳.基于BP神经网络的区域收入差异影响因素[J].统计与决策,2007(1):83-85.
[12] 吕琼帅,熊蜀峰.基于PCA和蜂群算法优化的BP神经网络[J].计算机应用与软件,2014,31(1):182-185.
Principal ComponentAnalysis of Factors Influencing City Bus Service Quality Based on BPNeural Network
ZHANG Bing1,CHEN Ting-zhao1,ZENG Ming-hua2
(1.School of Civil Engineering and Architecture,East China Jiaotong University,Nanchang 330013,China; 2.School of Railway Tracks and Transportation,East China Jiaotong University,Nanchang 330013,China)
In order to improve city bus service quality,the factors dimension of bus service quality were reduced by principal component analysis and 8 principal components were extracted from 15 variables according to the passenger service quality survey data analysis.Then,the BP neural network model which reflected the relations about the factors principal component and recognition was set up by using MATLAB7.0.By testing and comparing with different parameters,the weight matrix was calculated. Based on simulated data,it was calculated that the bus service quality recognition reduction impact coef⁃ficient variance was 0.000957,which indicated that the parameter values selected in model were used for the factors analysis to assess the bus service quality.Finally,according to weights and thresholds,it is calculated that the main factors influencing the bus service quality were passengers crowding,driver attitude and the first and last time of bus,whose impact were 53.09%,32.02%and 30.36%.The conclu⁃sion provided the basis and the clear direction for the city bus service quality improvement.
city bus;service quality;recognition of bus;principal component analysis;BP neural network
U491
A
2095-9931(2015)01-0014-06
10.16503/j.cnki.2095-9931.2015.01.003
2014-11-28