APP下载

基于EFA及CFA方法的西安市公共自行车选择行为分析

2018-11-15马书红王元庆韩笋生

关键词:题项西安市方差

马书红,杨 野,王元庆,韩笋生

(1. 长安大学 公路学院,陕西 西安 710064;2 .墨尔本大学 建筑、建设与规划系,澳大利亚 墨尔本 VIC3010)

0 引 言

随着我国以人为本、可持续发展理念的深入,慢行交通逐渐被广大群众认为是绿色环保的出行方式。公共自行车作为慢行交通与公共交通融合发展的产物,在倡导环保、发展慢行交通、实行公交优先、解决“最后一公里”等方面产生深远影响。为了发展城市公共自行车系统,提高居民公共自行车使用频率,首先需要分析影响居民公共自行车选择行为的因素。目前国内外已经有部分学者进行了相关研究:罗赟[1]利用二元Logistic回归模型,定量分析各主要因素如何影响出行者选择公共自行车;朱玮等[2]以上海市闵行区公共自行车系统为例,分析系统运营前后居民出行意愿的转变;周强等[3]探讨了以公共自行车作为地铁接驳手段的居民出行特性;钱佳等[4]基于探索性因子分析法,构建影响苏州市公共自行车满意度的结构方程假设模型; C. RISSEL等[5]提出用户是否使用新建自行车道与距离自行车道的远近以及原有的出行行为有关;P. P. KOH等[6]提出自行车设施的改善将提高自行车使用频率;J. WOODCOCK等[7]研究了伦敦的公共自行车系统,发现公共自行车对男性、老年人的效益更为显著;R. BUEHLER等[8]研究发现机动车拥有量、学生数量、燃油价格、城市规模以及自行车设施安全性影响自行车使用频率。

综上所述,在指标变量选择上,国内相关研究主要侧重于公共自行车设施布局、服务质量等对居民选择行为的影响。而国外相关研究具有地域特色,如燃油价格、城市规模等指标并不适应国内情况;在方法选择上,现有研究较多运用Logistic模型、回归分析等方法,模型结构简单与实际存在差异,而笔者尝试将探索性因子分析与验证性因子分析结合对影响公共自行车选择行为的诸多变量进行筛选、降维,以及潜变量命名、因子模型检验、模型结构修正,并按照重要度排序,分析过程更加科学合理,并加入诸多体现地域特色的因素,如自然环境、个人属性、出行目的、原因等指标,最后以西安市为例验证。

1 数据概述

部分学者认为交通选择行为受到出行目的、出行原因、出行时间、出行路径、出行者社会经济属性等指标影响[9-11]。公共自行车选择行为作为一种交通选择行为,一方面受到上述指标影响,另一方面受到其自身特性及社会环境等指标影响,如公共自行车运营服务质量、设计布局、出行者特性、交通基础设施[1-9]。在回顾上述文献的基础上,归类整理测量指标,并结合西安市实际使用体验,初步选定38个影响公共自行车选择行为的因素,最终设计了一份包括38个题项的调查问卷和一份居民属性调查表。针对每个题项,采用Likert 5点量表形式,以“非常不同意、不同意、中立、同意、非常同意”分别由低到高赋1~5分[4]。

2015年12月,调查小组对西安市莲湖区、未央区、新城区、碑林区、灞桥区、曲江区以及长安区进行问卷调查,获取有效数据1 228份。具体测量指标如表1。

表1 影响西安市公共自行车选择行为的测量指标Table 1 Indicators affecting public bicycle choice behavior in Xi’an

2 探索性因子分析

探索性因子分析法(exploratory factor analysis,EFA)是一项用于寻找多元观测变量之间的结构关系,以达到降维目的的技术。因而,EFA能够将错综复杂的变量关系综合为少数几个核心因子。计算公式如式(1):

y1=a11x1+a12x2+…a1pxp+ε1

y2=a21x1+a22x2+…a2pxp+ε2

yp=ap1x1+ap2x2+…appxp+εp

(1)

式中:x1,x2,…,xp为p个变量;yi(i=1,2,…,p)为变量x1,x2…xp公有的因子,称为公因子;系数aij(i=1,2,…,p;j=1,2…,p)为第i个变量在第j个因子上的载荷;εi(i=1,2,…,p)为第i个变量不能被前p个因子包括的部分,称为特殊因子,计算方法如表2。

2.1 确定样本规模

由于小样本变量的随机波动性可能产生较大误差,因而样本规模应越大越好。但随着样本规模的增加,测量的随机误差会相互抵消,模型参数开始稳定,再增加样本将不再重要。

B. S. EVERITT等[12]提出样本量与题项比率达10∶1为最佳。笔者初步选定38个题项,则考虑从1 228份有效数据中抽取400份数据作为样本数据。

2.2 判断因子分析的可能性以及筛选题项

实践中并非所有多变量数据均适合采用因子分析,SPSS中提供4个统计量来判断观测数据是否适合因子分析,同时达到筛选题项目的:KMO检验(kaiser-meyer-olkin measure of sampling adequacy)、巴特利特球体检验(bartlett test of sphericity)、反映像相关矩阵(anti-image correlation matrix)、共同性(communalities)。根据以上判断及筛选标准,将包含38个题项的400份数据导入SPSS中进行EFA分析,采用主成分分析法萃取公因子,结果见表2和表3:

表3 KMO和Bartlett 的球形度检验Table 3 KMO and Bartlett sphericity test

表2 因子分析结果摘要Table 2 Summary of factor analysis results

由表3可知,KMO检验值为0.78(越接近1越好),达到“适中(Middling)”等级,同时,巴特利特球体检验Sig.为0.006(<0.05),说明本研究初步选定的38个题项适合因子分析,可以建立因子模型;表3中大部分变量的取样适当性量数MSA值达到适应性判断标准(>0.50),其中性别、职业、学历、路线比较安全、办卡和补卡手续方便性的MSA值未达标,考虑从因子模型中删除;表3中有部分题项共同性未达到筛选阈值(<0.20),包括:性别、职业、学历、低碳环保、路线比较安全、办卡和补卡手续的方便性,考虑从因子模型中删除。综上分析,大部分题项可以进行因子分析,建立因子模型,同时考虑删除部分变量。

探索性因子分析重在“探索”二字,根据杨建明等[13]提出题项删除原则,通过不断探索,共进行了7次因子分析,删除6个题项(性别、职业、学历、低碳环保、路线比较安全、办卡和补卡手续的方便性),最终保留32个题项。

2.3 确定因子个数

在探索性因子分析中,常用于确定因子数量的原则有4种:事先决定准则法、碎石图检验法、Kaiser的特征值大于1原则、累计贡献率法,如公式(2)。由于以上4种准则均存在内部局限性,因而一些研究者认为,4个标准不应单独使用。

(2)

式中:p为累计贡献率,当p>50%时因子模型可靠;λi为公式(1)中第i个因子yi的方差,实际也是因子yi的特征值;p、r为EFA选定p个主成分,而保留r个主成分。

事实上在问卷设计阶段已利用了事先决定准则法,即根据事先拟定的因子模型结构选取变量;碎石图(图1)显示,在第7和第8个特征值之间出现明显的转折点,在此转折点以上的因子数代表公因子数量;根据Kaiser特征值大于1原则,图1中共有7个因子特征值大于1;由公式(2)计算得表3的累计方差贡献率,结果表明当提取7个因子时累计方差贡献率达60.955%,说明萃取7个公因子的因子模型是可靠的。综合以上4种方法,最终确定公因子数量为7个。

图1 碎石图Fig. 1 Scree plot

2.4 因子旋转

对于多变量数据,如公式(1),变量xi与多个因子yi(i=1,2,…,p)存在相关关系,即变量由多个因子共同解释;同时,一个因子yi可以同时解释多个变量x1,x2…xp。为了简化因子结构,使得yp之间、εi与yp之间,εi之间相互独立,这里采用方差最大直交旋转法旋转公因子,以便于得到合理的因子解释。

2.5 解释因子结构

由表3可知,选定因子(加粗项)载荷均大于0.50,说明公因子解释指标变量的方差达25%以上;选定的32个题项的共同性均达0.20以上,满足要求;32个题项的Cronbach’s α系数为0.854,达到“理想”水平,各个构面的Cronbach’s α系数均达到0.60以上(>0.50),表明各因子构面内部稳定性和一致性较高,因子结构稳定;组合信度均大于0.7,说明量表信度得到稳定测量,平均方差提取在标准值0.5附近,表明各观测变量可以较好解释对应潜变量[14]。综上分析,各公因子可以根据其所包含的共同特性进行命名。

第1个公因子解释总方差的11.311%,按照方差贡献率排序依次为:租赁点布局合理性>租赁点距离公交站点或地铁口距离>居住区位>出行距离>租赁点数量,解释了租赁点及居住地布局对居民公共自行车选择行为的影响,因而将之命名为空间布局因子。

第2个公因子解释总方差的5.832%,排序为:锻炼身体>休闲娱乐>方便换乘>买菜或购物>上班或上学,解释了不同出行活动对选择行为的影响,命名为出行目的因子。

第3个公共因子解释总方差的5.252%,排序为:健康状况>年龄>收入>性格,解释了居民属性对选择行为的影响,命名为居民属性因子。

第4个公因子解释总方差的22.365%,排序为:下雨>雾霾>大风>寒冷>下雪>炎热>霜冻,解释了天气状况以及温度变化对选择行为的影响,命名为天气及气候因子。

第5个公因子解释总方差的4.759%,排序为:路线畅通>骑行路线时长少>骑行路线距离短>道路平整,解释了骑行道路路况对选择行为的影响,命名为骑行路况因子。

第6个公因子解释总方差的7.479%,排序为:公共自行车调度系统>刷卡系统故障>车辆维修保养不及时,解释了公共自行车运营状况及服务质量对选择行为的影响,命名为运营服务因子。

第7个公因子解释总方差的3.960%,排序为:避免拥堵>便宜省钱>灵活自由>存取方便,解释了居民使用公共自行车出行原因对其选择行为的影响,命名为出行原因因子。

将命名后的7个公因子按因子平均得分排序:天气及气候>空间布局>运营服务>出行目的>居民属性>骑行路况>出行原因。上述次序可理解为西安市公共自行车选择行为影响程度的排序。

3 验证性因子分析

验证性因子分析(confirmatory factor analysis,CFA)是用于检验已知的特定结构是否按照预期的方式产生作用。验证性因子分析的主要环节如下:

3.1 定义因子模型

依据探索性因子分析结果,影响居民公共自行车选择行为的潜变量有7个(ξ1-ξ7),由32个测量题项共同组成,各变量对居民公共自行车选择行为(η1)的影响通过“我愿意使用公共自行车作为出行方式(y1)”来度量[15]。如图2,建立居民公共自行车选择行为理论模型。

3.2 模型参数估计、修正及评价

侯杰泰[16]指出,为避免最后所得的模型过于依赖样本数据,建议用一半的数据建立模型,另一半用于模型的交互确认。为了验证因子模型结构合理性,从1 228份有效数据(不包括做EFA分析的400份数据)中重新提取400份数据作为测试样本,导入AMOS7.0中构建结构方程模型(structural equation modeling, SEM)。计算结果如图2。通过不断修正因子模型结构,直到各项拟合指标达到阈值。

表4 SEM整体拟合指数Table 4 SEM global fitting index

图2 模型参数估计Fig. 2 Parameter estimation of the model

对比表4中理想值与假设模型,发现原始模型仍具有修正空间,基于解释上的合理性对原始模型微调,主要表现在外生潜变量观察指标的测量误差εi之间的相关性,其中修正指数最大的是建立租赁点车辆数与调度系统、居民收入与便宜省钱、路线比较畅通与避免拥堵之间的相关性,其次是居住区位与换乘之间的相关性。通过上述操作,SEM整体拟合指数进一步改善,基本达到各指标阈值。

图2中数值为路径系数,用于衡量变量之间相关性大小或称为变量之间的效应值。效应分为直接效应(direct effect)、间接效应(indirect effect)和总效应(total effect)。各变量之间的效应值均可从图2中观察或计算得到,可以看出测量模型中每个潜变量的观察变量标准化估计值在0.61~0.97,结构模型在0.21~0.52,统计上均显著(t-value>1.96)[15]。其中天气及气候、空间分布、运营服务、出行目的以及居民属性对选择行为具有显著影响(t检验值在0.01水平上显著),直接效应>0.40;其次是骑行路况、出行原因(t检验值在0.05水平上显著),直接效应>0.20。

4 结论及建议

基于探索性因子分析法,结合4种筛选原则,将初步选定的影响西安市公共自行车选择行为的38个题项缩减至32个,依据删除原则去除MSA及共同性不达标题项:性别、职业、学历、低碳环保、路线比较安全、办卡和补卡手续的方便性,并进一步划分成7个维度,各公因子根据其所包含的共同特性命名,按方差贡献率排序为:天气及气候>空间布局>运营服务>出行目的>居民属性>骑行路况>出行原因。

基于验证性因子分析法,证明了测量模型与结构模型内部以及彼此之间的显著性联系,不再需要剔除任何变量。7个公因子按照方差贡献率由大到小的顺序排序,其对应的最大路径系数依次是“下雨(0.86)”、“租赁点距离公交站点或地铁口距离(0.78)”、“公共自行车调度系统(0.80)”、“上班或上学(0.85)”、“年龄(0.82)”、“路线畅通(0.83)”、“避免拥堵(0.81)”。

1)研究结果表明,影响西安市居民选择行为的最主要因子是天气及气候因子。这个结果易于理解,由于公共自行车舒适性、稳定性、安全性差,抗干扰能力弱等缺点,雨雪大风天气、酷暑严寒气候将显著降低公共自行车的用户体验,甚至成为不可使用的出行方式。目前来看,天气及气候因子带来的影响是公共自行车交通方式不可避免和改变的,这与城市所处的地形、海拔、经纬度等因素有关,城市在考虑是否引进及推广公共自行车时需要结合自身的气候类型、自然天气现象、地表形态等因素,做出判断,以避免公共自行车“水土不服”、财政损失、城市公共空间资源浪费等现象。

2)其次是空间布局因子。由于公共自行车“骑不快、骑不远”的特点,西安市居民在选择公共自行车作为出行方式时对出行距离、租赁点位置、数量等因素较为敏感,规划者需要按照租赁点的合理辐射范围(<3 km)[14],以及城市“圈层式”的空间分异结构,对主城区、外围区、风景旅游区等采用不同规格调整租赁点布局,深入挖掘城市空间结构对各类地域使用特征的影响,以达到在满足居民需求的同时控制投入成本,减少不必要的租赁点布设。

3)运营服务因子是制约西安市居民选择公共自行车出行的重要因素。调查过程中发现,通勤高峰时段“租不到、还不上”现象较为普遍,同时刷卡系统故障、车辆损坏也是被调查者反映较多的问题。建议运营部门从后期系统维护、车辆调度与维修方面着手,切实提高用户满意度。

4)出行目的、出行原因在一定程度上决定了对出行距离、出行时间、出行质量的要求。研究表明西安市居民在选择公共自行车作为出行方式时将出行目的、原因纳入重点考虑范围,对具体量化指标有待进一步研究;居民属性因子是体现地域差异、确定适应群体的关键性指标。调查结果显示(表5),使用公共自行车出行的西安市居民年龄集中在20~40岁之间,职业以学生、职工为主,身体健康者居多,收入集中在2 000~6 000元之间,学历以大专、本科为主,性格以活泼好动、乐天派居多。规划者可根据公共自行车受众群体的聚类性,如在学校、企业、居民区附近增加公共自行车供给及站点密度;骑行线路是公共自行车系统的重要组成部分,保障线路平整、畅通是提高居民使用率的重要因素。

表5 西安市居民属性调查Table 5 Attribute questionnaire for Xi’an residents

猜你喜欢

题项西安市方差
概率与统计(2)——离散型随机变量的期望与方差
亲子创意美工展
幼儿家长学前教育立法需求调查问卷的编制
西安市第四医院
方差越小越好?
计算方差用哪个公式
123的几种说法
方差生活秀
高职学生价值观调查的研究变量的项目分析
基于CA-Markov模型的西安市热环境模拟研究