基于Binary logistic模型的公共自行车出行选择影响因素研究
2019-12-21杨泞珲周建波孟苏静
杨泞珲,李 康,周建波,孟苏静
(盐城工学院 材料科学与工程学院,江苏 盐城 224051)
公共自行车由于具有绿色环保、无污染、建设难度低、间距较近等优点,有效地解决了人民群众“最后一公里”的出行问题,得到了地方政府的大力支持。2008年5月,杭州市公共自行车租赁项目启动,在几年内不断发展壮大,取得了较大的成功,随后在苏州、太原等二三线及以下城市迅速扩展开来。截至2016年底,我国已有超过400个市、县配备了公共自行车系统,累计投放公共自行车锁车器设备约89万套,为全国会员提供了7.5亿次的出行服务(2016年)[1]。
随着公共自行车在各城市的普及,国内外学者对公共自行车系统的研究日益增多。Acheampongd等[2]从社会生态角度建立模型研究自行车通勤交通的出行影响因素,结果表明个人社会属性包括性别、受教育程度,以及出行距离和物理环境因素如交通设施等,对自行车通勤交通出行产生影响;Hunter等[3]将被调查者分为4类,运用多元logistic回归模型探讨自行车通勤交通出行的有利和不利因素;Fishman[4-5]等对公共自行车的当前研究方向、存在问题以及未来的研究重点等进行了综述。国内的大部分研究侧重于需求预测与调度、出行特征分析以及系统评估等,还有部分学者针对一、二线城市的公共自行车系统展开选择意向、出行行为方式的相关研究[6-10]。本文运用结合意向法和行为调查法设计问卷、采集数据,基于Binary logistic建立公共自行车出行选择模型,并以盐城市为例,探讨公共自行车使用者的潜在动机和非使用者的阻碍因素。
1 问卷设计与数据采集
公共自行车可分为有桩和无桩两大类型。目前,在一、二线城市存在政府主导的有桩公共自行车和社会资本支持的无桩公共自行车(共享单车)并行发展的格局,而三线及以下城市因城市规模较小、有效需求不足、管理难度较大、运营成本较高,仍将以政府主导的有桩公共自行车为主。目前,盐城市区共建设有桩公共自行车服务站点425个(含城南、亭湖自建17个站点),安装锁车器11 600多个,投放公共自行车10 400多辆。站点主要设置在居民生活区、行政中心、学校、大型商贸区、医院、公园等人流集中的地段,覆盖了主城区,兼顾了亭湖、盐都、开发区及城南新区的部分区域。截至2017年底,市民办理借车卡8万余张,另有4万多名注册了手机软件进行扫码借车,正常日借车量2.5万人次,最高日借车量近4万人次。
1.1 调查方案
1.1.1 调查方法
行为调查法(RP),主要调查已发生的选择性行为,包括被调查者的选择频率、出行距离、出行目的、出行时间等,该方法的缺点是存在选项或替代信息模糊,调查工作量较大。结合意向法(SP),是在假设条件下,了解被调查者在这一选择状态下的选择结果。与RP调查数据相比,SP数据可操作性极高、数据误差便于调节、调查中选择方案集合明确。本文采用RP和SP相结合的调查方法,通过现场问卷和网络调查的形式,获取公共自行车系统对居民出行方式影响的数据。
1.1.2 调查时间和地点
选取盐城工学院建军东路校区、希望大道校区、宝龙购物广场、中茵海华广场4点围成的区域,如图1所示。于2018年4月5日至4月25日,指派4名调查者采用现场调查的方式进行问卷调查,获得居民出行的数据;同时在问卷收集平台对盐城市区居民在上述区域内的出行方式进行网上问卷调查,并收集数据。在上述区域内调查了11个公共自行车站点,各调查站点基本情况如表1所示。
图1 调查站点区域Fig 1 Survey site area
表1 调查站点基本情况Table 1 Basic information of survey sites
1.2 问卷设计与发放
1.2.1 问卷设计
根据研究目的、盐城市交通状况、问卷发放的条件对问卷进行了设计,题目形式为选择题,主要包括3个方面:出行者属性特征(性别、年龄、职业、月收入等)、出行基本信息(出行目的、出行方式、出行距离)、公共自行车使用特征等。调查重点在于居民对有桩公共自行车出行选择的潜在作用因素,包括出行时段分布、出行分布、是否拥有自行车和汽车等。
1.2.2 问卷预调研
对于初步设计的问卷需要进行一定的预调研来保证问卷的适用性及可靠性。预调研的方法,主要是将初步设计的问卷发放给被调查者,并与被调查者沟通做问卷时候的想法,包括问卷的选项有哪些模糊不清的地方,需要进一步改进的建议等;在进行最终的归纳汇总后对问卷的初步设计进行修订,直到被调查者能够清晰理解问卷选项的含义,达到调查目的为止。
1.2.3 问卷发放与回收
本次调查共发放620份问卷,其中回答没有缺漏,对考察结果起到作用的问卷为602份,占发出问卷的97.09%。在602份问卷中,男性292人,占样本的48.5%;女性310人,占51.5%,性别差异不大。按年龄划分,602份问卷中, 20岁以下(含20)60人,占9.97%;20~30岁(含30)271人,占45.02%;30~40岁(含40)139人,占23.09%;40~60岁(含60)92人,占15.28%;60岁以上的40人,占6.64%。
2 基于Binary logistic建模
在针对某一问题的多因素影响研究,并对各个因素影响程度大小进行判断时,通常选择回归模型。由于公共自行车出行数据较为离散,无法运用线性回归构造模型方程,所以选择对数回归中的Binary logistic回归模型[11-12]。
设Y*表示选择公共自行车的出行效用,Y表示选择结果,X1表示性别,X2表示年龄,X3表示职业,X4表示月收入,X5表示有无私家车,X6表示有无自行车 ,X7表示出行目的,X8表示出行距离,X9表示出行时耗,X10表示换乘方式,X11表示借还车不方便,X12表示政策决策支持,X13表示步行至站点距离太远,X14表示注册流程不便,X15表示换乘不便,X16表示舒适度低,X17表示基础设施条件,建立模型如下:
Y*=a0+a1x1+a2x2+a3x3+a4x4+
a5x5+a6x6+a7x7+a8x8+a9x9+a10x10+
a11x11+a12x12+a13x13+a14x14+
a15x15+a16x16+a17x17+vi
(1)
式中,vi服从Logistic分布。
当Y*>0,Y=1,表示选择公共自行车出行;当Y*<0,Y=0,表示不选择公共自行车出行。
出行者选择公共自行车的概率为
P(y=1|x)=P(y*>0|x)=
P(vi>-xa)=1-F(-xa)=F(xa)
(2)
式中:X=[x1,x2,…,xn];a=[a1,a2,…,an]。
第n个出行者选择第j种出行方式的概率为
p(nj=1/χnj)=
p[(β0+β1χni+……+βmχnm+εj)>0]
(3)
式(1)中,常数项可由向前法获得,第一次获取到常数a表示x对y*的影响大小。另外应该考虑x对P(y=1)的边际影响b,此时,模型可以写成
p(y=1)=b0+b1χ1+b2χ2+b3χ3+b4χ4+
b5χ5+b6χ6+b17χ7+b8χ8+b9χ9+b10χ10+
b11χ11+b12χ12+b13χ13+b14χ14+b15χ15+
b16χ16+b17χ17
(4)
本模型作用要素大多根据理论和经验获得,然而不是每个要素都会对结论有显著影响,所以需要检验模型中各个要素的显著程度,并剔除不显著的变量,从而得到最终的模型结果。
3 模型结果分析
3.1 单因素差异分析
对公共自行车使用者和非使用者使用卡方检验和P值分析。由于问卷调查采集的数据为定类数据,无比较意义,所以在处理变量数据时,用数字定量代表定类数据,比如1代表男,2代表女,从而可以运用卡方检验定类数据之间的关系。
单因素差异分析可用于多组数据,这里运用单因素差异分析不同的使用人群在选择公共自行车出行时各影响因素是否有显著差异,结果如表2所示;若P<0.01,可认为该因素对公共自行车出行选择是有显著影响的。
3.2 影响因素检验
由表2可知,年龄、是否拥有私家车、政策决策支持、步行至站点距离太远、基础设施条件的P值分别为0.003、0.000、0.000、0.006、0.000,均小于0.01,故上述因素对是否选择公共自行车出行是有显著影响的,需要将其纳入Binary logistic回归中。回归分析及建模步骤如表3所示。
表2差异分析
Table2Variance analysis
变量不使用公共自行车使用公共自行车数值百分比/%数值百分比/%卡方P值性别男女1189754.945.117421345.055.05.4480.022年龄/岁≤20(20,30](30,40](40,60]>60161193931107.455.318.114.44.744152100613011.439.325.815.87.815.7830.003职业学生上班族个体经营待业退休965616262144.726.07.412.11419944564736.425.611.414.55.7860.216月收入/元≤1500(1500,3000](3000,5000](5000,7000]>7000873635263140.516.716.312.114.41514583535539.011.621.413.714.24.9200.296是否拥有私家车是否1288759.540.52889974.425.614.3400.000是否拥有自行车是否5516025.674.49229523.876.20.2450.621使用公共自行车出行的目的上班上学游玩探亲回家3252281837.65.925.99.421.2701552466728.06.020.818.426.86.6520.155使用公共自行车出行的距离/km≤1(1,2](2,3](3,4](4,5]>524282445028.232.928.24.75.905786652715022.834.426.010.86.003.4810.480使用公共自行车的出行时耗/min≤101011.82610.4(10,30]3440.09939.6(30,60]3237.610943.6>60910.6166.42.1380.544一般会使用哪种交通方式与公共自行车换乘BRT1011.8228.8公交1315.34216.8私家车22.493.6步行4047.111646.4电动车2023.56124.40.9980.910借车还车不方便11854.923661.02.1220.167政策决策支持11754.427871.818.5810.000步行至站点距离太远3616.710326.67.5830.006注册流程不便7032.613033.60.0670.857换乘不便7936.717344.73.5970.058自行车舒适度低6128.411128.70.0071.000基础设施条件7434.47719.915.5110.000
注:(1)表中卡方检验统计量也就是回归模型无效假设所对应的似然比检验量,即所有协变量的发生比均为1;
(2)P<0.01,表明该模型是显著的。
表3影响因素检验表
Table3Checklist of influence factor
模型步骤变量SigP值HL步骤1 政策决策支持0.0000.000步骤2 政策决策支持 步行至站点距离太远0.0000.0020.0000.819步骤3 年龄≤200.007 年龄(20,30]0.633 年龄(30,40]0.016 年龄(40,60]0.457 年龄(>60)0.256 政策决策支持0.000 步行至站点距离太远0.0060.0000.127 步骤4 年龄≤200.005 年龄(20,30]0.531 年龄(30,40]0.010 年龄(40,60]0.349 年龄(>60)0.200 是否拥有私家车0.022 政策决策支持0.003 步行至站点距离太远0.0140.0000.223步骤5 年龄≤200.004 年龄(20,30]0.514 年龄(30,40]0.008 年龄(40,60]0.337 年龄(>60)0.152 是否拥有私家车0.047 政策决策支持0.024 步行至站点距离太远0.046 基础设施条件0.0060.0000.112常量0.002
基于Binary logistic回归模型,通过向前法,分析得到的5个影响因素是否具有显著影响。因为向前法必须要依次加入各变量,P值代表每个添加的模型是否有意义,所以总共建立5次模型。
由表3可知:(1)几个步骤的结构方程总体检验P均小于0.01,说明最少有一个自变量有用途,即结构方程整体有用途;(2)模型拟合优度HL>0.05,说明模型拟合优度良好,当前数据信息已充分提取。
3.3 回归结果
模型最终选定年龄、是否拥有私家车、政策决策支持、步行至站点距离太远和基础设施条件5个因素,由上可知这5个因素构成的模型拟合效果良好。
由于Logit回归中的回归系数βi,表示自变量改变一单位时,各个因变量发生与不发生事件的概率之比的对数变化值,因这系数为对数,不能类似线性回归直接解释为自变量对因变量的影响程度,故将其转换为OR(Odds Ratio)发生比的对数值,系数才更有明确的意义。表4为上述5因素构成的公共自行车出行模型用OR、95%CI和Sig表示的影响因素的回归结果。
表4中,将年龄<20岁作为对照组,得回归模型的方程为Y=4.931+0.731*年龄(20,30]+0.665*年龄(30,40]+0.532*年龄(40,60]+0.344*年龄(>60)+0.669*未拥有私家车+1.583*政策决策支持+1.610*步行至站点距离太远+0.564*基础设施条件。
表4选择公共自行车出行影响因素的回归结果
Table4Regression results of factors influencing public bicycle travel
变量OR95%CISig年龄≤20ref-0.004(20,30]0.7310.285~1.8740.514(30,40]0.6650.290~1.5290.008(40,60]0.5320.225~1.2620.337>600.3440.157~0.7530.152是否拥有私家车0.6690.451~0.9950.047政策决策支持1.5831.062~2.3580.024步行至站点距离太远1.6101.008~2.5700.046基础设施条件0.5640.375~0.8480.006常量4.931-0.002
由表4可知:在其他因素不变时,年龄(20,30]是对照组的0.731倍,年龄(30,40]是对照组的0.665倍,年龄(40,60]是对照组的0.532倍,年龄(>60岁)是对照组的0.344倍;在调整其他因素后,没有私家车的人骑行概率是有私家车人的0.669倍;政策决策支持的人群使用自行车的概率是未选择这一选项人群的1.583倍;选择步行至站点距离太远的人群是未选择人群的1.610倍;选择基础设施条件的人群是未选择人群的0.564倍。因此,基于回归结果OR值,影响公共自行车使用率的主要因素是政策决策支持与否与站点距离的远近。一方面,公共自行车租赁属于微利行业,投资成本大,运营收益低,政府对公共自行车租赁缺乏持续的财力支持和足够的政策扶持,企业持续运营举步维艰;另一方面,交通部门对公共自行车租赁缺乏统一规划和管理,尚未形成科学的制度机制。大力发展公共自行车是为解决居民出行“最后一公里”的问题,但网点密度低,尚未实现站点500 m覆盖范围,没有形成规模效应。
4 结论
公共自行车主要集中在一线及部分二线发达城市。随着市场竞争的激烈,一线及部分发达二线城市单车数量会较快到达饱和点。有桩和无桩公共自行车两种模式各有优劣,预计未来一二线城市的公共自行车市场将由无桩共享单车主导,三四线及以下城市将由有桩共享单车主导。
选择公共自行车出行者主要以20~40岁的中青年为主,且随着年龄增大呈下降趋势;骑行目的主要解决通勤交通,并逐渐成为一种时尚。在三四线城市,私家车的便捷性给公共自行车出行带来极大的挑战;政策决策支持力度和站点距离出行点太远成为出行者选择公共自行车出行的最大阻碍因素。此外,非机动车道通行空间,与机动车隔离保护等骑行环境的安全性,以及停放的便捷性等均存在一定问题,影响公共自行车的投入使用。