基于数据挖掘的宁波市公共自行车使用特征
2019-10-12梅思雨乔观民邵黎霞
梅思雨,乔观民,邵黎霞,王 捷
(1. 宁波大学地理与空间信息技术系,浙江 宁波 315211; 2. 宁波大学建筑工程与环境学院,浙江 宁波 315211; 3. 宁波市公共交通客运管理局,浙江 宁波 315040)
2007年法国巴黎成功举办了“自行车自由行”,让政府与学者重新审视公共自行车等慢行交通对于城市发展的重要性。在全球变暖、能源危机背景下,公共自行车被认为是一种低碳、环保、健康的出行方式,也是短距离出行效率最高、最具环境可持续性交通方式[1]。因此“大力发展公共自行车,解决居民出行最后1公里问题”成为共识[2]。
当前国内对公共自行车的研究主要集中在:西方发达国家城市公共自行车理论研究与实践经验借鉴[3-5];利用传统O-D调查数据分析用户特征[6-7]、出行模式[8-10]、出行需求预测[11]、站点布局[12-13],建立公共自行车管理和调度系统模型[14]等;利用大数据研究公共自行车问题等[15-16]。快速城市化导致的交通拥堵问题严重影响了城市经济运行,因此运用大数据研究交通问题受到学者与政府的高度关注。
2013年9月宁波公共自行车系统开通运营,用户量逐年增加,至2018年9月办理51万张IC卡,投放公共自行车4.4万辆。本文运用IC卡数据,结合区域属性数据、开放网络数据,探究宁波市自行车使用特征及原因,为提高宁波市公共自行车营运效率、优化公共交通配置提供理论支撑。
1 数据来源与研究方法
1.1 研究区概况与数据来源
研究区域为宁波市中心城区(如图1所示),包括海曙区、江北区、鄞州区、镇海区和北仑区,土地面积为2 462 km2,布设1289个公共自行车租赁点,36 713个桩位。
数据来源主要为:公共自行车IC卡数据、网络数据、宁波市统计年鉴。IC卡数据为2018年3月12—18日居民506 343条出行数据,每条IC数据包含使用者卡号、借还租赁点代码、借还租赁点名称、借还时间、使用时长。剔除使用时长小于1 min及大于3 h的非正常性出行数据,获得有效数据483 961条。网络数据包括:百度地图提供的POI数据,如购物休闲、交通、餐饮、医疗、科教等类别数据。土地利用分类数据来源于《宁波市城市总体规划(2006—2020年)(2015年修订)》。宁波市统计年鉴数据为乡镇街道人口数据等。
1.2 研究方法
1.2.1 租还潮汐比
租还潮汐比反映了各租赁点公共自行车某一时段内租借、归还活动的均衡性。其计算公式为
R=(Q1-Q2)/(Q1+Q2)R∈[-1,1]
式中,R为潮汐比;Q1为某时段租赁点租借量;Q2为某时段租赁点归还量。
在特定时段R值为1时,自行车租赁点显示为租车,产生空架现象;反之,R值为-1时,全部为还车,租赁点桩位为满架现象。这两种情况均产生“租车者租不到,还车者还不了”的不可用现象。当租借量等于归还量时,R值等于0,为租还均衡理想状态。通常租赁点潮汐比R∈[-1,-0.1)为归还点,R∈[-0.1,0.1]为平衡点,R∈(0.1,1]为租借点[17]。
1.2.2 核密度
核密度估计(kernel density estimation,KDE)用于计算点要素或线要素在其周围邻域中的密度。方程定义为
式中,h为带宽值;x-xi为估计点到样本xi的距离;k为核的权重函数。
带宽值h会影响核密度估计结果:一般带宽值越大,生成的密度栅格越平滑且概化程度越高;带宽值越小,生成栅格所显示的信息越详细。经过多次模拟,最终确定带宽值为1200 m。
1.2.3 泊位周转率
泊位周转率为某时段租赁点锁止器被重复使用的次数,反映了租赁设施的利用水平。以某时段还车数与桩位数之比来表示周转率,时段为每日。计算公式为
α=Q1/N
式中,Q1表示租赁点日归还量;N表示租赁点锁止器数量。
1.2.4 回归分析模型
多元线性回归分析是表示因变量和自变量之间相关关系最基本方法。表达式为
Yi=β0+β1x1+β2x2+…+βmxm+εi
式中,Yi为因变量;X1,X2,…,Xm为影响因素;β0为常数项;β1,β2,…,βm为回归系数;εi为残差。具体结合公共自行车使用,Yi为i租赁点公共自行车使用量,X1,X2,…,Xm为i租赁点的系统变量、交通变量、社会经济变量、空间变量、时段变量、虚拟变量。
2 公共自行车的使用特征分析
2.1 时间特征
宁波市中心城区公共自行车日均总使用量为69 137次,平均出行时长为16 min。在时段上,公共自行车使用呈现明显的峰谷现象(如图2所示),早高峰为7:00—9:00,晚高峰为17:00—19:00,早高峰峰值大于晚高峰。休息日的早、晚高峰峰值比工作日都低。
公共自行车使用时长集中在15 min以内(如图3所示),占总量的64.06%;在25 min内的占83.4%。早高峰平均使用时长为14.80 min,晚高峰为14.79 min;工作日平均使用时长为15.72 min,休息日为16.41 min。宁波公共自行车具有很强的公共交通“最后1公里”接驳功能。
2.2 空间特征
宁波市公共自行车租赁点具有空间分布不均衡性(如图4所示)。租赁点集中于主城区地铁线路两侧,核密度值为16次/km2。公共自行车使用量的核密度具有“一核双中心”结构:一核为三江口地区,其核密度值达到4000次/km2;双中心分别为镇海中心城区、北仑中心城区,其核密度值分别达3500、1500次/km2(如图5所示)。
以三江口为中心,分别以3、5、10 km为半径的缓冲区,将研究区划分成内圈层、中圈层、外圈层和大于10 km的外围区(如图1所示)。3月12—18日,内圈层286个租赁点公共自行车使用量达326 673次,中圈层247个租赁点总使用量为201 449次,外圈层407个租赁点总使用量为187 191次,外围区349个租赁点总使用量为252 608次(见表1)。租赁点平均使用量、使用量空间密度具有由中心向外围递减规律,但租赁点平均使用量在外围区出现升高现象,这是由于外围区域面积大,租赁点密度低,导致居民对自行车的依赖度增加。
租赁点潮汐比整体上较平衡(如图6所示),平衡点占73.16%,但租赁点之间差异性很大。其中,以商业服务功能为主的内圈层为租还平衡区,平衡点占86.71%,潮汐性较弱;中圈层平衡点占78.54%;外圈层和外围区平衡点占比皆小于70%,潮汐性较明显。总体上呈现潮汐比由中心向外围增大趋势。
租赁点圈层内交换强度大于圈层之间。内圈层的内部交换强度为133 567次,占总租借量的81.45%,中圈层、外圈层、外围区内部交换强度占总租借量的80%左右。OD交换量存在“内圈层到中圈层”与“中圈层到内圈层”相互补偿流关系,同样在其他圈层之间也存在这一现象(见表2)。
表2 圈层OD情况 次
公共自行车居民出行以短距离为主(如图7所示),平均出行距离为3.91 km。租赁点间出行量最高出现在长乐站(自行车租赁点)与晴园(自行车租赁点)之间,距离为1.11 km,出行量达到63次/d。
租赁点泊位日均周转率为2.4次,最大周转率为17次,泊位周转率小于1次/d占32%。租赁点的公共自行车平均使用量与泊位周转率之间具有正相关关系(见表1)。内圈层日均泊位周转率最高(如图8所示),内圈层和外围区超负荷租赁点(日泊位周转率大于3次)较多,外圈层和外围区无效租赁点(日泊位周转率小于0.5次)较多。内圈层超负荷租赁点占47.55%,无效租赁点占2.80%;中圈层超负荷租赁点占24.69%,无效租赁点占5.67%;外圈层超负荷租赁点占4.67%,无效租赁点占22.85%;外围区超负荷租赁点占23.78%,无效租赁点占20.63%。因此,加强对超负荷租赁点调度和无效租赁点统筹规划是提高公共自行车利用效率的基础。
3 租赁点公共自行车使用的影响因素分析
3.1 影响因素选取
模型因变量采用2018年3月12—18日租赁点公共自行车使用量。参考文献[18]的研究,自变量分为系统变量、交通变量、社会经济变量、潜在变量、时段变量与土地类型虚拟变量等6类(见表3)。
表3 影响公共自行车使用量的因子情况
续表3
系统变量为租赁点桩位数与租赁点密度;交通变量为公共自行车租赁点缓冲区内公交站数量、地铁站数量、主干道及次干道里程数;社会经济变量为租赁点所在街道人口密度、缓冲区内公司企业数量;空间变量为租赁点缓冲区内医疗保健、教育机构、购物网点、餐饮服务、公园以及生活服务类等数量;时段变量为早高峰时段和晚高峰时段;虚拟变量为租赁点土地用地性质,即《城市用地分类与规划建设用地标准》的9类用地。参考文献[19]的研究,选取500 m为公共自行车租赁点缓冲区半径。
3.2 方程拟合结果
利用SPSS22.0软件回归分析:R2>0.8,F=711.771,Sig.=0.000,方程具有显著意义,其中10个自变量具有明显解释意义(见表4)。
表4 模型结果
注:*、**、***分别为P<0.1、P<0.05、P<0.01。
3.2.1 系统变量、社会经济变量
公共自行车租赁点的桩位数、密度与因变量相关性不显著,但在内圈层、外围区具显著相关性。公共自行车租赁点的桩位数与内圈层租赁点的使用量存在显著正相关,其标准系数为0.061,在内圈层具有租赁点桩位数越多使用量越大的特征。公共自行车租赁点密度,在内圈层回归标准系数为-0.098,这是由于内圈层租赁点密度越高,相互之间距离越近,竞争关系明显,单个租赁点效率降低;在外围区系数为0.078,总体上外围区租赁点密度远低于内圈层,租赁点之间距离远,公共自行车之间对流呈现互补性,因此密度越高,反而使用量越大。
人口密度、公司企业数量对因变量具有显著相关性。人口密度标准系数为0.074,人口密度越大,使用量越多。公司企业数量标准系数-0.031,公司企业集中区通常会布置公交站点,公共自行车需求自然就降低了。
3.2.2 交通变量、空间变量
公交站数、次干道里程与因变量相关性不显著。地铁站数与因变量存在显著负相关性,地铁站数量标准系数为-0.017。这说明公共自行车与地铁的接驳功能不完善。
公交站数在中圈层具有正相关性,其标准系数为0.098。中圈层是受三江(姚江、奉化江、甬江)自然阻隔影响最大的地域,公交站与公共自行车之间的接驳功能效果明显。次干道里程在内圈层和外围区具有显著性相关性,其标准系数分别为-0.069、-0.031。内圈层路网密集,公交站点多,人流拥挤,自行车功能让位于步行。外围地区次干道里程密度越低,“出行难”越明显,对公共自行车需求越大。
租赁点500 m缓冲区范围内医疗保健、教育机构、餐饮服务、公园等POI与因变量存在显著正相关,标准系数分别为0.051、0.049、0.054、0.028,租赁点周边这4类POI兴趣点集聚与自行车使用呈现正相关。
3.2.3 时段变量、虚拟变量
早晚时段变量与因变量存在显著相关性,标准系数分别为0.485、0.421,公共自行车使用具有明显时间节律性。
绿地与广场用地与因变量存在显著负相关,绿地与广场用地其标准系数为-0.016,该地类是居民日常休闲场所,以步行为主。
公共管理与公共服务用地、道路与交通设施用地分别在中圈层、外圈层与因变量具有显著的相关性。公共管理与公共服务用地、道路与交通设施用地与因变量的系数分别为-0.050、-0.046。在中圈层、外圈层公共服务用地和交通设施拥挤聚集区,都是大的单位(政府、大学等)用地和交通枢纽(TOD)用地,在中圈层公共交通便利或为共享单车天下,外圈层私家车取代自行车接驳。
4 结论与讨论
运用GIS和SPSS对宁波市公共自行车进行数据挖掘发现:①宁波市公共自行车使用量存在明显时空分异。公共自行车出行时间具有峰谷现象,骑行时长在工作日与休息日、早高峰与晚高峰都具有差异;公共自行车租赁点与使用量分布具有“一核双中心”特征,车辆使用量、潮汐比、泊位周转率都存在圈层特征。②通过对系统变量、交通变量、社会经济变量、潜在变量、时段变量与土地类型虚拟变量等24个变量进行模拟,发现10个变量具有解释意义。公共自行车使用与人口密度、医疗保健网点、教育机构、餐饮服务、公园数、早高峰时段、晚高峰时段具有明显的正相关关系;与地铁站数、公司企业数量、绿地广场与量存在明显的负相关关系。这说明宁波市城市空间结构影响了公共自行车使用。
数据获得性关系,研究着重刻画使用者共性特征。如果加强个体特征交叉分析,数据将更具有鲜活性。在共享单车影响下,宁波公共自行车生存空间受到压缩。设想如果公共自行车让开内、中、外圈层,仅仅占据共享单车不愿意投放的外围圈层地区,充分实现公共自行车公共物品功能,但研究表明这是低效率行为,不具有可行性。