基于大数据的公交服务供需动态匹配研究
2022-09-06王庆国郭富成
万 婕,王庆国,郭富成
(武汉科技大学 汽车与交通工程学院,湖北 武汉 430065)
随着城市空间规模的扩张和职住空间分离的加剧,长距离通勤、交通拥堵等城市问题日益严峻。由于公共交通具有集约高效、普惠公平等优点,优先发展公共交通成为缓解交通拥堵、转变城市交通发展方式的必然要求和战略选择。相应地,对公共交通的研究成为热点。
传统研究主要从站点布局、公交可达性、公交效益评价、乘客满意度等方面对公交服务供给进行量化分析,较少涉及公交服务需求的量化及公交服务供需的匹配。公交供给以满足公交需求为目标,只有供需匹配,才不至造成公交供给的不足或浪费。而公交需求量化研究的缺位,使公交优化失去方向、变得盲目,弱化了公交供给量化研究的实际意义。
现实中,由于人的出行存在波动性,对公交服务的需求是动态变化的,同时,路网实时交通状态的变化也导致候车时间和公交服务供给的动态波动;另一方面,在微观的人口活动空间,出行需求位置与公交供给位置之间依靠步行空间衔接,这使得供需识别与匹配需要空间上精细粒度的需求分布挖掘与步行级别的路网构建。因此,公交服务供需量化与匹配应该是微观动态的。
传统研究受限于长时间序列活动数据的缺乏,对人们活动的动态感知不够,空间覆盖也不全面。因而,传统的公交服务研究更多的是一种粗粒度和静态的研究,忽略了公交供需的动态变化,掩盖了局部供需的不匹配。随着大数据时代的来临和数据源的丰富,基于个体行为的大数据具有更精细的时空粒度,使得实时精细观察大规模的群体活动行为、全面感知人们的活动空间动态,从微观层面研究活动空间动态演化成为可能。为此,本文以武汉市主城区为研究对象,充分发挥大数据在微观尺度上精确与海量的优势,基于高德路径规划大数据获取实时交通状态下的公交出行信息,腾讯“宜出行”人口位置大数据挖掘不同时段精细粒度的需求分布,进行公交服务供需的动态挖掘与匹配,分析其差异与耦合;重点考虑早晚高峰时段的职住出行需求与城市公交供给,量化城市规模的公交服务供需,引入空间统计指标进行供需动态匹配及匹配程度定量计算,识别公交供需失衡区域。
1 研究区域与数据来源
1.1 研究区域与研究尺度
由于武汉市的通勤需求与公交设施主要集中于《武汉市城市总体规划(2010-2020 年)》规定的主城区范围,因此,本文以武汉市主城区为研究范围,进行公交服务供需水平挖掘与匹配分析。考虑交通出行者步行活动范围小、习惯就近乘车等特点与数据源精度,在研究范围内建立500m×500m 网格作为分析的基本单元,将主城区共划分为3 683 个网格单元,如图1 所示。
图1 研究范围与网格单元划分
1.2 数据来源
1.2.1 高德路径规划数据。本文基于高德地图路径规划API 获取研究区域内公交出行行程数据。高德地图路径规划API 是一套为开发者提供的步行、公交、驾车查询及行驶距离计算接口,可以规划综合各类交通方式与出行策略的通勤方案,并且返回通勤方案的数据。相较于其他路径规划与行程成本计算方法,高德地图路径规划API 路网信息全面,精确至步行路网,保障规划方案步行可达;模拟真实交通环境与乘车环境,结合精准的实时路况,还原真实交通状态下的实际行程时间,同时考虑乘车、换乘期间的候车时间与步行时间;规划方案自定义,提供多种出行方式与路径规划策略,自定义避让区域或道路,指定出发时间。
通过对主城区交通状况连续一周的观察与记录,确定早晚高峰时段范围;利用Python 程序获取2020 年6 月29 日至7 月1日连续三个工作日早高峰时段(08:30~09:30)与晚高峰时段(17:30~18:30),主城区3 683 个网格质心两两之间的13 564 489条公交出行路径规划信息作为公交服务供给挖掘的原始数据。高德路径规划示例如图2 所示。
图2 高德路径规划示例
1.2.2 腾讯“宜出行”位置大数据。本文采用腾讯“宜出行”位置大数据作为公交服务需求挖掘的数据来源。宜出行位置大数据基于腾讯全线互联网产品的用户数据,对各区域人口分布以热力地图的形式进行实时可视化展示。宜出行数据具有实时性强,能够实时动态展示不同时段人群的真实位置与聚散规律;覆盖群体全面,几乎涵盖所有智能手机用户;采集网格密度为25m,数据粒度细、定位精度高;可以实时获取后台原始数据等优点。利用Python 程序获取相应时段的实时人口位置数据,每条数据包含经度、纬度、人口热力值和爬取时间四个字段,在ArcGIS 中显示,如图3 所示。
图3 宜出行数据
2 公交服务供需量化分析
2.1 量化分析方法
2.1.1 公交服务供给量化分析方法。以不同时段、不同时间出行情景下的公交可达性表示公交服务供给水平,基于高德路径规划数据构建可达区,并以可达区域面积计算各网格单元的公交可达性。具体方法为:(1)构建OD 矩阵。将研究区域内的3 683 个网格单元分别作为起点与终点,获取网格质心坐标作为起讫点坐标,构建OD 矩阵。(2)获取行程数据。通过高德路径规划API 获取起讫点间的行程数据,提取并记录公交出行时间成本。(3)建立可达区。基于上一步获取的最短行程时间,建立各网格单元t 时间约束下的可达区域范围,即以网格单元i 为起点,所有在t 时间内乘公共交通能到达的网格单元构成网格单元i 在t 时间约束下的可达区,这里时间阈值t 取30、60、90min,分别模拟短、中、长时间出行情景。(4)计算公交可达性。统计各网格单元t 时间可达区的面积,作为该网格单元t 时间约束下的公交可达性。
2.1.2 公交服务需求量化分析方法。基于腾讯“宜出行”位置大数据获取实时人口位置数据,利用时间识别窗口的方法推测职住出行需求发生的位置。根据人口活动习惯,取23:00 至次日6:00 为休息时段,各网格单元休息时段人口值表示居住人口分布,代表早高峰时段以该网格单元为起点的出行需求;取9:00~12:00 和14:00~17:00 为工作时段,各网格单元工作时段人口值表示就业人口分布,代表晚高峰时段以该网格单元为起点的出行需求。
2.2 量化结果分析
2.2.1 公交服务供给量化结果分析。以30min、60min、90min 时间约束下的公交可达性评价主城区短、中、长时间出行情景下的公交服务供给水平,基于自然断点法将网格供给水平分为好、较好、中等、较差、差五级,从公交服务供给的空间分布上看(如图4 所示):主城区中央核心区域供给水平较好,主城区外围供给水平差,轨道交通沿线网格公交供给水平明显更好。早晚高峰时段公交供给水平差异不大,从均值与最值上看,晚高峰时段整体公交可达性相对较差。
图4 早晚高峰时段不同出行时间情景公交服务供给水平
结合公交供给水平直方图(如图5 所示),进一步对比不同时间出行情景公交服务供给的分布特征与变化趋势:短时间出行情景大部分网格公交供给等级为差或较差,早高峰时段38.01%、晚高峰时段37.82%的网格公交供给差,早晚高峰时段仅6.90%、7.28%的网格公交供给好或较好,21.69%、20.96%的网格公交供给在中等及以上,其分布与公交站点密度高的区域高度重合,可达性最好的网格高峰时段可达区可覆盖主城区的5%~10%(不含水域);中时间出行情景核心区域网格公交供给等级基本为好,早晚高峰时段35.89%、36.03%的网格公交供给高于主城区平均水平,可达性最好的网格高峰时段可达区可覆盖主城区的50%~60%(不含水域);长时间出行情景大部分网格公交供给水平在中等及以上,早晚高峰时段43.17%、42.38%的网格公交供给好或较好,仅5.67%、6.79%的网格公交供给差,主要为主城区边缘或水域上的网格,可达性最好的网格高峰时段可达区可覆盖主城区85%以上的区域(不含水域)。短时间出行情景只有距离公交站点近的网格可达性好,随着时间约束增大,大部分网格公交供给提升,不再局限于公交站点附近,供给好的网格占比增加、供给差的网格占比下降,可达性在0 值附近的网格明显减少。
图5 早晚高峰时段不同出行时间情景公交服务供给直方图
2.2.2 公交服务需求量化结果分析。从公交服务需求的空间分布上看(如图6 所示):各时段公交需求主要集中于主城区中央、滨江核心区域,由主城区中央向外围递减,主城区外围公交需求较低。结合出行需求直方图可以发现(如图7 所示):晚高峰时段公交服务需求高值突出、数值间差异大,公交服务需求相对集中,各网格单元需求分布差异明显;早高峰时段公交服务需求相对均匀分散,各网格单元需求分布差异小。
图6 早晚高峰时段公交服务需求分布
图7 网格尺度早晚高峰出行需求直方图
进一步分析主城区各区域的出行需求分布特征,将各网格单元按所在组团分类统计(如图8 所示)。汉口地区的汉口中央活动区、塔子湖组团出行需求较高,其中,汉口中央活动区出行需求密度在早晚高峰时段均为主城区最高,塔子湖、后湖组团早高峰出行需求占整体比重上升,二七组团晚高峰出行需求较高、早高峰出行需求下降,外围的黄浦组团出行需求较低。晚高峰时段以江汉路、循礼门为中心聚集了大量出行需求,另有王家墩片区、汉口火车站、万松街道、汉正街等区域晚高峰时段分布有较高的出行需求,万松街道早高峰出行需求降低,周边街道早高峰时段出行需求增加。武昌地区的武昌中央活动区、珞瑜组团、杨园组团出行需求较高,杨园、青山、白沙组团早高峰出行需求占整体比重均不同程度上升,外围的武钢组团、东湖风景区出行需求较低。晚高峰时段出行需求大量集中于粮道街、中南路等街道及轨道交通2 号线与4 号线沿线串联的多个大型商圈附近,这些区域早高峰时段出行需求明显下降。汉阳地区的汉阳中央活动区出行需求较高,四新组团早高峰出行需求占整体比重上升,十升组团早高峰出行需求比重下降,外围的沌口组团出行需求较低。晚高峰出行需求主要分布在王家湾片区,早高峰时段出行需求有向商圈外围移动的趋势。主城区组团早晚高峰出行需求分布密度如图8 所示。
图8 主城区组团早晚高峰出行需求分布密度
3 公交服务供需动态匹配
3.1 分析方法
双变量空间自相关性指标能很好地描述两个变量在空间分布上的相关性,因此,对于公交服务的需求与供给水平,基于双变量局部莫兰指数(Bivariate LISA)揭示二者在局域空间的集聚与分异。其计算方法如下式所示:
3.2 匹配结果分析
按照网格公交服务供需与周边网格平均水平匹配情况,可以将网格单元分为四类(高需求—高供给、高需求—低供给、低需求—高供给、低需求—低供给),从空间分布上看(如图9 所示):高—高类网格集中在主城区中央核心位置,主要分布在汉口、武昌、汉阳三大中央活动区及珞瑜组团等人口活动密集、公交站点密集的区域,随着时间阈值提高,高—高类网格的分布也向周边次级人口活动组团扩散;低—低类网格主要分布在主城区外围,二七、沌口、武钢组团外围及东湖风景区人口活动密度与公交供给水平均较低;低—高类网格主要分布在高—高类网格外围,因位置靠近中央核心区域而有较好的公交设施条件,然而公交服务需求并不高,应加强对该区域公交设施的利用,引导人口、产业向该区域移动,分担中央核心区密集的公交需求;高—低类网格主要分布在低—低类网格内侧,是主城区外围公交需求较高的区域,而主城区外围公交设施条件普遍不好,无法满足需求,应加强该区域公交设施建设,在公共交通线路向主城区外围延伸的过程中,首先考虑这些公交需求高的区域。早晚高峰时段供需匹配的差异主要表现在中、短出行时间情景高—低类和低—高类网格的分布上,整体匹配情况相似,这是由于早晚高峰时段需求分布的差异体现在非核心、非外围组团下的局部街道,出行需求由核心向外围组团递减的整体规律是相同的。
图9 早晚高峰时段不同出行时间情景公交服务供需匹配模式分类
从数量占比上看(如表1 所示):低—低类网格较多,其次是主城区中央的高—高类网格,主要是由于主城区外围公交供需水平均低的区域面积较大;低—高类网格和高—低类网格较少,即公交供需不匹配的区域占比较少,主城区公交供需匹配情况较好。
表1 四种类型网格数量及占比
进一步识别公交供需不匹配的区域(如图10 所示),其中:低—高类网格为需要加强需求的区域,该区域有较便利的公共交通条件,公交供给水平高,可以加强生活设施建设、增加就业岗位,吸引人口、增加需求,为中央核心区域分流人口、分担需求,作为次级生活或产业中心发展;高—低类网格为需要加强供给的区域,是现阶段公共交通设施尚未覆盖或供给不足的盲点区域,应加强配套公交设施建设、满足出行需求,作为下一步城市交通建设的重点。
图10 早晚高峰时段公交服务供需不匹配区域识别
4 结论与讨论
本文以武汉市主城区为例,对微观尺度上的公交服务供需进行动态量化及匹配。考虑供需分布的动态变化,发挥大数据精确与海量的优势进行微观尺度挖掘,基于高德地图路径规划数据构建不同时间出行情景下考虑步行活动空间的可达区域范围,利用腾讯“宜出行”位置大数据挖掘不同时段的人口分布与公交服务需求。引入空间自相关指标对公交服务供需匹配程度进行定量计算与分析评价,并进一步识别公交服务供需不平衡的区域。研究表明:不同时段、不同时间出行情景下从微观尺度对公交服务供需匹配的评价与不匹配区域的识别,可以发现现有城市职住空间与公交布局下人的职住出行需求与真实获得的可达机会之间的耦合与分异,识别供需匹配的盲区,为城市规划与交通设施建设提供可靠的规划依据与科学建议,从而优化城市布局、缓解交通压力,进一步提升城市交通运行效率、推进公交公平。
该方法基于细粒度大数据量化公交供需,可以对不同出行情景下城市规模公交供需进行动态匹配与失匹区域识别,适用于不同城市。然而,仍存在一些不足:首先,由于数据获取限制,本文采取的数据源有限,后续可结合IC 卡刷卡数据、手机信令数据等多源数据,进一步细化时空精度,丰富数据语义信息;其次,考虑职住出行时效性的需求特点,本文以时间成本最低为约束条件构建公交出行方案,后续可进一步细化出行目的,构建多重出行策略下的公交出行方案。另外,考虑人群差异、结合共享单车接驳等也是值得进一步深化研究的方向。