杭州地铁OD 数据客流时空分布特性分析
2021-11-28孟兵兵周健勇
孟兵兵,周健勇
(上海理工大学 管理学院,上海 200093)
0 引言
近年来,随着我国城市化进程的不断加快以及智慧城市的发展,交通领域产生了海量时空数据。由于世界城市规模的日益扩大,各大城市交通压力也持续增加,各国政府在大力提倡环保出行、增加地面交通工具的同时,也不断发展地下交通,而地铁就是最重要的地下交通工具。自1971 年北京地铁1 号线开通试运营,截至2019 年底,中国大陆地区(不含港澳台)40 个城市共开通城市轨道交通运营线路208 条,运营线路总长度为6 736.2km,其中地铁运营线路为5 180.6 km,占比76.9%。据不完全统计,2019 年城市轨道交通完成客运量237.1 亿人次,客运进站量149.4亿人次。如何基于数据充分挖掘交通的演化规律,提升交通运行效率,是一个亟待研究的课题。
本文基于大量乘客起始点—终止点(Origin-Destina⁃tion,OD)数据,选取杭州地铁部分数据,将空间统计与可视分析相结合,以探究城市居民出行规律,并对用户出行特征进行分析,从而改善杭州公共交通状况,同时为杭州地铁站点及线路规划提供参考。
1 相关工作
目前国内外对城市居民出行数据的研究主要集中在对公交和出租车的OD 数据进行挖掘分析,并对其轨迹进行可视化展现方面。如蒲剑苏等[1]对轨迹数据可视化研究现状进行了较详尽的综述,为探索轨迹数据中包含的时空规律提供参考;黄文达等[2]结合日历图、时钟图和群体行为分布地图等多视图联动进行交互分析,引入城市—区域—站点的多尺度群体租车行为交互分析系统,并通过案例证明了该系统在群体行为分析上的有用性和有效性;Wei等[3]设计一种路点约束OD 视图,提出一种探索城市及交通网络中与路径相关OD 模式的新方法——路标约束的OD可视化分析;Pablo 等[4]通过构建大规模出租车轨迹的交通密度模型预测交通状况,并据此模型估算排放物对空气质量的影响;姜晓睿等[5]设计一个出租车起止点数据可视化分析系统,并将其应用于杭州市出租车GPS 真实数据分析上,取得了不错的效果。北大可视化小组自主设计研发的Trip Vista 可视化分析系统从时间、空间、维度3 个方面分析交通路口流量信息,利用流图和平行坐标展示轨迹流数据的可视化效果,并采用多种交互方式对不同类型的车辆和行人轨迹进行可视化分析,同时提供了密度图来展示宏观的交通流量密度等[6]。江志彬等[7]通过可视化方法,从城轨交通运营管理者的实际需求出发,研究了大规模复杂网络OD 客流、断面、进出站和换乘客流大数据可视化的关键技术与实现方法;李文峰等[8]运用可视化方法分析了厦门市的公交客流特征与规律;张健钦等[9-10]采用GIS 空间插值法对北京市公交客流分布进行可视化展示,并采用直接可视化和聚集可视化两种方式绘制北京市线路分布图,最后根据可视化结果对北京市公交线路空间分布情况进行分析。
国内外目前对地铁客流数据的研究相对于公交、地铁、共享单车的研究较少,而且对地铁客流的研究更多地集中在客流预测、分时广告、站点价值等方面,针对站点客流时空分布特性分析的研究并不多。本文以杭州地铁客流数据为研究对象,通过构建客流OD 矩阵,与乘客出行数据的可视化展现相结合,从时间、空间两个维度分析杭州城市居民在工作日、周末及节假日3 种模式下的出行规律。
2 数据来源及处理
OD 数据,即城市居民出行的起讫点数据。从统计学角度来说,移动物体在空间上的移动呈现一种流动性特征,空间位置的迁移即是移动物体的轨迹起止点,其中O 点为轨迹起始点,D 点为轨迹终止点[11]。OD 矩阵也称为起讫矩阵,其借用了代数学里的矩阵,抽象、直观、简洁地度量了不同对象之间的连通性及其强弱。鉴于杭州地铁各站点具备很好的连通性,可利用抽象的OD 矩阵进行直观表示。矩阵中的元用来刻画任意两站点之间客流的来源和去向,然后把所有这样的元拼在一起构成一个矩阵,即为OD 矩阵。
本文以杭州市某日地铁刷卡数据为原始数据,利用集合论[12]等知识构造出一种简单的OD 矩阵[13]。杭州市地铁乘客原始OD 数据中包含的字段很多,其中本文研究所需的字段如表1 所示。为方便对地铁OD 数据的存储与管理,将所有OD 数据存储到MySQL 数据库中,从而有利于数据统计、查询等操作。此外,本文按照以下几个规则运用Py⁃thon 对OD 数据进行预处理:
(1)除表1 所列之外的字段全部删除。
(2)action 为2 或3 时属于异常订单数据,为确保数据的准确性,将相关数据删除,即数据库最终只保存action 为0 或1 的数据。
(3)对订单信息进行字符串切片,变成线路和车站两个字段,由于只研究各地铁站的OD 数据,所以在哪个设备刷卡进站并不重要,故删除设备编号信息。
(4)把乘客过闸机的时间,也即订单产生时间分割成日期和时间两个字段。
修改后的OD 数据字段如表2 所示。
Table 1 Passenger OD data field表1 乘客OD 数据字段
Table 2 Pre-processed passenger OD data field表2 预处理后乘客OD 数据字段
对数据进行以上预处理后,将某用户乘坐地铁action为0 和1 的两条订单数据按订单创建时间整合为一条订单数据。此外,定义A=(aij)为杭州市地铁OD 矩阵,矩阵中的元aij定义为该时段内从i站到j站的刷卡人次,例如令i为人民广场站,j为南星桥站,则表示该时段内从人民广场进站,之后从南星桥出站的客流量。当i取不同值时,即可知道其他站点到南星桥站的过闸人数。同理也可令j为其他站点,当i和j取遍所有可能值时,即能知道不同站点的进出和流向情况。以杭州市五号线2020 年10 月1 日的OD数据为例,构建OD 矩阵如表3 所示。
表3 中杭州地铁四号线各地铁站间一天的OD 客流量在某种程度上反映了城市居民出行规律。从表中可以看出,相比于其它站点,火车东站和市民中心两个地铁站客流量较大。由于本文选取的统计时段恰好位于国庆假期,而杭州又是一个旅游胜地,除本地居民的出行量外,其它地区的居民也有来杭州旅游的可能性。此外,市民中心的音乐喷泉和灯光秀等也吸引了大批游客到此打卡,因而造成了火车东站和市民中心客流量较大的现象。在这两个地铁站点上下地铁时也可以发现,地铁站会安排更多工作人员进行游客疏导,以确保人们顺利出行。
Table3 OD data of Hangzhou metro line 4 during October 1,2020 00:00:00-23:59:59表3 杭州地铁四号线2020 年10 月1 日00:00:00-23:59:59 的OD 数据
3 杭州地铁客流时空特性分析
客流OD 矩阵是进行客流分布特征分析的基础,本文选取2020 年9 月30 日-2020 年10 月18 日期间各地铁站点的客流OD 数据作为研究对象,在构建好杭州地铁各站点的OD 矩阵后,从时间和空间两个维度对杭州地铁运营客流分布特征进行研究。
3.1 全日OD 客流量时段分布
截至目前,杭州市地铁有1、2、4、5 和16 号线共5 条线路运行,开通站点122 个(换乘站不重复计算),运营里程共计206km。2020 年9 月30 日,杭州地铁线路网单日总客流再次刷新历史记录,突破261 万人次。通过对杭州地铁2020 年10 月13 日OD 客流数据的分析,可得到其全日客流量时段分布如图1 所示。根据杭州地铁运营时间以及对全日客流量时段分布图的综合分析,把研究范围设定为6:00-23:00。考核客流量时段分布的主要指标是客运时段系数P,该值是各时段客流量与全日客流量之比。经计算得到各客运时段系数值如表4 所示。
Fig.1 Passenger flow time distribution of Hangzhou metro in October 13图1 杭州地铁10 月13 日客流时段分布
Table 4 Passenger flow coefficient of Hangzhou metro in October 13表4 杭州地铁10 月13 日客流量系数
假设G 代表高峰时段均值系数,H 代表平峰时段均值系数,一般情况下,7:00-10:00 与17:00-19:00 为高峰时段,其余为平峰时段。交通需求时段分布的均衡性定义为:时,较均衡;时,一般不均衡;2.0 时,很不均衡。
通过对表4 中的数据计算可知:G=0.095,H=0.044,=2.16>2.0,因此杭州地铁现有线路的交通时段分布很不均衡。
3.2 OD 客流分布特性分析
利用Python 对杭州地铁某日各站点客流量进行统计,并采用百度的可视化框架Echarts 绘制杭州地铁各站点某日客流分布热力图,如图2 所示。图中红色代表客流量较大,绿色代表客流量较小,黄色为过渡色,表明大部分客流集中在景区、商业区、居民区以及具有办公性质的大楼附近,部分客流分布在学校周边及郊区等地。
Fig.2 Heat map of passenger flow distribution in a certain day at each station of Hangzhou metro图2 杭州地铁各站点某日客流分布热力图
为更直观地呈现各地铁站在各时段的OD 客流分布特性,本文设计了一个以横轴表示时间段、纵轴表示地铁站点、横轴与纵轴交叉所形成的方格颜色深浅表示客流量大小的热力图。选取部分站点,利用Echarts 为辅助工具,分别绘制了工作日、周末以及国庆假期3 种模式下的各时段OD 客流分布热力图,如图3-图5 所示。在该热力图中,以颜色深浅代表客流量大小,颜色越深,表明该地铁站在该时段内客流量越大,反之则越小。
Fig.3 Passenger flow at some stations of Hangzhou metro during working hours图3 杭州地铁部分站点工作日各时段客流量
Fig.4 Passenger flow at some stations of Hangzhou metro during weekends图4 杭州地铁部分站点周末各时段客流量
Fig.5 Passenger flow at some stations of Hangzhou metro during holidays图5 杭州地铁部分站点节假日各时间段客流量
从图3 中可以了解到,工作日期间杭州地铁各站点客流清晰呈现了早晚高峰的特性,早高峰是7:00-10:00,晚高峰是17:00-20:00,在这两个时间段内客流量比其它时段大。通过3 幅图的对比可以明显看出,无论是工作日还是节假日,火车东站(杭州东站)的客流量始终是最大的,而城站(杭州站)和火车南站(杭州南站)的客流量相对较小,表明杭州东站作为杭州交通的主要枢纽承载了杭州大部分客运量,甚至有可能会出现“过载”现象,杭州站和杭州南站则无法充分发挥该站点的效能,可能存在运营“过剩”现象。相关部门也应当留意这些问题,并适当采取措施,对杭州南站和杭州站进行引流,以充分发挥该站点的作用,缓解杭州东站的运营压力。此外,对于正在建设中的杭州西站更要注意这些问题,尽可能避免运营“过剩”现象。
除火车东站外,龙翔桥和凤起路两个地铁站点的客流量也较为突出。通过结合地图观察得知,该站点位于西湖边上,而西湖是国家5A 级旅游景区,无论是工作日还是节假日,都会吸引大批游客到此游玩观赏。此外,该地铁站附近不仅有一个汇集吃喝玩乐于一体的大型商场,还存在各式各样的网红打卡点,无疑又增加了两个站点的客流量,加大了站点运营压力。相关部门也正是考虑到这些问题,在该站点安排了更多工作人员辅助疏散人流,以保证人们出行畅通,避免交通拥堵现象及踩踏事故的发生。
通过对比工作日、周末和国庆假期3 种模式下杭州地铁部分地铁站各时段的OD 客流分布特性,发现无论是工作日还是节假日,人流量最大的地方主要集中在火车东站和西湖景区附近。
4 结语
地铁OD 客流量的可视化研究可实时监测人群流动状况,让交通部门能够更合理地规划交通资源,从而为市政交通建设与管理提供参考。另外,杭州城市框架拉开需要丰富地铁层次,且杭州市在2022 年亚运会开幕之前,除原有线路及站点外,需要陆续开通地铁线路近10 条,站点近200 个,而对地铁OD 客流的可视化分析能帮助杭州对在建地铁线路进行合理规划,优化地铁站点选址,构建更快速的地铁快线网,以满足快捷、高效的长距离出行要求,提升杭州的空间组织效率。这不仅可使本地城市居民出行更加便捷,而且能改善外来游客的游玩体验,提升其满意度。
本文仅用可视化方法对杭州市地铁客流进行分析,而对于影响客流量大小的因素并未深入挖掘。因此,未来可充分挖掘这些影响因素,并对其进行建模分析,以进行更深入的研究。