基于一卡通数据的公交客流时空特征分析
2016-06-21黄练唐小淋林钰龙詹承志
黄练 唐小淋 林钰龙 詹承志
摘要:一卡通数据记录了乘客的出行地点、时间信息,可反映城市居民公交出行的总体特征。文章提出了基于刷卡数据的常规公交、地铁客流计算方法,结合深圳市实际刷卡数据,分析了公交客流的时段分布特征、线路与站点特征和接驳换乘特征,可为行业主管部门优化公交线网、提升公众出行服务提供决策依据。
关键词:公交客流;一卡通数据;时空特征分析;客流分析;公共交通 文献标识码:A
中图分类号:U23 文章编号:1009-2374(2016)17-0087-03 DOI:10.13535/j.cnki.11-4406/n.2016.17.042
1 概述
随着物联网技术的不断发展,公交一卡通在国内大量城市得到了广泛应用,持卡出行的居民占比持续增加,一卡通刷卡数据作为公交乘客出行行为的记录,通过与城市智能公交系统其他动静态信息的结合,经过挖掘分析后,可为公交线网规划、企业运营管理和市民出行服务提供决策依据。
本文基于一卡通数据,将乘客的一次出行划分为上车、经过、下车/出站、换乘四类基础行为,通过公交到站时间计算、公交乘客上下车站点匹配、地铁乘客上下车站点识别等数据处理模块,从时间和空间维度展开,挖掘分析常规公交和地铁客流时空分布规律。
2 常规公交客流计算算法
随着卫星定位数据的发展与广泛应用,公车GPS数据已经成为辅助城市公交管理的重要数据基础。本文综合分析一卡通数据与公交GPS数据,识别乘客上下车点,实现常规公交的客流统计。
2.1 到站时间计算
公交车GPS数据包含有公交车的空间位置与速度信息,需要结合站点位置数据计算到站时间。首先,基于线路轨迹相似度分析确定车辆运行的实际线路;其次,通过计算连续GPS点的时空关系确定车辆运行方向;最后,以线路和方向为约束条件计算GPS轨迹点与各站点位置的距离,识别GPS点所在的站点区间,并取距离站点最近的轨迹点为进站点,记录到站时间。
2.2 乘客上车站点匹配
得到了公交的到站信息后,可通过与一卡通数据融合,确定乘客的上车站点。深圳一卡通刷卡数据通过设备编码号实现与特定车牌的关联,因此可根据车牌和时间两个关键字段判断乘客上车站点,算法流程如下:(1)读取当天深圳一卡通清洗后的数据和当天公交到站数据;(2)根据两个数据表中的车牌号,筛选出深圳通数据中每一条刷卡记录所乘坐的车辆的全天到站时间表;(3)选取到站时间和刷卡记录中刷卡时间最近的一对,将对应的站点作为此乘客的真实上车站点。
2.3 乘客下车站点估计
由于深圳公交采取单次刷卡制,本文基于出行链估计推断乘客下车站点。由于公交乘客在工作日出行呈现明显的潮汐特性,故算法通过聚类分析识别公交乘客可能的居住地、工作地,进一步提升下车站点识别的可靠度,总体流程如下:(1)将每位乘客的刷卡记录按照时间排序,将相邻的两条记录合并为一条;(2)对于合并后的记录,将距离第二次乘车的上车站点最近的第一次乘车方向的站点作为其第一次乘车的下车站点,同时去除距离大于2000米的数据;(3)取每位乘客每天的第一次上车站点刷卡站点作为可能的居住地站点;(4)取工作日与第一次刷卡记录相邻刷卡时间差大于3小时的第二次刷卡站点作为可能工作站点;(5)聚类分析一个月每位乘客的可能居住地和工作地站点,计数排序,取最可能的居住地/工作站点作为其最终居住地/工作站点;(6)对于乘客每天的最后一条刷卡记录,若乘车时间处于工作日6∶00~8∶00/16∶00~18∶00,则其下车站点为其工作地/居住地。
3 地铁客流计算模型
深圳地铁乘客的进出站需要刷卡两次,且通过设备编号与站点关联,一卡通刷卡数据记录了每位乘客的进出站时间、地点等交易信息。将当天地铁乘客的刷卡记录(进站、出站)按照时间排序,取第一、第二条记录为进站、出站标识,保留进出站时间差小于3小时、进出站站点不相同的记录,可判断地铁乘客的进出站点情况。
由于地铁轨道网络存在大量的站内换乘,当进出站之间有多条路径可选择时,乘客选择的具体线路无从得知,为客流统计分析带来困难。本文基于一卡通刷卡出行时刻和时间间隔,建立客流分配模型与算法,推断出行者在轨道交通网络中的出行路径,实现城市轨道交通客流量的精确分配,步骤如下:
步骤1:读取同一张卡ID下的相邻两个进站/出站记录,通过进站和出站的车站代码获得出行的起讫点,即出行OD对。若该OD之间只存在一条可达路径,则该路径为出行路径;若OD之间存在多条路径,进入多路径选择的判断过程。
步骤2:在多路径选择过程中,若该OD对是位于同一线路上且离进站时刻最近的发车班次和离出站时刻最近的进站班次相同,则认为出行过程没有换乘。
步骤3:若进出站时的列车班次不一致,则认为中途发生换乘行为,进行换乘情况下的多路径选择的判断过程,计算各条路径所需的最短时间,最短出行时间通常定义为列车运行的必要时间与正常快速通过进出站和换乘通道所需的时间。
步骤4:若离进站时刻最近的合理发车班次和离出站时刻最近的进站班次所属的运行线路有直接换乘站,且两车发车间隔足够通过换乘通道,则确定出行路径,若两条线路出现多次交汇,需结合运营时间来判断出行路径。
步骤5:若进站的线路和出站的线路需要经过两次以上的换乘,判断第一次换乘后所乘列车到达第二次换乘站的时刻与出站所乘列车班次的换乘是否合理,如不合理,则循环判断两个换乘站之间所有可能的列车班次,若存在多条可换乘的路径,依次循环判断最终找到合理路径,并完成客流分配及统计。
4 深圳市公共交通客流特征分析
截至2015年底,深圳累计发放一卡通2600万张,本文基于2015年9月的实际刷卡数据分析深圳市公共交通客流特征。
4.1 时间分布特征
常规公交和地铁作为城市公共交通的两个主要方式,承载了深圳市近90%的公共交通出行。从一周客流的分布来看,常规公交和地铁的工作日客流高于双休日,周一和周五的客流量高于其他工作日,常规公交、地铁的日均客流量占比约为4∶6,地铁日客流量和常规公交日客流量的皮尔逊相关系数r=0.60,两者存在一定正相关关系。
如图1所示,常规公交及地铁的工作日分时客流量呈显著双峰现象,早高峰集中在7∶00~9∶00,晚高峰集中在17∶00~20∶00。高峰时段常规公交的小时客流量达35万人次/小时,地铁的高峰小时客流量达25万人次/小时。周末各时段客流量与工作日平峰客流量基本持平,客流量总体少于工作日客流量。
4.2 空间分布特征
深圳地铁共包含五条运营线路,从工作日地铁各线路日均客流量来看,1号线客流量占比最大达35%,其次为3号线,2号线的客流量占比最小为11%,如图2(a)所示,选取早晚高峰客流量均超2000人次/小时的站点为地铁高峰时段繁忙站点,分布如图2(b)所示。
以1km2的网格将深圳市市区划分为1995个区域,早高峰时段和晚高峰时段小时出行量分布如图3所示,早高峰出发区域和晚高峰到达区域客流量大于4000人次/小时基本重合,客流呈现较为明显的潮汐分布特征。
4.3 接驳客流特征
以一卡通ID为关键字,时序分析乘客常规公交和地铁上下客点,可实现常规公交和地铁接驳客流识别与特征分析。如图4所示,从常规公交和地铁间换乘出行的换乘距离概率密度分布曲线来看,70%的换乘时间在10分钟以内,90%的接驳换乘距离在700米范围内。
以换乘步行距离700米为阈值,统计各地铁车站换乘出行距离大于阈值的客流量(如图5所示),清湖、布吉站换乘步行距离大于700米的换乘客流量超5000人次/小时,大芬、木棉湾站换乘步行距离大于700米的换乘客流量超4000人次/小时,其余站点远距离换乘出行量较少,总体而言深圳市的地铁站点分布和公交站点分布具有较好的接驳换乘服务水平。
5 结语
本文基于一卡通数据,提出常规公交、地铁客流的计算方法,通过刷卡数据的时空信息与公交线网空间信息的匹配,实现了站点、线路、换乘客流的识别和统计。结合深圳市实际数据的挖掘分析,揭示了常规公交客流和地铁客流的正相关关系,识别了早晚高峰、工作日非工作日的客流演变特征和城市通勤流向特征。通过海量出行数据的统计分布,提出了10分钟、700米的换乘服务评估基础指标,为进一步改善公交线网设置、提升出行服务水平提供了决策依据。
参考文献
[1] 陈学武,戴霄,陈茜.公交IC卡信息采集、分析与应用研究[J].土木工程学报,2004,37(2).
[2] 陈学武,李海波,侯现耀.城市公交IC卡数据分析方法及应用[M].北京:科学出版社,2014.
[3] 周崇华.基于IC卡数据的深圳地铁OD信息处理技术[J].城市轨道交通研究,2007,(1).
[4] 罗磊.基于IC卡信息的公交客流空间分布特征分析方法研究[D].东南大学,2006.
[5] 陈素平.基于数据自动采集的公交系统服务瓶颈诊断方法[D].东南大学,2010.
[6] 李海波,陈学武,陈峥嵘.基于公交IC卡数据的乘客出行时间特征研究[A].2013年中国城市交通规划年会论文集[C].2014.
作者简介:黄练(1982-),男,湖北武汉人,深圳市综合交通运行指挥中心工程师,博士,研究方向:交通数据
分析。
(责任编辑:小 燕)