APP下载

基于地铁刷卡数据的深圳职住地分析研究

2022-04-18敏,熊文*,张

江苏科技信息 2022年4期
关键词:IC卡刷卡高峰

罗 敏,熊 文*,张 瑞

(1.云南师范大学 信息学院,云南 昆明 650500;2.深圳北斗应用技术研究院,广东 深圳 518055)

0 引言

由于轨道交通具有便捷、高效、准时等特点,已成为城市居民出行的主要方式。借助于信息技术构建的轨道交通系统高速运转,每天产生千万级别的地铁集成电路卡(Integrated Circuit Card,IC卡)拍卡记录。这些数据记录了城市居民个体日常的移动轨迹,隐含了城市居民群体流动的时空特征和规律,为城市居民地铁出行和职住地研究提供了数据基础。当前,国内外学者围绕地铁IC卡数据做了大量研究。Kusakabe等[1]基于地铁智能卡数据,分析了乘客出行特征。Ji等[2]利用南宁市工作日地铁数据,分析了地铁通勤乘客的时空特征。黄洁等[3]利用北京的地铁IC数据计算了出行时间和研究了客流时空分布特征。陈艳艳等[4]利用北京市地铁IC卡数据,提出了一种计算高峰时段乘客等车时间的方法。

本文利用地铁IC卡刷卡数据,从出行量、出行时长与出行距离、通勤出行空间分布的不同角度分析了深圳地铁乘客出行的时空特征,为城市轨道交通管理提供了科学依据。

1 研究区与数据

深圳是中国著名的“创新之城”,以高科技产业闻名于世。改革开放40多年以来,从一个小渔村发展为比肩北京、上海、广州的超一线城市。在4个超一线城市中,深圳土地面积最小、人口密度最大,而单位面积创造的GDP最高。深圳是中国改革开放高速发展的一个缩影,以深圳为研究对象进行城市通勤和职住分析具有广泛的代表性。

目前,深圳下辖9个行政区和1个新区,福田区、南山区、罗湖区是深圳中心城区,为原关内区域。宝安区、光明区、龙华区、龙岗区、坪山区、盐田区、大鹏新区组成外围城区,为原关外区域。截至2017年底,深圳共建8条地铁线路和199个地铁站点,以此为本文的研究区域(见图1),轨道交通在2017年的日均客流量达到了450万人次。

图1 深圳市地铁线路分布

本研究使用的数据为深圳市2017年12月连续一月的地铁IC卡刷卡记录,共计约1.5亿条,记录包含了卡号、刷卡时间、刷卡站点、进出站标记等属性。本文所使用的地铁IC卡数据所涵盖的时间范围无法定节假日,因此本研究结果不受法定节假日的影响。

2 数据处理与方法

2.1 数据清洗

原始数据存在许多数据质量问题,包括:重复记录、字段缺失、数据异常等。在数据分析之前,本文对数据进行了清洗:重复记录对分析结果无价值,对其作过滤处理。重要字段缺失数据,可借助历史刷卡规律进行填充;非重要字段缺失数据,作删除处理。数据异常主要是由于设备故障导致数据某些字段不符合约束条件,但因异常数据占比较少,对研究结果无影响,可直接删除。

2.2 地铁OD匹配

地铁OD(Origin-Destination)匹配是指获取乘客乘坐地铁一次出行的起讫点信息,为后续分析乘客地铁出行时空特征奠定基础。乘客进出地铁站闸机处,均会产生一条拍卡记录。只需对乘客地铁IC卡记录按时间进行排序,即可判断连续两次刷卡记录的标志是否满足一进一出。若某一乘客连续两条刷卡记录在时间上满足先后顺序,且刷卡标志满足先进后出,即可成功匹配该乘客的地铁OD信息。

2.3 计算地铁出行时长和距离

一次地铁出行是指乘客完成从一站向另一站的移动过程,即使期间出现换乘,也认为是同一次地铁出行过程。根据乘客每一次地铁出行OD匹配结果,提取对应进出站刷卡记录中的刷卡时间、刷卡站点。乘客的地铁出行时间T由进出站刷卡时间差计算,而本文计算地铁出行距离D是通过进出站点间,所途经站点的相邻距离累加得到。地铁出行时间和距离的计算公式分别为:

式中:T为出行时间;Tout为出站时间;Tin为进站时间;D为出行距离;stai为出行过程经过的第i个站点;n为出行经过的所有站点数;distance(stai,stai+1)为相邻两个站点的距离。

3 结果与分析

3.1 出行量分布特征

通过对数据的预处理和过滤后,识别出了141万名地铁常乘客。地铁常乘客是指对地铁依赖性较强、出行乘坐地铁频率较高的乘客。对于地铁常乘客而言,乘坐地铁出行具有稳定性,以一周为单位的出行量会呈规律波动。因此,本研究绘制了一周内日均出行量的分布(见图2)。从图2可看出,工作日出行量高于双休日出行量,是由于工作日的通勤、通学乘客出行较多造成的;而在工作日中,周五的出行量达到最高,约为247万人次。

图2 周出行量

周出行量呈现的是一周内整体的出行量特征分布,而对于一天中出行量的特征分布需要进一步研究。本文对比研究了双休日、工作日内深圳地铁在运营时段(6∶00—23∶30),以小时为间隔的出行量分布情况(见图3)。从图3可看出,工作日的出行量有明显的早晚高峰,早高峰(8∶00—9∶00)出行量约32.1万人次,小时系数为12.9%;晚高峰(18∶00—19∶00)出行量达33.7万人次,小时系数为13.6%。就双休日而言,一整天的出行量分布较均衡,在17∶00—18∶00时段,出行量达到了全天最高,约19.2万人次,小时系数为8.6%。

图3 分时出行量

3.2 出行时长与距离

出行时长、出行距离是乘客出行考虑的两个重要因素,也是反映出行效率的关键指标。常乘客在工作日的地铁出行较稳定,因此本文统计了工作日的地铁出行时长、地铁出行距离,分布情况如图4所示。图4a的地铁出行时长分布可反映出,约90%的地铁乘客出行时长在50 min内,剩余10%的地铁乘客出行时长在80 min内。另外,计算出地铁出行的平均时长为30 min。在图4b的地铁出行距离分布中,从地铁乘客数量角度可以看出,约90%的地铁乘客出行距离在20 km内,剩余10%的地铁乘客出行距离在32 km内;从出行距离长短角度可以看出,5 km以内的短距离出行占比30%,5~15 km的中长距离出行占比50%。

图4 地铁出行时长与距离分布

3.3 出行空间分布

通勤乘客是地铁出行的主力军,而通勤乘客的地铁出行在空间上的分布可以反映出一些特征。本文借助ArcGIS工具,综合研究每个工作日通勤早高峰(7∶00—9∶00)2个小时内,通勤乘客出入地铁站点在空间上的分布(见图5)。图中的点越大,就代表进出该地铁站点的人数越多。图5a显示出通勤乘客早高峰地铁进站站点在空间上的分布主要集中在深圳市的外围区域,龙华区、龙岗区地铁线路沿线的进站人数尤为突出。图5b显示的是通勤乘客早高峰地铁出站站点在空间上的分布,在深圳市的中心区域较为密集。

图5 早高峰进出地铁站点空间分布

结合图5a和图5b可以分析出,早高峰通勤乘客流动主要是从外围区域进入中心区域的过程。而深圳市的外围区域是居住处较多的区域,中心区域是就业岗位多的区域,早高峰进出地铁站点分析结果也符合了这一点,即早高峰通勤时从居住地到就业地的过程。通勤上下班出行具有对称性,晚高峰通勤下班乘坐地铁出行是早高峰通勤上班出行的逆向出行,因此晚高峰通勤下班进出地铁站点在空间的分布可以从早高峰通勤上班进出地铁站点分布推算得到。

4 总结

本文以深圳市地铁IC卡刷卡数据为基础,对地铁通勤时空特征进行了详细的分析。实验结果表明:(1)90%的地铁乘客出行时长在50 min以内,出行距离在20 km内,还有少量的地铁乘客出行时长在80 min内,出行距离在32 km内;多数乘客主要是短距离以及中长距离出行。(2)早高峰地铁通勤出行是从居住地较多的外围区域往就业地较多的中心区域流动的过程。本文研究结果可为轨道交通系统的发展和管理提供有利参考。

猜你喜欢

IC卡刷卡高峰
工商业IC卡控制器改造为物联网控制器实践
病毒病将迎“小高峰”全方位布控巧应对
石庆云
在用电梯加装外接式IC卡运行控制系统设计改进
努力攀登文艺高峰
刷卡
长春开通公交IC卡充值平
刷脸就可以购物
湖北省高速公路IC卡管理系统浅谈
宅急送开始推行终端POS机刷卡结算