APP下载

基于空间插值法的公交客流分布可视化分析

2015-03-29张健钦王佳嘉杜明义

测绘通报 2015年4期
关键词:数据表乘车站位

张健钦,王佳嘉,杜明义

(1.北京建筑大学测绘与城市空间信息学院,北京100044;2.现代城市测绘国家测绘地理信息局重点实验室,北京100044)

一、引 言

公共交通作为城市交通的重要组成部分,影响着整个城市的交通状况,研究客流的变化规律可以更好地为公交规划和调度提供服务。随着科学技术的进步,可记录公交数据的设备和方法也越来越多。目前,对于公交客流规律的研究可分为两大方面:一方面是研究用于公交运营决策的公交客流规律,如总客流、线路客流、站点客流、时段客流、断面客流等;另一方面是研究用于公交规划的居民公交出行特征规律,如平均出行次数、起讫点分布、平均换乘次数、出行耗时和出行距离等[1]。在公交客流规律的研究中,越来越多的研究引入了公交客流的时间和空间特性,将时空特性与客流规律相结合,可以更准确地对客流变化规律进行挖掘,提高分析结果的科学性。

本文依据公交车刷卡器获得的客流数据,建立公交客流数据处理流程,实现对原始客流数据的预处理,为研究客流在站位的时空分布提供数据支持;在此基础上利用GIS空间插值技术,对公交客流的时空分布进行可视化表达,并以北京市公交数据为例,挖掘客流分布规律,为公交的运营调度提供决策参考信息,为公交线路的设置和规划提供科学的依据。

二、公交客流数据处理方法

1.数据预处理

随着公交IC卡技术在公交系统的逐步推广应用,公交系统在运行过程中积累的客流数据量越来越大。以北京市公交数据为例,每一趟公交车停靠一站都会形成一条客流数据,一天可以记录约178万条数据。为了将大量的多样化的公交数据进行有效存储,本文利用Oracle数据库系统建立BusData公交数据库,利用ArcSDE存储和管理公交GIS网络数据,具体数据库表结构如图1所示。

BusData公交数据库主要包含图1所示的4个数据表:客流数据表、站点数据表、线路数据表和站位数据表。不同的数据表是通过两表中相同的字段关联的。GIS编号是用来连接站点数据表和客流数据表所建立的字段,是用来标识不同线路站点间的唯一值。上下行线路名称字段的统一格式为“NNN(XX—XXX)”,如:103(动物园—北京站西),是用来连接站点数据表和线路数据表的字段。站位号是用来标识某一站位的唯一值,是用来整合客流数据的关键字段,也是连接站点数据表和站位数据表的字段。本文中的站点是指每一条线路停靠的站,每一条线路都有属于自己的若干个站点;而站位是代表了所有停靠在相同位置的站点的总和。如在站点数据表中查询站位名称(ZWMC)为“天安门西”的站点一共有14个,其中有9个站点的站位号为10,属于长安街路北侧的站位,剩下5个站点的站位号为31,属于长安街路南侧的站位,这就是站点与站位多对一的关系。

图1 公交数据库表结构

2.方法流程

为了深入研究客流在站位的时空分布特征,本文采用VS2010开发环境建立客流数据处理系统,对原始客流数据整合处理(原始客流数据见表1),生成新的客流数据表,具体数据处理流程如图2所示,主要处理步骤如下:

1)从原始客流数据表中筛选指定日期的客流数据,其中包含了不同的站位N个。

2)设站位为K,令K=1,查询第K个站位。

3)设时间点为T,令T=1,计算T时间点内乘车登量数之和。

4)将计算结果在新的客流数据表里创建一条新数据,存储日期、站位号等字段。

5)令T=T+1,判断T是否小于24,若是,跳转到步骤6);若否,跳转到步骤3)。

6)令K=K+1,判断K是否小于N,若是,跳转到步骤7);若否,数据处理结束。

处理后的客流数据表包含日期(RQ,即车辆行驶的日期)、时间点(SJD,即车辆到达站位所属的时间段,以整点计算,如8:00—9:00进站的公交车则会记录时间点为9)、登量(DL,即上车客流量)、站位号(ZWH,即站位的唯一标识号)、站位名称(ZWMC)、线路数(XLS,即此站点所包含的公交线路数)、站位坐标(X)、站位坐标(Y),经过处理后的客流数据表结构见表2。处理后的客流数据减少了原始数据中冗余的字段,并添加了站位的位置信息,将复杂、难理解的数据转换为简单、易懂的客流数据,为下文研究公交客流分布提供了依据,也可以直接用于交通规划和运营调度的研究。

图2 客流数据处理流程

表1 原始的客流数据表

表2 整合后的客流数据表

三、基于空间插值法的公交客流分布可视化与分析

1.公交客流分布可视化方法

公交站位的客流登量信息存储在具有空间信息的站位图层中,研究公交客流的空间分布特征可以将登量人数分级后通过站位的所在位置展示,图3为2013年6月4日早7:00—8:00的全北京市各个站位的登量图。但是在离散的点状信息中寻求不同站位间登量的区别和客流的分布规律是非常困难的,为了解决这个问题,本文对站位客流进行反距离加权法(inverse distance weighted,IDW)空间插值。设站位的分布为一系列离散点P,有待插值点Qj(Xj,Yj,Zj)和已知站点Pi(Xi,Yi,Zi)(i=1,2,…,n),其中(X,Y)为站位的空间坐标,Z为该站位的客流登量(DL)。则待插值点的属性值可通过邻近站位的客流登量值加权求得,具体计算公式如下

式中,Zj和Zi分别为待插值点和已知站位的值;ωi为已知站位对待插值点的权函数,公式如下

式中,di为已知站位与待插值点间的距离=(Xj+Xi)k+(Yj+Yi)k;k为控制参数。由公式可知,k的取值大小与权函数的值成反比,取值越大代表对距离较远的待插值影响越小。从式(1)和式(2)可以看出,距离待插值点越近的站位被赋予的权重越大,反之,距离越远赋予的权重越小[2]。

图3 空间插值前点状站位登量图

选择反距离插值法是根据居民的出行模式选择的,居民乘车时一般都会选择距离自己最近的车站乘车,因此将权重的衡量标准设定为已知站位距待插点的距离。对离散点数据进行插值计算后会生成连续的数据表面,通过这种空间插值可以对城市的客流分布进行展示,图4为与图3同一时间点生成的经过插值的站位登量图。经过插值后再通过分级可视化显示的图像与原始数据的点状图(如图3所示)对比,可以清楚地反映出公共交通乘车的热点区域,并挖掘随时间的变化乘客乘车的分布变化规律,为公交站点的设立和公交线路的规划提供重要的参考,也为其他客流数据挖掘和研究提供依据。

2.实例分析

利用上述公交客流数据处理的方法,选择2013年6月4日的公交客流数据计算得到早高峰客流分布情况,如图5所示;同样,计算出时间粒度为1 h的客流分布情况,图6为4个不同时间段内的客流分布情况。

图4 空间插值后面状站位登量图

图5 早高峰客流量分布图

早高峰主要反映了北京市居民通勤乘坐公交的分布状况。由图6可以看出,站位客流较多的地区(热点区域)多分布在北京市四环外,这与多数大型居住小区分布在城外的现状吻合;居住地与工作地的距离较远,会导致出行时间早于其他居住在城内的居民,因此早高峰时段内城区外围的公交客流量明显大于城区内部。通过对热点区域所在的地理位置和站点属性进一步分析,可将其分为以下3类:

1)大型住宅区周边站位:这类站点的主要特征就是周边有居住人口大的小区,是距离居住地最近的公交站点。居民在此类站点乘坐公交车或去换乘地铁和其他线路,如天通苑、通州东关、北皋、三元村等。

2)连通城内外的重要公交换乘点:这类站点的主要特征是该站可换乘的公交线路很多,包含了很多从城郊行驶来的公交车,大量的居民从这些站点换乘通往市区工作地的公交,北京市连接城郊的公交车一般以8、9字开头,主要是负责运载居住地距离市中心较远城区的乘客,居民出行模式大多为乘坐联络市区的公交到达市区某站进行换乘到达目的地,如达官营、东直门、劲松桥东、马家楼桥北等站位可换成的线路都在10条以上。

3)地铁主要换乘站周边站点:这类站点主要是与地铁客流相关联的公交站点。乘坐地铁出行虽然方便快捷,但是并不能覆盖所有的区域,居民通过乘坐地铁后还需换乘公交线路到达工作地,如公主坟、东直门、城铁立水桥等。

通过对在一天内不同时段的客流分布比较(如图6所示),早高峰时段全市各个地区的站点处于活跃状态,由于居民居住地分散在城市不同地区,因此该时段内全市大部分地区都处于客流的高峰时段;午间时段全市的客流有明显的回落,只有中心城区内有小范围的客流高峰区域;晚高峰时段全市的客流迅速增长,达到了一天中另一个乘车高峰,乘车的热点区多出现在连通城中心与远郊区的主干道附近,如与通州区和石景山区连通的长安街沿线、与昌平区和延庆区连通的京藏高速、与大兴区和房山区连通的京开高速、与顺义区连通的京顺路等;而晚间时段全市的客流量下降到最低,基本无乘车热点出现。图6表明了同一时间粒度内上下班高峰时段全城的客流总量明显大于午间和夜间时段,产生这样的原因是由城市居民日常早出晚归的生活习惯而形成的。

图6 北京市一天内不同时段内的公交客流分布

四、结束语

公交客流数据包含了大量的、全面的、实时的乘客乘车信息,是研究城市公交运行和客流分布规律的基础。本文将原始的客流数据通过数据处理流程转化为可直接用于研究分析的基础数据;并提出利用GIS空间插值对北京市公交站点的客流量进行可视化展示的方法。该方法的优势在于将传统的客流数据通过地理信息的空间展示进行表达,使抽象的客流数据转变为直观的可视化图层,通过可视化展示了某一时段内整个城市内的客流分布情况,分析了早高峰不同客流热点出现的原因,以及一天内客流变化的趋势。下一步将通过结合其他相关知识对客流变化规律进行更深入的研究,实现为公交线路的设置和优化提供帮助,从而提高公交利用率和乘客乘车满意度,最终达到减少城市交通的压力的目的。

[1] 舒国辉.基于数据挖掘的公交客流规律研究[D].北京:北京交通大学,2009.

[2] SULLIVAN D O,UNWIN D J.Geographic Information Analysis[M].北京:科学出版社,2013.

[3] 陈学武,戴霄,陈茜.公交IC卡信息采集、分析与应用研究[J].土木工程学报,2004,37(2):106-110.

[4] 朱求安,张万昌,余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报:自然科学版:2004,28(2):183-188.

[5] 王炜,杨新苗,陈学武.城市公共交通系规划方法与管理技术[M].北京:科学出版社,2002.

[6] CHANGK T.Introduction to Geographic Information System[M].北京:清华大学出版社,2009.

[7] 刘学军,徐鹏.交通地理信息系统[M].北京:科学出版社,2006.

[8] 单宝艳,郭金金.基于GIS空间分析的城市避震疏散规划研究[J].测绘通报,2014(1):86-89.

[9] 张亦汉,钟欣梅,李建程.利用自行车借还记录分析与挖掘空间位置信息[J].测绘通报,2014(7):113-116.

猜你喜欢

数据表乘车站位
提高政治站位 对标国内一流
建党百年说“站位”
这一次优步乘车,让我感动了
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
提升站位讲政治 创新担当争出彩
乘车的问题
提高政治站位 勇于担当作为 以从严要求开创人大工作新局面
基于列控工程数据表建立线路拓扑关系的研究
图表