APP下载

基于IC卡与GPS数据的公交通勤出行特征分析

2021-11-09李淑庆刘耀鸿邱豪基

关键词:公交线路IC卡黏性

李淑庆,刘耀鸿,邱豪基

(重庆交通大学 交通运输学院,重庆 400074)

0 引 言

通勤出行是城市交通的主体,通勤出行特征是城市交通规划和交通设施配置的重要依据。与传统的调查问卷方法相比,利用大数据技术更能全面、真实、准确分析通勤出行特征,获取通勤客流规律。基于公交IC卡与GPS数据,深入剖析公交通勤乘客的出行特征,不仅能为城市公交系统规划与优化、定制公交线路与站点的设置提供基础数据,也能为科学引导通勤客流使用公交系统出行、进行线路优化与运营管理、缓解城市交通拥堵提供数据支撑。

国内外学者基于IC卡与GPS数据对公交通勤出行特征研究已取得一定的成果。S.FOELL等[1]分析了葡萄牙里斯本公共交通系统中乘客刷卡的时空分布特征和个别公交车的使用情况。LI Guangxia等[2]分析了新加坡两票制公交系统IC卡数据,通过时空聚类法筛选上下车频率靠前的公交站点,利用频谱分析与启发式方法判断乘客的居住点。;王月玥[3]提出了公交通勤出行链提取的“四阶段”法,即出行链结构提取、通勤出行行为判别、出行阶段起讫点时空信息匹配、出行阶段行程距离和时间匹配,以北京市为例,分析了公交通勤出行特征;李莹[4]利用公交IC卡和GPS数据对公交出行乘客进行分类,并就各类乘客在时空、换乘等方面的出行特征进行分析;罗霞等[5]基于AVL和IC卡数据,利用乘车频次统计法和空间聚类法推导了通勤OD,并对通勤乘客进行了分析;文婧等[6]在千余份调查问卷的基础上,对北京市4个不同就业空间结构样本进行了不同的通勤距离、时间、效率特征比较,推导出通勤特征的内在规律;梁泉等[7]基于个体出行图谱构建,提取了出行天数、出行次数、OD分类数、出行往返性、集中出发时间、路径唯一性与出行空间均衡性7个指标;曹晨等[8]基于调查问卷构建结构方程模型,分析就业者通勤距离、通勤时间及通勤模式三者的关系及其对心理健康、身体健康以及健康行为的影响;翁小雄等[9]建立了机器学习算法通勤识别模型,制定调查问卷获取训练数据,利用GBDT算法训练分类模型,完成通勤识别。

目前国内外基于IC卡与GPS数据,对公交通勤出行特征主要针对“车”进行的碎片化研究,而将乘客“人”作为研究对象,对公交出行链特征、区间客流不均衡特征、职住平衡水平及线路黏性等的出行特征研究较少,提取的特征参数不完整。因此,笔者基于公交IC卡与GPS数据,从“人”的视角,分析研究较完整的通勤特征参数提取方法。

1 公交IC卡与GPS数据预处理

目前城市公共交通系统一般能收集IC卡数据与GPS数据。由于数据采集设备的不稳定性及周围环境的复杂性影响,所收集到的数据存在着异常数据、数据丢失、数据重复等问题。因此,在进行数据融合和应用之前,需要进行数据预处理。

数据异常是指数据中某些属性值明显超出正常范围或者数据中存在某些格式不正确的属性值。如IC卡数据中的刷卡时间超出了公交运营时间或者刷卡时间出现乱码。一般这类数据量较少,可直接将其删除。

数据丢失是指数据采集或保存的失败造成的数据丢失现象,这类字段的缺失影响后续的分析过程。如GPS数据中的公交车速数据丢失,公交车GPS数据每条信息的时间间隔一般为10 s,可以近似地将公交运行看作匀变速运动,采用时间序列插值补缺。其他特征可采用均值插值补缺。

数据重复是指数据中某条字段重复出行的现象。如在公交IC卡数据中,出现极短时间内,甚至一分钟内,同一卡号多次刷卡的现象,则仅保留第1条数据,其他则剔除。

公交IC卡与GPS数据预处理具体过程可参考文献[10-11]。

2 公交通勤出行链构建

公交通勤出行链(public transport trip chain)是指通勤出行者乘坐公交从出行起点到达终点的一个完整的过程。该出行过程由若干个出行阶段构成,每一出行阶段代表出行者使用一次公共交通工具[3]。

公交IC卡数据记录了乘客上车刷卡信息和乘坐车辆信息,但不能记录出行位置信息。目前大多数城市的公交系统采用 “一票制”收费方式,乘客只在上车时刷卡,下车不刷卡,因此无法获取乘客的下车信息。参考文献[3,9],基于公交IC卡与GPS数据的预处理结果,利用GPS数据推算出公交车辆的到站时间、上车站点匹配、下车站点匹配和换乘站点位置;应用通勤出行行为判别法识别出通勤乘客,完成公交通勤出行链的构建,构建流程如图1。

图1 公交通勤出行链构建流程Fig. 1 Construction flow chart of bus commuting travel chain

3 公交通勤特征提取分析

从公交出行链特征、区间客流不均衡系数、职住平衡水平与线路黏性系数4个维度分析计算公交通勤特征参数。

3.1 公交出行链特征

公交出行链特征主要包括出行链阶段数、出行链个数和出行链换乘次数。

3.1.1 公交出行链阶段数

公交出行链阶段数指一天各闭合出行链中乘坐公交的阶段数之和,单位为个/日,即乘客从居住地出发,下班后最终回到居住地,乘坐公交出行的阶段总个数。出行链阶段数一定程度反映通勤者在工作日中是否存在除通勤之外的其他活动,反映通勤者的生活多样化。

3.1.2 公交出行链个数

公交出行链个数指通勤者在当天活动中存在的完整出行链个数,单位为个/日。通勤者从居住地出发到就职地上班后,一般情况是下班后再回到居住地,即只有一条闭合出行链,若通勤者的出行链次数大于1,则该通勤者的居住地可能与就职地较近,有两次及以上的返家现象。

3.1.3 公交出行链换乘次数

公交出行换乘次数是指一次闭合公交出行链中所有出行阶段产生的换乘次数的总和,单位为次/个。 换乘次数的大小一定程度上反映了公交出行者乘车出行的直达性。

3.2 区间客流不均衡系数

参考文献[12],定义线路长度超过15 km的线路为长线公交,不足15 km的线路为常规线公交。

不同时段或路段的公交客流量大小通常有明显的差异,即客流不均匀性。

假设一条公交线路在某行驶方向上共有n个站点,则该线路在该行驶方向上共有n-1个运行区间。若在该行驶方向上共有m个班次,途径n-1个运行区间,定义所有运行区间实际载客量矩阵P为:

(1)

式中:Pij为在第i[1,m]班次公交车辆在第j[1,n-1]个运行区间中的实际载客量,计算公式为:

(2)

式中:Uk和Dk分别为第i班次公交车辆在k[1,n]站点上车人数和下车人数。

区间客流不均衡系数L为当天该线路全部区间实际载客量最大值与载客量均值的比值。该指标反映线路在当天的载客量稳定程度,数值越大则说明该线路的客流在各区间上分布越不均衡,计算公式为:

(3)

3.3 职住平衡水平

随着城市机动化水平的不断提高,城市职住分离现象越来越严重[13]。参考ZHOU Xingang[14]的测度职住平衡度方法,基于区域内的居住人数、就业人数、外出通勤率、外来通勤率,用区域通勤规模和区域独立系数指标来衡量区域的职住平衡水平。

3.3.1 区域通勤规模

区域通勤规模CCIAB反映区域之间通勤联系程度的大小,数值等于往返两个区域之间的通勤人数之和,计算公式为:

CCIAB=QAB+QBA

(4)

式中:QAB为居住在A区而在B区就职的通勤人数;QBA为居住在B区而在A区就职的人数。

3.3.2 区域独立系数

区域独立系数RIA可量化该区域的通勤独立程度,数值等于该区域的外来通勤率ECRA与外出通勤率OCRA之和的倒数,计算公式为:

(5)

(6)

(7)

式中:DA为在A区域就职的人数;OA为在A区域居住的就职人数;QAA为在A区域居住且就职的人数。

3.4 线路黏性系数

公交通勤乘客出行一般有多条公交线路可选择,但往往会“偏好”某条线路[15],笔者给出线路黏性系数来量化这种“偏好”程度,黏性系数大的乘客在通勤出行时倾向选择同一条线路,而黏性系数小的乘客在通勤出行时的线路选择往往更加多样化。

利用生物学量化生态系统物种多样性的辛普森多样系数(diversity index),来研究乘客选择公交的多样性。假设研究时间段内共有p名通勤乘客,共选择了q条不同线路,则所有乘客遍历选择公交线路的矩阵X为:

(8)

(9)

从式(9)可以看出,若乘客g只选择一条公交线路,则DIg的值为0;若乘客g均匀地选择乘坐q条线路(即:ng1=ng2=…=ngq),则DIg的值为1-1/q。选择的线路越多、选择线路分布越均匀,则该值越大,反之亦然。

显然,黏性系数是反应乘客选择公交线路的“偏好”性。一般说,乘客选择公交线路多样性越强,则黏性系数越小。当乘客仅选择一条公交线路时具有更高的黏性。然而,多样性同时考虑了选择线路的丰富度与均匀度,黏性与丰富度关系较弱。线路黏性系数SIg的定义如式(10):

(10)

从式(10)可知,当通勤者均匀地选择所有可能线路时,SIg的值为0,代表没有黏性。当乘客只乘坐一条线路时,SIg的值为1,即SIg取值范围为0

(11)

(12)

4 实例应用分析

以重庆市主城区2019年1月21日至25日,连续5个工作日650条公交线路中的47条代表性线路的公交IC卡与GPS数据进行通勤特征应用分析。

4.1 出行链特征

对重庆市主城区连续5个工作日47条代表性线路的公交基础数据进行预处理,识别出261 284位通勤人员,构建通勤出行链,得到了乘客的通勤出行链数据,包括卡号、线路号、上车站点、上车时间、下车站点、下车时间、换乘站点和换乘时间,如表1。

表1 乘客出行链数据表示例(部分)Table 1 Data table of passenger trip chain (partial)

对构建的公交通勤出行链进行分析,得到出行链阶段数、出行链个数和出行链换乘次数如图2~图4。

图4 通勤换乘次数分布Fig. 4 Distribution of commuting and transfering times

由图2可知:大部分通勤者的出行链阶段数为2,即只有居住地—工作地—居住地这种出行模式;而阶段数为3的占比不足10%,这类人在工作之余还可以中午返回居住地。计算样本整体的出行链阶段数均值为2.06,表明该城市通勤者生活节奏快,基本上只在居住地与工作地之间往返。

图2 通勤出行链阶段数分布Fig. 2 Distribution of phases in commuter travel chain

由图3可知:出行链个数为一次的通勤人群占比49.95%、个数为2的占比36.50%,这符合通勤者把一天的通勤安排在一次闭合出行的现实规律。

图3 通勤出行链个数分布Fig. 3 Distribution of the number of commute travel chain

由图4可知:早高峰通勤者一次换乘占15.5%,2次换乘占6.9%;晚高峰通勤者一次换乘占16.6%,2次换乘占4.2%;通勤出行中,早晚高峰中没有换乘的比例分别为76.9%和78.6%。总体来看,早晚高峰中没有换乘或仅有一次换乘占比为93.8%,表明多数公交通勤者出行换乘次数较少。

4.2 区间客流不均衡系数

在构建的所有公交线路公交通勤出行链中随机选取两条常规线(线路长度小于15 km):475路和809路,3条长线(线路长度大于15 km):872路、819路和319路。

根据式(2),计算出5条线路在各区间的实际载客量总和,其中线路475和线路872的客流量分布情况如图5、图6。

③目标的确立。从医院未来发展考虑,从两方面入手,一方面为院内宣传环境,另一方面为院外宣传环境。树立人人是标杆人人要发声的主人翁意识阵地意识。在标识管理上,加强可视性物体医院文化元素的植入应用,打造温馨、安全、方便、和谐的就医环境。加强培训和管理,建立有效考核机制,增强主动参与意识。与院外媒体积极沟通协调,加强主流媒体发声,扩大医院正能量宣传范围和力度,了解舆情动态,提高负面舆情的主动处置能力和应对水平。对全院的工作人员进行引导,确保思想统一,从而为患者展现良好形象。

图5 475路公交各区间客流分布Fig. 5 Passenger flow distribution of 475 bus in different sections

图6 872路公交各区间客流分布Fig. 6 Passenger flow distribution of 872 bus in different sections

根据式(3),计算出5条线路早晚高峰及两个行驶方向的区间客流不均衡系数,如表2。

表2 5条线路的区间客流不均衡系数Table 2 Section passenger flow imbalance coefficient of 5 lines

由图5、图6和表2分析可得:两条常规公交线路长度和站点数量合适,站点客流量分布较为均衡;而3条长线公交的线路较长,站点数量多,分布为“单峰型”形态。

参考文献[16],大城市通勤线路的区间不均衡系数L取值一般应低于1.5。分析表2可知,重庆市常规通勤线路满足L值小于1.5,长线公交则高于1.5。这说明山地城市重庆的长线公交乘客需求较大,总体运力不足,可采取增加发车频次、增加定制公交等方式,保持线路各站点间运力与运量的平衡。

4.3 职住平衡水平

重庆市主城区由渝中区、沙坪坝区、九龙坡区、大渡口区、渝北区、江北区、南岸区、巴南区、北碚区组成,基于公交IC卡及GPS数据,分析各区的职住平衡水平。

笔者假定通勤者在一天中的最后一次出行链的下车站点为通勤者的居住地,第一次出行链的下车站点为通勤者的就职地。根据式(4)~式(7),计算出各区的通勤规模与区域独立系数如表3、表4。

表3 重庆市主城区不同城区的通勤规模Table 3 CCI values in different urban areas of Chongqing

表4 重庆市主城区不同城区的独立系数Table 4 RI values in different urban areas of Chongqing

分析表3、表4得出:不论是核心城区还是外围城区,在本地居住且就职的人数均大于外出到其他各区的就业人数,因此城区内部的CCI指标普遍大于城区外部的CCI值,这充分表明了重庆主团城市布局的特性;其中,大渡口和巴南两个城区的内部通勤规模最大。

从就业和居住方面来看,重庆市主城各区居住与就业近一半通勤者均在同一城区。外围城区的平均外出通勤率和外来通勤率分别为51.23%和51.15%。核心城区的平均外出通勤率和外来通勤率分别为42.11%和55.30%。居住在核心城区通勤者约58%是在本城区就业,仅有42%的通勤者外出就业,因此核心城区的独立系数普遍比外围城区更大。

4.4 线路黏性系数

根据式(9)~式(12),计算出通勤人群中的线路黏性系数(SI)及其均值、标准差,如图7、表5。

图7 黏性系数频率分布Fig. 7 Frequency distribution of viscosity coefficient

表5 线路黏性系数总体情况Table 5 General situation of line viscosity coefficient

由图7和表5可知:黏性系数频率分布图整体呈现左偏趋势,总体样本的SI均值与标准差分别为0.385 2和0.203 1,线路黏性系数为0.5以下的占73.9%,0.5以上的占26.1%,说明有26.1%的通勤者在选择通勤线路时具有较强黏性,而73.9%的通勤者在选择通勤线路时没有特别“依赖”某条线路。

由于公交线路的多样性,通勤者在等待公交时,会优先选择先到达公交站点的公交线路;地面公交不同于地铁轻轨,通勤者选择地铁轨道的线路相较公交线路固定单一,而公交线路比较丰富多样,使得通勤者出行时选择的线路具有多样化、均等化。

5 结 论

基于公交IC卡与GPS数据对通勤乘客的出行特征进行研究,创新性提出了较完整反映公交通勤客流特征4个维度指标参数,包括公交出行链特征、区间客流不均衡系数、职住平衡水平及线路黏性系数的计算方法。以重庆市主城区连续5个工作日47条典型公交线路的公交IC卡及GPS数据为实例,进行重庆市主城区通勤出行特征分析,主要结论为:

1)大部分通勤者的出行链阶段数为“2”;出行链个数为“1”的通勤人群占比49.95%,为“2”的占比36.50%;多数公交通勤者出行换乘次数较少。

2)常规线路的区间客流不均衡系数满足小于1.5的特性;但长线公交不满足这一特性,这反映了重庆主城区公交长距离出行需求较大的山地城市交通特征。

3)本地居住且就职的人数均大于外出到其他各区的就业人数;居住在核心城区通勤者约58%是在本城区就业,仅有42%的通勤者外出就业,核心城区的独立系数普遍比外围城区大。说明重庆市主城区职住平衡水平较高。

4)26.1%的通勤者在选择通勤线路时具有较强黏性,73.9%通勤者在出行的线路选择没有特别“依赖”某条线路,往往具有多样化和均等化。

猜你喜欢

公交线路IC卡黏性
工商业IC卡控制器改造为物联网控制器实践
富硒产业需要强化“黏性”——安康能否玩转“硒+”
如何运用播音主持技巧增强受众黏性
在用电梯加装外接式IC卡运行控制系统设计改进
玩油灰黏性物成网红
基于GIS的公交路线优化设计
基层农行提高客户黏性浅析
城市轨道交通车站联合配置短驳道路公交线路的方法
长春开通公交IC卡充值平
湖北省高速公路IC卡管理系统浅谈