结合出租车轨迹数据的城市道路拥堵时空分析
2018-11-06邬群勇邹智杰邱端昇苏克云
邬群勇,邹智杰,邱端昇,苏克云
(福州大学地理空间信息技术国家地方联合工程研究中心,空间数据挖掘与信息共享教育部重点实验室,福建省空间信息工程研究中心,福建 福州 350116)
0 引言
广义上,交通拥堵定义为某一时空由于交通需求和供给产生矛盾所引起的交通滞留现象[1],这已成为制约城市发展的瓶颈[2]. 关于如何评价交通拥堵状态,国内外对拥堵指标和评价体系已经进行了大量研究,并形成许多有代表性的指标体系. 美国德克萨斯州交通研究院于1994年首次提出道路拥堵指数(roadway congestion index,RCI)用来衡量道路交通密度,描述拥堵强度和持续情况. EISELE等[3]提出出行时间指数(travel time index,TTI),用每个通勤人员年均延误时间、总延误等指标来描述交通拥堵的程度,并给出交通拥堵的发展趋势. 饭田恭敬[4]以拥堵度(degree of congestion,DC)来描述道路拥堵状况,定义为某路段实际交通量与一天24 h或白天12 h的评价基准量之比. 王力等[5]以车辆平均速度、拥堵指数、停车时间比例、加速度噪声和平均速度梯度作为交通拥堵表征量. 2010年起,欧洲国家开始使用INRIX指标来评价道路的拥堵程度[6]. 国内主要的道路拥堵值的计算方法可以归纳为基于拥堵里程比例、出行时间和综合评价几种. 以上指标的适用条件不同,因此选取合适的指标体系对分析交通拥堵至关重要.
城市道路拥堵的研究离不开交通数据,传统的交通拥堵探测方法一般是基于道路传感器,例如地下线圈,其成本高且仅能探测固定位置的数据,具有局限性[7]. 出租车轨迹数据因其具有覆盖广、精度好、成本低、易获取等优点成为城市交通研究中重要数据源之一[8]. 利用浮动的轨迹数据进行交通研究已经成为新趋势[9-12]. 何成兆等[13]利用出租轨迹数据建立拥堵源与拥堵评价点之间的函数关系,构建可视化模型,通过特征提取和拥堵聚类划分区域交通拥堵的空间分布模式. WANG等[14]基于轨迹数据提出一种交互式可视化分析方法,利用拥堵在时间空间上的关联性生成拥堵蔓延图,以此来分析交通拥堵. 张俊涛等[15]总结运行车辆的4种通行状态,提出一种基于轨迹分段的拥堵检测的可视化方法,能够较好地估计城市拥堵状况. KONG 等[16]利用出租车轨迹数据计算深圳市近10万条道路的道路等级TTI.
本文针对城市道路拥堵现象,选择不受道路等级影响的INRIX拥堵指标体系. 使用出租车轨迹数据计算城市道路拥堵指数. 对由出租车轨迹信息异常产生的拥堵值异常,提出一种拥堵指数异常判别和基于区域连续性修正方法. 实验表明该修正方法改善了拥堵指数计算结果,提高拥堵分析的准确性. 最后,以福州市出租车数据为例,对城市道路拥堵的时空特征进行分析和评价.
1 城市道路拥堵指标
多数城市道路拥堵指标是基于速度、时间、交通量3要素,其中速度是人们对交通状况最直观的体会,但由于存在道路等级和道路限速等问题,相同的速度条件下在不同等级道路上所表现的路况相去甚远,单一的速度无法准确反映交通状态. 因此如何排除道路等级道路类型带来的影响,选取合适的拥堵指标至关重要. 计算的复杂度和所需的数据也是选择拥堵指标体系时需要考虑的因素. 表1是几种比较成熟的拥堵指标的特点.
表1 道路拥堵指标特点对比
对比以上几种拥堵指标体系,INRIX指标能够消除道路等级对拥堵指标的影响,而且计算简单易于理解. 因此本文选择INRIX拥堵指标体系,使用出租车轨迹数据计算城市单条道路拥堵指标和城市道路总体拥堵指标值. 统计单位时间间隔内单条路段的指标值Aij,计算公式为:
(1)
式中: RSi为路段i的参考通行速度,即自由流下的道路通行速度值; CSij为路段i在第j时间段内的实际通行速度.Aij值越大说明路段i在j时间段内拥堵越严重.
(2)
式中:m为路段i在自由流时间段内GPS点总数;vk为自由流时间段内第k个GPS点记录的出租车行车速度.
(3)
式中:n为路段i在第j时间段内GPS点总数;vjk为第j时段内第k个GPS点记录的出租车行车速度.
Aij的实质是速度差(参考速度与实际速度之差)与实际速度之比,参考速度是各道路自由流下的速度值,以参考速度来表示该道路最佳通行状况. 因为不同道路在自由流下的行车速度完全取决于各条道路通行能力,所以用速度差与实际速度之比来表示道路状况可较好地消除由道路等级带来的影响.
统计间隔j内所有道路或某一区域内所有道路的拥堵指标值Bj,定义为以路段长度为权重系数对各个路段的指标值Aij进行加权计算,该值可以反映城市或者一定区域内总体的拥堵情况.Bj值越大则说明该区域在j时间段内拥挤程度越大.
(4)
式中:N为道路总数;Li为每条道路的长度.
2 城市道路拥堵指标计算与修正
2.1 INRIX指标计算
计算道路指标Aij与全市指标Bj时的关键是需要合理正确地确定道路的实际通行速度CSij与参考通行速度RSi. 对出租载客策略的研究表明出租车在空载时将四处游弋以寻找下一个客源,其空载时的速度,停靠点等均有很强的随意性,无法反映真实的道路水平[18]. 只有在载客时,出租盈利的性质促使司机在最短的时间内以最快的速度到达目的地,往往能在当时的条件下将速度最大化,更接近路况的理想状态[19]. 为避免空载点给研究带来的影响,本研究只选取出租车载客时的GPS轨迹数据.
道路实际通行速度由该统计间隔内行驶在该道路上车辆记录的行车速度均值表示,使用公式(3)进行计算. 道路参考通行速度定义为自由流状态下出租车的平均行车速度,在现实中绝对理想的道路环境是不可达的,只能尽量接近自由流状态. 以往研究将自由流状态定为凌晨时的交通路况或者道路设计最大时速,但是直接采用以上方案可能并不适用于福州市的道路环境,需要确定福州市道路通行的自由流时段. 本研究中先统计工作日24 h道路的平均通行速度,选取15 min作为统计单元以避免样本数过少,最后取平均通行速度最高的时段作为自由流时段. 图1是研究区城市道路在24 h内每15 min的实际通行速度分布. 结果表明, 研究区城市道路最佳交通状态在6:00—7:00,所以将6:15—6:30这15 min内道路通行速度作为道路参考通行速度. 在确定拥堵指标所需要的参数数值后计算各路段在各研究时段内的拥堵指标值,但是计算结果中存在部分路段的拥堵指标值异常,下一步分析产生指标异常的原因并提出修正方法.
图1 工作日城市道路每15 min平均速度Fig.1 Average speed of urban road per 15 min
2.2 城市道路拥堵指标异常识别与修正
道路拥堵指标异常主要包括两种. 一是由于路段上出租车GPS轨迹缺失导致的指标不存在,本文称之为轨迹缺失错误,可以采用前序时间间隔的道路拥堵指标或相邻道路的拥堵指标值计算. 二是经过数据预处理后遗留下来的异常数据导致的指标结果异常,称之为指标异常错误. 图2为拥堵指标异常的道路与纠正结果对比图,图2(a)中红色线段表示拥堵路段,颜色越深表示拥堵越严重,矩形区域内的道路并非福州市日常堵点也无大型施工,交通状态与实际调查结果不符合. 这表明存在部分指标值不能准确反映该路段的拥堵情况,需要分析造成该问题的原因并进行相应修正.
图2 道路异常发现与纠正对比Fig.2 Exceptional road identifying and correcting
从城市交通需求与供给上来看,道路上出租车轨迹点少表示该道路通过的车辆少,道路通行速度应该较快,拥堵值也较低. 而在计算结果中部分路段却呈相反趋势: 道路轨迹点少,但道路通行速度低,拥堵值高. 可以判断这样的路段其道路拥堵值可能存在异常. 因此提出了道路拥堵值可疑度Si,以此来发现存在拥堵指标异常的路段,其定义如下:
(5)
其中:Aij为路段i在第j时间段的指标值, 表示道路的拥堵程度; sum为路段i在第j时间段内的轨迹点总和. 当道路拥堵程度高而轨迹点数少时,道路拥堵值可疑程度越高. 为判定路段拥堵指标值可信与否,需要确定可疑度阈值Sp来判断,Sp的确定步骤如下:
1) 由式(5)可得路段Si值,将得到全部路段Si值升序排序,Si值越大越可疑.
2) 计算斜率Ki. 排序后的Si值前低后高,并在一处迅速拉升,故Sp应在Si突变位置. 通过Si-1与Si间斜率Ki确定突变点.
(6)
其中:x为升序排序后路段i的可疑度排名;y为路段i的可疑度Si.
3) 确定突变点. 用累计距平法确定趋势发生变化的点,累计距离Di最小的点即为突变点.
(7)
4) 通过突变点确定对应的阈值Sp. 当Si>Sp时,路段i可疑度大于阈值则认为其拥堵指标值不可信. 由此可以将道路划分为可信道路与可疑道路.
Sp={Si|min(Di)} (i=1, 2, 3, …,m)
(8)
使用异常识别法确定异常道路后需要对错误道路进行纠正. 依据城市交通的拥堵传播规律,道路的规律性拥堵在空间上是具有连续性的,拥堵往往是从某一特定点延伸到某一条路,再到某一片区域,基于此本文提出了一种基于规律拥堵区域连续性的拥堵异常纠正. 主要步骤如下:
1) 使用基于拥堵值的道路异常识别法搜索所有异常道路Lw,k为异常道路的数量.
Lw={lw1,lw2, …,lwk}
(9)
2) 对每条异常道路,搜索一定半径范围内所有的正常道路Lr,h为搜索半径内正常道路的数量.
Lr={lr1,lr2, …,lrh}
(10)
(11)
通过上述方法对拥堵值进行修正,图2(b)为修正后的道路拥堵指标. 纠正后的道路处于通畅或轻度拥堵状态,这与实际状况相符,结果证明了该道路拥堵指标异常识别和修正方法的有效性.
3 实例分析
3.1 数据预处理与拥堵指标计算
选取福州市2015年5月1日—31日的出租车GPS轨迹数据作为数据源. 数据采样间隔为10 s,连续性较好,极少出现缺失点,具有较高的精度与可信度. 本文对福州市轨迹数据进行清洗和筛选,预处理流程如下: ① 筛选载客状态值为载客的轨迹点. ② 补足缺失轨迹. ③ 清除漂移轨迹. ④ 清除异常数据. 最终获得工作日早高峰期间(7:00—10:00)出租车载客运行轨迹.
城市路网数据处理包括剔除支路、道路交叉口分割和长路段分割等. 策略如下: ① 因为出租车主要在城市的主干道上运行,所以保留城市的主干道,将城市的细小支路及小区内部道路去除. ② 存在交叉的多条道路在道路交叉口两侧路段的路况可能存在差异,因此对城市主干道进行分割时,遇到道路交叉口则以交叉点为断点,将两条或多条交叉道路打断,使其成为连接在这一点的多条简单路段. ③ 部分道路交叉路口少,道路类型一致但长度过长,道路上各个部分的路况可能存在差异,例如道路一端通畅,而另一端拥堵,因此需要将其分为若干长度适合的路段以准确反映道路的通行情况. 对路网按策略进行清理划分,经处理后总计有780条路段.
在轨迹与道路数据的基础上,以15 min为统计间隔,计算每个间隔内各道路拥堵指数Aij与全市拥堵指数Bj. 发现7:00—7:30存在较多指标异常的路段,这时主要是客流较少,轨迹点缺少,其它时段的道路指标异常占全部道路的2%以内. 通过道路拥堵指标异常识别和修正得到每个统计间隔内各路段和全市准确的拥堵指数.
3.2 时间尺度分析
图3反映了城市道路拥堵值、全市拥堵值与拥堵比例随时间的变化,整体呈现先激增后递减趋势.
图3 全市7:00—10:00 期间拥堵道路比例,拥堵值Aij与BjFig.3 Proportion of congested road, Aij and Bj during 7:00 to 10:00
从图3可知: 7:00—7:30间拥堵值迅速上升,因为通勤需求导致城市居民多在此时出行,此时道路上车流明显增多,导致出现道路拥堵,但总体上保持畅通. 拥堵指数峰值出现在7:45—8:00,在此时段内道路拥堵指数均值为159.48,全市道路拥堵值为133.16,说明道路交通趋于饱和状态,全市道路平均通行速度不足最佳通行速度的一半,拥堵程度在7:30—8:00时间段内逐渐加重,到8:30之前保持较高水平. 拥堵道路比例在8:00—8:15期间达到顶峰,全市处于拥堵(包括轻度拥堵、拥堵、严重拥堵)的道路占全部道路的比例达34.2%,与拥堵指数相同,在8:30之前维持较高水平,说明道路拥堵范围逐渐扩散.
从图中可以看出两者的变化趋势相似,但拥堵指数峰值早于拥堵道路比例峰值15 min,这是因为道路拥堵具有向相邻道路传播的性质,而拥堵的传播需要一段时间,所以造成拥堵道路比例峰值滞后于拥堵指数峰值. 在8:30后道路拥堵值、全市拥堵值与拥堵道路比例逐渐回落,道路通行状态整体通畅. 总体上,拥堵时段为7:30—8:30,持续时间为60 min.
3.3 空间尺度分析
图4为福州市道路在工作日早高峰期的道路拥堵空间分布状况. 其中绿色路段表示通畅,红色路段表示拥堵,红色越深表示拥堵程度越严重. 从图中可以直观地看出工作日早高峰时段内福州三环内道路拥堵发展的过程,如图4(a)和4(b)所示.
图4 福州市7:00—9:15拥堵空间分布Fig.4 Spatial distribution of congested road during 7:00 to 9:15
在7:30 之前市区内道路通行状况良好,道路拥堵首先发生在通向城市CBD(central business district)或者交通枢纽的主干道上(图4(a)中红色矩形框标记区域),如通往福州站(区域Ⅰ)的华林路和五四路,通往东街口(区域Ⅲ)的杨桥路和通过宝龙广场(区域Ⅳ)的西环南路等,其拥堵强度低但在短时间内迅速提高; 在7:30—8:30之间道路拥堵程度加剧,拥堵范围扩大,如图4(c)~(f)所示,拥堵路段在空间分布上表现出相对集中,其分布趋势是从中心区域向外扩散,并且拥堵程度随着与中心区域的距离增大而降低; 图4(g)~(i)说明8:30后拥堵路段开始逐渐减少并趋于稳定,拥堵的程度也开始降低,拥堵和严重拥堵的路段空间分布随机性强,没有明显的规律特征,而轻度拥堵的路段中有一大部分的路段始终保持着轻度拥堵的状态,比如杨桥路和五四路,因为大量支路车流汇入主干道,导致主干道车流量保持在较高的水平.
3.4 时空关联分析
以上从时间尺度和空间尺度分别对福州市道路拥堵的分布与变化进行分析,为了进一步分析道路拥堵的时空规律,得到能够指导居民出行的规律. 本文使用一个月中20个工作日早高峰道路拥堵指数大于等于轻度拥挤水平的数据集进行关联模式挖掘. 令置信度阈值confidence=0.7,支持度阈值support=0.1,挖掘得到形式如下的强关联规则(见表2): (国货东路)^(7:30—7:45)==>(严重拥堵) conf=0.8, sup=0.12. 其中conf为规则的置信度,sup为规则的支持度. 该规则表示国货东路在7:30—7:45经常处于严重拥堵的交通状态.
表2 关联规则列表
以国货东路为例进一步分析,如图5所示,国货东路连接六一路与连江路,大量车流从两条主干道流入国货东路. 数据显示国货东路是出租轨迹最密集的道路之一,同时也是福州市最为拥堵的道路之一,平均拥堵值为371.33. 早高峰时期两条主干道的车辆流入国货东路,造成交通拥堵,尤其在连江路往六一路方向的后半段,因为车道数量减少导致拥堵更加严重. 图6为国货东路在早高峰期间的交通状态随时间的变化,与图3的拥堵时间分布特征相似,均呈三段式分布特点,并且与上述关联规则描述相符. 居民在出行时如果要经过国货东路,应尽量规避严重拥堵的时段; 如果时间不可调整时,应该重新规划出行路线避开国货东路.
图5 全市7:45—8:00 时段路况Fig.5 Traffic condition during 7:45 to 8:00
图6 国货东路7:00—10:00 时段路况Fig.6 Traffic condition of East Guohuo Road during 7:00 to 10:00
4 结语
本文考虑道路等级对道路拥堵指标体系的负面影响,选择INRIX道路拥堵指标体系,使用出租车轨迹数据计算福州市区道路拥堵指数,并提出计算结果的修正方法,结果表明该拥堵指数异常识别和基于区域连续性的拥堵指数修正方法有效. 从时间尺度、空间尺度分别分析福州市区道路交通拥堵的产生原因和变化规律,发现福州市早高峰道路拥堵呈三段式,在7:30 前道路基本通畅,在7:30—8:30期间道路趋于拥堵,8:30—10:00路况转好,对居民出行影响严重的城市拥堵时段为7:30—8:30; 在空间上,严重拥堵路段主要集中在CBD以及交通枢纽区域,并向周围扩散,拥堵强度随着与中心的距离增大而减小.
综合道路拥堵的时空关联规则提供的经验,城市居民应根据自身情况尽量避免在拥堵时段和路段出行; 交通管理部门可以采取一定的宣传手段引导居民分时段出行减少因通行需求激增造成的拥堵,还可以通过诱导手段进行分流控制分担拥堵路段的通行压力,或者从频繁出现拥堵的路段分析城市规划中的问题以辅助城市规划决策. 由于本文分析拥堵的基本单元是路段,所以在需要进行精细化分析的应用场景中存在不足,下一步研究工作可以改进本文的方法进行道路拥堵的精细计算与分析.