基于数据挖掘的路网交通拥堵特征分析
2022-11-16黄艳国刘红军金超
黄艳国, 刘红军, 金超
(江西理工大学电气工程与自动化学院, 赣州 341000)
随着各大城市的高速发展,机动车的数量正在大幅增长,全国大多数城市的路网结构无法满足快速增长的汽车需求,进而导致交通拥堵,而交通拥堵又会引发通勤时间和燃料用量的增加,这无疑是对资源的浪费,更严重的是对环境的污染也会加剧[1]。因此,探索和分析区域路网交通拥堵的时空特征至关重要。
交通拥堵是指路网容纳不下交通流量所导致的,拥堵强度及其特征的量化是制定缓解拥堵措施的基础[2]。目前国内外的许多研究者进行了多项研究,主要集中在拥堵较为严重的大城市,并提出多个指标来分析拥堵特征,如车流量、车流密度、车辆行驶速度、出行延误和行驶时间都可用来评估道路拥堵程度及其特征[3]。随着各种拥堵测量方法不断发展,道路拥堵指数、拥堵严重程度指数和拥堵持续时间指数等也相继被广泛采用。王芹等[4]采用平均速度和限行速度构成的速度指标来评价北京高速公路网的拥堵情况;孙建平等[5]通过蔓延理论研究城市道路空间网络拓扑结构并分析了交通拥堵的时空特性;陈绍宽等[6]通过改进后的时空指数,研究北京二环路段的交通状况和周围路网交通拥堵的特征;Tanzina等[7]、Wang等[8]分别利用浮动车数据和行程时间比数据为数据源,对研究区域进行了有效的时空特征分析。在大数据应用方面,何兆成等[9]利用采集的全球定位系统(global positioning system,GPS)数据构建可视化模型来直观反映区域路网拥堵特征; Rempe等[10]通过获取实时数据来具体研究区域路网在时空上的分布特征;赵从光[11]通过开发软件抓取大数据研究了西安市交通拥堵在每日、每周、每月的时空分布特征。
针对上述特征研究发现,利用交通信息数据研究交通拥堵主要集中在微观层面,采用的数据指标比较单一。基于路网交通拥堵的相关研究,现通过抓取实时出行时间指数数据和道路实测数据相结合的方式,利用大数据聚类分析方法对研究区域路段进行定量化研究,以期更准确地揭示路网拥堵的时空分布特征,为缓解城市道路交通拥堵提供一定参考。
1 研究区域与数据来源
1.1 研究区域概况
各个城市由于城市规模、人口密度、经济水平、路网结构等存在一定差异,交通拥堵情况也会有所不同,因此有必要对不同城市交通拥堵展开特定研究,从而更好地解决交通相关问题。以赣州市章贡区的道路网络作为研究对象,章贡区是赣州市的市辖区,也是赣州市的经济和交通中心,位于昌赣深和渝长厦“一纵一横”高铁大动脉的交叉点,交通路网结构如图1、图2所示。主要的研究重点区域为文明大道、红旗大道、南门口、三康庙,红旗大道处于研究区域的中心地带,此路段拥堵状况时常发生。当早晚高峰时段,路段的减速停车排队长度有时多达几百米,因此选择此区域路网作为研究对象,通过对红旗大道周边区域当前的交通运行状况进行调查分析,对研究交通拥堵传播和缓解交通拥堵具有重要意义[12]。
图1 研究区域卫星示意图
1~31表示研究区内道路编号
1.2 数据来源及计算方法
出行时间指数(travel time index,TTI)[13]是研究交通拥堵程度方面使用较多的指标数据,它是车辆实际的行程时间与在自由流状态行程时间的比值,或者是自由流速度与实际速度的比值,如某条道路行驶时间比为1.3,表示该时段行驶的时间比自由流状态多0.3倍。值越大表示交通拥堵程度越严重,其他如异常天气(如雨、雪、雾等)或者道路突发情况可能对TTI的数值产生影响。随着车辆定位技术的发展,各种数据采集变得更加便捷,为城市交通拥堵的研究提供了丰富可靠的数据。根据章贡区部分路段的交通运行情况,从百度地图上抓取实时路况数据,时效性是百度地图数据的一大优点,能够及时更新出行时间指数和道路运行状态[14]。为了防止出行时间指数数据的抓取数据的缺失,导致数据量不足的情况,另外进行道路固定点采集交通流,经式(1)计算得到出行时间指数数据。
(1)
式(1)中:Tt为车辆实际的平均行驶时间,s;Tm为车辆在自由流时平均行驶时间,s;Vm为在自由流时行驶速度,km/h;Vt为实际的行驶速度,km/h。某条道路的TTI指数的计算公式为
(2)
(3)
式中:Vlm(t)为道路l在t时刻的道路限速,即自由流速度,是依据道路等级规定的;Vlt(t)为道路l在t时刻的实际行驶速度;D为道路的长度,km;T1、T2分别为驶入道路的时间和驶出道路的时间。若要计算几条道路、一个辖区甚至一个城市的TTI指数,则需要根据道路等级和道路间的行驶速度加权处理,公式为
(4)
(5)
式中:n为辖区的道路总数;Di为道路i的长度;Wi为道路的权重,可根据主干道、次干道、支路等级和车流量划分,道路所能容纳的交通流越大,权重就越高;Vit、Vim分别为道路i的实际行驶速度和自由流速度。根据2020年中国发布的《城市道路交通管理评价指标体系》[15]中以道路车辆的平均速度来判定拥堵程度,以此作为研究区域拥堵程度划分的依据,具体指数数据与拥堵程度划分如表1所示。
表1 出行时间指数数据与道路运行等级
利用在百度上抓取的交通指标数据和道路定点采集的交通流数据,选取2021年1月4—17日作为分析时间,记录每天6:00—22:00每隔10 min的数据。在对交通道路进行分析前需将获得的数据进行处理,从获得的数据可以发现,出行时间指数在每周之间有很大的周期性,因此先整理数据,数据集为14 d(两周)。依据出行时间指数的大小范围,对异常值进行删除处理,缺失的数据用定点采集的交通流数据进行计算补齐。
城市交通的出行需求大多是市民的通勤出行,市民通勤出行的周期性变化导致城市交通流也有相似的周期性。不同等级的道路如主、次、支路自由流速度差别较为明显,可根据获取的指数数据和检测数据进行计算分类。研究城市交通拥堵的分布特征,需先对获取的指数数据进行定量研究,针对出行时间指数数据的特点,然后对研究区域的交通拥堵时间特性和空间特性进行分析[16]。
2 出行时间指数聚类分析
城市的交通网络是由路段和交叉口组成的,不同时间节点、地点都会形成不同的交通流,其特征也不相同。交通拥堵是路网在一定时间内供求不平衡的现象,当交通路网发生拥堵时,根据交通波的车辆流动特性,速度和交通量通常表现为线性关系,上下游的交通量因蔓延发生显著变化。在路网的上游路段,通行量开始下降,车流密度开始增加,行驶速度的下降导致车辆延误、行程时间增加。在路网的下游路段,车辆数量数减少,流量也随之下降,如图3所示。
图3 交通拥堵源蔓延示意图
在城市路网中,交通拥堵一般呈现周期性变化,每周的变化情况大致相同,为了研究不同道路的交通运行状态,对各路段在6: 00—22: 00的出行时间指数数据采用聚类分析,对工作日的数据进行聚类,聚类算法应用较多的有系统聚类和K-means聚类算法等,聚类分析是将收集的数据进行分类,把差异变化不大的数据分为一类,差异较大的数据分到另一类,然后依次迭代分类。聚类分析方法的具体步骤如下。
步骤1对于K-means聚类算法,首先确定k值,选择合适的聚类中心。
步骤2输入数据集D=(x1,x2,…,xn),聚类簇k,最大迭代次数为n;输出簇D=(y1,y2,…,yk),从数据D中随机选取k个样本,计算xi和k个样本的距离dij,计算公式为
(6)
将样本标记为dij距离最小的类别cj,然后又对cj中样本重新计算出最短距离,重复计算之后,若距离不再发生变化,则结束计算。
步骤3输出簇分类D=(c1,c2,…,ck)。
道路的平均行驶速度是计算数据的数值变量,以指数数据为分类对象,得出速度变化差异小的相同道路类型,可以揭示不同道路类型的行驶速度特征。由于数据量较大,因此选择K-means聚类法进行分析,出行时间指数数据将道路运行等级分为5类,因此聚类初始中心选取5个。从聚类结果发现研究区域畅通和基本畅通数据量较少,将其合并为一类,最终聚类分为四类时效果最佳,默认迭代10次,最后将研究区域的道路类型分为4类,四种道路类型指数曲线如图4所示,道路聚类分析结果如表2所示。
表2 聚类结果
图4 四种典型道路出行时间指数曲线
第一类路段主要有文明大道、东阳山路等,存在明显的早、晚高峰,持续时间较短。第二类有高琰路、文山路等,早高峰明显拥堵,可能是由于处于居住区上班族较多导致的拥堵。第三类有环城路、西郊路等,早、晚高峰存在明显差异,主要是路段内学校在下午放学时家长接孩子导致的。第四类有红环南路,路段车辆行驶速度接近道路限速,出行时间指数数据在早高峰期间在1.4左右,晚高峰有所增加,但未达到拥堵阶段,属于基本畅通阶段,交通运行良好。
3 拥堵时空分布特征分析
3.1 时间变化特征
时间变化特征是指交通道路状态随时间变化而相应变化的特性,聚类分析出的4种不同类型的交通特征后,可对不同分类特征进行特征描述,主要包括早晚高峰和周期性等特征。工作日和周末的交通拥堵模式差异较大,虽然道路运行状态一直都在波动,但总体仍呈现周期性。如图5~图12所示,是区域典型路段的工作日和周末的交通数据图,首先以同一路段的工作日与周末横向对比,然后以不同道路的工作日纵向对比来进行分析。
从横向对比中,以文明大道为例进行分析,如图5、图6所示,此类道路是市民上班族上班的必经路,出行需求较高。道路特征是早、晚高峰都有较明显的高峰,峰值间是指数数据相对较低的平峰。工作日路段早高峰开始大约在早晨7:00,结束的时间大概在上午9:00。晚高峰持续时间为17:30—19:00,这反映了市民在工作日的工作时间,大多企业在8:00—9:30营业,因此交通量从7:00—8:00增加,随后减少。早高峰形成快但消散较慢,而晚高峰则与此相反。对比工作日来看,周末拥堵状况明显好转,车辆速度波动范围小,白天的行车速度明显大于工作日。这是由于在工作日,市民出行方式固定,出行的时段基本相同,在周末,市民没有相对固定的出行时间,但在下午18:00左右,市民会选择出门,晚高峰相对于工作日的晚高峰持续时间长。
图5 文明大道工作日指数变化趋势
图6 文明大道周末指数变化趋势
纵向对比不同路段,对于类型二,以高琰路为例,如图7、图8所示,高琰路周围多为住宅区,工作日早高峰较明显,市民出行较为集中,而下班时段市民有时加班,有时参加娱乐活动,回家时间不一,因此晚高峰不明显。对于类型三,以西郊路为例,如图9、图10所示,这类道路两侧一般都有学校,在工作日,小学在下午16:30左右放学,家长提前在学校门口接孩子,人员集中势必会引起道路拥堵等情况,所以晚高峰较早高峰明显。对于类型四,以红环南路为例,如图11、图12所示,此类道路为文明大道和红旗大道的连接段,两端为区域主干道,交通车流大,无论是驶进车辆还是驶出车辆,都能很快地流通,因此全天整体上无明显拥堵,行驶速度较为平稳。
图7 高琰路工作日指数变化趋势
图8 高琰路周末指数变化趋势
图9 西郊路工作日指数变化趋势
图10 西郊路周末指数变化趋势
图11 红环南路工作日指数变化趋势
图12 红环南路周末指数变化趋势
3.2 空间变化特征
交通拥堵的空间变化过程由道路结构和出行需求共同作用。由于复杂的路网结构,交通流在交叉口转向时极易发生拥堵,当某个交叉口发生拥堵时,其空间传播并不是均匀地扩散到相邻的路段上,如发生拥堵点时,会以0.1、0.2、0.5不等的传播率进行拥堵扩散,其中后续主路段受其影响较大,如图13所示。上游路段与下游路段有相同的网络拓扑结构,但因各路段与交叉口的通行量及距交叉口的位置不同,所受拥堵影响也不同。若路网结构单一,车辆就极易朝一个方向行驶,也就不会因转向而降低车速。
图13 交通拥堵传播路径示意图
根据交通时间分布特征来看,一周的工作日和周末交通拥堵有差异,其具体是在时间上的不同,周末的拥堵发生时间一般要滞后于工作日,但周末拥堵的持续时间要比工作日大,因此可以通过具体拥堵点,对拥堵的空间变化进行分析。以1月4日早高峰为例分析研究区域拥堵空间特征,如图14所示,颜色深浅代表拥堵程度,以1~10为变化程度。由于1月4日是工作日,学校正常上课、公司正常营业等条件,因此早高峰在早晨7:00左右,各路段口交通车流陆续增加,车速降低,拥堵开始形成。
图14 研究区域早高峰拥堵热力图
在早晨7:00左右,只有几个路段口出现拥堵现象,为典型的点拥堵阶段,较严重的路口有南门口和三康庙等。在7:25左右,拥堵开始加剧,由交叉口向路段逐渐扩散,通过早高峰的路况数据可以直观反映出拥堵的路段及扩散方向,其中高琰路和文山路上升较快,高琰路和文山路相离不远,很快由两个交叉口引起的点拥堵逐渐形成线拥堵。在7:50左右,拥堵进一步扩大,高琰路和文山路属于支路,道路通行量较小,又是居民和学校集聚地,附近有住宅区、小学和商场等,路口的拥堵逐渐向外扩散,先影响上游如廉泉路和福寿路等路段,随后拥堵向下游蔓延,由高琰路逐渐向文明大道和红旗大道扩散,形成了面拥堵状态。在工作日期间,由于出行时间较为集中,在8:20左右,面拥堵渐渐传播到其他路段,但其他主路通行量较大,拥堵得到减缓,最后处于正常通行状态。在早高峰期间整体上大部分路段呈现中度拥堵状态,个别路段枢纽处于严重拥堵状态,在早高峰形成期间交通拥堵表现出点、线并存的空间拥堵特征,点拥堵多发生于路段口处,若路段口的不同方向的拥堵程度较高,则此路口可认定为拥堵源。结合地图可以发现,拥堵点的附近一般分布着大型商场、学校、住宅区等人流较大的场所,如南门口、三康庙附近都有大型商场,中间路段多为学校等,并由此点拥堵向周围扩散蔓延形成线甚至面拥堵的趋势。可以看出,交通拥堵在路网中的分布主要有点拥堵、线拥堵及面拥堵3种形式,通过道路上某个局部路段的拥堵,沿道路交通线向外传播蔓延,若交通需求持续增长而未有效疏解,则最终演变为区域性的拥堵。
4 结论
基于研究区域的出行时间指数数据,结合检测的数据对交通运行指数进行了计算和分析,为分析不同道路的交通状态特征,采用数据挖掘分析的方法,将所研究的道路进行划分,从时间维度和空间视角对路段特征和拥堵规律进行阐述,总结了区域交通拥堵的周期性和拥堵扩散的蔓延趋势,在时间上存在每日、每周的相似性,在空间上表现为由点向线再到面的拥堵扩散规律,对于任何一种路网拓扑结构,以出行时间指数数据来分析路网拥堵特征,可以促进对交通拥堵演化的研究。后续在交通指数数据丰富的条件下,也会引入不同季度的天气和交通事故数据,为整个区域的交通拥堵管理提供一定支持。