基于路段速度的信号交叉口运行评价方法
2023-01-13王路曼王理民杨炜俊
王路曼,王理民,杨炜俊,蔡 铭
1.中山大学 智能工程学院,广东 深圳 518106
2.广东省智能交通系统重点实验室,广州 510006
交叉口是城市道路交通系统中的重要组成部分,各个方向的交通流在交叉口处有规律地汇集和分离,交叉口位置的重要性和交通运行状况的复杂性,使得其成为制约整个道路系统充分发挥功能效率的重要因素之一[1-2]。因此,针对信号交叉口设计专有的运行评价方法是城市道路交通运行评价领域研究的重点内容。此外,随着智慧交通建设的展开,交通数据采集能力显著提升,交通数据种类与数量增长迅速,可实现对城市信号交叉口运行状况进行实时、全面的连续监测,形成日益丰富的城市道路交通数据环境;而大数据等信息技术的迅速发展,使得对海量城市道路交通数据进行挖掘、存储、加工以及分析更加便捷,量化评估城市交叉口运行状况更加准确。
在交叉口运行评价指标方面,国际上广泛采用的是美国发行的《道路通行能力手册》中以车辆平均延误作为划分服务水平等级的标准[3],其认为信号交叉口服务水平的各种影响因素均可反映在车辆平均延误上,如交叉口的几何条件、交通条件以及信号条件等。国内早期较为常用的是北京市市政设计院建议的信号交叉口服务水平评价标准[4],除了考虑平均停车延误外,还增设了交叉口交通负荷系数、红灯平均阻车长度以及乘客与驾驶员感受指标,并将交叉口服务水平划分为4个等级。《交通工程学》中建议的交叉口服务水平分级标准同时考虑了交叉口交通负荷系数、效率系数、交叉口受阻车辆、平均停车延误和排队长度等各项参数,从而将信号交叉口服务水平分为5个等级[5]。在实际的研究中还有学者用到了两次停车率、通行能力、车道占有率等评价指标[6-8],但缺乏相对统一的指标优劣分级标准,无法对交叉口运行状况进行直观的评价。
交叉口运行评价的数据源早期主要是人工调查数据[9-11],调查数据较为准确,可调查的数据种类也较多,但需耗费大量的人力物力,且时效性较差。随着交通数据采集设备的完善和大数据技术的进步,固定交通流检测设备数据、视频数据和浮动车GPS数据等开始广泛应用于交叉口运行评价研究中。曲昭伟等[12]、王力等[13]利用交叉口附近布设的固定检测设备数据,得到交叉口进口道临近路段的交通流量和车道占有率数据,进而判别交叉口的交通状态。唐少虎等[14]、Zhang等[15]、李君羡等[16]通过对视频图像数据特征提取,将交叉口交通状态识别问题转化为图像搜索问题。Ban等[17]、Tan等[18]通过移动检测数据计算车辆的运行时间,进而估算出交叉口的排队长度,以便识别交叉口过饱和状态。刘泽等[19]、姚宇[20]、蔡晓禹等[21]、Chen等[22]基于浮动车GPS数据估算最大排队长度,将队尾浮动车位置作为基础项,并考虑队尾浮动车之后排队车辆的到达率,从而计算出信号周期内车辆的最大排队长度。现有研究大多假定已知的信号配时等先验条件,且计算方法较为复杂,同时由于浮动车GPS数据、固定检测设备数据等数据难以全路网、高密度地覆盖,导致无法对全路网的交叉口运行状况进行实时、准确的评价,在实际应用中具有较大的瓶颈。
现今手机已成为人们出行时随身携带的工具,手机导航地图也已成为最常用的导航方式,用户在使用导航地图软件的同时,导航软件也会定时向手机请求GPS数据,以便获得用户的移动信息,进而通过对大量的手机GPS数据分析计算得到路段的平均行程速度。导航平台路段速度数据具有数据量大、准确性好、数据更新稳定、容易获取等优点,因而被广泛应用于交通领域。本文基于路段速度对信号交叉口运行状况进行评价,考虑采用交叉口进口道临近路段的速度判定交叉口的服务水平等级,同时可通过拥堵频率统计识别常发性拥堵交叉口,并根据常发拥堵的时段不同将其分为三类,分别进行拥堵成因分析,以便后续有针对性地对各类交叉口进行专项治理与管控。
1 数据描述与清洗
1.1 数据描述
本研究数据主要包括三部分,即来自国内某导航平台推出的路段速度数据和配套的路网地图数据,以及交叉口位置数据,数据所在区域均为佛山市。路段速度数据以不同长度的路段为单元进行反馈,数据时间范 围 为2021年2月1日—2021年3月31日,共计52 752条路段产生1 352 309 210条数据记录,数据时间粒度为2 min,路段速度数据的主要字段及释义如表1所示。其中,图幅编号meshiid和道路编号road_id共同确定唯一路段。
表1 路段速度数据字段及释义Table 1 Field interpretation of road section speed data
路网地图数据同样也包含52 752条路段,包括路段的名称、长度、宽度、车道数、道路等级、所属行政区域等基础属性信息,其中,路段编号gid是路段的唯一编号,图幅编号meshiid和道路编号road_id与路段速度数据相对应。路网地图数据的主要字段释义如表2所示。
表2 路网地图数据字段及释义Table 2 Field interpretation of road network map data
交叉口位置数据与路网地图数据相匹配,采用的是同一坐标系,佛山市路网地图及交叉口数据示意图如图1所示。交叉口位置数据共计775个交叉口,主要包含交叉口编号、名称、经纬度位置等信息。其中,交叉口编号crossid是交叉口的唯一编号,且编号不连续,取值范围为35~2 252。其位置数据主要字段及释义如表3所示。
图1 佛山市路网地图及交叉口数据示意图Fig.1 Schematic diagram of Foshan road network map and intersection data
表3 交叉口位置数据字段及释义Table 3 Field interpretation of intersection location data
1.2 数据清洗
路段速度数据中存在重复数据和无效更新数据,重复数据是指实时更新数据中存在的数据重复现象,因此首先要对数据进行去重,清洗掉重复数据;无效更新数据是指部分路段速度数据虽然持续更新,但更新速度数据长时间为0,或者某一固定值,需要对这部分数据进行清洗。路段速度数据清洗算法流程如图2所示。清洗后保留的数据约为原始数据的94%。
图2 路段速度数据清洗算法流程Fig.2 Procedure of road section speed data cleaning
首先对路段速度数据进行去重处理,然后再针对持续更新速度值为同一值的无效数据进行清洗。无效数据清洗时,先提取某路段上一时刻速度vi-1和当前时刻速度vi(时间间隔为2 min),然后判断二者是否相同,若不相同则数据正常,进行保留;若二者相同则判断连续为此值的累计频次是否大于10,即为连续更新速度值为同一值的持续时间是否大于20 min,若不大于则数据正常,进行保留;若大于,则判定该速度数据为无效数据,予以剔除,直至出现下一个与此速度值不同的数据再进行保留。其中判定速度数据是否有效的临界值20 min的选取主要考虑两个方面:一方面是基于实际应用,道路交通运行时若发生较严重拥堵可能出现一段时间内速度持续为0;另一方面是基于数理统计,一个月内速度数据连续为同一值的持续时间和累计频次统计后如图3所示,由于持续时间取值较多,影响图片可读性,图中仅显示持续时间60 min内的累计频次。考虑取边际效益不足5%时对应的值作为临界值,即速度连续更新为同一值的持续时间是否超过20 min作为判定速度数据有效的标准。
图3速度连续为同一值的持续时间累计频次分布Fig.3 Cumulative frequency distribution of duration with same speed continuously
2 信号交叉口运行评价方法
2.1 评价方法概述及框架
本研究所提出的基于路段速度的信号交叉口运行评价方法框架如图4所示。框架包括三部分内容:第一部分为基础数据的匹配,主要包括路段速度数据与路网地图数据的关联,以及路网地图数据和交叉口位置数据的匹配;第二部分为评价指标的计算方法,通过匹配关联后的交叉口进口道临近路段速度数据,得到交叉口的整体运行速度,进而得到交叉口的服务水平等级;第三部分为常发性拥堵交叉口识别,通过对拥堵频率统计识别常发性拥堵交叉口,并根据常发拥堵的时段不同将其分为三类,分别进行交叉口拥堵成因分析。
图4 评价方法框架Fig.4 Framework of evaluation method
2.2 数据匹配
基础数据的匹配主要包括两部分,路段速度数据与路网地图数据的关联,以及路网地图数据和交叉口位置数据的匹配。由于路段速度数据和路网地图数据的图幅编号meshiid和道路编号road_id相对应,通过对这两个字段匹配即可完成路段速度数据与路网地图数据的关联,关联后以路段编号gid作为路段的唯一编号。
路网地图数据和交叉口位置数据的匹配则相对复杂,由于交叉口数据仅为经纬度位置数据,在进行交叉口运行评价前,需要先将交叉口位置数据与交叉口进口道路段进行匹配,得到交叉口编号对应的进口道编号和进口道路段编号。交叉口进口道路段匹配算法流程如图5所示。
图5 交叉口进口道路段匹配算法流程Fig.5 Procedure of intersection entrance road segment matching algorithm
首先识别路网地图数据中路段的端点经纬度,然后利用最短距离法将交叉口位置数据与路段端点数据进行匹配,得到交叉口临近路段,再通过交叉口临近路段的行车方向信息判断路段是否为交叉口进口道,若不是则返回上一步,若是则对该路段的长度进行判断,根据《城市道路交叉口设计规程CJJ 152-2010》[23]确定交叉口范围半径为150 m,若该路段的长度大于150 m,则该路段长度为150 m,即完成交叉口该进口道的路段匹配;若路段长度不足150 m,则将该路段的上游路段进行关联,以此类推,直至关联后的进口道路段总长度超过150 m,即完成匹配,得到交叉口各进口道路段数大于等于1条,且最后一条路段的长度为150 m减去其下游所有路段长度的总和。匹配完成后的交叉口及其进口道的路段示意图如图6所示。
图6 交叉口进口道路段示意图Fig.6 Schematic diagram of intersection entrance road section
2.3 评价指标及计算方法
交叉口进口道临近路段速度数据可直接反映交叉口各进口道的运行速度,通过对交叉口进口道临近路段速度数据进行加权平均,即可得到交叉口的整体运行速度,权值主要考虑交叉口各进口道路段的长度和车道数,计算公式为:
式中,vˉ为某交叉口整体运行速度,vi为进口道路段i的速度,li为进口道路段i的长度,mi为进口道路段i的车道数,n为某交叉口所有进口道的路段总数。
由于不同交叉口的车道数、道路等级等基础设施条件并不相同,使用交叉口整体运行速度的大小判定交叉口运行状况等级并不科学,考虑参考国家标准《城市交通运行状况评价规范GB/T 33171—2016》[24],将交叉口整体运行速度与自由流速度的百分比作为判定交叉口运行状况优劣的依据,交叉口运行状况等级分为:畅通、基本畅通、轻度拥堵、中度拥堵和严重拥堵5个等级。交叉口整体运行速度与自由流速度的百分比与交叉口服务水平的对应关系,如表4所示。其中,自由流速度取该交叉口平均运行速度的历史数据中一个月内每天6:00—24:00的速度值,并按从大到小排序,取排序结果的前1/9进行平均,其结果作为该交叉口自由流速度。
表4 交叉口服务水平判定标准Table 4 Standard of intersection service level
2.4 常发性拥堵交叉口识别
道路交通拥堵主要包括常发性拥堵和偶发性拥堵两大类,偶发性拥堵由于其不确定性很难进行预测和专项治理,因此通常对常发性拥堵路段或交叉口进行识别和统计分析,以便交通管理者针对常发性拥堵路段或交叉口采取相应的管控措施。交叉口是道路交通路网的重要组成部分,由于其结构的多样性和运行状况的复杂性,当交叉口交通供给无法满足需求时,极易发生经常性的拥堵。通过对交叉口出现严重拥堵状态(服务水平为5)的频率进行统计,识别常发性拥堵交叉口。
拥堵频率指在一定统计时段(如一天、一星期、一月、一年)内,累计考察某交叉口的拥堵时间与总时间之比,表征某交叉口在此统计时间内发生拥堵的概率,据此可用于分析常发性拥堵交叉口。常发性拥堵交叉口根据统计时间可分为日常发拥堵交叉口、周常发拥堵交叉口、月常发拥堵交叉口、年常发拥堵交叉口[24]。
日常发拥堵交叉口:某日高峰时段拥堵频率大于等于60%或者全天拥堵频率大于等于25%的交叉口;
周常发拥堵交叉口:每周有大于等于4天属于日拥堵交叉口的交叉口;
月常发拥堵交叉口:每月有大于等于3周属于周拥堵交叉口的交叉口;
年常发拥堵交叉口:每年有大于等于6个月属于月拥堵交叉口的交叉口。
计算出常发性拥堵交叉口个数的加权累积量与路网所有交叉口个数的比值,得到常发性拥堵交叉口比例,其中各个交叉口的权值为该交叉口所有进口的车道总数。
常发性拥堵交叉口根据常发拥堵时段不同可分为三类:第一类是高峰拥堵交叉口,是指高峰时段拥堵频率大于等于60%,且全天拥堵频率小于25%的交叉口,该类交叉口的拥堵时段主要集中在高峰时段,而平峰时段则较为畅通;第二类交叉口是平峰拥堵交叉口,是指全天拥堵频率大于等于25%,但高峰时段拥堵频率小于60%的交叉口,该类交叉口的拥堵时段较为分散,拥堵的发生也较为随机;第三类是全天拥堵交叉口,是指不仅高峰时段拥堵频率大于等于60%,且全天拥堵频率大于等于25%的交叉口,该类交叉口高峰及平峰时段拥堵都极为频发。
3 实验与分析
3.1 实验结果
实验中路段速度数据的历史数据集为2021年2月1日—2021年2月28日,共1个月,以2021年3月1日—2021年3月31日1个月的数据为研究测试集。路段速度数据与交叉口位置数据匹配完成后的实验数据样例如表5所示,其中freespeed字段表示路段的自由流速度,cross_dire字段表示交叉口的方向,以区分交叉口不同进口道的路段。
表5 路段速度数据与交叉口位置数据匹配数据样例Table 5 Samples of matching data between road section speed data and intersection location data
通过对交叉口各进口道路段的速度数据进行加权平均得到交叉口平均运行速度,并将其转化为交叉口服务水平,实验数据样例如表6所示,其中mspeed字段表示交叉口平均运行速度,mfreespeed字段表示交叉口的自由流速度,index字段表示交叉口的服务水平。
表6 交叉口服务水平计算数据样例Table 6 Samples of intersection service level calculation data
通过对交叉口出现严重拥堵状态(服务水平为5)的频率进行统计,识别常发性拥堵交叉口,并根据常发拥堵时段不同将其分为三类。日常发拥堵交叉口判别数据样例如表7所示,其中day_congestion_time字段表示全天发生严重拥堵的时间(单位:min),peak_congestion_time字段表示高峰时段发生拥堵的时间(单位:min),congestion字段表示是否为日常发性拥堵交叉口和拥堵交叉口类型,0代表非常发性拥堵交叉口,1代表高峰常发性拥堵交叉口,2代表非高峰常发性拥堵交叉口,3代表全天常发性拥堵交叉口。
表7 日常发拥堵交叉口判别数据样例Table 7 Samples of daily congestion intersection discrimination data
3.2 实验验证
为了验证本文所提出交叉口运行评价方法的有效性和实用性,设计实地验证实验将上述实验结果与实地交通调查结果进行对比。交叉口运行评价调查通常为交叉口延误调查,根据每车平均延误确定交叉口服务水平,等级划分标准选用《交通工程学》中建议的交叉口运行状况分级标准,如表8所示。
表8 《交通工程学》建议的交叉口服务水平分级标准Table 8 Classification standard of intersection service level proposed by Traffic Engineering
为了度量评价方法的准确性,本文以交叉口服务水平的平均绝对误差(mean absolute error,MAE)和均方根误差(root-mean-square error,RMSE)为评价指标。定义如下:
式中,rj表示本文提出的评价方法得到的交叉口服务水平,rjs表示实地交通调查得到的交叉口服务水平,N表示时间粒度的个数。
在佛山市主城区随机选取南海大道与佛平二路交叉口作为实地调查地点,该交叉口为十字交叉口,连接的路段分别为双向十车道和双向八车道,南北向进口道包含四条直行车道和两条左转车道,东西向进口道包含三条直行车道和两条左转车道,信号灯为四相位,如图7所示。调查时间为2021年3月10日15:00—16:00和17:00—18:00,包含一个高峰时段和一个平峰时段。
图7 南海大道与佛平二路交叉口示意图Fig.7 Schematic diagram of Nanhai Road and Foping 2nd Road intersection
调查方法采用点样本法,每一个交叉口进口道需要3名调查人员和1块秒表,调查人员站在进口道停车线附近的路侧人行道较高处,便于观察交叉口排队车辆的队尾,清点排队车辆数。其中1人持秒表,按固定的时间间隔(15 s)通知另外2名调查人员,第2名调查人员负责每隔15 s清点一次排队车辆数,第3名调查人员负责清点交叉口进口道的引道交通量,每隔2 min记录一次。实地调查数据表样例如表9所示。
表9 交叉口延误实地调查数据样例Table 9 Samples of intersection delay field survey data
交叉口的总延误为总停驶车辆数乘以固定时间间隔(15 s),由于路段速度数据的更新时间粒度为2 min,则需要将实际调查数据的交叉口每车平均延误处理成2 min的时间间隔,即为2 min内停驶车辆总延误除以引道交通量,再根据表8确定实际调查数据的交叉口服务水平。
将本研究提出的评价方法所得到的交叉口服务水平,与实地交通调查得到的交叉口服务水平进行对比如图8所示,图中对比数据共60组,高峰时段和平峰时段各30组,交叉口的服务水平取值为1~5,实验交叉口的运行状况在平峰时段基本维持在畅通和基本畅通水平,高峰时段由基本畅通逐步拥堵,最后形成持续性拥堵。交叉口服务水平的研究试验值和实测值大部分相同,仅部分存在一个等级的偏差,整体准确度较高。将交叉口服务水平的研究试验值与实测值进行对比分析,得到平均绝对误差和均方根误差,如表10所示。实验表明,在随机选择的实验交叉口的应用中,交叉口服务水平的研究试验值和实测值的平均绝对误差为0.32,误差仅为6.33%,均方根误差为0.56,其中,测量高峰时段和非高峰时段的交叉口服务水平平均绝对误差分别为0.37和0.27,整体偏差较小,表明了本文所提出的交叉口运行评价方法的有效性。
图8 交叉口服务水平的研究实验值与实测值波动曲线Fig.8 Fluctuation curve of research test value and measured value of intersection service level
表10 交叉口服务水平的研究实验值与实测值对比Table 10 Comparison of research test values and measured values of intersection service level
3.3 常发性拥堵交叉口分析
通过对交叉口出现严重拥堵状态(服务水平为5)的频率进行统计,识别常发性拥堵交叉口。2021年3月内每天的日常发性拥堵交叉口个数及占比如图9所示。由图9可知,工作日的日常发性拥堵交叉口个数及比例明显高于周末,工作日居民通勤产生刚性出行需求,在早晚高峰时段主要通勤廊道的交叉口极易产生周期性的拥堵,尤其是每周周五,如5日、12日、19日和26日,即将迎来周末,市内通勤和短程跨市出行都明显增加,日常发性拥堵交叉口个数也明显增多。此外,常发性拥堵交叉口个数及比例整体波动较大这可能是由于交叉口结构的特殊性,以及部分交叉口信号配时的问题,使得交叉口对区域路网的运行状况感知较为敏感。
图9 日常发性拥堵交叉口个数及占比Fig.9 Number and proportion of daily frequent congested intersections
通过对日常发拥堵交叉口进行统计得到周常发拥堵交叉口,再对周常发拥堵交叉口进行统计得到月常发拥堵交叉口。佛山市2021年3月的月常发拥堵交叉口有22个,月常发拥堵交叉口位置分布如图10所示,月常发拥堵交叉口位置分布相对较为分散,可能由于交叉口的运行状况不仅受交通需求的影响,还很大程度上受限于交叉口的结构、信号配时、交通渠化等因素。
图10 月常发拥堵交叉口位置分布Fig.10 Location distribution of monthly frequent congested intersections
常发性拥堵交叉口根据常发拥堵时段不同可分为三类,在关键瓶颈交叉口拥堵治理时,可针对拥堵交叉口不同类型采取对应的治理措施。高峰拥堵交叉口如图10中的三角形标志所示,主要集中在中心城区,该类型交叉口的拥堵时段主要集中在高峰时段,而平峰时段则较为畅通,说明该类型交叉口是主要通勤要塞,其基础设施可以满足日常平峰的交通需求,但当高峰时段交通需求激增时则易发生拥堵,因此,可以考虑在高峰时段采取特别的管控措施,如调整主次道路的信号配时、重点进口道借对向车道通行,设置交警辅助引流等措施以提高通行效率。
非高峰拥堵交叉口如图10中的圆形标志所示,其位置较为分散,大都不在核心区,交通需求压力也相对较小,该类交叉口的拥堵时段较为分散,拥堵的发生也较为随机,可能是由于其信号配时或交通渠化等物理条件的限制,可以考虑合理调整信号配时,优化交通标志标线等物理设施。
全天拥堵交叉口如图10中的五角形标志所示,该类型交叉口由于其所处位置为关键交通瓶颈,交通需求较大,或者基础设施条件有限,无法满足实际的通行需求,因而全天拥堵频发,可以考虑进行专项交叉口交通调查,在实际条件允许的情况下对交叉口进行扩建,增加进口道车道数,以提高交叉口的设计通行能力,如基础设施条件有限,建议诱导部分交通流到平行路段上分流。
3.4 不同交叉口运行评价方法对比
将本文提出的信号交叉口运行评价方法与现有的运行评价方法进行对比,各评价方法的优缺点对比如表11所示。
表11 不同交叉口运行评价方法对比Table 11 Comparison of operation evaluation methods at different intersections
传统的交叉口运行评价标准中评价指标较多,因而更为全面准确,但所需的数据源也较多,大都只能采用人工调查法,无法全域内获取,经济性和时效性都较差;现有基于大数据技术的评价方法虽时效性较强,但对运行环境要求较高,评价实时覆盖范围较低,且计算较为复杂,实用性较差。而本文提出的基于路段速度数据的评价方法较好地解决了上述问题,时效性和稳定性都较强,准确性也在上述实验中得到验证。通过实地校验实验,将本文提出的基于路段速度数据的交叉口评价方法与《交通工程学》中建议的基于人工调查数据的评价方法进行对比,误差仅为6.33%,满足交叉口运行评价的应用需求,可实现对全路网的交叉口进行实时、准确的评价,且方法简便,运算速度快,适用性较强,虽在部分车流稀疏路段会相对不准确,但随着大数据时代的发展,数据采集能力会不断提升,车流稀疏路段占比较少,可整体满足交叉口运行评价需求,值得推广应用。
4 结束语
鉴于导航平台路段速度数据具有数据量大、准确性好、数据更新稳定、容易获取等优点,本文提出了一种基于路段速度的交叉口运行评价方法,可实现对全路网的交叉口进行实时的评价。首先,将路段速度数据与交叉口位置数据进行匹配,然后采用交叉口进口道临近路段的速度判定交叉口的服务水平等级,同时可通过拥堵频率统计识别常发性拥堵交叉口,并根据常发拥堵的时段不同将其分为三类,分别进行拥堵成因分析,以便后续有针对性地对各类拥堵交叉口进行专项治理与管控。最后设计实地校验实验,随机选取佛山市的一个信号交叉口进行交叉口延误调查实验,并根据交叉口延误确定服务水平,将交叉口服务水平的研究试验值和实测值进行对比,结果表明:该评价方法的服务水平平均绝对误差为0.32,误差仅为6.33%,显示了本文所提出的交叉口运行评价方法的有效性。在后续的研究中将进一步将结合浮动车GPS数据,改善部分交叉口临近路段速度数据缺失问题,提高交叉口运行评价的准确度。