基于数据驱动的交叉口通行效率评价
2024-01-05吐尔逊买买提曲古拉图马尔拜马洁陈俊豪
吐尔逊·买买提, 曲古拉·图马尔拜, 马洁, 陈俊豪
(新疆农业大学交通与物流工程学院, 乌鲁木齐 830052)
近年来乌鲁木齐市机动车保有量持续增长,2011年2月底,乌鲁木齐市机动车保有量已近35.3万辆,到2018年末达到了114.72万辆,其中汽车保有量111.93万辆,小汽车保有量102.47万辆[1],交通供需矛盾日益严峻,对乌鲁木齐城市道路网建设、交通管理和控制以及交通环境治理提出了新的要求和挑战。城市道路网中交叉口是核心节点,交叉口的管控和运行效率以及服务水平直接影响城市道路网的服务水平。因此交叉口的排队长度、延误时长、通行时间、停车次数等微观指标,通行效率、服务水平以及渠化等宏观参数方面的研究一直是学术热点,也是涉及大众出行时间的应用问题。
综上所述,研究内容方面,随着城市规模及汽车保有量持续增长,目前的研究具有由单个交叉口效率评价向区域多个交叉口效率评价方向发展的迹象,同时目前交叉口运行效率方面的研究中多数采用一种或两种评价参数,虽然这种方法简单、易用,并具有较好的可行性,但由于城市道路平面交叉口交通流影响因素较多,因此单一指标或较少的指标不能充分映射交叉口实际运行的微观参数变化以及宏观的评价需求。研究方法方面,交叉口效率评价研究中浮动车GPS轨迹、传感器技术、视频和微波等数据采集技术已取代传统交通调查方法为交叉口效率评价提供了感知多源数据的方法,同时,交通仿真以及数据孪生等方法和技术为交叉口效率评价研究提供了方法途径。
因此,现根据研究区域城市交通现状、数据的获得性以及现有研究基础上,提出一种基于大规模浮动车GPS轨迹数据与多指标融合的交叉口运行效率评价思路和方法。
1 数据来源及预处理
1.1 轨迹数据总体特征描述
乌鲁木齐市自2007年末开始实施浮动车辆GPS信息采集系统,目前,9 000多辆出租车均配备了GPS定位系统[10]。出租车每隔5、15、30 s向数据中心发送一次数据,包括车牌号、时间、经纬度、速度、方位角以及载客状态。将乌鲁木齐交通流现状和数据的可获得性等因素相结合,选取 2021 年 11 月 26 日的5 645 669 条出租车 GPS原始轨迹数据作为数据源开展交叉口通行效率评价研究,出租车GPS原始数据样例,如表1所示。
表1 出租车GPS原始数据样例Table 1 Taxi GPS raw data sample
根据乌鲁木齐市小汽车保有量和出行强度25%(小客车出行比例)估算,配备了GPS的出租车即浮动车占比达到了32%。因此,通过出租车轨迹分析城市道路交叉口交通效率从浮动车占比方面考虑具有较好的可行性和代表性。
乌鲁木齐市出租车GPS出行轨迹量空间分布,如图1所示,从图1中可以看出,出租车GPS行驶轨迹可基本覆盖到乌鲁木齐市每个区域,尤其是在集中于中心城区的快速路、主干路以及次干路,而少量分布于外部通道。
图1 乌鲁木齐市出租车GPS轨迹点空间分布Fig.1 Spatial distribution of taxi GPS trajectory points in Urumqi
1.2 轨迹数据处理流程
通过车载GPS设备采集的轨迹数据因设备、信号干扰和外部因素存在错误数据、缺失数据和冗余数据,因此通过利用SQL server数据库与python语句结合,对2021年11月26日的5 645 669 条出租车 GPS原始数据集中存在的异常数据进行清理,其预处理操作步骤如下。
(1)针对重复数据,以车牌为主关键字进行数据分类,并删除与每个“车辆ID”相关的重复记录。
(2)由于出租车在进入高架、拥挤路段、恶劣天气等条件下,浮动车GPS信号会受到干扰,导致数据的丢失和不连续。为此,采用相邻数据取均值方法补全不连续的缺失数据。
基于上述方法预处理并补全缺失数据之后的有效数据为7 330 065条,为后续研究提供数据支撑。
2 研究方法
2.1 交叉口范围划定
在进行城市道路交叉口各评价交通参数的估算之前要先划定交叉口的研究范围。在确定信号交叉口的范围时,根据信号交叉口的车辆实际排队长度,中国城市道路规划规范、以及信号交叉口影响区域范围的标准,通常以140~180 m的范围为准[11]。
选取乌鲁木齐市新华北路-光明路信号交叉口(简称目标交叉口)为研究对象,以信号交叉口转角缘石曲线端点为计算起点,并以车辆行驶的方向为转向,进口道向上游、出口道向下游计算180 m范围内为交叉口范围,如图2所示。
图2 交叉口研究范围Fig.2 Scope of intersection research
交叉口范围确定后将预处理后的全部样本数据导入到Arc Map的道路图层中,选取研究区域内的交叉口,借助Arc Map软件,判断出车辆与信号交叉口之间的位置,然后对经过目标交叉口的车辆进行筛选,提取在早高峰时段交叉口范围内行驶的出租车轨迹信息共28 329条,为各指标交通参数的提取提供数据支撑。
2.2 通行效率评价指标体系及量化方法
2.2.1 指标体系建立
评价指标的选取是城市道路交叉口通行效率评价的一个初步环节,它直接影响评价结果的效果和适应性。交叉口通行效率作为影响城市道路交通流运行的关键因素受到交叉口区域道路条件、交通条件和管控措施等多个因素的影响。其中交通条件包括交通流特性、车辆行驶速度、路段上的交通流量分布、大中小型客货车构成比例、长途短途车的分布情况等。由于道路交通的随机性与模糊性,无法对交叉口通行效率进行直接的量化判断,但,评价指标在一定程度上描述交叉口通行效率。通过对评价指标的分析,可以更好地了解各评价指标的特点和作用,从而明确在不同的交通条件下,应该选取哪些评价指标来描述交叉口的通行效率。交叉口通行效率评价指标可以分为宏观评价指标和微观评价指标。宏观评价指标包括交通流量、速度、占有率、排队长度、通行时间、延误以及停车次数等,能够反映整个交通流的运行状态特性,而微观评价指标包括,车头时距和车头间距,能够反映交通流中各个交通工具的行驶状态特性。相比微观指标,宏观指标对交叉口的交通流特征敏感度较高,能够及时、准确地反映交叉口通行效率的变化。
交叉口通行效率评价方面目前多数研究基于单一指标评价方法,为弥补单一评价指标的缺陷。故,本文将根据目标交叉口实际交通流现状、出租车GPS轨迹数据的获得性、评价指标的特点以及相关文献[12-15]的方法相结合,为提高评价结果的准确度以及充分反映交叉口实际运行的评价需求建立以排队长度、延误、通行时间和停车率组成的交叉口通行效率评价指标体系。
2.2.2 指标量化方法
城市道路交叉口交通流是一种变化趋势较复杂的时间序列,在分析交叉口通行效率中,根据交通流时间序列变化特征选取正确提取和反映其变化曲线的方法是关键。本文研究中定量分析目标交叉口排队长度、延误、通行时间和停车率等通行效率指标时采用以下方法。
(1)交叉口排队长度。排队长度是指车辆进入排队状态之后,排在最后一辆车距至交叉口停车线的距离,以米为单位统计。本文应用球面距离算法估计车辆的排队长度。首先筛选出每一辆车的初试停车点位置(速度小于5 km/h),然后判断该车至停车线的距离。设交叉口停车线A的经纬度为(Xlat1,Ylong1),车辆在经过交叉口进口道减速排队时的第一个轨迹停车点B的经纬度为(Xlat2,Ylong2),则可以得到基于地球半径来计算两点距离的方法为
(1)
LDistance(AB)=RArccos(dL)
(2)
式(1)中:R为地球的平均半径,m/s;dL为距离;LDistance(AB)为两点之间的距离。
(2)交叉口通行时间。通过交叉口的初始停车点和通过路口终止点的GPS定位数据,应用位置-时间插值法估计车辆的通行时间。根据任意一辆车的两个GPS定位点时刻初始停车点时刻和通过路口终止点时刻,用终止点的时刻te,减去初始停车点的时刻ts,就可以得到通过该交叉口的通行时间T。具体计算公式为
T=te-ts
(3)
式(3)中:T为车辆通过目标交叉口所用的通行时间;te为车辆初始停车点的时刻;ts为车辆通过路口终止点的时刻。
(3)交叉口延误。交叉口延误的计算是指车辆从进入十字交叉口到车辆离开十字交叉口的全过程。当浮动车向左或直行时,除了行驶信号交叉口范围la外,还应当考虑由停车线所围绕的导流线距离lb,因此在信号交叉口范围内浮动车行驶的距离为L=la+lb。本次研究对确定车辆向左或直行的导流线长度确定过程不做详细阐述。则具体计算公式为
(4)
式(3)中:di为信号交叉口延误;Ts为信号交叉口范围起点;Te为信号交叉口范围终点;Vp为城市道路规划规范设定的速度;(xs,ys)和(xe,ye)为分别为交叉口影响范围起点Ts与交叉口范围终点Te时刻浮动车在信号交叉口弧段处经纬度坐标;Ts1、Ts2为分别为交叉口起点的上游和下游时刻;Te1、Te2为分别为交叉口终点的上游和下游时刻;(xs2,ys2)为Ts1时刻浮动车的坐标;(xe2,ye2)为Te2时刻浮动车的坐标。
(4)交叉口停车率。停车率是指车辆在进入排队状态之后停车的次数总和占全部流量的百分率。本文研究所选取的停车率为车辆进入排队状态之后,停车的总数量与交叉口范围内行驶的出租车有效样本车辆的百分率。首先要确定每一辆车的初始速度为0 km/h,即处于停止状态,并判断每一辆车是否进入下一区域(速度大于0 km/h)。然后按照该规则进行统计样本中车辆的停车总数。具体计算公式为
(5)
式(4)中:qt为交叉口有效样本中的停车总数量;qe为交叉口有效样本车辆数。
2.3 通行效率影响因素分析方法
针对传统数据处理技术无法有效处理交通领域产生的具备非结构化、季节性、随机性、混沌和含有噪音等特征的数据,需要考虑新的理念、方法和技术来解决这些问题。根据研究对象特征序列变化趋势,采取合理的方法对多个影响因素进行定量分析对交叉口通行效率分析产生重要影响。粗糙集(rough sets)是Pawlak等[16]首先提出来的分析数据的理论,用于从研究对象特征数据序列中挖掘其所隐含的知识的方法,是在数据挖掘中常用于决策属性已知情况下计算参考属性的权重。
根据量化后的评价指标值的值域、变化趋势和数据量的现状,采用粗糙集理论中的计算属性依赖度和重要度方法测度每个通行效率影响因素向量对输出向量的重要程度,进而进一步量化影响因素的权重。计算步骤如下。
(1)知识表达系统的建立:设S=(U,A,V,F)为一个知识表达系统,其U为所有对象的集合,U=[X1,X2,…,Xn],A为属性的非空集合;V为各属性离散化值域的并集;F为信息函数,它为每个属性赋予一个属性值。A=C∪D,C∩D≠ф,这里的C是参考属性,D是决策属性,从而生成二维的决策表。论域中,对象根据条件属性的不同被划分到不同决策属性的决策类中。
(2) 属性依赖度计算:若U/C={X1,X2,…,Xn},U/D={Y1,Y2,…,Y},决策属性D对条件属性C的依赖度可以定义为
(6)
式(6)中:posc为决策属性;yi为全体条件属性;|u|为集合中包含的元素个数;其中0 (3)计算第i种条件属性对决策属性的重要性。 (7) (4) 计算属性权重Ki。 (8) 基于实测数据,采用VISSIM 仿真方法,对交叉口的通行效率进行分析,进一步验证排队长度、通行时间、延误和停车率对交叉口通行效率的影响程度的可行性,其基本算法思路如下。 (1)在VISSIM 中绘制道路交叉口仿真路网图。 (2)将现场调查的交通流量数据输入仿真系统。 (3)设置各进口道交通冲突点处的优先权、让路规则、期望速度以及信号灯相位。 (4)选取排队长度、通行时间、延误、停车次数等评价指标,进行交通仿真,并观察交叉口各进口道和整个交叉口的通行效率。 (5)应用各评价指标的仿真结果服务水平进行评价,输出相应的仿真结果,并验证各个影响因素对交叉口通行效率的影响程度的可行性。 乌鲁木齐市出租车GPS轨迹数据作为基本数据集,应用2.2.2节通行效率指标的量化方法估计了目标交叉口各高峰期的车辆交通参数,某早高峰部分数据提取结果,如表2所示。 表2 车辆交通参数信息表Table 2 The table of vehicle traffic parameters 从表2中可以看到,4个进口道中,南进口和西进口的排队长度和通行时间较为长,该交叉口的总的平均排队长度为142.64 m,平均延误60.82 s、平均通行时间108.43 s、平均停车次数0.51。参考美国 HCM2000 给出的服务水平划分标准[17],目标交叉口(西、东、北、南)4个进口道的服务水平分别为 F、E、F、F,总体服务水平为 F,因此,该交叉口处于严重堵塞状态。 经过目标交叉口的实际通行效率分析发现,基于出租车GPS轨迹数据作为数据源,可以较好地估算车辆排队长度、通行时间、延误以及停车率等交通参数,并提取的各交通参数可以较好地反映城市道路交叉口的各进口道和整个交叉口的通行效率。因此浮动车采集的数据可为信号交叉口交通参数的计算提供真实可靠的数据源,可以用于交叉口实际通行效率分析中。但提取的样本量的不足,GPS点漂移及定位误差等现象降低了少数评价指标的精确度,不过总体上可以接受范围内。 城市道路中交叉口通行效率的变化趋势在排队长度、通行时间、延误和2次停车率等因素的联合作用下,其变化趋势呈现出季节性、随机性和混沌性以及含有噪音等特性。交叉口通行效率评价指标体系中正确映射各指标与通行效率之间的关系是定量分析交叉口通行效率的关键。 表3 影响因素的依赖度、重要度和权重Table 3 Weights, significant and dependence degree for every input factor 表3结果表明,排队长度是交叉口通行效率的主要的因素,其次是延误和停车率,最后是通行时间。影响因素的权重反映其对交叉口通行效率的影响程度的大小,而且也表示不同指标在同一个交叉口通行效率评价中的重要程度。本文研究中,排队长度对交叉口通行效率的影响最为显著。 为了分析基于轨迹数据的交叉口交通参数提取及通行效率评价方法的适用性,应用上述方法中目标交叉口实测交通流数据,在VISSIM8平台中建立面向新华北路与光明路交叉口微观仿真模型。目标交叉口某早高峰(9:00-11:00)时的实测交通流量数据,如表4所示。 表4 早高峰交通流量Table 4 Morning rush of traffic 目标交叉口搭建的交通仿真模型,如图3所示。 图3 VISSIM交通仿真模型Fig.3 VISSIM traffic simulation model 在以各进口道车辆排队长度、停车次数,通行时间、延误为通行效率评价指标,对目标交叉口进行3 600 s交通仿真,结果如表5所示。 表5 各参数仿真结果Table 5 Simulation results of each parameter 从表5可知,根据文献[17]方法评价交叉口(西、东、北、南)4个进口道的服务水平分别为 F、E、F、F,总体服务水平为 F,该交叉口的通行效率很差,早高峰时段交通拥堵尤为突出。经过分析发现降低交叉口通行效率的原因是多方面的,而最主要的原因一方面是由于研究交叉口的行驶周期在180 s之间,红灯过长,导致车辆停车次数较多,加大了车辆的延误。另一方面, 在仿真运行中,车辆静态路径选择时会出现异常的车辆行驶,造成交叉口进口道异常停车等候、换道或者掉头等现象,扩大了交叉口的排队长度范围位置。 排队长度、通行时间、延误以及停车率作为评价交叉口通行效率和服务水平的重要指标,不仅反映整个交叉口的交通拥堵程度、车辆行驶平稳程度以及驾驶员的舒适性程度、车辆油耗和行驶时间损失,而且还可以反映信号规划与设计的合理程度,因而排队长度、通行时间、延误和停车率都是目前评价交叉口最为常用的评价指标。准确估计车辆在交叉口的各评价指标对改善交叉口运行状况、提高交叉口服务水平和整个路网的通行效率都有着重要的意义。 建立了交叉口通行效率评价指标体系和量化方法,并结合大规模浮动车数据对交叉口通行效率进行分析,提出基于粗糙集的通行效率影响因素定量分析思路,结合仿真方法分析了通行效率评价方法的适用性,得出如下结论。 (1)通过大规模浮动车数据和评价指标体系对目标交叉口4个进口道的服务水平分析发现,基于数据驱动的通行效率评价方法在动态分析交叉口通行效率方面有较强的可行性。 (2)在本文建立的通行效率评价指标体系中排队长度、延误、停车率和通行时间4个指标对通行效率的重要度分别为0.726 0、0.516 3、0.510 3和0.479 1,发现排队长度是动态准确判断交叉口通行效率和运行状态的关键因素,表明,基于粗糙集的通行效率影响因素定量分析方法在正确映射交叉口通行效率及其影响因素之间的非线性关系方面有较好的参考价值。 (3)从数据的可获得性、计算复杂度和实效性角度分析,本文提出的基于轨迹数据的评价方法在计算复杂度方面和仿真方法相比不具备优势,但从数据的可获得性方面具备较好的应用价值。从评价结果的实效性方面分析,智能交通大背景下,仿真方法有一定的优势。同时由于数据的精确度、仿真参数的不确定性等因素,导致2种方法所得出的结果也存在部分差异。2.4 仿真分析方法
3 实例验证
3.1 交叉口通行效率评价
3.2 通行效率影响因素分析
3.3 交叉口交通仿真分析
4 结论