APP下载

基于地图API 数据挖掘的道路交通运行状态分析

2020-08-21陈诗意潘义勇南京林业大学汽车与交通工程学院江苏南京210037

物流科技 2020年8期
关键词:高峰车速路段

陈诗意,潘义勇 (南京林业大学 汽车与交通工程学院,江苏 南京210037)

0 引 言

道路运行状态信息是交通规划、交通管理等所需的基础数据。根据交通流检测器、视频监测、卡口系统等传统方式获取道路信息具有滞后性,无法反应道路实时情况,收集数据的零散使得难以对数据进行分析和独立储存。而且这些数据由于国内开发机制的限制,交通行业研究人员很难获。地图API 的出现提供了一种新的思路:基于互联网地图自身的道路结构编写网页程序,根据需要添加各种功能模块,可获取实时的交通运行信息,获取历史数据进行存储,用于分析评价。数据信息的完整度和准确度较手机信令、传统地图app、出租车GPS 等数据有较大优势,方便对道路运行情况进行研究和分析,指导城市交通建设的发展。

对于目前应用地图API 的研究中,刘鹏程向百度服务器传递居住地和就业地的坐标,通过地图API 的路线查询功能计算职住距离[1]。王彬调取百度地图API 接口获取驾车路线规划方案,对万家丽高架进行交通运行评价[2],以上研究对路段平均行程车速的获取具有参考意义。对于城市交通运行状态方面的研究,裴文杰分析典型快速路路段交通流特性,提出了以速度、密度、饱和度为参数的运行状态分析指标体系[3],但是需要获取各种参数的数据用于综合评估,数据获取较为困难。对于交通运行状态可视化方面的研究,刘秀彩对交通数据进行可视化分析,利用基于时间、空间和交通属性的三维可视图谱分析大数据背景下的交通规律[4],但是对于海量数据存在的错误和信息缺失问题并没有进行深入研究。

本文在以上提及的研究基础上,研究利用百度地图API 获取24 小时路段实时行程车速,基于车速对交通运行状态的评价,但同样存在数据失真的情况,为此对异常数据进行了判定和处理。首先,为了消除其他因素影响或者周期变动幅度大导致难以显示道路交通运行状态发展趋势,选择用移动平均法对异常数据进行判定,即当实际值与预测值偏差大于50%时认为该数值失真。其次,利用线性插值将失真的数据进行处理,得到符合速度曲线特性的值,替代缺失和失真的数据。再次,以速度为评价对象,选择评价指标,对交通运行状态进行评价。最后,绘制出道路全程行驶时间变化图和拥堵时空分布图。直观地反映了速度时序特性和交通运行状态的时空演变规律。

1 基于地图API 数据挖掘

1.1 速度数据提取方法

百度地图提供了丰富的实例参考,在实际应用中,可以利用百度地图URI API 程序接口直接调起百度地图产品,相应地可以使用JavaScript API(Android/iOS 地图SDK)作简单的二次功能开发[11],包括地图展示、线路查询、导航等功能。浏览器端将获取驾车规划方案的请求发送至百度服务器,百度服务器会使用内部算法计算出规划方案的时间和距离数据返回给浏览器[5-6]。所以用HTML 语言编写可以定时重复调用的函数就可以隔一段时间获取实时的运行状态信息。具体流程如下:

(1)首先明确研究的道路范围,将道路分成多个路段,创建由各个微小路段的起终点坐标构成的数组,以百度地图API函数的格式定义:mycars[0 ]=new BMap.Point (110.32452,25.266469 )。

(2)在网页中创建Map 实例后,使用map.centerandzoom()方法定义地图,设置地图中的各项属性,包括地图的缩放级别,以及地图中心的显示等。

(3)通过设定间隔指定的毫秒数不停地执行代码的定时器实现相同时间间隔调用函数,考虑到地图数据更新速度,此处选择隔5 分钟调用一次函数。

(4)利用循环结构将起点坐标值赋给start,终点坐标值赋给end,使用driving.search (start, end )方法发起检索。为了获取路段的平均行程车速,则需创建一个驾车导航实例来获取驾车路线规划,可以通过DrivingRouteResult.getPlan()方法或WalkingRouteResult 类的getPlan()方法查询两点之间的驾车方案,利用返回总方案的驾驶路径的距离和行程时间可以得到每个路段的平均行程车速。

1.2 速度数据处理方法

调取速度过程中,出现了速度不合理的情况,这种情况分为以下两种:一是速度极低接近于零,二是通过前后速度对比,速度相差巨大。

在对数据进行分析过程中,得出造成数据误差主要存在以下的几个原因:(1)网络原因:运行的程序需要良好的网络连接环境,当网络环境不良时也会出现数据缺失的情况或者数据异常的情况。(2)样本数量原因:夜晚出行量少,会出现速度大大高于白天的情况。(3)系统原因:百度地图API 服务提供的函数主要是对大量获取的数据进行分析和处理得到的,包括出租车GPS 数据、交通管理部门提供的数据和导航数据,当这些大量数据上传至服务器可能因为耗时导致无法同步。而且这些数据来源的准确性也需要探讨。(4)交通原因:存在路边停车或者车流交织等问题。

综上所述,对于以上提出的存在数据误差的原因,需要对获取的速度数据进行判别和清洗处理,才能得到正常的数据来进行分析。

用公式(1)进行判断,当实际值与预测值偏差大于50%时视为异常数据,认为该数值失真[7]。

式中:x^i为预测值;xi为实际预测值;e 为偏差系数;k 为移动平均指数,可取6~10。

为了研究速度曲线的变化趋势和规律,利用公式(2)将失真的数据进行处理。在查询各种数值表时,可通过线性插值来得到表中没有的数值。因此线性插值函数是一个既能反应原函数的特性,也能近似原函数的函数。

式中:V (t1)为异常数据后一个速度值,V (t0)为异常数据前一个速度值,t1为异常数据的后一个速度值对应的时间,t0为异常数据前一个速度值对应的时间。该方法考虑了当前速度值的前后值进行修复,适合于对单个异常速度值的处理。

2 交通状态评价方法

对城市道路交通运行状态的分析必须有清晰和准确的理解,在评价时需要对影响因素进行量化,来进行评级。本文基于道路平均行程速度、拥堵时长、拥堵距离等进行综合评价。

(1)评价指标选取

根据不同评价对象,按照表1 选取评价指标。

(2)路段(道路)运行状态等级划分

根据路段或道路的平均形成速度和批准的道路坡度,路段或道路交通运行状态等级可分为5 级,如表2 所示,单位为km/h(其中代表路段(道路)的平均行驶速度)。

3 实例分析

3.1 分析范围及概况

表1 评价指标

表2 道路交通运行状态划分

本文选取了桂林市几条主要道路作为研究对象——上海路至漓江路、解放西路至解放东路、中山路、普陀路(如图1 所示)。

图1 研究道路范围

(1)中山路全长5.2 公里,为双向六车道,设计车速为60km/h;

(2)上海路至漓江路全长3.8 公里,为双向六车道,设计车速为60km/h;

(3)解放西路至解放东路全长1.2 公里,为双向六车道,设计车速为60km/h;

(4)普陀路全长2.2 公里,为双向四车道,设计车速为40km/h。

研究道路双向早晚高峰时间段如表3 所示。

表3 研究道路双向早晚高峰时间段

3.2 结果分析

(1)时序特性分析

中山路在凌晨到早高峰前的6.5 小时内最为畅通,而且速度数据波动较小,稳定性好。最小车速可以达到25km/h 以上即运行状态为畅通及以上的等级,在平峰时间段车速为15km/h 到25km/h 不等,总体运行状态处于拥堵。中山路北向南平峰相较高峰运行状态没有得到较好的改善。中山路24 小时内各个路段车速变化趋势一致,分布较均匀,有明显的双峰特征(如图2 所示)。

普陀路北向南比普陀路南向北方向速度的双峰特性更明显,普陀路南向北方向的早高峰出行与平峰时测得的速度相差不大,基本处于轻度拥堵的等级。普陀路上游路段比下游路段车速波动大,双峰特征更明显(如图3 所示)。

图2 中山路24 小时全程车速变化

图3 普陀路24 小时全程车速变化

漓江路除去早晚高峰时段,道路全程整体的速度比较稳定,波动小,运行状态达到轻度拥堵级以上的等级,运行状态良好。上海路至漓江路平峰时间段车速波动较大,具有不稳定性和不确定性(如图4 所示)。

解放西至解放东路除了凌晨到高峰前的6.5 个小时内速度可以达到25km/h 以上。其余时间的交通运行状态不佳,时常发生拥堵,早高峰结束后拥堵仍然持续数小时。24 小时速度分布图早晚高峰不突出,晚高峰通勤结束后拥堵仍然持续了3 小时。造成拥堵现象的原因可能是因为近期对十字街地下通道进行修建,封闭部分道路,而且附近是东西巷与正阳步行街两大商业休闲街区,尽管在工作日,大流量缓慢通行一般从17:00 持续到晚上22:00。解放西至解放东路拥堵情况最严重,车速波动大且不稳定,基本没有双峰特征,通勤晚高峰过后车速持续保持一个较低的水平(如图5 所示)。

图4 上海路至漓江路24 小时全程车速变化

图5 解放西至解放东路24 小时全程车速变化

(2)时空特性分析

中山路北向南早高峰时间为6:35~10:00,拥堵时长为1.25 小时,拥堵距离为5 千米;晚高峰时间为16:40~18:45,与早高峰拥堵时长相同,拥堵距离为4.4 千米,道路最拥堵路段是整段中山北路。南向北方向晚高峰拥堵情况较早高峰严重,而北向南方向相差不大。拥堵里程比例为48.73%,中山路南向北早高峰时间为7:15~9:35,拥堵时长为2.25 个小时,拥堵距离为5.192千米;晚高峰时间为16:35~19:10,拥堵时长2 小时,道路最拥堵的路段为南方大厦到叠彩路—中山北路交叉口。拥堵里程比例为46.55%(如图6 所示)。

普陀路北向南方向早高峰时间为7:40~9:55,拥堵时长为1.5 个小时,拥堵距离为1.6 千米,晚高峰时间段为17:05~19:30,拥堵时长为2.25 个小时,拥堵距离为1.6 千米,拥堵路段从桂林国际商贸城前漓江路到广西师范大学育才校区附近的路段。拥堵里程比例为24.64%。南向北方向的早高峰时间为7:15~9:05,拥堵时长1.8 个小时,拥堵距离为1.416 千米,晚高峰时间段为17:55~20:45,拥堵时间为2.75 个小时,拥堵距离为1 千米。早晚高峰拥堵路段相同。拥堵里程比例为39%(如图7 所示)。

图6 中山路北向南及南向北拥堵时空分布图

图7 普陀路北向南及南向北拥堵时空分布图

上海路至漓江路道路路段东向西方向早高峰时间为7:10~9:05,拥堵时长达到了1.8 个小时,拥堵距离为3.6 千米;晚高峰时间为17:55~20:25,拥堵时长为2.3 个小时,主要拥堵路段是上海路往桂林站的方向。拥堵里程比例为61%。西向东方向早高峰时间为2 个小时,拥堵时长为1.6 个小时,拥堵距离为3.4 千米,最拥堵的路段是桂林国际会展中心前的漓江路到桂林站附近的路段。拥堵里程比例为56.3%(如图8 所示)。

解放西至解放东路东向西方向早高峰时间为7:00~9:00,拥堵时长达到了2.3 个小时,拥堵距离为0.635 千米;晚高峰时间为17:55~20:05,拥堵时长为5.3 个小时,拥堵路段是桂林中学门前交叉口至微笑堂交叉口路段。拥堵里程比例为82.2%。西向东方向早高峰时间为6:55~8:35,拥堵时长为1.4 个小时,拥堵距离为0.825 千米,最拥堵的路段是桂林中学前交叉口至东西巷西南门入口路段。拥堵里程比例为67%(如图9 所示)。

图8 上海路至漓江路东向西及西向东拥堵时空分布图

图9 解放西至解决东路东向西及西向东拥堵时空分布图

4 结 论

对研究对象的分析得到道路运行状态的特性:

(1)时序性

运行状态的变化在时间序列上的演变规律与时间有很大的关系[9]。对于非偶然性、常发性的拥堵规律,是可以通过历史数据分析得到的。由于道路本身固有的时序性,其速度也会呈现周期性演变。本研究对车速数据进行整理和清洗之后换算成行程时间得到了24 小时行程时间分布图。图中每条研究道路的行程时间基本都呈现了较为明显的双峰特征。所有研究的道路在凌晨到早高峰前的一段时间内最畅通。在早晚高峰结束之后,通勤交通出行结束,拥堵等级降低[8]。晚高峰拥堵情况比早高峰严重,持续时间更长,拥堵距离更长。

(2)时空性

路段拥堵产生和消散明显有传递特性[10],拥堵状态变化由开始拥堵路段通过空间传播给下游路段,使得下游路段经过一段时间差后可以获得和上游拥堵路段相类似的运行状态驼峰。

(3)时间临近性规律

研究发现主干道的平均行程车速的波动比支路大,即主干道的车速比支路更具有不稳定性。支路的速度分布趋势的时间相关性更突出,当进行交通运行状态预测的时候,要更为重视相邻时间段的交通运行状态。而且对于等级高的道路以较精细的速度进行运行状态的分级,说明了出行者在设计速度大的道路上行驶时对于基于速度分级的运行状态感受更敏感。

本文获取到的可以用于分析的数据只有时间和速度,存在评价角度单一、影响因素分散的问题。考虑全局的交通运行特性问题需要进一步研究。

猜你喜欢

高峰车速路段
冬奥车道都有哪些相关路段如何正确通行
病毒病将迎“小高峰”全方位布控巧应对
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
石庆云
基于XGBOOST算法的拥堵路段短时交通流量预测
2012款奔驰R300车修改最高车速限制
雨天早高峰,自在从容时。
北京现代途胜车车速表不工作
两车直角碰撞车速计算方法及应用