APP下载

基于轨迹数据的短时交通流预测

2020-06-23楚潇蓉山东理工大学建筑工程学院胡玉龙中国交通通信信息中心

数码世界 2020年5期
关键词:交通流度量时空

楚潇蓉 山东理工大学建筑工程学院 胡玉龙 中国交通通信信息中心

逯跃锋 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室

引言

随着全球定位系统的快速发展,人们可以快速方便地获取GPS定位数据。轨迹数据存在大量的道路信息,且具有成本低、来源广,现势性高等特点,成为道路交通流预测的研究热点。国内外学者对于交通流预测进行了大量研究,并取得了一定的成果。历史平均法模型相对简单,但不能反映交通流的时变性,1981 年,Stephanedes 在交通控制系统中应用了历史平均模型。贺国光等根据时间序列模型理论和方法构建了行驶时间预测模型,并通过仿真实验进行了评估;唐毅等人对时间序列模型加以改进,动态选取样本数据并使用ARIMA(p,d,0)模型进行识别,实验表明该模型对不同的交通状况具有较好的适应性。王翔等人利用高速公路收费站数据,使用交叉验证方法计算K 值,改进了K 近邻非参数回归方法,该方法具有较好的预测精度。目前交通流预测面临的一个问题是大多数短时交通流预测算法仍然使用固定的环路检测器来获取交通数据,由于交通流的复杂性,单一的模型具有一定的局限性,多模型组合是未来发展的一个趋势。

1 交通流

交通流是指在道路上连续行驶的汽车形成的车流,广义上还包括其他类型车辆形成的车流和人们行走形成的人流。不同的参数对于道路交通来说代表不同的含义,可以据此研究道路交通流的变化规律和特征,同时也可以辅助道路规划和交通管控。它主要包括交通流量、交通流速度、交通流密度这三个基本参数。

2 非参数回归方法

非参数回归方法是一种非线性的统计建模方法。非参数回归方法对数据的分布和应用没有具体的限制,该方法非常灵活,主要取决于历史数据。其中状态向量、距离度量函数和预测函数是影响该方法的关键要素,需要根据不同的研究对象来进行确定。状态向量越能够描绘对象的特征、距离度量方式越能体现相近状态的相似性,预测结果的准确度也越高。

2.1 状态向量

状态向量是指能够影响被研究对象的因素组成的向量,它能够代表数据库中的数据特征,是实时数据与历史数据比较的标准,描述研究对象的状态向量可以有多个维度,这里主要从时间和空间两个维度定义状态向量。

在时间维度上,预测时间段t+1 时刻的状态与前n-1 个时间段的状态是相关联的。由于每个时间段与待预测时间段的接近程度不同,其影响权重也是不同的,本文采用指数权重来表示不同时间段的权重。时间状态向量由目标路段前若干个时段的交通流和相邻时段间交通流的变化趋势组成,其定义为:

交通流的状态还与相邻路段的状态有关,本文将状态向量从时间维度扩展到时间和空间两个维度即形成时空状态向量,其定义为:

2.2 度量函数

度量函数用来度量当前状态向量与历史状态向量间的相似性。结合上文中的时间状态向量和时空状态向量,这里的度量函数也定义为时间度量函数和时空度量函数。

时间度量函数指的是当前和历史时间状态向量间的距离,其定义为:

时空度量函数指的是当前时空状态和历史时空状态向量的距离,其定义为:

2.3 预测函数

近年来,有不少学者通过验证发现,基于秩次加权法的性能更好,因此本文选取该方法作为预测函数中的权函数,其定义为:

最终的预测函数为:

3 实验与结果分析

本文的实验数据来源于是2018 年2 月份的某地车辆轨迹数据。

3.1 研究范围数据提取

原始轨迹数据覆盖范围大,数据量多,造成数据加载等困难,首先截取出研究区域范围内的数据,然后筛选出符合时间要求的数据。数据属性信息包括车辆ID、GPS 时间、GPS 经度、GPS 纬度、GPS 速度、经度、纬度等7 个字段。截取出实验范围后,选择预测路段,预测路段如图1 所示。

图1 预测路段图

3.2 交通流预测

由于天气、树木遮挡等因素,设备会出现定位误差,导致存在一定的错误数据,需对重复数据和偏移数据进行预处理。将预处理后的轨迹数据存储在数据库中,前27 天的数据存入历史数据库,第28 天的数据存入当前数据库。本文以10 分钟为预测时间间隔,预测18:10~18:50 这五个时间段的交通流量和交通流速度,这里的交通流速度指路段的平均速度。

在时空状态向量中有2 个参数需要确定,通过多次实验可得,时间状态向量中的追溯时间d 的取值为1,预测函数中近邻数量k 的取值为5。

分别对使用时空状态向量预测的交通流速度和交通流量预测值和仅使用时间状态向量预测的交通流速度和交通流量预测值使用平均绝对百分比误差(Mean Absolute Percent Error, MAPE)进行精度评价,评价结果如下表所示。

表1 模型精度评价

从上表中可以看出使用时空状态向量模型预测的精度比仅使用时间状态向量模型预测的精度高,且MAPE 值都在15%以内。根据MAPE 模型预测能力评价表,一般MAPE ≤20%,就认为模型预测是有效的。时空状态向量的MAPE 均在15%以内,故模型的预测能力较好。在预测不同路段时可以根据路段实际情况调整参数设置。

4 结论

(1)本文将时间和空间两个因素加入预测模型,实验表明时间和空间两个因素共同影响着交通流的变化,利用这两个因素对交通流进行预测更准确。

(2)本文在对轨迹数据的预处理方面还有待提高,尤其是轨迹数据量较大,会造成空间存储和查询方面的问题,后期对这一方面进行研究。

猜你喜欢

交通流度量时空
有趣的度量
跨越时空的相遇
模糊度量空间的强嵌入
镜中的时空穿梭
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
玩一次时空大“穿越”
交通流随机行为的研究进展
时空之门
路内停车对交通流延误影响的定量分析
地质异常的奇异性度量与隐伏源致矿异常识别