高速公路施工控制区动态交通流预测的LSTM-BiGRU-Attention模型

2024-01-20韩晓,陈昕,肇毓

交通科技与经济 2024年1期

韩晓 ,陈昕,肇毓

(1. 辽宁工业大学汽车与交通工程学院,辽宁锦州 121000; 2. 辽宁省高速公路运营管理有限公司,沈阳 110000)

随着城镇化进程的加快,迅速增加汽车保有量与有限的道路资源出现矛盾,极大地影响了可持续绿色交通业的发展。动态交通流指的是车辆在交通路网上的实时运行情况。高速公路施工控制区一般存在速度限制、车道限制,有临时的标志和标线。该区域也常有施工人员和设备以及交通管理部门进行临时的交通管控。因此准确对高速公路施工控制区动态交通流进行预测能实现高速公路施工控制区段的交通优化管理,从而达到减少拥堵、优化道路利用资源、预防交通事故发生的目的,提高交通运输系统的运输效率与服务质量。

目前,涉及交通流预测的研究方法大致分为四大类:

第1类是基于时间序列分析:这类方法是基于历史交通数据的时间序列模式。Bartholomew[1]将时间序列方法整理,主要介绍了时间序列的基本理论和方法,并涉及了预测和控制的应用。韩超等[2]提出了一种基于ARIMA模型的短时交通流实时自适应预测算法,利用带有遗忘因子的递推最小二乘方法进行参数估计,并应用了基于线性最小方差预测原理的Astrom预测算法进行交通流的预测。聂佩林等[3]为解决单一交通流预测模型性能不稳定的问题,使用约束卡尔曼滤波方法来对每个预测模型进行状态更新和预测。齐驰等[4]提出了一种自适应的单指数平滑法,通过引入近似动态规划方法并结合实际交通流数据,优化了指数平滑系数。通过自适应调整,预测结果能够更好地适应交通流变化。Tiao等[5]讨论了一类向量自回归移动平均模型的性质。

第2类是基于统计回归分析:这类方法使用统计回归模型来建立交通流量和速度与各种影响因素的关系模型,如时间、天气、道路几何特征等。通过回归模型,可以预测未来交通流量和速度,并评估各种因素对交通流的影响。

第3类是基于机器学习算法:这类方法使用机器学习算法进行预测。如杨胜等[6]运用决策树对城市道路上下游短时交通流量关系进行了分析,并建立了相应的规则库,得到了一个城市短时交通流的预测方法,为城市交通流控制与诱导提供了良好的基础。杨兆升等[7]在已有预测模型的基础上,考虑到交通流的非线性、复杂性和不确定性,提出支持向量机(SVM)的短时交通流量预测模型。陈忠辉等[8]提出了基于FCM和随机森林(Random Forest)算法的短时交通状态预测方法。该方法在融合时空信息的基础上,利用随机森林算法具有较高的预测精度,可提供实时可靠的短时交通状态信息。还有其他图类方式比如概率图模型,它结合概率论和图论,交通流已知和预测变量的联合概率,由图展示出来[9]。如Bai等[10]提出用于交通预测的注意力时间图卷积网络模型。汪鸣等[11]提出的门控循环图卷积网络(GR-GCN)模型。

第4类是基于智能交通系统与数据挖掘方法:这类方法结合智能交通系统技术和数据挖掘方法,利用实时交通数据进行动态交通流预测。Li等[12]利用学习方法预测大数据下交通流量。该方法使用长短时记忆(LSTM)网络结构对历史交通流量数据进行建模和训练,从而实现对未来交通流量的预测。此外还引入了一个特征选择方法来选择最具代表性的特征。Ma等[13]提出使用卷积神经网络的方法,将时空交通动态转换为图像,通过二维图象描述交通流的时空关系时空矩阵。罗文慧等[14]通过CNN进行特征提取,然后将提取的特征输入到SVR进行流量预测。通过实时数据的监测和分析,可以更新预测模型并调整预测结果,实现对动态交通流的准确预测。王祥雪等[15]提出了基于LSTM-RNN的城市快速路短时交通流预测模型,捕捉交通流的时空相关性对时间序列进行重构,通过模型训练来识别和增强时空关联特性。张文松等[16]提出了一种基于深度学习的组合方法,通过利用CNN捕捉交通流的空间特性和使用LSTM和GRU挖掘交通流的时间特性,构建了一个综合的交通流参数估计模型,以提高估计精度。

以上四大类方法都具有一定的优势和适用场景。首先,传统的交通流预测模型对于复杂的非线性关系和非平稳性的交通流数据的建模能力有限,但深度学习的发展为动态交通流预测领域带来了更多可能[17]。其次,以往主要研究的是道路断面流量、速度预测等方面,对单车道的研究较少且存在历史数据数量少和质量不高的问题。最后,大多数研究着眼于短期交通流预测,缺乏对长期趋势准确预测的能力。因此,文中以半幅施工状态下的高速公路施工控制区为研究对象,创新性提出LSTM-BiGRU-Attention深度学习模型,即在LSTM的基础上结合双向循环神经网络(Bidirectional Recurrent Neural Network, BiGRU)和注意力机制(Attention Mechanism)。该模型能够更好地捕捉时序特征和上下文信息,在处理长期依赖性方面表现出较好的能力,有助于提高高速公路施工控制区动态交通流预测精度,为动态交通规划与管理提供参考依据。

1 LSTM-BiGRU-Attention模型研究

LSTM-BiGRU-Attention模型是一种深度学习模型,它基于循环神经网络(RNN)结构,由三个关键组件组成。一是,模型中长短期记忆网络(LSTM)。LSTM具有记忆单元,可以捕捉和存储长期依赖关系,有效地处理时间序列数据。二是,双向门控循环单元(BiGRU)。BiGRU可以同时考虑过去和未来的上下文信息,通过正向和反向传播进行信息的交互和整合,从而更好地理解序列数据中的复杂关系。三是,注意力机制(Attention)。它能增强模型的表达能力。该机制可以自动学习并集中关注输入序列中重要的部分,提取关键信息,从而提高模型对于关注点的准确性和敏感性。该模型可以准确地预测交通流量,为高速公路施工控制区的交通管理与规划提供有益参考。

1.1 模型构架与原理

1.1.1 LSTM

LSTM可以解决传统RNN在捕捉长期记忆方面存在困难的问题。它通过借助门控单元有效地捕获时间序列的长期依赖关系。LSTM的基本单元包括记忆单元、输入门、遗忘门和输出门。在计算过程中,LSTM利用当前输入和上一个时间步的隐藏状态、记忆状态,通过输入门、遗忘门、输出门和记忆单元进行运算,从而得出当前时间步的隐藏状态和记忆状态。然后将这个结果作为下一个时间步的输入,以此实现连续的时间序列预测[18]。简单来说,LSTM可以有效处理时间序列中的长期记忆,并可以用于连续预测问题。其计算公式如下:

1)输入门:输入门决定了当前时间步的输入信息对细胞状态的影响程度。

i(t)=σ(wi×[h(t-1),x(t)]+bi)

(1)

式中:wi和bi代表输入门的权重矩阵和偏置向量;x(t)是当前时间步的输入;h(t-1)是上一时间步的隐藏状态;σ是sigmoid激活函数。

2)遗忘门:遗忘门决定了上一时间步的细胞状态对当前时间步细胞状态的影响程度。

f(t)=σ(wf×[h(t-1),x(t)]+bf)

(2)

式中:wf和bf是遗忘门的权重矩阵和偏置向量;x(t)是当前时间步的输入;h(t-1)是上一时间步的隐藏状态;σ是sigmoid激活函数。

3)记忆单元的更新:细胞状态更新通过一个tanh激活函数来计算一个候选的细胞状态。

c(t)=f(t)×c(t-1)+i(t)×

tanh(wc×[h(t-1),x(t)]+bc

(3)

式中:wc和bc代表更新记忆单元的权重矩阵和偏置向量;x(t)是当前时间步的输入;h(t-1)是上一时间步的隐藏状态。

4)输出门:输出门决定了当前时间步隐藏状态的输出。

o(t)=σ(wo×[h(t-1),x(t)]+bo)

(4)

式中:wo和bo代表输出门的权重矩阵和偏置向量;x(t)是当前时间步的输入;h(t-1)是上一时间步的隐藏状态;σ是sigmoid激活函数。

5)隐藏状态:隐藏状态通过输出门和细胞状态的tanh激活函数来更新。

h(t)=o(t)×tanh(c(t))

(5)

式中:tanh是双曲正切激活函数;o(t)代表输出门。

1.1.2 BiGRU双向门控循环单元

BiGRU模型是循环神经网络(RNN)的变种,具有前后两个方向的循环计算单元,这样能够同时捕捉时间序列数据的前后信息,更加全面地理解数据中所存在的依赖关系,从而提高时间序列在动态交通流预测中的准确度[19]。图1为BiGRU结构。

图1 BiGRU结构

1.1.3 注意力机制在交通流预测中的应用

注意力机制(Attention Mechanism)在交通流预测中可以更好地捕捉交通流数据的信息,从而提高交通流量预测的准确度[20]。注意力机制在交通流分析中的应用具体表现在:

1)基于时间序列特征的注意力权重计算。在注意力机制中,将时间序列数据作为模型的输入,根据每个数据的重要性自适应地计算每个事件步的注意力权重。通过不同时间段,模型展示效果的差异,能够聚焦到重要时间段上。

2)特征加权和选取。基于对时间序列特征的加权,可以将注意力集中在与交通流预测关联度更大的特征上,过滤掉无关信息,以便获得更好的交通流预测结果。

3)空间关联性的建模。通过注意力机制,模型可以更加精准地捕捉到不同空间位置的交通流信息,从而提高不同空间的交通流预测能力。

4)对异常交通流数据进行处理。注意力机制可以减少模型对确实数据的依赖,提高有效数据的利用率。

1.2 模型预测流程

研究提出的LSTM-BiGRU-Attention模型预测高速公路施工控制区动态交通流数据集的预测流程如图2所示。首先,对原始数据进行预处理和特征选择。其次,按照8∶2比例将数据集划分为训练集和测试集,将提取的特征信息输入至LSTM-BiGRU模型中,捕捉时序特征和上下文信息。通过权重分配,利用注意力机制将模型聚焦在更加重要的特征上,减小模型误差并提高预测精度。最后,通过对模型的训练,可视化模型预测结果与测试值,提高模型的直观性与可解释性。

图2 LSTM-BiGRU-Attention模型预测流程

1.3 模型优势与特点

LSTM-BiGRU-Attention模型能够充分捕捉时间序列中的长期依赖关系。LSTM通过门控机制选择性记忆和遗忘过去的信息,而BiGRU结合了前向和后向GRU,能够更加全面理解时间序列的特征。该模型可以处理多模态的交通流数据,如本研究中的车辆速度、交通流量、小车比例、车头时距等。通过引入注意力机制,模型可以自动关注重要的时空特征。这种综合利用多模态信息的能力有助于提高动态交通流预测的准确性和可靠性。除此之外,模型能够进行可视化,为交通决策者提供更加直观的结果。

2 LSTM-BiGRU-Attention模型训练与测试

2.1 高速公路施工控制区交通流特点

高速公路施工控制区的交通流相比较于正常运行的高速公路交通流有一些不同之处:

1)交通流量限制:高速公路施工控制区的交通流受到施工活动的限制,可能存在道路封闭、车速限制等措施,导致交通流受限。而正常运行的高速公路没有限制措施,交通流更为顺畅。

2)交通流量极化:相比于匀称、持续运行的高速公路交通流,高速公路施工控制区的交通流量在施工区域附近集中,车速较慢。在限制措施解除或者施工结束后,交通流量又会集中释放。

3)安全风险增加:施工控制区域伴随着施工设备和工人的存在,交通安全风险增加。

2.2 动态数据集来源

文中研究基于G35济广高速公路某全长为2 400 m施工控制区单车道行驶的车辆运行数据。G35济广高速公路每条车道宽度为3.75 m,设计速度为80～120 km·h-1,路基宽度28 m。该区段施工类型为半封闭占用车道施工形式,如图3所示。

图3 半封闭式施工控制区

图中从下到上的符号依次代表着警告区、上游过渡区、缓冲区、工作区、下游过渡区和终止区。采集数据8个属性包括采集数据的时间,数据采集的位置、路基宽度(m)、施工控制区全长(m)、车辆行驶速度(km·h-1)、车流量(pcu·15 min-1)、车头时距(s·pcu-1)、小车比例等[21-22]。

2.3 预测模型输入参数特征选取

真实的高速公路施工控制区交通运行数据通常是数量庞大且无序杂乱的,在确定研究目标后并不是所有的指标都需要考虑。对大量有序或者无序的进行信息整合、提取、展示以便发现研究对象的内在规律。首先,文中的预处理是对数据集进行异常值处理、数据清洗以及数据编码,得到2 304组样本数据,数据规模为2 304×8。

其次,实验对数据集进行特征选取,由相关性计算结果可知,车流量(pcu·15 min-1)与车头时距(s·pcu-1)、车速(km·h-1)存在强烈的负相关性,车流量(pcu·15 min-1)与小车比例呈现弱负相关,而车流量(pcu·15 min-1)与交通状态表现出强烈的正相关。

表1 特性参数相关性系数

由此,与车流量(pcu·15min-1)特征相关性最强的4个特征分别是:车头时距(s·pcu-1)、车速(km·h-1)、交通状态、小车比例。

2.4 模型预测精度分析

为验证LSTM-BiGRU-Attention模型预测高速公路施工控制区动态交通流的有效性,研究选取了另外5种模型与其做对比,分别是:LSTM模型、BiGRU模型、BiGRU-Attention模型、LSTM-BiGRU模型以及ARIMA模型。采用均方误差(MSE)作为损失函数,adam作为优化器,时间步长为5进行实验。为了保证实验公平有效,6组实验的数据集一致且实验环境相同。其次,为了提高模型的预测精度,研究进行多次交叉验证得出不同模型的实验参数。在2 304组样本中,选取80%作为训练样本,20%作为验证样本。通过采集到的交通流量数据集训练模型得到6组预测结果,但由于LSTM模型与ARIMA模型预测效果差,故剔除不再考虑。

图4是LSTM-BiGRU-Attention模型对该高速公路施工控制区进行动态交通流预测结果与预测效果较好的BiGRU、BiGRU-Attention、LSTM-BiGRU 3种模型实验对比图。由图4可知,LSTM-BiGRU-Attention模型相比于其他实验模型更加贴近真实的数据且误差较小,在高速公路施工控制区动态交通流预测方面具有较好的准确度与有效性。

图4 多模型预测对比

3 模型结果分析与讨论

3.1 模型性能评估指标

研究采用4种模型性能评估指标进行预测结果准确性分析,分别是:平均绝对误差(MAE)、均方根误差(RMSE)、决定系数(R2)和平均绝对百分数误差(MAPE),各评估指标计算公式如下:

1)MAE:

MAE=(1/n)×∑|ypred-ytrue|

(6)

2) RMSE:

(7)

3)R2的计算:

(8)

4)MAPE:

MAPE= (1/n) ×∑|(ytrue-ypred)/

ytrue| ×100%

(9)

式中:n是样本数量,ypred是模型的预测值,ytrue是对应的真实值;ymean是模型的平均值。

3.2 模型性能评估结果分析

实验表明,LSTM-BiGRU-Attention模型的平均绝对误差MAE、均方根误差RMSE、平均绝对百分数误差MAPE数值均小于其他五组模型。ARIMA模型与LSTM模型的决定系数R2值为负数,说明这2个模型拟合效果比简单地平均预测要差,并且可能出现明显的偏差,模型预测效果差。

6组实验具体结果如表2所示。

表2 6组实验结果对比表

对于平均绝对误差MAE值,LSTM-BiGRU-Attention模型相比BIGRU模型下降0.36,相比LSTM-BiGRU模型下降0.41。对于均方根误差RMSE值,LSTM-BiGRU-Attention模型相比BIGRU模型下降0.17,相比BiGRU-Attention模型下降0.91,相比LSTM-BiGRU模型下降0.3。对于决定系数R2值,LSTM-BiGRU-Attention模型与BiGRU模型、LSTM-BiGRU基本持平。对于平均绝对百分比MAPE值,LSTM-BiGRU-Attention模型比BiGRU模型下降0.61,相比BiGRU-Attention模型下降1.01,相比LSTM-BiGRU模型下降0.67。

4 结论

1)针对高速公路施工控制区交通运行速度减缓、车辆密度集中、安全风险增加等特点,建立LSTM-BiGRU-Attention动态交通流预测模型,并与其他模型进行对比实验。实验结果表明,该模型的平均绝对误差MAE为1.91,均方根误差RMSE为2.83,决定系数R2为0.79,平均绝对百分比MAPE为3.23。对比其他模型,LSTM-BiGRU-Attention模型的4个评估指标均有所下降,可为高速公路施工控制区提供更加精准的预测模型。

2)建立LSTM-BiGRU-Attention深度学习组合模型并以G35济广高速某处高速公路施工控制区实际交通流运行数据为案例对模型进行实验验证。模型首先使用LSTM捕捉数据之间的长期依赖关系[23]。其次为了更好地利用上下文信息,引入BiGRU分别从正反两个方向捕获序列模式。最后采用Attention机制[24],进一步提高模型性能,使模型能够关注关键的时间步。通过此模型,能够更好地捕捉序列数据中的长期依赖关系和上下文信息。

3)在后续研究中,可以进一步考虑天气[25]和空间特性等影响因素,提高模型的泛化能力。以及可以更加全面覆盖交通场景和时间段以提高可用数据的质量和规模,更加专业地调整参数以获得最佳性能,弥补模型的局限性。