APP下载

基于AGRU-Trans融合模型的特长海底隧道交通量预测

2024-01-31谢文红陈耀鹏张素磊

青岛理工大学学报 2024年1期
关键词:胶州湾海底隧道交通量

黄 欣,谢文红,陈耀鹏,李 翔,张素磊,4,*

(1.青岛理工大学 土木工程学院,青岛 266525;2.台州市杭绍台高速公路有限公司,台州 318000;3.青岛国信建设投资有限公司,青岛 266000;4.青建集团股份公司,青岛 266071)

随着社会经济水平的发展与城市规模的扩大,我国城市机动化水平日益提高,海底隧道里程也在不断增加,交通拥堵问题愈发严重,交通事故频发,因此迫切需要有效的交通控制和诱导策略。构建智慧交通系统(ITS)能够更好地改善交通拥堵,缩短出行时间,提高通行安全性。交通量预测通过实时交通数据的信息滚动来预测未来的交通状况,是对车辆进行精细化诱导及管控的重要依据。

目前,国内外针对交通量预测的相关研究提出了大量预测方法。WILLIAMS等[1]提出了季节性ARIMA模型并结合交通量周期性的特征,来提高交通量预测的精度;李文勇等[2]对ARIMA模型交通流预测方法进行改进,构建实际交通流量数据均值和方差之间的函数关系,并因此推导出交通量时间序列的方差齐次转换函数。但由于传统交通量预测模型为浅层结构,无法对特定函数族进行有效的表征从而获取数据集的本质特征[3],且对于高维度数据集运用传统预测方法会造成维度灾难问题[4]。

随着计算机技术的发展,研究人员提出了大量智能预测方法。罗向龙等[5]对交通流进行特征分析,在网络顶层连接支持向量回归模型进行交通量预测,相比于传统交通量预测模型具有更高的预测精度;WANG等[6]结合实验客运量数据,通过与基准预测模型进行对比,验证了LSTM网络能够取得较好的预测性能,同时分析了各种参数设置对LSTM预测性能的影响;沈庙生等[7]通过对实测交通流量数据进行实验,得到了考虑缺失值修复的Dropout-LSTM的高速公路流量预测模型相较长短期记忆模型预测精度更高的结论;温惠英等[8]提出基于Bi-LSTM的方法,研究表明,该模型在非线性交通流数据中具有更好的预测性和广泛性;SUN等[9]针对道路网络交通流,提出了一种新的基于最大似然的选择性堆叠门控循环单元模型( SSGRU ),得出应用于所有道路场景的多道路输入基础设施时,该模型比其他模型具有更高的准确性的结论。殷礼胜等[10]基于考虑短时交通流量时间序列的复杂非平稳性、空间相关性和时间依赖性特性,提出改进的VMD-GAT-GRU交通量融合预测模型,相较于基准模型,其预测精度及收敛速度均有所提升。汪鸣等[11]结合Transformer算法提出多时间尺度时空图网络模型,并通过消融实验证明了该模型提升预测性能的有效性。

上述研究提出的模型仅关注高速公路短期交通量预测,训练所用数据量较少,忽略了具有城市道路功能的海底隧道中短期交通量在时间跨度内的变化规律,且用于交通量预测算法更多集中于LSTM及其融合模型,针对新提出的GRU模型及Transformer模型研究较少。本文提出基于AGRU-Trans融合模型的海底隧道交通量预测模型,以小时为跨度、近一年交通数据量为训练,对海底隧道交通量进行预测,通过结果分析,验证了该模型相比其他基准预测模型具有更高的预测精度,为胶州湾海底隧道管理部门对车辆进行精细化诱导及管控提供了理论参考。

1 交通量预测模型

交通量预测模型的不断优化进一步推动了交通流预测技术的发展,大量学者从多元时间序列联合预测[12]、量化时间序列噪声的随机性[13]、分析不同观测时间尺度的时间序列构成[14]等多个角度提出研究方法。单一模型预测无法很好地满足预测的需要,为了提高预测精度,组合模型、切换模型、模型优化等方法被广泛使用[15]。

1.1 LSTM模型

长短期记忆(LSTM)模型[16]是循环神经网络(RNN)的改进变体。相比于普通的RNN,LSTM能够在更长的时间序列中有更好的表现。该模型通过增加遗忘门、输入门和输出门等门控单元来克服传统的循环神经网络模型梯度消失或梯度爆炸的问题[17]。其中遗忘门利用激活函数sigmoid对上一时刻的记忆状态进行选择性地遗忘或者保留,输入门利用tanh函数生成该时刻记忆状态的候选值,然后再通过与该时刻输入门输出值进行元素对位相乘,以控制该时刻的记忆状态是否发生更新,而输出门为控制记忆状态输出到LSTM的当前输出值。LSTM的神经网络结构如图1所示,其计算公式如式(1)-式(6)所示。

图1 LSTM的神经网络结构

ft=σ(Wf·[ht-1,xt]+bf)

(1)

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

(4)

ot=σ(Wo·[ht-1,xt]+bo)

(5)

ht=ot*tanh(Ct)

(6)

1.2 GRU模型

门控循环单元神经网络(GRU)是由K. CHO等在2014年提出的,它同LSTM一样也是传统RNN的变体,能够有效捕捉长序列之间间隔较大的依赖关系。GRU是对LSTM复杂模型结构的精简改进,在获取将来时段信息数据过程中,保证信息数据准确率的同时速度也得到提升。它的核心结构分为更新门及重置门两个部分[18],GRU单元结构如图2所示。其计算公式如式(7)-式(10)所示。

图2 GRU单元结构

zt=σ(Wz·[ht-1,xt])

(7)

rt=σ(Wr·[ht-1,xt])

(8)

(9)

(10)

LSTM和GRU都通过门控机制保留了前一序列的有用信息,克服在长期传播过程中丢失的问题。但由于GRU参数个数较少,所以GRU整体运行速度相比LSTM更快。然而GRU有着循环神经网络结构本身不可并行计算的弊端,在未来数据量和模型体量持续增大的趋势下,仍需进一步优化。

1.3 Attention based GRU(AGRU)模型

通过来自注意力机制的嵌入信息修改GRU架构后,AGRU可以有效地提取复杂查询中的关键信息。AGRU使用权重来代替GRU的更新门,权重越大,当前时刻隐藏状态更新的信息就越多,之前的信息遗忘的也就越多,该方式需要修改GRU单元内部的计算公式,计算见式(11)。

(11)

式中:h′t为AGRU时间步为t时隐藏层的输出变量;at为权重。

1.4 Transformer模型

除上述算法可以处理时间序列数据以外,近几年由Google提出的Transformer算法同样可以解决梯度消失问题以处理时间序列数据,其中的注意力机制运行原理实现了并行计算,相比于只能串行计算的RNN极大地提升了运行速度。基于以上特性,Transformer一经提出就引起了研究者的广泛关注,在机器翻译、阅读理解、文本摘要等多个领域展现出了优异的应用效果[19]。本文将Transformer模型引入到交通量预测领域,为其增加了新的应用场景。该算法基于编码和解码构建,解码部分比编码部分多了一个交互层和一个被掩盖的多头注意力机制。由于编码部分和解码部分相差不大,为方便介绍,本文主要介绍Transformer算法的解码部分。Transformer算法解码部分的结构如图3所示。

图3 Transformer算法解码部分结构

其中位置编码计算见式(12)-式(13)。

(12)

(13)

式中:P为位置编码;p为时间序列的位置;dmodel表示模型的维度。

1.5 基准模型优劣比较

基于以上分析,对LSTM,GRU,AGRU及Transformer 4种交通量预测模型间优劣进行整体对比分析,见表1。

表1 基准模型优劣比较

1.6 AGRU-Trans融合预测模型

基于以上分析,本文提出了基于AGRU-Trans的融合预测模型,如图4所示,操作流程如下:

图4 AGRU-Trans融合模型结构

1) 对数据集进行划分,分为训练集和测试集;

2) 将数据集分别输入至AGRU模型和Transformer模型中进行训练;

3) 将Transformer模型输出值进行降维后与AGRU模型的输出值利用concat函数进行拼接;

4) 最后将拼接后的矩阵通过全连接层输出相应的预测值矩阵。

2 胶州湾海底隧道交通信息数据特征分析

本文所依托的隧道工程为青岛胶州湾隧道,该隧道是连接青岛市市南区与黄岛区的双向六车道海底公路隧道,全长7.8 km,隧道纵断面最大坡度为3.9%,内净空高10.391 m,宽14.426 m。该隧道的建成,不仅有效缩短了两岸间的通行距离,而且极大缓解了交通运营压力,缩短了人们的出行时间。

对具有城市道路功能的海底隧道中短期交通量在时间跨度内的变化规律进行研究。由于该隧道2021年6月底进行大区段增设可变道路段,为提高训练精度,因此选取胶州湾海底隧道2021年7月1日到2022年5月18日时间跨度为1 h的交通量数据信息,经处理后的数据共有7464条,对处理后的交通量数据按照时间进行可视化操作,如图5所示。交通量的数值虽然在0~4200 veh/h,但是主要的交通量数值还是集中在0~2500 veh/h。

图5 胶州湾隧道交通量分布示意

为近一步了解目前胶州湾隧道内交通量的特性,且避免初始或结尾数据以及数据的偶然性对交通参数规律性造成影响,本文选取中间时间段2021年8月30日到2021年9月20日3周内的交通信息数据进行细化处理,并针对1周内的交通数据规律性进行分析。图6为各交通量1周内的可视化数据。

从图6中可以看出,交通量变化规律呈现出周期性和时间相关性,并非杂乱无章。1周内工作日通过海底隧道的交通量相较于休息日更多,休息日高峰期呈现滞后性,这突出反映了交通参数和人们的出行习惯具有很强的相关性。

3 实验基础

3.1 评估指标

本文采用平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和拟合优度可决系数R2作为模型预测精度的评价指标。MAE表示的是真实值和预测值之间的绝对误差的平均值;RMSE可以测量误差的平均大小,是真实值与预测值偏差的平方与实测次数n比值的平方根;R2可以衡量预测曲线对于真实数据拟合效果的好坏,R2越大说明拟合效果越好,R2的最优值为1[20]。

(14)

(15)

(16)

3.2 超参数设置

设置超参数回溯时间窗为24,即每次输入一个交通信息数据,模型都需要考虑前24 h数据的值;设置分批大小为32,即模型一次训练所选取的交通信息数据数,可以减少模型训练的时间,从而能及时反馈预测的值;学习率为5×10-4,用以反向传播更新梯度参数和权重系数;隐藏层单元数设置为100个;层数设置为4层;最后设置迭代次数为100次。

3.3 对比模型选取

为检测模型精度,将所选模型和其余基准模型进行对比,基准模型包括:长短期记忆模型(LSTM)、门控循环模型(GRU)、Transformer模型。

4 实证研究

4.1 数据来源

本实验采用青岛胶州湾海底隧道交通量数据,以青岛市市南区-黄岛区作为研究对象。将2021年7月1日-2022年5月18日按时间跨度为1 h交通量数据信息进行划分,将前面80%的数据作为训练集,最后20%的数据作为测试集用以判断训练后模型的性能状况。

4.2 结果对比

分别通过4种模型对海底隧道交通量数据进行训练和预测,如表2所示,在4种模型中,AGRU-Trans融合模型的MAE值和RMSE值相比基准模型最小,其R2也最接近于1,具有良好的预测性能与精度。

表2 各模型预测效果比较

通过表2可以看出4种模型的R2均大于80%,可以认为4种模型在交通量预测上均有较好的预测性,而Transformer模型预测误差相对更大,究其原因为Transformer模型算法完全基于self-attention,对于位置之间的信息有一定的丢失。GRU模型的拟合程度略高于LSTM模型,这与时空序列预测的结论一致[21]。LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分别大了31.48%,67.55%,20.57%;RMSE值分别增长了35.64%,38.46%,32.03%。

由于交通量数据多、重复率高且交通量变化规律呈现出周期性和时间相关性,为更清晰展示模型预测结果,本文选取基准模型中预测性能最好的GRU模型与本文所提出的AGRU-Trans融合模型为研究对象,对某包含早晚高峰时刻的120个预测数据和真实数据进行对比。从图7中可以直观看出,AGRU-Trans融合模型的预测结果与真实数据贴合性最好,预测精度高于基准模型,在交通量波动大的时段预测结果更接近真实值。

5 结论

1) 通过对循环神经网络和Transformer算法的研究,结合GRU与Transformer模型算法优点并加入自注意力机制,提出一种基于AGRU-Trans融合模型的海底隧道交通量预测模型用以对青岛胶州湾海底隧道交通信息数据进行预测,该模型预测结果与真实数据贴合性好,具有良好的预测性能和精度。

2) 选取胶州湾海底隧道市南区-黄岛区交通数据,通过AGRU-Trans融合模型与3种基准模型对比发现,LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分别大了31.48%,67.55%,20.57%;RMSE值分别增长了35.64%,38.46%,32.03%。表明:AGRU-Trans融合模型的预测结果与真实数据贴合性最好,预测精度均高于基准模型。

本文提出的基于AGRU-Trans融合模型的海底隧道交通量预测模型对交通规划及交通控制有积极意义,基于此方法可为胶州湾海底隧道管理部门对车辆的诱导及管控提供理论参考。

猜你喜欢

胶州湾海底隧道交通量
海底隧道,不简单
BIM技术在大连湾海底隧道工程中的应用实践
基于ETC门架数据的高速公路交通量转换探究
基于动态差法的交通量监测技术应用
平流雾罩,海上蓬莱胶州湾
高速公路补偿交通量模型研究
基于四阶段法的公路交通量预测研究
胶州湾夏季盐度长期输运机制分析
深圳将建首条海底隧道
渤海海峡或建世界最长海底隧道