基于OD的高速公路收费站出入口流量预测方法
2024-06-03符骏张星宇陈健安成川
符骏 张星宇 陈健 安成川
摘要:目前,高速公路收费站拥堵问题成为影响高速公路通行效率的重要因素,为收费站管理人员提供精准高效的拥堵流量预警具有重要的现实意义。文章基于GC-LSTM模型进行改进,提出了一种称为GC-LSTM-OD的高速公路出入口多步流量预测模型。该模型能够有效预测流量演变趋势,同时具备适应非常态情况的能力。为验证模型性能,文章使用了沿江高速太仓-常州段的现实流量数据,实验结果表明,相较于其他模型,GC-LSTM-OD在多步流量预测方面表现出更加优异的性能。
关键词:高速公路收费站;出入口流量预测;高速公路车流OD;GC-LSTM
中图分类号:U491.14文献标志码:A
0引言
在无人值守收费站的行业发展背景下,管理人员需要兼顾各类收费特勤事件的处理以及交通疏导任务,面临着管理效率和工作强度上的巨大压力。因此,如何精准而高效地预测高速公路通行流量,为收费站(特别是在无人值守的情况下)提供拥堵的提前预警,以实现人员和资源的合理调度,成为高速公路管控领域亟待解决的问题。
随着人工智能领域和计算机技术的高速发展,以及在采集和存储技术支持下交通数据的不断丰富,深度学习模型在交通预测领域得到了广泛应用[1-3]。递归神经网络(RNN)[4]及其变种,如长短期记忆(LSTM)和门控循环单元(GRU),在时间序列预测方面具有卓越表现[5]。但是这种方法只考虑交通数据序列之间的时间依赖性,缺乏对交通对象之间空间关联的考量。与此同时,卷积神经网络(CNN)因其出色的特征提取能力而被广泛用于建模非线性空间依赖关系,将CNN与LSTM结合使用,有助于联合建模时空信息,提高交通预测的准确性[6]。然而,CNN存在一些限制,无法很好地处理非结构化数据[7],难以准确提取公路线网间交通流的空间相关性。
相较于CNN,GCN(图卷积网络)将传统的卷积扩展到图的结构数据中[8],通过图的节点与边将空间拓扑结构纳入考量,并根据边的邻接关系对节点特征信息进行空间聚合,为交通网络中的空间相关性建模提供了一种更为可行的途径。目前,GCN已经广泛应用于交通领域的时空建模,并在一系列交通预测问题中取得了最先进的性能[9]。Wang等[10]建立了GEML模型,使用类似GCN的方法捕获空间信息,p-Skip LSTM 捕获时间信息,预测每对出发-到达地点间的出租车OD流量。Liu等[6]使用双视图卷积神经网络进行了CSTN模型的OD矩阵预测。考虑到短时预测情境下OD矩阵的稀疏性,Li等[11]提出了两级融合框架(TFF),利用基于注意力的时空图卷积网络(AST-GCN)预测行程的产生/吸引力(出发/到达流量)。在短时客流预测中,有研究提出了EMGC-GRU模型,自适应地融合来自多个基于知识的图之间的空间依赖关系以及车站之间的隐藏相关性[12]。Wang等[13]使用MAGCN模型进行流量预测。为了减少时空特征之间的干扰,Chen等[14]使用GCN与SBULSTM的并行结构。唐继强等[15]提出了LSTM+GCN的OD预测。由于传统的GCN无法提取跨时间步的空间相关性,有研究提出了STSGCN模型,时空同步建模机制有效地捕获了复杂的局部时空相关性[16]。针对动态网络问题的研究,Chen等[17]提出了一种名为GC-LSTM的端到端模型,该模型使用嵌入了图卷积网络(GCN)的LSTM进行动态网络链路预测。上述方法在应用领域均取得了较高的精度,但是在短时流量预测方面仍有所欠缺,同时较少考虑OD信息的有效融合。
鉴于准确推断路网交通演变态势,为收费站的管理人员提供精准而及时的拥堵预警实际需求,本文在现有GC-LSTM模型的基础上进行了改进,提出了GC-LSTM-OD模型。该模型由空间图卷积网络(GCN)嵌入长短期记忆(LSTM)模块的门控单元组成,GCN模块用于捕捉高速公路线网的空间依赖关系,LSTM模块通过多尺度时序变化信息的信息传递机制来捕捉时间特征。同时,引入站间OD信息作为邻接矩阵权重,从而捕捉高速公路网络中收费站点流量之间关联程度的动态变化。该模型有望继承GCN和LSTM在捕获空间关联和时间依赖方面的优点,并且适应高速公路网络OD关系的动态变化,从而实现工作日、周末及节假日各类场景下的高速公路出入口多步流量预测。
1高速公路出入口流量时空预测模型构建
1.1模型总体架构
基于GC-LSTM-OD的高速公路出入口多步流量预测模型主要由空间图卷积神经网络模块(GCN)与长短期记忆网络(LSTM)两部分融合组成。首先将高速公路出入口流量的n个历史时间序列数据{Xt-n,…,Xt}和相应的邻接矩阵{At-n,…,At}作为模型输入,针对每一历史时间片的图结构数据与隐藏状态,利用空间图卷积网络(GCN)模塊捕捉高速公路出入口的空间依赖关系,实现空间特征嵌入。其次,将具备空间特征嵌入的时间序列输入长短期记忆(LSTM)模块,通过多个LSTM模块间的信息传递机制捕捉多尺度时序变化信息,实现时间特征嵌入。最后,利用全连接层输出未来T个时间步长的出入口流量多步预测结果{Xt+1,…,Xt+T}。
1.2空间特征嵌入
利用G={V,E,F}描述高速公路线网空间拓扑结构,其中,vi∈Vi=1,…,n表示各个高速公路线网各收费站出入口节点;eij=(vi,vj)∈E表示节点vi与vj在图结构中存在邻接关系;Fij∈F表示邻接边的权重(根据节点vi到vj的车辆OD得到);n表示高速公路线网图结构中的节点个数;m表示高速公路线网图结构中的邻接边个数。图结构中空间相邻关系则由邻接矩阵A表示,Aij表示节点vi与vj之间邻接边的权重。Aij的具体定义如公式(1)所示:
Aij=Fij,if eij∈E
0,if eijE(1)
式(1)中,N(vi)=u∈V(vi,u)∈E表示节点vi所有邻居节点的集合。节点vi的度di表示和该节点相关联边的数量,对于无向图而言,di=|N(vi)|,图的度矩阵D是对角矩阵的形式,对角线上的元素为图中各个节点的度di。图中的节点vi具有特征向量Xi∈Rk,特征向量的维度是k,用特征向量矩阵X∈Rn×k存储每一历史时间片的高速公路线网节点出入流量。
空间图卷积神经网络模块通过高速公路线网节点的特征矩阵X∈Rn×k与图拓扑邻接关系的表达即邻接矩阵A∈Rn×n,利用非线性神经网络架构和学习训练机制,获得一个函数映射关系F(·),图拓扑结构中的节点vi通过该函数映射关系可以聚合其自身特征Xi与其邻接节点vj的特征Xj。与卷积神经网络中卷积层结构相似,对于图结构数据特征提取GCN同样具备深度学习的层级结构(通过特征的层级抽取,获取较高维度的特征表示),层间的映射函数通式定义如公式(2)所示:
H(l+1)=(H(l),A)=σD-12(A+I)D-12H(l)W(l)(2)
式(2)中:σ(·)为非线性激活函数,通常使用Relu函数;A为图的拓扑结构信息表达形式,邻接矩阵A∈Rn×n;H(l)为第(l)层网络输入的节点特征矩阵,H(l)∈Rn×k(l),H(0)=X;W(l)为第(l)层网络的权重系数矩阵,其中的权重系数为可训练参数,W(l)∈Rk(l)×k(l+1)。
邻接矩阵A与输入特征矩阵H(l)相乘作用是通过节点v的邻接节点N(v)=u∈V(v,u)∈E的特征向量聚合来更新节点v的特征向量,同时为了保留节点自身特征信息而加入自环的形式,即让邻接矩阵A加上相同维度的单位矩阵I∈Rn×n,此外,为了使节点具有相同的特征尺度,引入了谱图卷积理论中对称规范化拉普拉斯矩阵Lsys=D-12LD-12,其中D为图的度矩阵,对加入自环的邻接矩阵(A+I)进行归一化。
1.3时间特征嵌入
长短期记忆网络(LSTM)是循环神经网络(Recurrent Neural Networks, RNN)的升级版本,能够更好地捕捉高速公路出入口流量时间序列中的长期依赖关系,解决了梯度消失与梯度衰减问题。如图1所示,LSTM通过引入输入门、遗忘门与更新门的门控结构,优化了传统循环神经网络(RNN)中隐藏状态的信息传递机制。本文利用多个长短期记忆单元(LSTM)间信息传递获取时间序列数据中的多尺度时间依赖关系。
将t时刻的初始输入Xt∈Rn×d(n为空间嵌入特征的节点数,d为节点的特征维度)与t-1时刻长短期记忆网络(LSTM)输出的隐藏状态信息Ht-1∈Rn×h(h为隐藏状态的特征维度)输入空间图卷积网络模块(GCN),对节点的空间特征信息进行聚合,将输出的空间嵌入特征作为长短期记忆网络(LSTM)的输入,计算过程如下:
ft=σ(XtWf+GCNfHt-1+bf)(3)
it=σ(XtWi+GCNiHt-1+bi)(4)
C~t=tanh(XtWc+GCNcHt-1+bc)(5)
Ct=ft⊙Ct-1+it⊙C~t(6)
ot=σ(XtWo+GCNoHt-1+bo)(7)
Ht=ot⊙tanh(Ct)(8)
式(3)-(8)中:ft、it、ot、C~t、Ct、Ht分别代表遗忘门、输入门、输出门、候选细胞状态、细胞状态和隐藏状态;W∈Rd×h为权重参数;b∈R1×h为偏差参数;t代表第t个时间步。
1.4多时间步预测
针对未来T个时间步长的高速公路出入口流量多步预测任务,将空间图卷积神经网络模块(GCN)与长短期记忆网络(LSTM)所学习到的时空嵌入特征输入至全连接层,输出高速公路出入口流量多步预测结果Yt={Xt+1,…,Xt+T}。
1.5模型训练方法
面向高速公路出入口多步流量预测任务,GC-LSTM-OD模型训练目标是最小化高速公路出入口流量多步观测值与多步预测值之间的误差。因此,GC-LSTM-OD模型损失函数具体形式如公式(9)所示:
loss=argminω{L2[yi,f(xi;ω)]+λ∑ni=1ω2i}(9)
模型损失函数中第一项L2[yi,f(xi;ω)]衡量回归模型对第i个样本的预测值和真实值之间的误差,也称为经验风險。模型损失函数中第二项λ∑ni=1ω2i用来约束参数ω,使模型尽量简单,减少过拟合的可能,也称为结构风险。λ是一个超参,用来控制该项的大小。
2实例分析
本文利用沿江高速太仓-常州段15个收费站30个出入口的收费记录数据,统计出各个站点每15 min的通行流量,研究数据的格式如表1所示。数据覆盖的时间范围为2023年4月30日—5月31日,本文将选取前80%的数据用于训练,后20%的数据用于测试。
基于划分的训练与测试数据,生成对应的数据集。以训练数据为例,每15 min为1个时间步长,拟定使用过去10个时间步的数据{Xt-9,…,Xt-1,Xt}作为历史数据(模型输入),未来2个时间步的流量数据{Xt+1,Xt+2}作为数据标签(目标真值),在用于训练的数据上,采用滑动窗口沿时间方向顺序生成训练数据集。
本文构建了基于收费站间OD流量的邻接矩阵N,Nij表示当前时间步内,节点vj的通行流量中来自节点vi的车辆数,即从目的地(D)视角出发,统计来自各出发地(O)的车流量,OD流量代表了节点间的邻接边权重。为统一不同时间下节点对之间关联程度的度量标准,减少模型对权重的敏感性,将OD矩阵N的元素值归一化到[0,1]区间内,生成权重矩阵F,基于各收费站节点的边索引E与边权重F,计算出各个时间的邻接矩阵At,t∈{1,2,…,tmax}。
2.1模型超参数设置
通过超参数调优,本文最终建立了一个GC-LSTM-OD模型,其初始学习率为0.001,并用Adam优化器对模型参数进行自动优化,训练epoch为50,隐层单元数为64,批量大小为16,正则化系数为0.003,用于后续的高速公路出入口短时流量预测任务。
2.2模型训练与测试过程
如图2所示,GC-LSTM-OD模型在训练集与测试集中损失与误差在前5个批次中快速收敛,并且模型精度获得了较高的表现,表示模型能够迅速高效地学习到节点流量信息的数据特征,进行较为精确的预测。模型损失和误差随迭代轮数上升趨于收敛,表明模型已逐渐完成对数据特征的学习,性能趋于稳定。
2.3模型预测性能分析
通过测试集检验模型性能,并将输出的预测结果可视化显示,如图3所示。可以看出,工作日、周末及节假日各类场景下GC-LSTM-OD模型预测结果均取得了较高的准确度,并且有效捕捉了各节点每15min短时流量的时序变化模式。
选取2023年5月26日—31日8:00—10:00的高峰小时流量信息作为测试数据,采用流量归一化后的RMSE和MAPE(平均绝对百分比误差)作为评判指标,分别计算模型对测试集中各个收费站通行流量的预测性能,如表2所示。由表2可见,总计15个收费站(30个出入口节点),有10个收费站的入口RMSE大于出口RMSE,表明对入口的预测性能基本低于出口,主要原因在于邻接矩阵使用OD数据作为权重,为车辆从入口行驶至出口的通行信息,较少包含收费站出口至入口的情况,因此GCN卷积空间特征时,能较好地提取入口至出口的空间关联,使出口能有效聚合其他入口节点的特征信息,故模型具有更好的出口流量预测性能。MAPE结果显示,多数站点的预测误差在20%以内,误差较高的情况多为流量较小的收费站,如浮桥北的出入口,这主要归因于该站的通行流量较低,节点流量序列和OD矩阵都非常稀疏,因此模型无法有效学习该站的数据特征,预测性能较差。
2.4模型性能对比
本文将GC-LSTM-OD模型和其他基准模型在相同测试集上的预测性能进行了对比,对比的基准模型包含GCN模型、LSTM模型,以及GC-LSTM(不进行OD权重赋值),比较结果如表3所示。由表3可见,LSTM的预测性能最差,代表该模型难以学习节点流量信息的数据特征,原因在于节点流量空间上具有关联性,时间上以天为单位呈现出周期性,且15min流量不断波动,因此难以根据短时流量信息进行时序预测;GCN相比LSTM的预测性能有了显著提升,表明空间关联相对时序关系对节点流量特征有着更为重要的影响。GC-LSTM性能相比GCN有了小幅提升,表明考虑时间特征嵌入对模型预测性能的提升起到积极作用;GC-LSTM-OD模型具有最好的预测性能,RMSE最低且R2最高,证明基于OD的权重矩阵能有效衡量节点之间的空间关联,合理聚合节点的空间特征信息。
本文测试了GC-LSTM-OD的多时间步预测性能,如表4所示。随着预测时间步数的提升,模型的预测性能逐渐下降,这是由于长距离的预测时间步缺乏足够的有效数据(临近时间步)支撑,因此预测性能降低。同时,GC-LSTM-OD相较于其他模型,在多个时间步上的预测性能均有提高,展示出该模型在高速公路出入口多步流量预测上的优秀性能。
3结语
本文研究了高速公路出入口多步流量预测问题,在GC-LSTM的基础上引入了动态OD权重,通过建立GC-LSTM-OD模型,对收费站流量数据的时空关联性进行了提取,将收费站之间的OD动态演变趋势纳入模型,以此捕获不同场景下高速公路网络的流量动态变化模式,提高模型的可靠性和精确性。本文使用沿江高速的现实流量数据对模型进行训练与测试,通过R2、RMSE、MAPE指标对模型性能进行评估,实验结果表明,模型在各个时段均取得了较高的准确度,有效捕获了各节点每15min短时流量的时序变化模式,同时相较于单独的LSTM、GCN、GC-LSTM模型,本文提出的GC-LSTM-OD模型在多个时间步长上的预测性能均有所提升,证明了模型的先进性。
参考文献
[1]LIYANAGE S, ABDULJABBAR R, DIA H, et al. AI-based neural network models for bus passenger demand forecasting using smart card data[J]. Journal of Urban Management, 2022(3): 365-380.
[2]LV Y S, DUAN Y J, KANG W W, et al. Traffic flow prediction with big data: a deep learning approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2015(2): 865-873.
[3]MA X L, ZHANG J Y, DU B W, et al. Parallel architecture of convolutional Bi-directional LSTM neural networks for network-wide metro ridership prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019(6): 2278-2288.
[4]MIEBS G, MOCHOL-GRZELAK M, KARASZEWSKI A, et al. Efficient strategies of static features incorporation into the recurrent neural network[J]. Neural Processing Letters, 2020(3): 2301-2316.
[5]FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). Wuhan, China. IEEE, 2016: 324-328.
[6]LIU L B, QIU Z L, LI G B, et al. Contextualized spatial–temporal network for taxi origin-destination demand prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019(10): 3875-3887.
[7]DELECRAZ S, BECERRA-BONACHE L, FAVRE B, et al. Multimodal machine learning for natural language processing: disambiguating prepositional phrase attachments with images[J]. Neural Processing Letters, 2021(5): 3095-3121.
[8]MAJI D, GHORAI G. A novel graph invariant: the third leap Zagreb index under several graph operations[J]. Discrete Mathematics, Algorithms and Applications, 2019(5): 1950054.
[9]JIANG W W, LUO J Y. Graph neural network for traffic forecasting: a survey[J]. Expert Systems with Applications, 2022(207): 117921.
[10]WANG Y D, YIN H Z, CHEN H X, et al. Origin-destination matrix prediction via graph convolution: a new perspective of passenger demand modeling[C]Anchorage: ACM, 2019: 1227-1235.
[11]LI D Y, WANG W, ZHAO D. Designing a novel two-stage fusion framework to predict short-term origin-destination flow[J]. Journal of Transportation Engineering, Part A: Systems, 2023(5): 04023032.
[12]XU Y H, LYU Y, XIONG G W, et al. Adaptive feature fusion networks for origin-destination passenger flow prediction in metro systems[J]. IEEE Transactions on Intelligent Transportation Systems, 2023(5): 5296-5312.
[13]WANG Y, ZHAO A T, LI J B, et al. Multi-attribute graph convolution network for regional traffic flow prediction[J]. Neural Processing Letters, 2023(4): 4183-4209.
[14]CHEN P F, FU X D, WANG X. A graph convolutional stacked bidirectional unidirectional-LSTM neural network for metro ridership prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2022(7): 6950-6962.
[15]唐繼强,杨璐琦,杨武.融合长短期记忆网络和图卷积网络的轨道交通短时客流起讫点预测[J].重庆大学学报,2022(11):91-99.
[16]SONG C, LIN Y F, GUO S N, et al. Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020(1): 914-921.
[17]CHEN J Y, WANG X K, XU X H. GC-LSTM: graph convolution embedded LSTM for dynamic network link prediction[J]. Applied Intelligence, 2022(7): 7513-7528.
(编辑编辑李春燕)
Prediction method for expressway toll plaza entrance and exit traffic based on Origin-Destination (OD) data
Fu Jun1, Zhang Xingyu2*, Chen Jian2, An Chengchuan2
(1.Jiangsu Suhuaiyan Expressway Management Co., Ltd., Huaian 223006, China;2.Southeast University, Nanjing 211189, China)
Abstract: Currently, congestion issues at expressway toll plazas have become a significant factor affecting the efficiency of expressway traffic flow. Providing accurate and efficient congestion flow warnings for toll plaza managers holds practical significance. In this paper, an improvement is made based on the GC-LSTM model, and a multi-step traffic flow prediction model called GC-LSTM-OD for expressway entrance and exit is proposed. This model can effectively predict the evolution trend of traffic flow while possessing the capability to adapt to non-normal situations. To validate the models performance, realistic traffic flow data from the Taicang-Changzhou section of the Yangtze River Expressway is utilized. Experimental results indicate that, compared to other models, GC-LSTM-OD exhibits superior performance in multi-step traffic flow prediction.
Key words: expressway toll plaza; entrance and exit traffic prediction; expressway traffic flow OD; GC-LSTM
作者簡介:符骏(1990—),男,工程师,硕士;研究方向:智慧交通。
*通信作者:张星宇(2000—),男,硕士研究生;研究方向:交通信息工程及控制。