APP下载

基于门控卷积的时空交通流预测模型

2023-09-27符祥远李浩然

计算机应用 2023年9期
关键词:解码器交通流编码器

徐 丽,符祥远,李浩然

(长安大学 信息工程学院,西安 710064)

0 引言

随着科技的发展和人民收入的不断提升,汽车保有量每年持续上升,智能交通系统用于规划管理和智能调度交通运行,占有越来越重要地位。作为智能交通的关键技术,交通流预测在路径规划中发挥着越来越重要的作用,不仅可以为交通部门提前感知拥堵情况,还可以提高出行者的出行效率[1-3]。然而复杂的时空特征导致交通预测成为一项具有挑战性的任务。

交通流预测是实现交通智能化服务的重要任务之一,自20 世纪30 年代出现以来,经过广大学者的积极研究与实践,已经取得了相当多的研究成果。早期的机器学习方法和统计方法[4-5]在交通预测方面取得了广泛的应用。Huang 等[6]认为早期人工神经网络方法大多采用单隐层结构,他首次将深度学习方法引入交通预测领域,提出了利用深度置信网络进行交通流量特征学习,在深度置信网络的输出层中加入多任务回归层进行多条道路交通流量的预测。但是上述方法仅考虑了交通序列的时间特征,没有考虑复杂的动态空间特征。

此后,随着卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、长短时记忆(Long Short-Term Memory,LSTM)网络的蓬勃发展,越来越多的学者开始将交通预测方法转移到深度学习技术。交通序列的空间特征也逐渐在预测中被考虑到。Sun 等[7]利用全球定位系统(Global Positioning System,GPS)轨迹数据考虑前30~90 min 的交通速度数据,构建了CNN、RNN、支持向量回归(Support Vector Regression,SVR)等几种交通速度预测模型,结果表明深度学习方法的预测效果优于机器学习方法。阎嘉琳等[8]综合利用城市道路交通的时空关联特征,搭建了基于LSTM 的城市道路交通速度预测模型,在时间特征上考虑了近历史时间段和远历史时间段以及待预测时间段的速度信息;在空间特征上将上下游路段速度信息集成到目标路段。交通路网具有复杂的空间特征,每一时刻的交通流量都会受到相邻路段的影响,上述方法提到的CNN 处理的是欧氏空间的数据,而复杂路网具有非欧氏的空间特征,CNN 在复杂路网的交通数据中存在空间特征提取不足的问题。

随着计算机视觉和图像处理领域的发展,图卷积网络(Graph Convolution Network,GCN)被提出用于处理非欧氏空间的数据。Wu 等[9]提出自适应邻接矩阵,通过节点嵌入学习,利用GCN 和空洞卷积网络学习时空车流量模型。Wu等[10]提出了一种GCN-LSTM 模型,该模型组合了GCN、LSTM和残差网络(Residual Network,ResNet)来捕获交通流数据的时空特征。Li 等[11]提出的扩散卷积递归神经网络(Diffusion Convolutional Recurrent Neural Network,DCRNN)利用扩散图卷积和门控循环单元(Gated Recurrent Unit,GRU)提取交通数据的时空相关性。Zhao 等[12]提出了时间图卷积网络(Temporal Graph Convolutional Network,T-GCN)用于提取交通流数据的时空相关性以预测交通流数据。Yu 等[13]提出的时空图卷积网络(Spatio-Temporal Graph Convolutional Network,STGCN)同样利用GCN 提取交通数据的空间相关性,利用一维扩张卷积提取交通数据的时间相关性。Guo等[14]提出了一种基于注意力的时空图卷积网络(Attention based Spatial-Temporal Graph Convolutional Network,ASTGCN)来解决交通预测问题,引入时间和空间注意力机制并采用GCN 和一维卷积提取时空相关性。Guo 等[15]提出一种基于注意力的时空图神经网络(Attention based Spatial-Temporal Graph Neural Network,ASTGNN)模型并用于交通预测,引入自注意力机制来捕获交通数据的时间相关性,并引入动态卷积模块捕获交通数据的空间相关性。

上述方法在交通预测中虽然综合考虑了交通数据的时空相关性,同时也在单步预测中体现了良好的预测效果,但是大部分模型不能准确体现未来交通数据的多步时序关系。此后,王博文等[16]提出基于CNN 与GRU 的交通流预测模型ED CNN-GRU(CNN and GRU model based on Encoder-Decoder),利用CNN 作为编码器,GRU 作为解码器,搭建模型对交通流数据进行多步预测。汪鸣等[17]提出基于门控循环图卷积网络的交通流预测模型GR-GCN(Gated Recurrent Graph Convolutional Network),利用GRU 结合GCN 构建时空组件对数据进行时空特征提取,引入编码解码机制达到多步预测效果。编码器-解码器虽然很经典,但是有很大的局限性,比如当输入长序列时,由于编码器的输出仅为上下文变量C,C包含所有序列的特征信息,不难看出编码器对序列的特征信息编码不足会导致解码效果大打折扣。

以上方法虽然考虑到了复杂的时空特征,模型也得到了很好的验证;但是,这些模型要么仅利用时空图卷积网络捕获交通数据的时空特征,没有对时空图卷积网络的有效性进行校验;要么仅在单步预测中体现出良好的预测性能,而在多步预测中的预测性能并不理想。综合考虑以上方面,本文提出将GCN 与GRU 注入编码解码机制中,利用门控卷积对原始数据与时空特征数据进行拼接筛选,最终将筛选的信息注入解码器,以预测交通流序列,并构建了基于门控卷积的时空交通流预测模型(Spatio-Temporal Traffic Flow Prediction Model based on Gated Convolution,GC-STTFPM)。本文主要工作如下:

1)通过编码器-解码器的引入成功解决了交通数据多步预测不佳的问题。

2)门控卷积的引入成功校验了GCN-GRU 对交通数据时空特征提取的有效性,并解决了解码器解码效果不佳的问题。

3)开展了同一模型在不同尺度下及不同模型在同一尺度下的对比实验。利用可视化结果图表明,GC-STTFPM 在不同尺度下仍能保持良好的预测性能。

1 相关技术

1.1 问题描述

交通流预测是一个典型的对时间序列进行预测的问题,即通过已知过去的交通流序列来预测将来的交通流序列。具体公式如下:

1.2 编码器-解码器

编码器-解码器(encoder-decoder)是一种很成功的机器翻译模型,编码器的作用是将一个长序列转化成一个固定长度的背景变量,并在该背景变量中编码输入序列信息;解码器的作用是将编码后的序列进行解码输出,编码器-解码器的结构如图1 所示。

图1 编码器-解码器的结构Fig.1 Structure of encoder-decoder

编码器-解码器有很强的变通性,编码器可以采用GCN、RNN、LSTM 等;解码器可以采用神经网络的任意组合,只需满足如下关系式:

其中:p为编码器的长度,q为解码器的长度,两者可以不相等。编码器-解码器结构被广泛用于多步序列预测,将历史时间序列通过编码器编码为一个上下文变量C,然后将C通过解码器输出为预测的交通时间序列。本文采用GCN 与GRU 并结合门控卷积作为编码器,提取交通序列的时空相关性;采用GRU 作为解码器,对交通序列进行预测输出。

1.2.1 图卷积网络

图卷积网络(GCN)用于提取数据特征,相较于传统的处理欧氏空间的数据的CNN,GCN 处理的是非欧氏空间的数据。交通路网相关数据具有复杂的非拓扑结构,属于非欧氏空间数据,所以本文采用GCN 提取交通流的空间特征。

GCN 的核心思想是将邻接矩阵与特征矩阵进行傅里叶变换,将时域数据转换为频域数据,时域的卷积操作转换为频域乘积,最终将邻接矩阵与特征矩阵转化为频域数据,在频域内对数据进行相乘,最终完成时域上的卷积操作,将周边节点的信息聚合到中心节点。

假设有一批图形数据,其中有N个节点,每个节点对应的节点特征构成一个N×D维的特征矩阵X;节点之间的关系形成一个N×D维的邻接矩阵A,A和X为模型的输入矩阵。GCN 为神经网络层,具体传播方式如下:

1.2.2 门控循环单元

门控循环单元(GRU)与LSTM 相似,是RNN 中的一种门控机制,两者都会保存现有的内容,并增加新的输入数据。与LSTM 不同的是,GRU 不会保存内部记忆,使用的参数更少,对大数据的训练速度也更快。GRU 主要解决了RNN 中的梯度消失和梯度爆炸问题,同时保留了序列的长期信息。GRU 引入了重置门和更新门,重置门决定了有多少过去的信息需要遗忘,更新门决定了有多少过去的信息传递到将来,以此控制信息的流动。本文采用GRU 捕获交通数据的时间特征。GRU 的结构如图2 所示。

图2 门控循环单元的结构Fig.2 Structure of gated recurrent unit

各门控的计算公式如下:

其中:h为隐藏单元数;Xt∈Rn×(d样本数为n,输入个数为d)为t时间步长的时间序列;Rt∈Rn×h为重置门;Ut∈Rn×h为更新门;Ht-1∈Rn×h为上一个时间步的输出响应;W和b分别为权重矩阵和偏置矢量;σ为Sigmoid 激活函数。GRU 在每个时间步上都会生成一个隐藏状态Ht∈Rn×h,它也被看作是每一个时间步的记忆状态,允许信息沿网络流动而不会流失或爆炸。在每一个时间步中,当前的隐藏状态通过时间步迭代进入到下一次时间循环,从而将前面的有用信息依次向后传递。最终,经过这些门控单元的学习,就可以捕获到交通数据的时间相关性。

1.2.3 门控卷积单元

上述方法利用时空图卷积网络提取了交通流数据的时空特征,但是考虑到时空图神经网络单元作为编码器存在着一些局限性,比如上文提到的对长序列特征编码不足导致解码效果不佳及时空特征数据的有效性不能校验的情况,本文采用两种方法改进:1)缩短序列的输入长度从根源上解决此问题;2)采用注意力机制的思路,对特征序列进行权重分配间接解决此问题。对于交通流序列,缩短序列长度不现实。综合考虑到这些因素,本文提出了一种门控卷积单元,对初始序列及特征序列进行了拼接和筛选,从而对序列的有效性进行校验,并将校验后的特征序列作为GRU 状态信息的输入,保证了上下文关系的相关性,最终编码器的输出(即上下文变量C)包含每一时刻特征序列的权重信息,成功解决了编码器对长序列特征编码不足的问题。门控卷积单元的结构如图3 所示。

图3 门控卷积单元的结果Fig.3 Structure of gated convolution unit

计算公式如下:

其中:εt为Xt和两个向量的权重分配;Wn为门控卷积单元中的第n个卷积核即权重;Wo为融合各卷积结果的参数矩阵;σ表示Sigmoid 函数,将值映射到[0,1]内。

2 预测模型构建

综合考虑到交通流数据的时空相关性及多步预测性能,本文基于GCN、GRU、门控卷积单元及编码器-解码机制提出了一种基于门控卷积的时空交通流预测模型(GCSTTFPM)。具体的模型框架如图4 所示。

图4 基于门控卷积的时空交通流预测模型的框架Fig.4 Framework of spatial-temporal traffic flow prediction model based on gated convolution

图4 中的门控卷积(GC)、GCN 和GRU 共同构成了编码器单元,简称门控图卷积网络(Gated Graph Convolutional Network,GGCN)。该网络采用GCN 和GRU 对交通流数据进行时空特征提取,然后对捕获到的信息及原始信息进行拼接并采用卷积门控单元对拼接后的信息进行筛选,筛选后的信息作为前一时刻的状态信息输入到门控循环单元,再进行下一时刻的特征提取,当整个历史序列输入完成后,最后一时刻的信息输入到上下文变量C,C表示输入序列的语义概要而且聚集了经过编码所有时刻的交通信息。编码计算过程如下:

其中:编码器单元GGCN 接受交通时序数据输入X以及上一时间步的隐藏状态ht-1;输出ht为第t时刻的隐藏状态。

解码器单元的解码与编码过程类型,由于它已经采用图卷积捕获了交通数据的空间相关性,所以不再需要对数据进行图卷积操作,只需要采用GRU 作为解码器即可。上下文变量C经过解码器后得到一个隐藏状态,然后通过一个前馈神经网络对交通信息进行预测,得到预测信息。

解码器的计算过程如下:

其中:C=ht;st为解码器输出的隐藏状态。根据解码器的隐藏状态进行连接计算,并通过前馈神经网络对交通信息的隐藏状态进行计算预测输出Yt。

3 实验与结果分析

3.1 数据集

本文利用真实的数据集Los-loop 环路[12]验证模型的性能。该数据集由环路检测器从洛杉矶高速公路实时采集(https://paperswithcode.com/dataset/metr-la)。本文在该数据集中选择了207 个传感器及它们的交通流数据。同时,数据集中包括一个邻接矩阵和一个特征矩阵:邻接矩阵为207 个传感器之间的关系;特征矩阵为是2012 年5 月1 日至5 月7日每一条道路的交通流数据,采集交通速度的时间步长为5 min。该交通流数据集中共2 016 条数据,可以更好地提取交通流的时空相关性进行多步预测。实验中将数据集按8∶2 分为训练集、测试集。

3.2 模型参数与评估指标

本文将学习率设置为0.001,批大小设置为32,隐藏单元数设置为64,迭代次数设置为5 000。

为了更精确地判断模型是否可靠,本文采用平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)作为评估指标,具体公式如下:

3.3 不同模型的结果分析

实验选取的基准对比模型如下:

历史平均(History Average,HA)模型:直接利用平均值作为交通数据的预测结果。

支持向量回归(SVR):将交通数据拟合成一条曲线,对下一时刻进行预测。

差分整合移动平均自回归(AutoRegressive Integrated Moving Average,ARIMA)模型:一种应用广泛的经典预测模型。

GCN:针对复杂交通路网的非拓扑结构,将时域数据卷积扩展到频域进行乘积操作。

GRU:可以捕获交通序列的长期依赖性。

T-GCN[12]:能有效提取交通数据的时空相关性,模型参数设置隐藏单元数为64,输入时间步长为12。

DCRNN[11]:集成扩散图卷积与GRU 来提取交通数据的时空相关性,用于交通时序数据预测。

ASTGCN[14]:是一种改进的时空图卷积网络,引入时空注意力机制并利用一维卷积和GCN 捕获时空相关性。

将测试集中的数据输入训练好的GC-STTFPM 中,得到2012 年5 月7 日一天的预测结果。评价结果如表1 所示。可以看出,本文的GC-STTFPM 融合了时间序列特征和空间特征两方面的预测优势,在5、15、30、60 min 这4 个尺度上都取得了最好或次优的预测结果,充分说明了GC-STTFPM 的正确性、有效性和广泛的适应性。

表1 不同尺度下交通流预测的评价指标Tab.1 Evaluation indicators of traffic flow prediction under different scales

由表1 可以看出,在未来一个或多个时间步内,对比现有的机器学习模型和深度学习模型,本文的GC-STTFPM 模在单步和多步预测方面都有着很好的拟合度,可以更有效地提取交通流数据的时空特征,本节将从3 方面对GC-STTFPM的通用性作出阐述:

1)在时间特征提取上表现优异。本文采用了HA、SVR、ARIMA、GRU 时间序列预测模型与GC-STTFPM 进行了对比。这些对比模型均能捕获交通数据的时间相关性,就单步预测(5 min)而言,GC-STTFPM 相较于拟合度最好的GRU 模型和传统机器学习模型SVR 的MAE 下降了2.5%、14.5%,RMSE下降了2.7%、15.5%,这是由于传统机器学习模型只能处理一些简单的时间序列,不能够精确处理复杂度较高的交通序列。

2)在时空特征提取上表现优异。本文采用T-GCN、ASTGCN、DCRNN 预测模型进行对比,这些模型均可捕获交通数据的时空相关性。就单步预测(5 min)而言,GCSTTFPM 相较于拟合度最好的T-GCN 模型,MAE 下降了3.1%,RMSE 下降了2.3%;相较于GCN、ASTGCN 和DCRNN模型,MAE 下降了42.1%、5.9% 和9.9%,RMSE 下降了36.0%、1.7%和5.8%,这是由于GCN 模型只能单纯捕获交通数据的空间相关性而忽略了交通数据的时间相关性。

3)在多步预测表现优异。从表1 可以看出,本文的GCSTTFPM 相较于效果好的ASTGCN 模型在15、30、60 min 的MAE 分别下降了2.4%、9.8%和6.3%,RMSE 下降了1.2%、0.2% 和3.6%。但是相较于DCRNN 模型只在30 min 的RMSE 提升了1.3%,在其他时间尺度都有着良好的预测性能。这些数据验证了GC-STTFPM 不仅在捕获交通数据的时空方面表现突出,还在多步预测中表现优异。

任取一条道路某一天的预测数据,将不同模型的预测结果和真实数据叠加显示,如图5 所示。从图5 可以看出,GC-STTFPM 相比其他模型有着更好的预测性能。为了更直观地观测GC-STTFPM 的性能,本文选取了不同模型的局部细节(18:00 到00:00),如图6 所示。从图6 可以看到GC-STTFPM 相比其他的模型在极值处收敛较快,能够更好地拟合交通数据的真实值。

图5 不同模型的预测效果对比Fig.5 Comparison of prediction results of different models

图6 不同模型预测结果18:00到00:00局部细节图Fig.6 Local details of prediction results of different models from 18:00 to 00:00

为验证模型在不同尺度下的预测性能,选取同一条路,进行不同尺度预测,如图7 所示。可以看出,GC-STTFPM 随着时间步的增加,拟合度降低。这是由于随着时间步的增加,当前时刻与过去时刻信息的相关性在减少,从而出现到达峰底不能够尽快收敛导致预测性能不佳的情况。选取GC-STTFPM 在峰值处的可视化预测的局部效果图(15:00 到21:00),如图8 所示,可以直观地看到GC-STTFPM 在不同的尺度下均具有良好的预测性能。

图7 不同尺度下的预测效果对比Fig.7 Comparison of prediction results under different scales

图8 GC-STTFPM预测结果15:00至21:00局部细节图Fig.8 Local details of prediction results of GC-STTFPM from 15:00 to 21:00

4 结语

本文针对现有交通流预测方法在特征提取及预测精度方面的不足,提出了一种基于门控卷积的时空交通流预测模型(GC-STTFPM)。通过实验对比现有的基准模型,本文提出的GC-STTFPM 不仅在捕获交通数据的时空特征上表现优异,在多步预测中的精度也显著提升。下一步将利用Transformer 捕获交通数据的时空特征;此外,综合考虑天气、节假日等因素也是今后的研究重点。

猜你喜欢

解码器交通流编码器
科学解码器(一)
科学解码器(二)
科学解码器(三)
线圣AudioQuest 发布第三代Dragonfly Cobalt蓝蜻蜓解码器
基于FPGA的同步机轴角编码器
基于PRBS检测的8B/IOB编码器设计
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
JESD204B接口协议中的8B10B编码器设计
具有负压力的Aw-Rascle交通流的Riemann问题