基于图卷积网络的路网短时交通流预测研究

2020-09-01陈喜群周凌霄

交通运输系统工程与信息 2020年4期

陈喜群，周凌霄，曹震

(浙江大学建筑工程学院，杭州310058)

0 引言

随着我国经济发展和城市化进程推进，城市规模逐步扩大，交通拥堵带来的经济损失、环境污染、能源浪费等问题日益加剧，给交通出行者和相关管理部门带来极大不便和困扰.

智能交通系统(Intelligent Transportation Systems，ITS)是缓解交通拥堵问题的有效手段[1].交通流预测是实现交通系统智能化的关键所在，短时交通流预测可以帮助交管部门识别交通流演化态势，提前制定短时交通管制措施，有效缓解交通拥堵，还可以帮助出行者了解路网运行状况，进行路径规划.国内外文献就单个路段或固定检测点位的交通流预测做了广泛研究，但对于大规模路网交通流的预测相对较少，同时，现有模型较少将路网拓扑结构融入预测模型中，因而模型的现实解释意义不强，预测精度有待提高.因此，本文提出基于图卷积网络的交通流预测框架，旨在通过提取交通流时空相关性和路网拓扑结构，实现路网短时交通流预测，实现城市级复杂路网交通流预测，同时考虑路网拓扑结构的影响，提高交通流预测精度.

1 路网短时交通流预测研究现状

国内外有关交通流预测研究大多集中于单点或单一路段上，通常采用ARIMA等参数模型以及机器学习等非参数模型进行预测.例如，Ahmed等[2]首次将ARIMA模型应用于高速公路短期流量预测.Wu等[3]应用支持向量回归(SVR)进行旅行时间预测.由于城市交通环境的复杂性，目前针对城市路网短时交通流预测的相关研究还有待深入.

近年来，学者们将传统模型应用于路网层面，取得较好的效果，Cheng 等[4]提出一种自适应k 近邻(k-NN)模型用于短期路网交通预测；Du等[5]基于传统的交通波模型设计旅行时间预测算法.许多学者借助深度学习强大的非线性数据挖掘能力，提出基于深度学习的路网交通流预测模型，Ma等[6]提出基于卷积神经网络(Convolutional Neural Network，CNN)的方法预测路网交通流量.Yu 等[7]提出基于长短时记忆网络(Long-Short Term Memory，LSTM)的方法，用于高峰期路网交通流预测.根据现有研究经验，混合模型往往比单一模型具有更好的预测效果，Sun 等[8]应用图形拉索(Graphical Lasso)和神经网络融合算法进行路网规模的流量预测；Yu 等[9]融合CNN和LSTM 实现北京路网交通速度预测.

传统深度学习模型虽然具有较高的精度，但未考虑路网拓扑结构带来的影响.图卷积网络(GCN)的兴起为路网交通流预测模型带来新的机遇.Li等[10]提出图卷积循环神经网络(GCRNN)用于预测路网交通速度，并应用于高速公路路网预测；本文提出的模型应用在包含多种道路类型的城市路网，且预测时间间隔更短.Zhang等[11]提出带注意力机制的图卷积网络预测模型，称为AGCSeq2Seq，具有较高的预测精度，混合模型结构相对较复杂，待标定参数数量多；相较而言，本文构建的模型更加简洁，测试路网范围更大.

鉴于ITS和人工智能的快速发展，目前虽已有许多预测算法，每种算法都有其优点和缺点，但由于各种复杂因素的影响，例如路网拓扑结构、交叉口信号控制和交通事故等，大规模城市路网交通流预测仍然是具有挑战性的科学问题.

2 基于GCN的路网短时交通流预测模型

GCN能同时对节点特征信息与图结构信息进行端到端的学习，是对图数据进行处理建模的很好选择[12].本文提出的路网短时交通流预测模型是在基本GCN的基础上进行构建，模型框架如图1所示，在传统图卷积网络基础上形成3个模块：邻接交通流信息提取模块、相关交通流信息提取模块和历史信息提取模块.分别得到矩阵和，通过不同的权重P1、P2和P3加权求和获得最终的输出.

图1 图卷积路网交通流预测模型框架Fig.1 Framework of network-wide traffic prediction model based on GCN

图1所示框架的3个组成模块内容如下：

(1)邻接交通流信息提取(模块I).模块I 考虑路网拓扑结构，输入是由各个路段交通流时间序列堆叠而成的矩阵X.通过各个路段的实际地理位置提取邻接矩阵，若路段在地理上存在上下游链接关系，则认为其邻接.在模块I中，将邻接矩阵A(k)和交通流矩阵X输入图卷积网络进行特征提取，得到最终的输出.其中，A(k)表示k阶邻接矩阵，对于节点i，其k阶邻表示至多经过k个节点即可到达i的所有节点集合.

(2)相关交通流信息提取(模块II).模块II 考虑交通流之间的时间和空间相关性，将图卷积网络中的邻接矩阵A(k)替换为相关矩阵C，其中，C由X通过一系列变换得到，即

式中：f(·)为相应的函数映射，可以是皮尔逊相关系数计算函数，也可以是其他机器学习方法.获取相关系数矩阵C后，和交通流矩阵X输入图卷积网络进行特征提取，得到输出.

(3)历史信息提取(模块III).提取历史上同一时刻的交通流信息，将直接构建成与输出同等尺寸的矩阵.

式中：hnt(n=1,2,…,N,t=1,2,…,T)为一定时间之前(如一天、一周、一个月等)路段n在t时刻的历史交通流信息.

(4)矩阵融合.矩阵和通过不同的权重P1、P2和P3加权求和得到输出为

式中：为最终输出；⊙为哈达马(Hadamard)乘子，为矩阵相应位置的数值相乘；表示路段n在t时刻的预测交通流信息.

本文所采用的GCN模型的优势是考虑路网拓扑结构，通过图卷积网络提取出各个节点之间的关系.模型识别出具有关联性的节点，其对应路段在现实中是相邻或存在交通流的相互影响.为可视化这种相关关系，利用节点颜色和大小代表该节点与其余所有节点的相关系数：取绝对值的平均值，即通过提取这些节点之间的相关关系，识别出重要节点对上下游的影响，提高模型的预测精度和可解释性，模块II考虑交通流之间的相关系数矩阵，提取路网交通流之间隐式的相关关系，再结合显式的路网拓扑邻接关系，实现准确的短时交通流预测效果.

3 案例应用与结果分析

为测试构建的图卷积网络交通流预测模型，分析美国马里兰州包含多种道路类型的城市路网，如图2所示，包含高速公路、快速路、主干道和次干道等道路类型，数据来源于区域综合交通信息系统(RITIS).表1为实际路网统计信息，共包含582个路段，单个路段的长度范围为0.010～4.323 km之间.获取的交通流参数是路段平均速度，数据集包含2017年1月1日∼3月31日城市道路网各个路段每5 min的平均速度.

使用前两个月的速度数据作为训练集，剩余的一个月数据用作测试集.使用前60 min 速度数据预测未来30 min的路网速度.激活函数采用ReLU函数，即：Re LU(x)=max{0,x}.

图2 实际测试路网示意图Fig.2 Illustration of test road network

表1 路网基础信息描述Table1 Description for road network

图卷积网络的超参数主要包括：邻接矩阵的k值、隐含层的层数和隐含层神经元个数.在路网案例中，模块II 隐含层数为1层，隐含层神经元个数设定为32，相关矩阵按皮尔逊相关系数计算.

模型共训练80 epoch，采用均方根误差(Root Mean Square Error，RMSE)作为损失函数，计算平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)用以评价模型性能.RMSE和MAPE的定义为

式中：N为路段数量；T为预测的时间间隔；ynt和分别表示速度的真实值和预测值.

图3和图4分别为不同k值和隐含层层数对模型测试误差和效率的影响(仅改变模块I的参数).由图3可知，k值从0 变为1时，预测精度有显著提高，因为，当k=0时，图卷积网络退化为全连接网络，仅考虑交通流相关性，未考虑路网拓扑结构；当k值逐渐增大时，模型精度有所提升，因为较大的k值能使模型捕获更多相邻路段之间的空间相关性；随着k值继续增大，模型的性能提升效果不明显，因为随着阶数的上升，路段之间距离变大，相互间的影响削弱，更多阶近邻的加入使得模型引入部分不甚相关的数据；在同时考虑模型精度和复杂度的情形下，本文选择k=5.由图4可知，随着隐含层数的增加，RMSE和MAPE先下降后逐渐上升.表明在该案例中，较浅层的图卷积网络结构即可捕获复杂的相关关系，随着深度的增加，模型可能出现过拟合问题.

图3 k值对模型性能的影响(1层隐含层)Fig.3 Impacts of k value on model performance(1 layer)

图4 隐含层数对模型性能的影响(k=5)Fig.4 Impacts of number of layers on model performance(k=5)

采用时空深度张量神经网络模型(STDTNN)[13]、历史平均(HA)、自回归移动平均模型(ARMA)、随机森林(RF)、卷积神经网络(CNN)、长短时记忆网络(LSTM)、融合CNN和LSTM(FCL)等现有的模型与GCN模型进行对比，预测性能如表2所示.结果表明，GCN模型在精度指标上均优于基准模型，且在保证精度的条件下，展现出较高的效率.仅考虑相关矩阵的模型也呈现出较好的结果，说明不仅邻近交通流之间存在相关性，一些看似不相关的路段交通流也存在潜在相似性，这通常由路网结构、道路周边区域规划等相似性导致，因此，考虑潜在交通流时空相关性对模型精度也会产生重要影响.同时考虑邻接矩阵和相关矩阵的GCN模型具有更好的效果，表明考虑路网拓扑结构和交通流相关性可以有效地提升模型精度.

表2 模型预测性能对比Table2 Prediction performance comparison of different models

为测试GCN模型多步预测的效果，同时预测未来30 min(即6步)的路网速度演化规律，表3和表4为不同预测步数下GCN模型的预测误差.结果表明：预测误差随着预测步长的增多而增加，增加量在5‰以内，时间最接近的未来交通速度与当前交通流状况最相关，最容易预测；比较不同道路类型上的多步预测性能，由于主次干道有行人、信号交叉口和分支道路的影响，所以相对更难预测，同时，主次干道的车速较小，其相对误差相应较大.

为进一步测试模型预测效果，提取每天上午07:00-09:00和下午17:00-19:00 早、晚高峰预测结果，将真实速度和预测速度绘制成散点图，45°线表示真实值和预测值相同，越接近45°线精度越高.如图5所示，直方图表示数据在x轴和y轴上的投影，大多数散点接近45°线，且在±10 mph(±16 km/h)范围内，皮尔逊相关系数 PCC(Pearson Correlation Coefficient)为0.857，表明GCN模型在早、晚高峰时期也能保持良好的预测性能.

表3 多步预测误差表(RMSE)Table3 Multi-step prediction performance of the GCN model (mph)

表4 多步预测误差表(MAPE)Table4 Multi-step prediction performance of the GCN model (%)

图5 早、晚高峰时期模型预测结果散点图Fig.5 Prediction performanceof GCN modelat peak hours

GCN模型考虑路网拓扑结构，图6和图7可视化这种相关性，颜色越深，表明该节点与其余节点越相关.图6为相关系数大于一定阈值的节点拓扑结构，以真实地理位置进行布局，可以发现模型和现实存在一定的匹配关系；节点代表每一条路段，节点大小和颜色代表与该路段有关联的路段数量，节点间的边代表两个路段之间的相关系数，越接近深色，相关系数越接近于1；不少路段与其他路段存在强相关性，通常为高速路的立交桥和主次干道的交叉口，这些路段在现实中也是对上、下游产生重要影响的关键节点.图7为所有节点的真实地理位置图，图7呈现出和图6相类似的结果.

图6 相关节点拓扑结构图Fig.6 Graph topology of correlated nodes

图7 各相关节点真实地理位置图Fig.7 Geographical layout of correlated nodes

4 结论

本文提出用于路网交通流预测的GCN模型框架，采用真实大规模城市路网浮动车数据对GCN模型进行测试，通过实验确定合适的超参数，可视化路网各节点之间的相关性，并将这种相关性嵌入GCN模型框架中，利用GCN模型独特的邻接矩阵设计，使得模型同时考虑真实的路网拓扑结构和交通流的时空相关性，具有较高的预测精度、预测效率和现实解释意义.通过与现有模型进行对比发现，GCN模型在预测精度和计算效率上均有所提升，其中RMSE为5.012，MAPE为0.153.本文探究模型在多步预测下的预测结果，不同道路类型的预测结果以及早、晚高峰时段下的预测结果，GCN模型均具有较好的表现.GCN模型改进路网交通流预测框架，其高效和高精度特性为实际交通管控和路径规划场景应用奠定基础.后续研究可以在混合模型、超参数寻优等方面进行深入.