APP下载

多因子融合时空图神经网络的交通参数预测

2023-09-14张建旭金宏意王雪芹

关键词:关联矩阵路网交通

张建旭,金宏意,胡 帅,王雪芹

(1.重庆交通大学 交通运输学院, 重庆 400074;2.重庆交通大学 山地城市交通系统与安全重庆市重点实验室, 重庆 400074)

0 引言

路网交通参数预测对实际交通应用至关重要。现有大部分交通预测模型,如动态模式分解[1]、循环神经网络(RNN)[2]及其变体模型[3-4]主要针对路网中某一观测点进行时序预测。而卷积神经网络(CNN)[5]能将空间关系转换为欧式结构,但不适用于处理交通网络的非欧式结构。近年兴起的图神经网络将路网拓扑成图进行研究,让非欧式结构的路网级参数预测成为了可能。如果能够提高图神经网络对路网级参数的预测精度,对交通管控来说有更加重要的意义。

作为图神经网络经典模型之一的图卷积网络(GCN)[6]分为空域图卷积和频域图卷积两大类。空域图卷积[6]直接在空间上聚合相邻节点信息,思想来自于CNN对图像的计算,定义直观、灵活性强。频域图卷积[7]则利用傅里叶变换,将空域信号转换到谱域中,借助图谱的方式进行图卷积的推导,具有较为坚实的理论基础,但不适用于有向的交通网络图。GAT[8]模型的出现很好地解决了交通网络是有向图的问题,它通过注意力机制来聚合空间特征,不论交通网络图是否有向都能够进行预测。现有的研究中,GCN和GAT通常采用邻接关系来获取空间特征,Zhao等[9-10]都是通过交通路网拓扑得到邻接关系来实现图卷积。然而,城市交通与高速公路、轨道交通相比,条件复杂多变,道路之间的相互作用和其他关联信息对预测结果也至关重要。因此,还需要从邻接关系以外的角度进一步挖掘交通路网的空间特征信息。Geng 等[11]将城市网格化划分,根据区域的邻接关系、功能相似度和交通连通性确定节点之间的连边值,构建3种不同图结构的表示,实现乘车需求预测。AST-GCN[12]整合外部影响信息,如实验中的天气条件和周围的兴趣点来促进交通预测。以上方法对空间关联性的挖掘大部分利用了路网周围的土地性质和环境特征,并没有进一步体现路网中道路的交通特征。

因此,考虑从道路的交通特征出发,从节点间地理拓扑结构、通行能力和交通数据相关性3个方面去探讨和挖掘节点间空间关联关系,再结合门控循环单元,提出一种多因子融合时空图卷积网络(multi-factor spatial-temporal graph neural network,MF-STGNN)。首先构建节点间的3个关联因子矩阵:空间近邻矩阵A、通行能力关联矩阵C和交通数据关联矩阵D。然后根据GCN适用于无向图的特点,将对称的通行能力关联矩阵C和交通数据关联矩阵D分别输入到GCN中提取2种不同的空间特征。考虑道路具有方向性,保留了空间邻近矩阵A的非对称性,将其输入到GAT中进行空间特征提取。再通过通道注意力模型将提取的3种空间特征进行加权,得到最终的空间聚合特征。最后通过门控循环单元(GRU)提取时间特征,输出预测结果。通过对比实验和消融实验证明考虑了3个关联因子的MF-STGNN模型能够很好地提取空间特征,进行路网交通参数预测。

1 问题定义

针对城市路网交通预测问题,利用有向图G(V,E)来表征路网的拓扑结构,V是路段的集合,E是2个路段之间连通的边集合。假设当前时刻为t,则t+1时刻的交通信息可以表示为:

Xt+1=f(G;(Xt-T,…,Xt-1,Xt))

(1)

式中:Xt∈RN×P为各个路段在t时刻的交通信息;N为路段数量;P为节点信息的数量;T为历史时间序列的长度。节点信息可以是交通速度、交通流量等交通信息。

2 空间特征提取

2.1 常用方法

基于图神经网络的路网交通参数空间特征提取方法比较常用的有图卷积网络GCN和图注意力网络GAT,它们都是通过利用节点的连接关系来储存图的结构。这种连接关系一般定义为简单的邻接关系。GCN和GAT通过邻接关系将邻居节点的特征聚合到中心节点上来获得新的特征表示。从另一种角度来看,是将邻居节点的信息传递给了中心节点来形成新的特征。

2.1.1 GCN

基于频域的GCN通过傅里叶变换实现卷积操作,思路和推导过程有较为坚实的理论基础。GCN的优点在于结构信息能够在各层之间共享,但不适用于有向的图结构。双层GCN模型的前向传播公式可表示为:

(2)

2.1.2 GAT

GAT通过注意力机制,给每条边加了一个可学习的注意力系数αij,模型能够根据任务自适应调整边的权重,获得更好的结果。GAT对αij的计算是逐点运算,仅与节点特征相关,与图的结构毫无关系,摆脱了拉普拉斯矩阵的束缚,使得有向图问题迎刃而解。

GAT[8]在更新节点i的特征向量时,先计算i节点所有邻居的注意力分数αij,再用注意力分数乘以对应邻居的特征Whj∈RP′×1后相加,得到节点i的聚合特征yi∈RP′×1,最后得到全部节点的聚合特征fGAT(X,A)∈RN×P′。

fGAT(X,A)=(y1,y2,…,yi)T

(3)

(4)

式中:W∈RP′×P为权重矩阵,P′为节点特征新的输出维度;Ni表示节点i的相邻节点,在计算过程中使用邻接矩阵A作为掩膜矩阵进行节点邻域信息融合。

2.2 多因子关联矩阵构建

2.2.1 空间近邻矩阵

路网中邻近路段交通流参数的运行特性在某段时间内存在着相似性,可以看作交通流运行状态在时间上具有传递性[13]。本文从路网的地理拓扑结构出发,通过道路的连接关系构建有向的空间近邻矩阵,实现将相邻道路的特征聚合到目标道路上来获得新的特征表示。 空间近邻矩阵用AR∈N×N={aij}表示,当2条道路连通时,aij=1,否则aij=0。由于考虑了道路的方向性,因此空间近邻矩阵是非对称矩阵。

2.2.2 通行能力关联矩阵

城市路网是由不同等级的道路组成的,道路等级不同,对路网交通运行状态产生的影响不同[14]。高等级的道路具有更多的车道数、更宽的车道和更高的行驶自由度,在路网中的地位更高。文献[14]从路段通行能力、长度、车道数3个方面量化了不同等级路段对交通流运行的影响程度。如果能构建和邻接矩阵类似的,并且能体现节点道路等级差异的连接矩阵,就可以将不同等级道路对交通状态带来的影响融入到GNN节点的信息传递中,使获取到的特征更加有效。

因此,考虑用道路的通行能力大小来代表道路的等级高低,通过计算两两节点的通行能力因子cij,得到通行能力关联矩阵C来代替邻接矩阵,表征道路的空间联系。

(5)

式中:ci和cj为节点i和节点j的通行能力;cij为节点i和节点j之间的通行能力因子;aij为空间近邻矩阵元素,值为0或1。

(6)

2.2.3 交通数据关联矩阵

现有的研究中常用交通流时序数据的相似性来对未来的交通流状态进行预测[15]。文献[16]利用欧式距离来表征交通流数据之间存在的某种标量距离的大小,发现了路网节点交通流序列数据中潜在的时空模式,以此来划分不同的交通流模式。

基于以上研究,可以通过分析节点的交通参数数据关联性来挖掘节点间潜在的关联关系。将这种关系体现到GNN的信息传递机制上,则可以获取到邻接关系以外的一些潜在特征。如果一个节点与目标节点的交通参数数据高度相关,则GNN在提取目标节点特征时,高度相关的节点的信息占的比重会更大。

度量相似性主要采用皮尔逊相关系数和欧式距离等方法,但2个变量数据之间的关联可能是是非线性的,常见的皮尔逊相关系数无法准确使用,而距离相关系数可以用来刻画这种非线性的关联性。距离相关系数的计算依赖于距离协方差和距离方差,将节点的交通速度看作随机变量,两两节点间的速度的距离协方差除以它们的距离标准差的乘积,得到距离相关系数dij,即:

(7)

式中:Xi,Xj∈RK×1,是节点i和节点j的速度值,i、j=(1,2,…,N),N为节点数量,K为样本量;Var(·)为距离标准差; Cov(·)为距离协方差。

最终的交通数据关联矩阵为:

(8)

空间近邻矩阵、通行能力关联矩阵的构建都与邻接关系有关,体现的是节点局部关联关系,但后者在邻接关系的基础上还考虑了道路的通行能力,消除了一些伪邻接关系的干扰,获取到的特征更加有效。距离相关系数计算的是所有交通数据之间的相关性,可以提取到邻接关系以外的潜在特征。

3 MF-STGNN交通参数预测模型

3.1 模型总体结构

MF-STGNN主要由多因子空间特征聚合模块(MF-GNN)和时间模块(GRU)组成,MF-GNN先提取交通参数的空间特征,再由GRU提取时间特征,最终输出预测结果,总体结构如图1所示。

图1 MF-STGNN模块

3.2 空间聚合模块

空间聚合模块包含了3个部分,一是因子关联矩阵的构建,二是图神经网络的学习,三是通道注意力的特征融合,如图2所示。

图2 MF-GNN模块

在因子关联矩阵的构建上,通过考虑节点间地理拓扑结构、通行能力和交通数据相关性分别构建了3个因子关联矩阵,分别是空间近邻矩阵A、通行能力关联矩阵C和交通数据关联矩阵D。根据GCN适用于无向图的特点,将矩阵D和矩阵C构建为对称阵;考虑到道路的有向性,保留矩阵A的非对称性。

(9)

(10)

(11)

最后将提取到的3种特征通过通道注意力模型自动加权求和,得到新的特征X′。通道注意力来源于SENet模型[17],应用于计算机视觉领域,用来融合多通道的图像信息。通道注意力先将每个二维的特征通道压缩成一个实数,这个实数在某种程度上具有全局的感受野,再经过类似于RNN中的门控机制,每个特征通道生成权重。权重是经过特征选择后的每个特征通道的重要性,然后通过乘法逐通道加权到先前的特征上,完成在通道维度上对原始特征的重标定。

将3种不同的特征看成拥有3个通道的二维图像,即3个N×P′(N为节点个数,P′为节点交通参数的输出维度)矩阵,首先使用每个特征矩阵的全局平均池化来产生每个矩阵的特征综合值z=(za,zd,zc)T∈R3。za,zd,zc分别代表3种不同的特征通道下的所有节点交通参数信息的压缩,其特点是利用全局感受野融合了各自通道的交通信息,是在该通道上响应的全局分布,因此对当前通道特征来说是具有表现力的。

(12)

同理,可以求得zd和zc。然后将求得的每个通道的综合值经过2个全连接层和激活函数得到每个通道的注意力系数s=(sa,sd,sc)T∈R3×1。

s=σ(W2δ(W1z))

(13)

式中:W1∈RH×3、W2∈R3×H分别对应第一个和第二个全连接层的权重矩阵;δ(·)和σ(·)分别是 ReLU和Sigmoid函数。最后,将s作为3个通道的权重与每个通道特征值进行加权,得到最终的空间聚合特征Xt′∈RN×P′:

(14)

3.3 时间模块

得到交通网络参数的空间特征后,还需要获取交通参数的时间特征才能进行预测。LSTM和GRU是RNN的变体,具有门控机制,能很好地处理长期记忆问题,因此可有效地对随时间推移而获取的交通参数时序数据进行分析处理。然而,由于LSTM结构比GRU复杂,训练时间较长,对大规模的路网结构适应性较差,因此选择结构相对简单、训练较快的GRU来构建时间模块。

也有研究针对GRU的局限性提出了一些改进模型。文献[18]针对输入时间序列过长导致预测有效信息失真的问题,提出了基于GRU和注意力机制的油温预测模型。文献[19]中为了提高GRU的预测性能,使用Salp Swarm算法自动优化GRU的超参数来实现交通状况预测。这些改进模型的精度虽有一定改进,但增加了模型的复杂度。文献[9-10,12]中构建的图神经网络模型中,直接采用GRU模型进行时间特征提取,取得了较好的效果。因此,在不增加模型复杂度又不失准确度的情况下,直接用GRU构建时间模块进行特征提取。

通过空间聚合模块,可以得到所有节点在历史时间窗口T的特征值,将其作为时间模块的输入,可以预测t+1时刻的交通信息Xt+1。

图3 GRU的单个cell结构

rt=σ([ht-1,xt]Wr+br)

(15)

zt=σ([ht-1,xt]Wz+bz)

(16)

(17)

(18)

式中:tanh(·)为激活函数;Wr、Wz和Wh分别为重置门、更新门和候选集更新的权重参数;br、bz、bh分别为重置门、更新门和候选集更新的偏置项。

4 实验与分析

4.1 数据集

采用的数据集为重庆市浮动车数据,选取了重庆市渝北区新溉大道附近路网进行研究。路网中有32条路段,每5 min聚合一次速度数据,一条路段每天包含288条记录,共计7 d。将数据的80%划分为训练集,20%为测试集,并对数据进行[0,1]归一化。

4.2 评价指标

使用3个指标来评估MF-STGNN模型的预测性能,分别是平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。RMSE与MAE用于评价预测误差,两者的数值越小,说明预测效果越好。MAPE用于评价模型的好坏,MAPE越小,说明模型越好。

(19)

(20)

(21)

4.3 实验结果与分析

4.3.1 模型对比

将提出的MF-STGNN模型与HA、GCN、GAT、TGCN、A3T-GCN模型进行对比,结果如表1所示。MF-STGNN模型在MAE 、RMSE、MAPE 3个评价指标中均获得了最好的性能,3个指标分别提升了 2%~73%、2%~64%、6%~64%。GCN、GAT、TGCN和A3T-GCN模型单纯考虑了节点的邻接关系,预测效果不如MF-STGNN模型,这说明考虑3种关联因子提取空间特征可以提高模型预测性能。

表1 不同模型交通速度预测的性能

选取路网中的一条道路,将其某一天速度的预测效果进行可视化对比分析,如图4所示,可以看出,MF-STGCN和GAT模型的拟合程度较好。其中,MF-STGCN的拟合效果最好,预测值和真实值误差最小。A3T-GCN拟合效果相对较好;GCN拟合效果最差,可能是因为GCN不适用于有向图,采用的非对称邻接矩阵影响了预测结果。另外,GAT和A3T-GCN都添加了注意力机制,说明注意力机制有助于提高预测效果。

图4 不同模型预测效果可视化曲线

另外,在构建通行能力关联矩阵时,由于强调了路段近邻空间的相似性,因此矩阵C是在邻接关系的基础上进行构建的,而交通数据关联矩阵D是从所有节点间相关性角度进行考虑的,不受邻接矩阵的束缚。因此,为了分析邻接关系对构建矩阵D和矩阵C产生的影响,进行了4种情况的对比实验,如表2所示。经过分析,矩阵D与邻接空间呈弱相关性,而通行能力C呈强相关性。这说明道路之间通行能力的相关性作用在相邻道路之间离得越近,关联性发挥的作用越大,这也符合交通流状态在相邻路段传递的规律。而对于道路交通参数数据来说,它的时间传递性较弱,因为在构建矩阵时输入的是整个交通数据,因而也不需要过多考虑相邻的路段。

表2 矩阵D和矩阵C是否考虑邻接关系的预测性能

4.3.2 消融实验

通过消融实验进一步证明3个关联因子可以在交通预测任务中发挥作用。实验设置分为只添加空间近邻矩阵A,只添加通行能力关联矩阵C,只添加交通数据关联矩阵D,添加空间近邻矩阵A和交通数据关联矩阵D,添加空间近邻矩阵A和通行能力关联矩阵C,添加通行能力关联矩阵C和交通数据关联矩阵D,添加空间近邻矩阵A、通行能力关联矩阵C和交通数据关联矩阵D以及不添加任何矩阵8种情况,不添加任何矩阵的情况为直接使用网络的邻接关系结合GCN和GRU进行预测的模型,结果如表3所示。从表中可以看出,“A+D+C”组合,即MF-STGNN模型的预测结果优于其他排列组合。只使用1种因子矩阵的模型比使用2种因子矩阵的模型预测效果普遍差一些。

选取路网中一条道路的一段时间的消融实验速度预测结果进行可视化对比分析,如图5—图7所示。

图5 单因子关联矩阵可视化曲线

图5展现了只添加单因子矩阵、不添加任何矩阵的速度预测结果与真实速度,从图中可以看出,只添加空间近邻矩阵A的预测效果最好。图6展现了添加2个因子矩阵、不添加任何矩阵的速度预测结果与真实速度的可视化结果,从图中可以看出,A+C和A+D组合的预测效果不错,A+C组合稍优于A+D组合。将只添加空间近邻矩阵A和A+C组合这2种预测结果较好的情况与A+D+C组合进行对比分析,如图7所示,可以看出,MF-STGNN模型的拟合效果最佳。

图6 双因子关联矩阵可视化曲线

图7 因子关联矩阵可视化曲线

除此之外,为了探索构建的通行能力关联矩阵C和交通数据关联矩阵D是否真的能够提取到除邻接关系以外的空间特征,将3个矩阵分别代入到GCN模型中进行实验,结果如表4所示。从结果可以看出,交通数据关联矩阵的预测结果最好,表征邻接关系的空间近邻矩阵A效果最差。交通数据关联矩阵D的预测结果明显优于其他2个矩阵,而矩阵D体现的是对每个节点全局特征的把握,这表示在预测过程中考虑网络的全局信息至关重要。

表4 采用不同关联矩阵的GCN模型实验结果

综上所述可以得出:① 仅仅依靠邻接关系来提取空间特征具有局限性,构建的通行能力关联矩阵C和交通数据关联矩阵D能够捕捉到更多的空间特征。② 使用多个关联因子比使用单个关联因子更能提取到有效的空间特征。③ 在预测过程中可以进一步考虑网络的全局信息。

5 结论

提出的MF-STGNN模型,从更多的交通空间特征角度去探索图神经网络与时间序列的交通预测问题。通过节点间地理拓扑结构、通行能力和交通参数相关系数3个因子构建因子关联矩阵,再结合图神经网络和GRU进行时空特征提取,取得了一定的的预测效果。MF-STGNN模型不只考虑了道路的地理邻接关系,还分析了节点的通行能力和节点间交通数据的相关性,与其他仅考虑邻接关系的模型相比,可以有效地挖掘交通数据的空间信息。从实验结果来看,仅仅依靠邻接关系来提取空间特征具有局限性,在以后的研究中,应进一步考虑网络的全局信息来提升预测精度。另外,模型提取空间特征时,由于考虑因子较多,增加了模型的复杂度,因此,在保证模型准确度的情况下,提升训练效率、降低模型复杂度是以后需要研究的问题。

猜你喜欢

关联矩阵路网交通
n阶圈图关联矩阵的特征值
单圈图关联矩阵的特征值
繁忙的交通
小小交通劝导员
打着“飞的”去上班 城市空中交通路网还有多远
基于关联矩阵主对角线谱理论的欧拉图研究
省际路网联动机制的锦囊妙计
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
路网标志该如何指路?
n阶圈图的一些代数性质