APP下载

基于图神经网络的短时交通流预测技术研究

2023-04-29李斐轩

信息系统工程 2023年6期
关键词:注意力机制数据融合深度学习

李斐轩

摘要:由于当前交通流预测中各参数之间的关联性不能在模型中加以呈现,因此提出了多因素融合的图注意力交通流预测模型(MFI-GAT),将交通流量和交通平均速度两个参数通过残差网络进行融合,并将交通流特征矩阵与天气属性矩阵结合起来,使用图注意力网络(GATs)来捕捉空间特征,并通过添加了注意力机制的门控循环单元(AGRUs)来捕捉时间特征,通过采用真实数据集进行试验,证明该模型与现有部分模型相比准确率有所提升。

关键词:深度学习;数据融合;短时交通流预测;图神经网络;注意力机制

一、前言

交通流分析是智能交通网络系统的主要部分,其研究方法经历了多个不同的发展阶段。当前,主要存在的技术类别:基于传统理论的预测技术、基于单一智能模型的预测技术以及基于多种智能模型的预测技术。本文探讨了一种基于混合智能模型的预测方法,它能够充分利用交通流数据的时空特征和多种外部环境因素,从而提高预测的准确度。混合智能模型是指一种利用两种或两种以上的模型进行短时交通流预测的模式,它可能包括两种模式,一种是利用几个不同的模型相互衔接的,一个模型的输出结果可以作为另一个模型的输入,并相互衔接以便得出最后的结论;而另一类则是利用多种模型一起进行的,最后可以通过对他们的检测结果做出若干数学计算,以便得出最后的预测结论。在2016年,Wu等人[1]利用复杂的空间依赖性关系,将一维CNNs和二维LSTM技术有机地结合起来,构建出一个新的特征融合框架,以更好地预测短时交通流。首先,他们利用一维CNNs技术探索交通流的空间依赖性,随后,他们又利用二维LSTM技术,深入探究交通流量的短期变化趋势及其周期性。次年,Liu等人[2]在国际WCSP大会上,提出了一种新的短时交通流预测技术,它将单ConvLSTM模型与双向LSTM模型有机结合,以获取时间特性、周期特性以及其他相关信息,而不需要对车辆行驶轨迹数据集进行任何预处理,从而实现了端到端的快速、准确的短时交通流预测。Yu和其他研究者[3]使用GCNs架构来描述时间相互作用的过程,他们发明的时间空间图卷积网络(STGCN)被广泛应用于交通流的预报。STGCN的架构由多个时间分割单元组成,其中一个时间分割单元拥有两个时间门限,另一个时间分割单元拥有一个时间分割单元,它们能够有效地抓住时间的本质,同时也能够揭示其中的空间规律。Zhu和其他研究者[4]利用A3T-GCN(图卷积)模拟,将注意力机制纳入其中,使得整个时期的数据能够被有效地整合,进一步大大提高了预测的精度。目前的研究方法主要是以交通流信息的时间特性作为研究重点的目标,只是少数时候顾及一些外界要素, 晏臻等人[5]提出了融合多因素的短时交通流预测模型(MFNN)的交通流预测模型,但其理论手段还仅仅把外界要素的全连接层直接整合在时间预报模型中,还不能很好地抓住其特点。

综上所述,提出了多因素融合图注意力网络预测模型 (Multi Factor Integration-GAT, MFI-GAT),该模型注重数据融合将已有参数(交通流量和车速)融合为单一参数后将路网空间与天气等因素变为融合矩阵作为模型输入,以此进一步提高了模型的精度。

二、基础模型

(一)交通流定义

交通流量:即指定时间间隔内该路段通过的车流量与指定时间间隔的比值。其时间间隔一般为5分钟所以称之为短时交通流预测。由于交通流数据会受到时间空间等一些不确定因素的干扰,所以这里简单介绍一下其具有的特征:

1.空间相关性。路网的拓扑结构会对交通流产生很大影响,当路网结构中路段的交通流发生变化时会对相邻路段产生影响。

2.交通流的时间特征可以分为两部分。一部分是有规律的,另一部分是无规律的。交通流数据因周期性会表现得十分相近,且会受到相邻时间段交通流数据的影响。

3.不确定性。当发生暴雨,大雪等特殊天气时会对交通产生影响,交通流也将产生明显变化,遇到车祸等人为因素交通流也会受到影响。

(二)数据融合

当前,在短时间内的交通流预测方面,有两种主要的方法:一种是仅使用一个交通流参数,另一种是将多个参数分别输入到不同的模型中,并通过全连接层融合来得出结果。第一种方法可能会导致较大的预测误差;第二种方法虽然能够提取更多的交通流时空特征,但需要更多的模型,并且对硬件设备的要求也比较高。通过式1对数据进行了加权融合[6],以找到最佳的加权参数,以达到最佳的结果。

式中:F为路段交通流量; 为路段交通平均速度; 为加权参数,其取值为[0,1];X加权融合后新的交通流参数。

我们首先使用加权平均法来整理两个关键因素(交通流量和平均速度)的信息,从而创建一个全面的,能够反映真实情况的数据集。研究结果显示,这种方法能够很好地整合这两个因素的时间和空间信息,从而对短时交通流预测进行更加精准的预测。

(三)GATs模型

传统GCN模型存在两大局限性,首先它无法完成inductive任务,即处理动态问题。同时GCN模型还有处理有向图的瓶颈,不容易实现分配不同的学习权重给不同的邻居节点。而GAT模型完全不依赖于图的结构,对于inductive任务无压力。所以这里采用GAT模型进行实验。

通过多层 AGRU 层的循环,每一层的 AGRU 的输入都考虑了上一层 AGRU的输出,从而捕获道路网络的时间依赖关系。

三、MFI-GAT 预测模型

框架主要由数据预处理,时空建模和预测三部分组成。经过大数据技术处理后,可以获取路网拓扑结构G、交通流特征矩阵X、天气特征矩阵K,将矩阵X和K经时序特征进行合并得到融合矩阵E,然后与路网拓扑结构输入到GATs模型去获取其空间特征,然后用AGRUs去获取时间特征,最后将时空特征作为输出。预测部分使用已有数据集进行预测对比。

四、实验与分析

(一)数据集

本文数据集主要使用了来自滴滴打车的开放数据其包含了实验所需的特征,而通过查询“天气网”的数据获取了车辆行驶过程的相关不确定因素。

1.车辆行驶轨迹数据集。收录了2018年9月西安市局部地区滴滴打车的出租车轨迹信息,总容量达到71GB,并且对司机和订单信息进行了严格的加密和脱敏处理,该轨迹数据集的经纬度范围分别[34.2049,34.2800]和[108.9218,109.0094]。表1为数据集中原始加密数据,数据内容为出租车ID行驶轨迹的经纬度与时间。

2.天气数据集。通过查阅“天气网”和中国国家气象局得到了2018年9月西安市的相关天气数据包括了天气,温度,降水量,风速等多种天气指标。

(二)实验环境

见表2。

(三)评价指标

使用均方根误差(RMSE)平均绝对误差(MAE) 准确率(Accuracy)三种指标来评估模型的预测性能。

(四)实验结果

1.数据特征分析

由于交通流数据会受到空间时间以及其他不确定因素的影响所以将从其空间相关性、时间相关性和不确定性这三种特征对其进行可视化分析。

空间相关性:图1中选取了以25号路段为核心路段其他路段为其相邻路段,时间为9月18日上午,天气晴,以此进行探究。由图中交通流趋势变化我们可以看出25号路段会受到其相邻路段(31,19,18,21,24号路段)交通流变化的影响,其影响因素包括因直行与左右转弯而汇出或流出的交通流。以10:30这一时间点为例,在位于25号路段上游路段的18号31号以及24号路段的交通流减少时,25号路段的交通流也有所减少,而位于其下游的19号路段的交通流大幅提高。同理在11:30左右,25号路段因上游路段的交通流减少而减少,之后因上游路段交通流增长而增长,最后趋于稳定。从这一点可以清楚地看出,一个路段的车流量会受到其他路段的限制,因此,车流量与道路网络的空间布局之间存在着密切的联系。

时间相关性:图2选取了25号路段早高峰时间段(上午六点至九点),一周内的交通流变化图,其交通流变化大体相同,大约在每日的6:30左右达到低谷,之后开始上涨,8点左右交通流会达到峰值,并且在周末时的峰值数据一般会高于其他时间段。研究表明,休息日、节假日等因素会显著改变交通流量,从而证实了交通流量与时间序列之间的密切联系。

不确定性:图3为25路段3日内上午六点至下午五点的交通流趋势图,其天气分别为大雨,晴天,多云。由图中数据可明显看出27日的交通流数据受天气因素影响远低于其他两日。所以天气,车祸等之类的不确定因素会对交通流数据产生很大影响。

2.实验结果分析

为评估模型在交通流预测中的性能,将其与近五年来已有模型进行比较,结果如表3所示。

由表3可以看出,将模型T-GCN与传统模型GRUs和GATs相比其RMSE分别降低了约19.22%和20.36%,其准确度也有一定提高;MFI-GAT模型在融入天气要素以及进行了数据融合后,其精准度与T-GCN 模型相比提高了0.83%,RMSE 和 MAE 分别降低了1.7%和4%,其预测结果优于模型T-GCN,可见MFI-GAT模型的可行性。

五、结语

本文提出了一种新的图注意力交通流预测模型,它将多种因素,如天气、时间、空间等,融合在一起,并利用滴滴打车“盖亚”数据公开项目的数据集,开展性能评估,与GRUs、GATs和T-GCN等模型相比较。最终结果表明,本文模型相较于这三类模型有了一定的提升。

参考文献

[1]Yuankai Wu and Huachun Tan. Short-term traffic flow forecasting with spatial-temporal correlation in a hybrid deep learning framework.[J].CoRR,2016,abs/1612.01022.

[2]Liu Y,Zheng H,Feng X,et al.Short-term traffic flow prediction with Conv-LSTM[C]//2017 9th International Conference on Wireless Communications and Signal Processing (WCSP). IEEE,2017:1-6.

[3]Yu B,Yin H,Zhu Z.Spatio-temporal graph convolutional networks:A deep learning framework for traffic forecasting[J].arXiv preprint arXiv:1709.04875, 2017.

[4]Bai J,Zhu J,Song Y,et al.A3t-gcn:Attention temporal graph convolutional network for traffic forecasting[J].ISPRS International Journal of Geo-Information,2021,10(7):485.

[5]晏臻,于重重,韩璐,等.基于CNN+LSTM的短时交通流量预测方法[J].计算机工程与设计,2019,40(09):2620-2624+2659.

[6]董真杰,郑琛瑶,张国龙.不同精度数据融合的自适应加权平均法研究[J].舰船电子工程,2014,34(10):31-33+126.

猜你喜欢

注意力机制数据融合深度学习
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统
基于数据融合的家庭远程监护系统研究
MOOC与翻转课堂融合的深度学习场域建构
融合K—T和K—L数据的洽川湿地水体提取
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现