APP下载

基于深度学习的高速公路交通流数据监控方法研究

2021-06-29林艺华

粘接 2021年5期
关键词:深度学习

林艺华

摘 要:用深度学习的方法对高速公路上的定时交通流进行监测,有关部门根据监测到的数据结果进行交通管控,缓解道路压力,保障交通安全。首先,用递归神经网络RNN进行短期交通流量预测,然后利用残差反卷积形成深层网络从而实现长期的交通流量预测。在此基础上,创新性的使用图卷积进行特征提取,提高模型的鲁棒性。通过实验证明,基于深度学习的长短期交通流量预测具有重要的研究意义和使用价值。

关键词:深度学习;RNN;残差反卷积;图卷积:交通流量预测

中图分类号:TP38 文献标识码:A 文章编号:1001-5922(2021)05-0182-05

Research on Expressway Traffic Flow Data Monitoring Method Based on Depth Learning

Lin Yihua

(Yuexiu (China) Transportation Infrastructure Investment Limited Company, Guangzhou 510600, China )

Abstract:The content of this paper is to monitor the regular traffic flow on expressways with the method of deep learning, and relevant departments carry out traffic control according to the monitored data results to relieve road pressure and ensure traffic safety.  First, the recurrent neural network RNN is used for short-term traffic flow prediction, and then the residual deconvolution is used to form a deep network to realize long-term traffic flow prediction.  On this basis, the innovative use of graph convolution for feature extraction improves the robustness of the model.  Experiments show that the long-term and short-term traffic flow prediction based on depth learning has important research significance and application value.

Key words:deep learning;  RNN; residual deconvolution; graph convolution: traffic flow prediction

0 前言

随着城市化的不断发展,越来越多的人开始聚集。这给我国旅游业带来了机遇,但是却给交通管制带来了前所未有的压力。目前,一些关于交通的单位时间内人流量和速度的研究已经成为了重点的研究内容。基于中期和长期客流预测通常指的是时间跨度在未来3~15年的范围之内,而短期客流预测通常具有下一周或一个月的预测范围。对城市客流的研究是城市交通规划、运营和安全防护的重要方面。短期客流预测可用于优化线路和客流组织,为运营商提供预警和多方决策,进一步提高城市的科学管理水平,对于安全和操作具有实际重要性。该预测可以为先进的客流控制和诱导方法提供证据,该方法可以防止拥塞,践踏和其他安全事故。而一些长期预测也是在短期预测的举出上不断的进行优化的,因此二者都对交通管制具有指导意义。

1 基于RNN的交通流量预测

RNN循环神经网络中的LSTM长短期记忆网络目前在对自然语言的处理上有着很好的效果。由于,LSTM的提出能够很好的解决RNN的梯度爆炸和消失的问题,二者的结合使用符合交通流预测的问题。

1.1 RNN的简介

RNN被称为循环神经网络是因为它的输入和输出不是相互独立的,能够利用记忆来联系上下文的关系。在交通流的预测中,未来的交通流量是和之前的样本数据有联系的,所以用RNN来做交通流预测。

图1展示了RNN的完整结构图,以预测5个长度的句子为例,具体可以通过以下的公式进行运算。

xt指是在时刻t的输入样本数据,例如x1是一个one-hot vector对应整个句子的第二个单词,st是在时刻t的隐藏状态,也是网络的记忆部分,具体st计算如下:

函数 f 使用的是非线性的例如tanh或者ReLU,Ot是时刻的输出,例如在我们进行预测时时一个句子的下一个单词,那么我们希望得到的输出是我们字典中所有詞的概率组成的向量,计算公式如下:

具体来用以下的公式来表示RNN在其具体的某一层网络结构的的计算方法:

状态和当前输入传输给Tanh函数,得到的结果在-1和1之间,从而进行判断来调节网络,最后把Tanh输出和Sigmoid二者的输出相乘,Sigmoid输出将决定在Tanh输出中哪些信息是相对重要的并需要保留的。

1.2 数据的准备及处理

本次实验是对道路交通流的短期预测,也是后续研究的基础实验。由于keras相当于对tensorflow函数的封装。所以,实验环境使用的是keras2.3版本,python3.6版本,windows环境下的tensorflow-gpu1.5版本。把Caltrans Performance Measurement System (PeMS)获取的作为本次实验的数据集,得到的原始数据是长度为n的一个一维数据,通过数据标准化,并且用keras对数据进行清洗,划分出实验所需的训练集和测试集。具体按照训练集70%,测试集30%。

1.3 实验所用的网络模型

把上述划分好的数据集进行乱序处理。图2所示是本次实验的两层隐层LSTM网络结构。可以看出,第一层LSTM网络的输出增大为64,而第二层LSTM实现了降维处理。第一层和第二层的叠加使用能够有效的利用LSTM产生的输入和输出之间的联系。用RNN结构中的忘记门和输出门来缓解梯度爆炸的情况的出现。

1.4 网络训练过程

编码器使用的是Auto-Encoders自动编码。首先,对第一层输入进行编码,然后利用第二层的参数计算进行重新输入,然后利用重新设置的输入与实际输入形成损失参数,整体是一个三层结构。同时,提出图卷积(图3)循环网络创新的在交通流检测上的应用。

时空注意力机制的应用能够关注到重要的交通信息,防止出现遗漏状况。训练过程用train_seas()函数进行训练,使用RMS作为优化器,学习率设置为0.001.一个batch为256,进行12个循环次数,训练时间在30min之内。用CPU来实验也可以进行,时间上过慢。

1.5 实验结果

在本次实验中,我们使用的是MAE、MSE、RMSE、MAPE、R2几个指标对交通流的预测结果准确性进行评估。这里,使用之前训练好的模型对测试集进行预测。具体的实验结果如图4所示。

其中,蓝色为真实值,橙色为使用RNN和LSTM预测出的结果值。可以看出,由于训练次数不够,模型的拟合程度不高。数值的波动性较大,可能由于采集的数据中存在中断现象导致的。通过其他线条的预测结果显示,这种方法检测效果良好,如表1所示。

GRN是一种图卷积循环神经网络,SAES传统的预测方式,是利用编码器对交通流进行监测的一种方式。从三者的精度对比图可知,基于循环神经网络的预测方式精度不差,且代码量简单,所以使用这种方法具有可行性。

2 基于残差网络的交通流监测

目前,基于对高速公路上交通流预测大多采用的是短时预测。短期预测大多基于一周内的样本数据进行预测,上一章节中的RNN就是短期预测的一种代表方式。本章将研究使用一种深层次的残差反卷积网络模型对交通流量实现长时间的预测。其在精度上有了较大的提升,并且算法的鲁棒性较强。

2.1 实验配置和数据集介绍

本次研究使用的是从网络上利用python爬虫技术爬取的高速公路上海市延安高架和内环的连续3d之内的样本数据,即以高速公路上的交通流量为标准。从而实现长时的交通流量预测实验。选取的实验验证时间为上午的八点到十点内的时间段。对于爬取到的缺失数据进行删除或修复,要考虑到数据的连续性。选择1000个数据作为训练集,同时选取了30个样本数据作为测试集。每隔350m进行检测。

本次实验由于实验的样本数据容量较大以及网络结构相对复杂,所以对硬件配置的要求高一些。所用的实验环境是windows系统下的tensorflow,i7的NVIDIA Geforce GTX1080 GPU,也可以用远程服务器进行实验。

2.2 实验所用的网络模型

为了增强数据的关联性从而更好地提升精度,增强鲁棒性。将得到的原始数据按照每五分钟的时间间隔,进行输入。同时,这种方法的使用还能有效的去除噪音对数据产生的影响。在对历史数据的选取过程中用以下的公式进行数据的输入。

其中,Si表示不同的时间输入,x指的是每天监测到的交通流矩阵数据样本。m表示所用到的检测器的数量,n是取到的时间间隔在时间跨度上的划分。这里的T是周期性的,由于每5min监测一次,所以接下来的矩阵时间维度上的输入为T-5,T-10。

本次实验最重要的部分就是最后的生成器部分,使用的是残差反卷积的网络模型,并在此基础上进一步进行模型的改进。具体的网络模型结构图如下图5所示。

由图5得到了实驗所用到的网络结构图,首先将输入的交通数据流矩阵作为输入经过三层卷积神经网络,激活函数分别使用了Tanh和Relu,然后经过上采样进入反卷积神经网络的结构中去。上采样的作用是较少数据量和改变数据的维度。经过了三层反卷积最后得到了样本数据的特征图。反卷积操作与卷积操作是相反的。运用反卷积能够减少在特征提取过程中的相关特征丢失,并且保持了数据有相同的维度。

2.3 实验的训练过程

引入了空间的注意力机制,使得模型能够更具泛化性。从而实现时间和空间上的动态联系。本小节中将重点介绍实验训练过程中的重要过程,反卷积上采样操作。反卷积是图像的上采样的经典操作之一,其他两种是双线性插值法和反池化法。反卷积又叫做转置卷积,其操作过程与一半的卷积过程相反。其操作过程较为简单,以下面的公式推导来理解反卷积的具体实现过程:

o=size of output

i = size of input

P = padding

S = strides

利用上述已经定义好上述的数学描述,那么在进行反卷积时的输入与输出的计算关系式为利用上面反卷积可以实现图像由小分辨率到大分辨率的对应映射。解决了经过CNN卷积层后图像尺寸变小的问题。这里,可以在相关步骤内提取到更为清晰的交通流特征数据。

2.4 实验结果分析

本次实验设置的每个卷积核的步长为1,学习率设置为0.0001,网络进行了约20000次的训练。首先,展示出了利用不同的时间输入粒子的有效性。具体的判别方法与第二章中的实验相似。

评估实验结果的精度使用的是平均误差MSE,平均绝对误差MAE以及均方根误差RMSE。以下为不同时间输入的有效性验证。并且创新型的在实验中引入注意力机制,确保各个检测器之间有着相同的距离,这里设置为3.5km,在时间维度,考虑到不同的时间间隔高速公路上的交通流数据的关联性。如表2所示。

DCN為我们本次实验的反卷积操作,而另外两组对比实验是记录了单独提取低时间2min和高时间25min作为两种不同的间隔时间的实验结果。经实验结果验证,本次研究提出的提取关联的时间粒子模型在有着较好的性能。

2.5 评价方法

在进行道路系统的交通流的预测过程中,需要使用间隔时间来进行时时间步的设置。在实现长期预测时,这种方法尤为适用。

均方根误差(RMSE)和平均绝对误差(MAE)都符合这一要求,尽管RMSE更常用,并将在本次研究中采用。与MAE不同,RMAE对待测数据更敏感 。这个问题的性能指标将是从第1d到第7d的一周内时间交通流的RMSE。可以使用的一个可能的评分是所有预测日的RMSE,它更具有准确性。

均方根误差,它是实验所测的预测值与真值偏差的平方和观测次数n比值的平方根,在实际测量中,由于实验的次数不多,真值只能用最能被信任的量(最佳)值来代替。同时,均方根误差能够快速区别出数据中的最大值和最小值,所以,均方根误差能够很好地反映出试验过程是否准确。其作为实验精度的评价指标之一,这一测量列真误差的均方根差(真误差平方的算术平均值再开方),称为标准偏差,以σ表示。σ反映了测量数据偏离真实值的程度,σ越小,表示测量精度越高,因此可用σ作为评定这一测量过程精度的标准。具体的公式如下式:

3 结语

文章首先论述了高速公路的交通数据流的几种监控方法以及其数据特点,然后使用深度学习的研究方法。创新性的使用了图卷积神经网络代替传统的卷积神经网络对高速公路上的交通流数据进行特征提取。同时,做了两组对比实验,实验证明RNN和LSTM相结合的方法比传统的编码器预测交通数据流在性能上有了很大提升。又提出了一种引入注意力机制的残差神经网络用于交通流的长期预测,将RMSE作为模型的评价指标进行实验评估,经过不断的对比实验验证出提出的融合模型具有有效性。

同时,通过优化算法配置参数来进行网络和算法上的优化。分别在自制的轻量数据集和具有实际生活中的上海高速公路路段的交通流进行监测,在两个数据集上都有着良好的预测效果。并且克服了RNN在预测过程中易出现的梯度消失和爆炸等情况。在以后的实验中,要克服硬件上的困难,在稍大一些的数据集上进行实验,从而对算法进行优化,提升模型得到泛化性。

参考文献

[1]陈淑燕.交通流量预测方法和多相位交通信号模糊技术的研究[D]南京:东南大学,2003.

[2]贺国光,李宇.基于数学模型的短时交通预测方法探讨[J].系统工程理论与实践,2000(12):51-56.

[3]胡小健,陆健.基于二步自适应的交通实时预测模型[[J]南京:东南大学,210096

[4] Zheng Zhao,Weihai Chen,Xingming Wu,et al. LSTM network: a deep learning approach for short-term traffic forecast[J]. IET Intelligent Transport Systems, 2017, 11(2):68-75.

[5] Yang Hao-Fan; Dillon Tharam S; Chen Yi-Ping Phoebe. Optimized Structure of the Traffic Flow ForecastingModel With a Deep Learning Approach[J]. IEEE Transactions on Neural Networks& Learning Systems, 2017, 28(10):2371-2381.

[6] Lv Y, DuanY, Kang W, et al. Traffic Flow Prediction With Big Data: A Deep LearningApproach[J]. IEEE Transactions on Intelligent Transportation Systems, 2015,16(2):865-873.

[7] KoesdwiadyA, Soua R, Karray F. Improving Traffic Flow Prediction With Weather Informationin Connected Cars: A Deep Learning Approach[J]. IEEE Transactions on VehicularTechnology, 2016, 65(12):9508-9517.

[8] Omar Y.Al-Jarrah,Paul D.Yoo,Sami Muhaidat , et al. Efficient Machine Learning for Big Data : A Review [J]. Big Data Research, 2015, 2(3):87-93.

[9] Chun Mei Duan.Design of Big Data Processing System Architecture Based on Hadoop under the Cloud Computing[J]. Applied Mechanics and Materials, 2014, 3207:6302-6306.

[10] Anyu Cheng,Xiao Jiang,Yongfu Li, et al. Multiple sources and multiple measures based traffic flowprediction using the chaos theory and support vector regression method[J]. Physica A: Statistical Mechanics and its Applications, 2017, 466:422-434.

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究