基于CNN-BiLSTM的高速公路交通流量时空特性预测
2022-03-16刘永乐谷远利
刘永乐,谷远利
(北京交通大学 综合交通运输大数据应用技术交通运输行业重点实验室,北京 100044)
近年来,世界范围内的交通拥堵问题愈发严重,城市道路和高速公路的交通事故频发,解决以上问题迫切需要有效的交通控制与诱导策略。交通流量预测是利用实时交通数据的信息滚动来预测未来的交通状况,作为交通流控制和诱导的前提正发挥着越来越重要的作用。
目前已有大量关于交通流量预测的研究成果,早期的方法有传统线性预测法,线性预测方法简单易操作,但不能很好地反映不规律的交通流状态,为适应不断波动的交通流,又出现了传统非线性预测方法。后随着计算机技术的发展以及人们对准确实时交通的掌握,出现了现代智能预测方法,如基于机器学习和深度学习的预测方法。由于单个方法会出现或多或少的缺陷,近些年出现了组合预测方法,该方法是将不同预测方法组合,弥补单个预测方法的缺点,以达到更好的预测效果。
Abadi等[1]估算了无法获得交通数据的交通网络中所有路段的交通流量,但只能预测后30 min的短时交通流。Deng等[2]将时间序列分析问题转化为图像分析任务,提出的模型具有预测路网不完整流量数据的能力,但这些深层网络具有复杂的架构,且可解释性较弱。HTM分层时间记忆[3]具有作为短期交通流量预测的有效工具潜力,其效果与LSTM相当,且在交通流量分布发生变化时得到改善,但不能很好地从模型输出中检测异常流量,并将其用于推断异常事件的存在。Ma等[4]将机器学习算法与统计模型相继连接,通过ARIMA分析对其进行后处理,从而显著提高预测的准确性,局限性在于机器学习算法只考虑了最简单的传统神经网络。Minal等[5]将神经网络和模糊逻辑的互补功能相结合,在短期交通流量预测上取得了令人满意的成绩。Lv等[6]提出了一种基于SAE模型提取交通流抽象和潜在特征的方法,但当交通流量较小时,观察流量与预测流量之间的微小差异会导致较大的相对误差。温惠英等[7]针对高速公路交通量的预测问题,引入一种新的基于双向长短期记忆网络的预测方法,在预测非线性问题时具有较好的泛化能力。王硕等[8]创新性地将混沌理论和改进BP神经网络相融合,用思维进化算法优化BP神经网络,提高预测精度。戢晓峰等[9]用BP神经网络对样本数据进行处理,再将LSTM捕获的数据特征输入到SVR回归层中,实现站点级别的交通流量预测,但没有推广到路网范围。陆文琦等[10]采用了基于ARIMA模型和PSO-BP模型组的合加权城市快速路短时交通流速度预测方法,预测的拟合度较高。Wan等[11]提出了CTS-LSTM相关时间序列预测方法,能够同时显示序列内时间和空间的依赖性。Xiao等[12]提出了一种混合式LSTM神经网络,能够预测更精确的结果,且适用于实际交通网络中的不同交通状况。Tian等[13]运用多尺度时间平滑法推断丢失数据,并学习残差预测。
上述研究仅关注短期交通流量预测,忽略了中期交通流量在一定时间跨度内随空间的变化规律。文中采用CNN-BiLSTM从时空两个维度预测美国加州一条高速公路连续10个工作日内的25个断面交通流量,并通过结果分析,验证了文中模型相比于其他基准预测方法具有更高的预测精度。
1 交通量预测模型
1.1 交通量预测问题描述
交通量[14]是指某一时段内,连续通过道路某一断面的车辆或行人数。交通流的预测实质是对交通量、速度和占有率等交通流基本参数进行预测,文中主要预测高速公路断面的交通量。
根据交通量预测时间长短可以把交通量预测分成长期预测、中期预测和短期预测[15]:长期预测主要是交通规划四阶段法中对规划区域目标年交通量的预估,中期预测主要是交通管控中小时、日、周的时间跨度预测,短期预测主要为交通诱导中时间跨度小于15 min的实时预测。文中研究的是中期交通量预测。
1.2 CNN模型
卷积神经网络(CNN)分为一维CNN、二维CNN和三维CNN。一般CNN包括输入层、卷积层、池化层和全连接层等[16]。
数据输入层预处理输入的数据,卷积层在反向传播训练中将学习到合理的权值,池化层减少空间信息参数、提高运算效率,防止过拟合。全连接层把经过池化之后的神经元展开为一维向量形式,方便对数据进行处理。
图1和图2分别为典型的一维和二维卷积神经网络示意图。
图1 典型的一维卷积神经网络结构
图2 典型的二维卷积神经网络结构
1.3 LSTM 模型
长短期记忆LSTM[17]比普通循环神经网络RNN[18]多出3个控制器,即输入门、输出门和遗忘门。输入门是LSTM单元获取外界新信息的通道,输出门在每一步中生成输出,遗忘门决定是否选择性遗忘相应的输入结果。LSTM的神经网络结构如图3所示,其算式如式(1)—式(6)所示。
图3 经典的长短期记忆神经网络结构
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(Wo·[ht-1,xt]+bo)
(5)
ht=ot∘tanh(ct)
(6)
1.4 BiLSTM模型
双向长短期记忆BiLSTM[19]可以同时获得正向和反向信息,输出结果由这两个方向的信息综合处理得到。每个单向LSTM的传播与前面介绍的前向LSTM传播算法完全相同。BiLSTM的结构如图4所示。
图4 双向长短期记忆神经网络结构
一维CNN只沿一个方向做卷积和池化处理,更适合一维数据,如时间序列、自然语言等;二维CNN沿两个方向做卷积和池化处理,普遍应用于二维领域,如计算机视觉和图像处理等。鉴于文中从时空两个维度预测交通流量,用一维CNN在空间维度上做一维卷积池化来提取线性25个连续断面的交通流量空间局部特征,因此,文中选择一维CNN。
LSTM模型解决了循环神经网络RNN的长期依赖问题,独特的“门”结构能够避免梯度爆炸和梯度消失,且具有长时记忆能力强的优点。BiLSTM在具备LSTM优势的同时,还能在时间维度上考虑前向和后向的双向时间序列信息,预测更加全面准确。
一维CNN适合提取局部空间特征,BiLSTM兼顾双向时间序列信息,将一维CNN与BiLSTM相结合,可以从时空特性上更周全地分析交通流量数据,使预测结果的拟合度更高。
1.5 CNN-BiLSTM模型
基于以上分析,文中提出了基于CNN-BiLSTM的融合预测模型,结构如图5所示。其中CNN主要提取时间序列不同空间位置的特征,BiLSTM主要提取时间序列内部的时间信息特征。
图5 卷积-双向长短期记忆神经网络模型结构
该模型由输入层、CNN层、BiLSTM 层、全连接层和输出层组成,CNN层由一维卷积(Conv_1D)层和最大池化(MaxPooling_1D)层堆叠组成,BiLSTM层由一层BiLSTM堆叠成,分别在CNN层和BiLSTM层的末尾加上Dropout层随机丢弃节点,以防止过拟合。将研究断面历史交通量经过归一化和缺失值修复等数据预处理后输入CNN和Dropout层,进行局部空间特征提取,提取后得到多组特征向量,将特征向量依次输入BiLSTM层、Dropout层、一层flatten层和三层Dense层中,得到输出结果。
2 实例验证和结果分析
2.1 数据来源和数据预处理
2.1.1 数据来源
本实验采用美国加州PeMS交通量数据,以第八区I10-E高速公路连续25个公路断面为研究对象。数据采集时间为2016年2月1日至2016年4月11日的工作日(周一至周五),共50 d。取前40 d数据为训练集,最后10 d数据为测试集,数据采集间隔为5 min。
2.1.2 数据预处理
采用最大最小归一化方法对数据进行预处理,最大最小归一化算式为
(7)
式中:x′为最大最小归一化后的结果,xi为序列的第i个真实值,xmin为序列数据的最小值,xmax为序列数据的最大值。
对于缺失数据,采用简单加和平均进行插值修复。
2.2 模型训练
2.2.1 评价指标
在交通流量预测的测试集中,设置了5种评价指标:均方误差MSE,均方根误差RMSE,平均绝对误差MAE,平均绝对百分比误差MAPE以及拟合度R2。这5类评价指标的算式为
(8)
(9)
(10)
(11)
(12)
2.2.2 超参数设置
优化方法采用mini-batch梯度下降法,模型选择Adam算法,迭代100次,批量大小设置为256,学习率为10-3,在训练数据集上采用十折交叉验证。设置回溯时间窗步长T为待定参数(T=1,2,3,4,5,6,7)。设置L层CNN中L为待定参数(L=1,2,3),包括卷积层与最大池化层,设置1层BiLSTM。CNN层卷积核滤波器深度设置为64,kernel size为2,步长为1,设置padding为same,以保证CNN输入和输出的空间维度一致,采用ReLU函数作为激活函数。Max Pooling的pool size为2,步长为1,padding设为same。BiLSTM的双向隐藏单元数总共为512个,分别在CNN和BiLSTM的末尾增加1层随机丢失Dropout,防止过拟合,Dropout rate的参数均设置为0.1。
为获得合理的模型结构,对不同回溯时间窗长度T(T=1,2,3,4,5,6,7)和CNN层数L(L=1,2,3)取值组合下的CNN-BiLSTM模型进行测试和预测。选择CNN-BiLSTM模型的回溯时间窗长度T为4(回溯时间窗长度=4×5 min=20 min),设定各变量结构中CNN层数为1层,在上述参数设定条件下,CNN-BiLSTM模型的预测结果偏差较小,具有较高精度。
2.3 不同对比模型设置
为检测模型精度,将所选模型与其余基准模型进行对比,基准模型包括:整合自回归移动平均ARIMA、卷积神经网络CNN、长短期记忆LSTM、门控循环单元GRU、双向长短期记忆BiLSTM、卷积-长短期记忆CNN-LSTM、反向传播神经网络BPNN和支持向量回归SVR。
2.4 结果分析
表1比较了文中模型和其他几种对比模型在所研究断面上的平均预测效果。通过表1可以看到,预测效果最好的CNN-BiLSTM比次好的CNN-LSTM的MSE、RMSE、MAE和MAPE分别提升了29.789%、13.666%、18.198%和25.220%,表明:BiLSTM相较于LSTM能够同时考虑2个方向的交通流量信息,能够顾及到时间序列的前后依赖性特点;相比于单独的LSTM、GRU和BiLSTM模型,CNN-LSTM和CNN-BiLSTM结合时空特性预测交通流量,考虑更周全、且预测结果拟合度更高;SVR是传统的机器学习预测模型之一,能够学到非线性变换数据,预测准确性明显高于传统线性模型。此外,由于文中预测的是未来时段25个公路横断面的交通流量,更多关注的是时间特征,而CNN注重的是局部空间特征的提取,预测效果并不理想;BPNN是传统智能非线性预测模型的代表,虽然模型效果不如现代智能预测方法,但精度高于传统线性预测方法ARIMA;ARIMA模型十分简单,只需要内生变量而不需要借助于其他外生变量,但其要求时序数据是稳定的,或者通过差分化之后是稳定的,本质上只能捕捉线性关系。
表1 各模型断面平均预测效果比较
下面分别进行同一断面不同日期不同方法、不同断面不同日期同一方法以及不同断面平均10 d不同方法的比较。
2.4.1 同一断面不同日期不同方法比较2.4.1.1 每日交通流量比较
研究了美国加州第八区110-E高速公路在2016年3月29日至4月11日10 d 25个公路断面的交通流量变化情况,并进行了预测分析。选取19号断面比较同一断面不同日期的不同方法预测结果。
图6为第19号断面在不同方法下的预测结果。其中子图(a)~(j)分别代表预测的10 d每日交通流量的变化情况。
图6 第19号断面2016年3月29日至4月11日交通量预测
从图6可以看出:在早晚高峰时段,最大车流量可达450 veh·(5min)-1,文中模型的预测误差依旧稳定在恒定范围内,有较强的适用性。
为量化CNN-BiLSTM的优越性,将该方法与其他方法进行对比,表2所示为2016年3月29日至4月11日在19号检测器断面的指标。
表2 不同方法3月29日~4月11日在19号检测器断面5项评价指标对比
由表2可知,CNN-BiLSTM法在预测期10 d中的5项评价指标平均值优于其他几种方法,模型准确度较高、预测能力较强,体现了该模型中BiLSTM在时间上的适用性。
2.4.1.2 不同周同一天交通流量相似性比较
为方便说明,同样选取第19号检测器断面为研究对象,利用SPSS(一种数据统计分析软件)进行相关系数计算。
表3展示了预测期内不同周同一工作日的实际交通量与采用不同种预测方法预测得到的交通量相似性比较结果。
由表3可知,相关系数均大于0.9,可认为不同周同一工作日的交通流量具有较强相关关系。表3中每种预测方法均反映出了周二的交通量相似性最强,周五的相似性相较于其他4天最弱,文中预测方法预测出的交通量与真实值最吻合、相似度相差最小,因此,验证文中使用方法的适用性较强。
表3 预测期内不同周同一工作日实际与预测交通量相关系数
2.4.2 不同断面不同日期同一方法的比较
将预测期的第1天3月29日、第2天3月30日、第4天4月1日、第8天4月7日和第10天4月11日中25个断面的实际值,与CNN-BiLSTM预测得到的值分别用热力图形式展现出来,如图7所示。
图7 卷积-双向长短期记忆神经网络模型工作日预测效果
由图7可知,CNN-BiLSTM模型在工作日的早高峰07:00—09:00和14:00—19:00点均能动态地反映交通状态变化情况,在不同断面处真实值与预测值相差较小,预测结果与真实交通量比较吻合,体现了该模型中CNN在空间上的适用性。
2.4.3 不同断面平均10 d不同方法比较
图8显示了CNN-BiLSTM方法和其他几种方法的比较,平均10 d中在16、18、20、22和24号检测器断面上的5项评价指标的簇状柱形汇总。
图8 16、18、20、22和24号检测器断面五项评价指标簇状柱形
由图8可知,CNN-BiLSTM在16、18、20、22和24号检测器断面的预测较稳定,相比于其他模型在不同断面处的误差波动较小,尤其在交通量波动最大的第22号检测器断面处,其他对比模型的预测误差都较大,而文中模型在第22号检测器断面处的拟合优度R2接近于96%,明显高于其他模型。无论在时间还是空间上,CNN-BiLSTM的预测精度均优于基准模型,体现了该模型中CNN和BiLSTM组件分别具有出色的空间局部信息提取和时间序列预测能力,在交通流量波动较大时段或公路断面,预测精度均较高,模型结果更接近真实值。
3 结论与展望
针对交通流量序列存在的时空相关性等特征,文中提出了一种结合CNN与BiLSTM各自优点的CNN-BiLSTM模型。CNN-BiLSTM模型通过CNN和BiLSTM分别提取空间和时间特征,通过实例验证分析表明:相比于其他基准模型,文中的模型能够较好地适应不断波动的交通流量数据,早高峰和晚高峰预测的稳定性和精度均较高。
同时,研究也存在一些不足:可以增加注意力关注时间序列中更重要的因素,充分利用交通流中3个参数分析交通流量;对外部因素,如雨、雪、交通事故、公路改线等的考虑上也要有所关注。以上这些都是未来的研究方向。