APP下载

基于VMD-BiLSTM-BLS 模型的短时交通流预测①

2022-06-27卢海鹏张龄允丁昱杰

计算机系统应用 2022年5期
关键词:交通流基线精度

卢海鹏, 韩 莹, 张 凯, 张龄允, 丁昱杰

(南京信息工程大学 自动化学院, 南京 210044)

1 引言

目前, 交通流预测模型中最常见的模型就是统计模型和机器学习模型. 其中统计模型中典型的代表是差分自回归移动平均(autoregressive integrated moving average, ARIMA)模型. 文献[3]用ARIMA 模型在周期性交通流数据下进行短时交通流预测; 文献[4]指出ARIMA 模型适合于线性的数据预测, 对于非线性强度较高的交通流预测有一定的局限性. 鉴于此情况,适合非线性的机器学习被广泛地应用到交通流预测中.支持向量机(support vector machine, SVM)是传统机器学习中最常见的模型. 文献[5]利用SVM 模型预测异常状态下的交通流, 证明了SVM 模型能够提高预测精度. 但是, 研究表明机器学习难以捕捉交通流序列长期记忆的特点, 从而影响机器学习预测精度.

近些年, 随着人工智能的发展, 深度学习已经成为当前研究的热点, 被广泛地应用于交通流预测领域. 文献[6,7]将长短时记忆网络(long-short term memory networks, LSTM)应用于交通流预测, 通过LSTM 对交通流数据中的特征进行提取, 从而更好地表示交通流数据的非线性, 达到更好的预测结果. 为了提高交通流预测模型的准确性和泛化性, 文献[8]提出了基于模糊分析的LSTM 交通流预测. 文献[9]利用卷积神经网络(convolutional neural network, CNN)与LSTM 相结合的深度结构, 构建二者相结合的复合模型, 通过捕获交通网络的时空相关性进行有效的预测. 文献[10]在CNN-LSTM 模型基础上加入了注意力机制(attention mechanism), 利用注意力机制重新分配权重的特点, 进而提高了预测精度. 在交通流时间序列中, 考虑前向和后向数据的变化规律有助于提高模型的拟合精度, 文献[11]利用双向长短时记忆网络(bi-directional longshort term memory, BiLSTM)模型对高速公路交通流进行预测, 结果表明BiLSTM 模型预测精度优于LSTM模型预测精度. 文献[12]为了充分发挥CNN 对空间特征的选择提取能力, 同时利用BiLSTM 提取时间特征,构建CNN-BiLSTM 复合模型, 通过实验证明该模型的预测值与真实值更贴合, 证明了BiLSTM 挖掘数据特征能力比LSTM 更强, 对于复杂的回归问题具有较好的拟合性能. 深度学习模型结构复杂, 层数较多, 容易陷入局部最优的情况, 从而影响预测精度, 很难满足短时交通流预测.

为了解决上述问题, 2018 年宽度学习系统(broad learning system, BLS)的提出被广泛应用于各类预测领域, 从理论上证明了BLS 在时间序列的预测上具有良好的函数逼近能力, 且通过实验证明了BLS 在回归性能上表现优异[13]. 文献[14]利用KNN 筛选出时空相关性高的K个路段, 将选取的路段交通流输入到BLS网络中进行预测, 预测效果都显著的提高.

ITS 中短时车流量的数据均会存在一定量的噪声,为实现数据的准确预测, 可在数据处理时采用信号分解的方式. 文献[15]通过多种分解算法对交通流数据进行分解, 以此降低数据中的噪声对预测结果的影响,接着使用K 均值聚类将分量进行聚类, 之后通过BiLSTM对交通流进一步的预测. 结果表明, 经变分模态分解算法(variational mode decomposition, VMD)分解后的预测精度更高.

虽然上述方法都取得了较好的预测结果, 但都没解决深度学习带来局部最优的问题.本文的创新点是在交通领域首次引入BLS 与深度学习结合, 通过其得到全局最优解, 解决深度学习易陷入局部最优从而影响预测精度的缺点. 同时考虑到交通流数据的噪声干扰, 引入了VMD 进行降噪处理. 基于此, 本文提出基于VMD-BiLSTM-BLS 模型的短时交通流预测. 为了证明本文模型预测的准确性和可应用性, 选取了美国加利福尼亚州交通局PeMS (performance measurement system)交通数据库实测的交通流数据进行实验. 通过对比基线模型、消融模型以及现有模型, 结果表明: 本文模型在预测精度方面显著提升. 另外值得指出的是,本文提出的深度学习和宽度学习相结合的预测模型不但可以应用于交通领域, 其在金融、气象、海洋等需要大量时间序列分析预测等领域也有广泛的应用前景.

2 模型的构建

2.1 VMD 模型

2014 年Dragomiretskiy 等[16]提出了变分模态分解, 解决了经验模态分解中存在的端点效应和模态分量混叠的问题. 具体分解步骤如下:

2.2 BiLSTM 原理及结构

LSTM 网络在循环神经网的基础上增加了输入门、输出门和遗忘门, 通过这3 个门, LSTM 模型解决了循环神经网络中长序列依赖的问题. LSTM 数学原理运算公式如式(7)-式(11)所示.

在卫可S溶液中加入液态的单丙二醇(MPG)可将其结冰点降至-10℃,同时不会影响其功效,从而确保建筑物和场地入口处的屏障控制设备,例如脚踏消毒盆和车辆喷雾消毒在严冬季节仍可保持液态。“卫可S和卫可LSP都为畜牧生产商和养殖户提供了可靠的消毒性能和适用性,可以满足现实中的农场条件需求,从而成为各个季节保障圈舍、各类表面、设备、车辆和鞋类物品生物安全的首选消毒剂。”Cho补充道。

BiLSTM 是由前向LSTM 和后向LSTM 构成, 进行双向训练, 既保留了LSTM 能够处理长时间序列的特点, 又考虑到了前后数据变换的影响, 提高了特征提取的全局性, 对于复杂的回归问题具有较好的拟合性能. BiLSTM 的结构图如图1 所示.

图1 BiLSTM 结构图

2.3 BLS 原理及结构

在随机向量函数链接神经网络的基础上提出BLS,消除了局部最优的缺点. 图2 为BLS 结构系统图. 流程步骤如下.

图2 BLS 结构系统图

2.4 本文模型

通过上述分析, 本文集聚了深度学习和宽度学习系统的优势, 并引入了VMD 模块进行降噪处理, 提出了VMDBiLSTM-BLS 组合预测模型, 模型结构如图3 所示.

图3 VMD-BiLSTM-BLS 模型结构图

由图3 可以看出, 本文模型由车流量序列预处理、网络训练预测、预测输出3 个模块构成. 具体步骤如下:

步骤1. 车流量序列预处理. 由于每天会出现上下班高峰期, 车流量原始序列可能存在奇异值, 为了减少奇异值对数据造成不必要的影响及加快梯度下降, 本文首先将原始序列进行归一化处理, 其归一化公式如式(15)所示. 接着为了减少噪声对该模型预测结果的影响, 将归一化之后的序列进行VMD 分解, 得到多个不同频率下的子序列.

图4 BiLSTM-BLS 连接图

3 实例分析

3.1 数据来源

本文车流量数据来源于美国加利福尼亚州交通局PeMS 交通数据库实测的交通流数据, 本文选用的交通流数据是从2016 年1 月4 日至2016 年2 月16 日内工作日的1 车道点每5 分钟统计一次的交通流, 共7 776组数据.

3.2 模型参数设置和评价指标

根据本文数据集的特点, 将27 天7 776 组数据,前90%作为训练集, 后10%作为测试集. 为了提升数据的平稳性, 设置时间滑动窗口为6. 利用VMD 把原始序列分解为5 个子序列, 将子序列转换为三维的张量输入给BiLSTM 网络, 为了防止过拟合在每层的BiLSTM 后加上Dropout 机制. 再通过全连接层, 将其输出作为BLS 层的特征节点, 特征节点经过激活函数非线性变换生成增强节点, 更新权重及其偏置. 本实验是基于深度学习框架Keras 实现的, 通过多次重复实验, 选取了最优情况的数值. 具体的参数见表1. 其中Alpha 为惩罚因子,K为分解的模态数, Tol 为收敛准则容忍度, N1 为每个映射特征节点个数, N2 为映射特征个数, N3 为增强节点个数,C为正则化参数.

表1 VMD-BiLSTM-BLS 模型参数表

4 结果分析

4.1 VMD 分解分析

将原始序列进行VMD 分解, 得到5 组频率尺度不同的子序列, 图5 是交通流数据分解图. IMF0 为趋势分量, 反映了交通流序列的总体变化趋势. IMF1-IMF4为波动分量, 反映了曲线的随机波动细节. 分解的序列与原始序列相比, 平稳性和平滑性方面表现更好, 相似的细节信息更集中, 更加容易拟合.

图5 交通流数据分解图

4.2 结果对比分析

(1)与基线模型对比分析

由于基线模型比较经典, 此外交通流数据存在一定的周期性, 基线模型在具有周期性的数据上预测效果还是有较好表现. 为了验证本文所提模型的预测能力, 首先将本文模型分别与基线模型ARIMA[3]、SVM[5]进行对比, 评价指标结果如表2 所示. 各个模型的参数都是通过多次实验采用拟合效果最好的数值.

表2 基线模型与本文模型评价指标对比表

从表2 可以看出, ARIMA、SVM 模型的RMSE都大于15,MAE都大于11, 而VMD-BiLSTM-BLS 模型的RMSE、MAE均没超2, 且R2_score也达到了0.997 5. 证明了本文模型在预测精度上明显要比基线模型预测精度高, 这是由于基线模型无法挖掘出复杂、非平稳时间序列的特征.

(2)与消融模型对比分析

其次, 将本文模型与消融模型BiLSTM-BLS、VMDBiLSTM[15]进行对比分析, 其中VMD-BiLSTM 也是最新的模型. 评价指标结果见表3.

表3 消融模型与本文模型评价指标对比表

通过表3 可以看出, 本文模型与BiLSTM-BLS、VMD-BiLSTM 相比,RMSE分别下降了8.287 7、4.050 4,MAE分别下降了5.999 9、3.618 6, 且R2_score分别提高了5.8%、2.13%, 预测效果显著提升. 这是由于本文模型, 集聚了VMD 去除数据噪声的作用, BiLSTM 充分考虑前后向数据的影响, BLS 解决局部最优的优势.

(3)与现有模型对比分析

最后, 为了验证本文模型本文模型预测精度有所提升, 分别与现有模型BiLSTM[11]、当前研究较热的CNN-BiLSTM[12]模型以及最新模型, 含有注意力机制(attention mechanism)的CNN-LSTM[10]模型进行对比分析, 评价结果如表4 所示.

从表4 可以看出, 本文模型的3 个评价指标明显优于现有模型BiLSTM, 其中CNN-BiLSTM 模型与BiLSTM 模型相比,RMSE下降了1.009 5,MAE下降了0.865 4, 这是由于CNN-LSTM 不仅提取了时间特征, 还挖掘了空间特征, 可以提升预测精度. 在此基础上加上注意力机制的模型, 预测精度再次提升, 这是由于注意力机制进行权重新分配, 提高了预测精度. 本文模型与CNN-LSTM-Attention 相比,RMSE、MAE分别下降了5.784 6、4.991 1,R2_score提升了3.71%, 验证了本文模型预测效果要优于最新模型.

表4 现有模型与本文模型评价指标对比表

(4)可视化对比分析

为了更加直观地验证本文模型的有效性, 选取测试集中最后一天的交通流原始序列进行拟合分析, 图6-图10分别给出了本文模型与其他模型的预测结果对比图.

图6 BiLSTM 模型预测值与真实值对比图

从图6、图7 中可以直观的看出VMD-BiLSTM模型相对于BiLSTM 模型拟合效果有所提高, 这是由于原始序列经过VMD 分解之后, 得到不同频率的子序列, 降低了噪声对原始数据造成不良的影响, 使得拟合程度增强. 从图6 和图8 可以看出, 在上班高峰期的时候BiLSTM 模型拟合效果不如BiLSTM-BLS 模型,从而验证了BLS 解决了局部最优的问题, 提高了预测的准确性. 分析图7 和图8, 可以明显地看到, 不管是VMD-BiLSTM 模型还是BiLSTM-BLS 模型在波峰和波谷的时候拟合效果并不是很理想, 但是从图9 可以看出VMD-BiLSTM-BLS 模型明显改善了波峰和波谷不准确性的问题. 通过对图9 和图10 进行对比, 可以看到在8 点到15 点的时候, VMD-BiLSTM-BLS 模型拟合效果要比现有模型中较火的CNN-BiLSTM 模型明显提高.

图7 VMD-BiLSTM 模型预测值与真实值对比图

图8 BiLSTM-BLS 模型预测值与真实值对比图

图9 VMD-BiLSTM-BLS 模型预测值与真实值对比图

图10 CNN-BiLSTM 模型预测值与真实值对比图

通过以上实验的对比结果来看, 本文所提出的VMD-BiLSTM-BLS 模型在评价指标RMSE、MAE、R2_score均达到比较好的结果, 对短时交通流的预测有着良好的预测结果, 改善了现有模型不准确性的问题.

5 结论

准确的短时交通流预测会给人们的出行带来极大的便利, 不仅提出合理的出行意见, 而且减少了事故率.准确的短时交通流预测是构建智慧交通的关键, 所以准确的掌握短时交通流的发展趋势, 建立健全的预测系统, 有利于交通部门做出合理的疏导安排.

本文所提出的短时交通流预测模型, 是将深度学习与宽度学习进行结合, 改善了现有模型预测不准确的问题. 将本文提出的模型与基线模型、消融模型以及现有模型进行对比, 实验结果表明本文所提出的短时交通流预测模型在RMSE、MAE、R2_score三个评价指标上均表现最佳. 实验表明, 本文所提出的VMDBiLSTM-BLS 模型可以准确地预测短时车流量, 为交通部门提供了有利的参考价值.

猜你喜欢

交通流基线精度
适用于MAUV的变基线定位系统
航天技术与甚长基线阵的结合探索
基于DSPIC33F微处理器的采集精度的提高
一种改进的干涉仪测向基线设计方法
交通流随机行为的研究进展
GPS/GLONASS/BDS组合PPP精度分析
路内停车对交通流延误影响的定量分析
改进的Goldschmidt双精度浮点除法器
具有负压力的Aw-Rascle交通流的Riemann问题
技术状态管理——对基线更改的控制