考虑降雨影响的短时交通量预测研究

2022-05-26王晓阳侯明业徐青杰王笑风

河南科学 2022年4期

王晓阳，侯明业，徐青杰，杨博，王笑风

（河南省交通规划设计研究院股份有限公司，郑州 450000）

短时交通量能否精准预测是制定交通规划、交通引导、交通控制等方案的重要基础，实时准确的交通量预测可为驾驶员提供信息和指导、降低通行成本、优化出行决策，为交通管理部门制定先进的交通管理策略提供重要的参考依据.但由于短期交通量受到各方面因素的制约和影响，使得交通量的预测出现较大的波动性和不确定性，极大地增加了交通量精准预测的难度，在目前复杂的交通量环境条件下，交通量的短时精准预测仍是一个较难解决的问题.

短期交通量的预测本身是一个时间序列的问题［1-2］，因此，在早期的交通量模型预测中，时间序列模型在交通量预测研究领域应用较为广泛［3-4］，其中应用较多的是滑动平均模型（ARIMA），该模型提出后在交通量预测统计方面取得了显著成效［5-7］，后续的研究学者也在该模型的基础上［8-10］，不断进行了相应的扩展和优化.但局限于模型的参数特性，使得该模型在面对越来越复杂的交通流问题和随机性问题上，难以满足预测精度要求.

近些年来，针对非线性和随机性问题，基于非参数模型的机器学习凭借预测精度高的优势逐渐成为众多学者的研究热点，彭文勤［11］针对交通流数据缺失的现象，建立了双层双向结构的门控循环神经网络，可将交通流序列中缺失的数据进行有效恢复，该模型考虑了路网的多模式特性，对交通量数据的缺失进行了有效弥补.为了获取更为真实可靠的交通流量数据，范馨月［12］基于小波降噪的原理将含有噪声的交通流序列进行分解、降噪，在此基础上进行的数据滤波与原极限学习机相比，预测精度有了较大幅度的提升.王习昇［13］运用离散小波分解的原理，提出了一种动态小波变换网络预测模型，构建了以频率感知的多特征学习模型进行交通量预测，与单特征的学习模型相比，多特征学习的训练及预测结果具有更高的预测精度.Fu等［14］为了保留交通流信息中的长期序列信息，减少梯度消失的现象，将门控循环单元（GRU）应用于交通量的短期预测，通过将交通流信息存贮并传递到下一单元，成果预测了未来5 min的交通流.袁华［15］针对传统卷积神经网络在短期交通流预测上无法获取长时记忆的问题，提出了扩张-因果卷积神经网络，通过引入扩张卷积来增加感受野大小，以此解决长时记忆获取和信息泄露问题，在短期交通量预测上计算效率要优于其他对比模型.

在非线性函数的作用下，神经网络可以很好地处理交通流的非线性和随机性特征，这在近几年的文章中已经达成了共识，但从大量关于交通量预测的文献来看［16-20］，绝大多数的神经网络预测模型都忽略了非交通因素对交通量预测的干扰和影响，例如降雨降雪等天气因素、道路颠簸等道路行驶因素.因此，在深度学习的模型中是否可以通过添加外界条件和数据来源来提高预测模型的精准度和泛化性能，这是一个值得深入研究的问题.

通常人们的理解是降雨降雪等不利的天气条件会对交通量有着不利的影响，甚至于导致拥堵和事故的发生，但如果没有全面深入地了解天气因素对交通量的影响程度，交通管理部门也就无法在相关管理或运营中发布具体的措施来提高道路的交通通行能力和安全性能.针对上述问题，本文将降雨因素作为外界影响交通量的特征纬度，构建交通量神经网络预测模型，对比分析常规深度学习模型与考虑多源数据变量的预测模型精准度的差异性.

1 交通量预测模型

1.1 长短期记忆模型（LSTM）

为了在模型的训练和预测中能够捕捉到时间序列特征，记忆并存储以往的信息，引入了循环神经网络（RNN）来解决交通序列问题，RNN通过学习复杂的时空内部特征，将前几个隐藏层数据作为当前的数据来源，从而使模型在学习和训练的过程中完整地保存了历史数据.其中应用最为广泛的是长短期记忆模型（LSTM），该模型利用记忆单元来替代传统的隐藏单元用以克服梯度消失和爆炸的现象，记忆模型单元由输入门、遗忘门、输出门三个门控单元组成，这些单元控制了隐藏函数的信息流，其中，输入门控制隐藏信息流的传递，遗忘门可以决定当前存储的历史信息是否遗弃，输出门控制输出信息的向外传导.

输入交通量的时间序列定义为X=(x1,x2,…,xt)，定义记忆单元隐藏向量M=(m1,m2,…,mt)，定义记忆单元向量C=(c1,c2,…,ct)，则遗忘门ft为：

其中：ot为输出向量.

1.2 深度信念神经网络

深度信念网络（Deep Belief Network，简称DBN）最早由Geoffrey在2006年提出，它是一种具有大量隐藏层和隐藏单元的深度神经网络，由多个的受限玻尔兹曼机（Restricted Boltzmann Machine，简称RBM）组成.训练DBN的过程是逐层递增的，在每一层的计算中，前一层计算所得的数据向量将被用来推断隐藏层，推断出的结果则又被当作下一层的数据向量来使用.通过RBM的逐层叠加，DBN模型就可以做到从原始数据中逐层提取有效特征，最终获得更高层次的表达方式.该算法的核心思路是通过逐层的深度学习来不断优化神经网络的连接权重，可以通过无监督训练的方式有效挖掘数据特征，在增加分类器的条件下，将训练结果对深度学习模型进行有监督的调整，不断优化模型的学习和诊断能力.这种能够在无监督的条件下不断学习和提取关键特征的能力可以有效地帮助我们获取外界影响交通流量的干扰因素的关键特征.

每一个RBM由一个可见层v和隐藏层h构成，其中，输入向量与可见层关联，特征检测器与隐藏层关联，层与层之间为全连接，而层内之间无连接.RBM的能量函数可以定义为：

其中：〈.〉data表示数据分布下的期望；〈.〉model表示模型分布下的期望.由于同层的神经元并未相互连接，〈.〉通过计算条件概率分布很容易获得，公式为：

其中：激活函数是sigmoid函数.

1.3 考虑降雨影响的综合预测模型

在预测模型的建立过程中，本文通过在输入门中添加了若干的受限玻尔兹曼机，旨在快速提取交通量及降雨数据特征.每个RBM模型分别使用未标记的数据进行单独训练，并将训练结果作为输入导入到模型中，同时在RBM模型的基础上建立一个完全连接的输出层，最后利用增减算法标记的数据信息对预测模型的整体架构进行微调.出于预测和学习的目的，本文在DBN预测模型上方添加一个监督层，通过使用增减微调算法来不断调整模型，不断优化标记学习到的数据特征，在本文中，选择全连接层作为顶层，全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来，本文将这种考虑降雨因素的综合预测模型命名为RAIN-DBN（简称R-DBN），结构图如图1所示.

图1 考虑降雨影响的R-DBN预测模型Fig.1 R-DBN prediction model considering the influence of rainfall

与R-DBN的结构类似，R-LSTM的输入数据也包含交通流量数据与降雨数据.该模型还有一个隐藏层作为记忆单元，用于循环保存交通数据的时间序列特征，结构图如图2所示.

图2 考虑降雨影响的R-LSTM预测模型Fig.2 R-LSTM prediction model considering the influence of rainfall

2 预测结果分析

两种预测模型的学习步骤如下：首先，将原始的交通数据和降雨数据作为输入数据集和预测数据集来不断训练优化模型；然后，使用架构优化数据集来决定最佳的架构参数，包括输入维度、架构层数、每层隐藏单元大小和迭代次数等；其次，使用训练数据集来训练最优架构下的两种深度学习预测模型；最后，使用测试数据集来测试训练完成的预测模型，将考虑R-DBN、R-LSTM与未考虑降雨影响的常规模型DBN、LSTM和ARIMA进行对比，使用不同的预测模型分别预测未来10 min和20 min后的交通量变化情况，部分预测结果见图3.

图3 实际流量观测值与模型预测值Fig.3 Actual flow observations and model predictions

用于评估预测结果的计算参数由平均绝对误差（Mean Absolute Error，MAE）、平均绝对百分比误差（Mean Absolute Percentage Error，MAPE）、方根误差（Root Mean Square Error，RMSE）构成，参数模型如下.

其中：N代表流量样本个数；xi和yi分别代表观测流量和预测流量.

经过参数优化调整，确定训练步数为400，隐藏层数3层，训练次数20次，得到不同预测模型的评测指标，结果见表1.

表1 预测模型评测指标结果Tab.1 Evaluation indicator results of predictive models

由表1可知，所有模型的性能预测结果都表明未来10 min交通流量的预测精准度都要高于未来20 min交通流量的预测精准度，这表明，现阶段的交通量预测模型会随着未来预测时间的增加，预测精度有着较大幅度的下降，这与其他相关研究的预测结果相一致［21-22］；同时，R-DBN模型预测精度略低于R-LSTM，与未考虑降雨因素影响的LSTM模型性能相当；本文提出的R-DBN、R-LSTM与未考虑降雨因素的模型相比，预测精度有一定程度的提高，这表明，多源数据的输入确实可以在一定程度上提高深度学习模型的准确性.