基于时空混合残差网络的事故黑点预测研究

2020-12-24马德明梁宏斌

交通运输工程与信息学报 2020年4期

马德明，梁宏斌

基于时空混合残差网络的事故黑点预测研究

马德明，梁宏斌

（西南交通大学，交通运输与物流学院，成都 611756）

深度学习在图像识别、自然语言处理方面的研究进展突飞猛进，也逐渐开始应用于交通领域，目前主要应用于交通流和交通需求预测，但对事故的研究较少。本文将事故数据作为一种时空数据，在时间和空间维度分析其与其他深度学习所研究数据的差异，利用深度学习相关技术分别从时间和空间维度建模，提取相应的特征与属性，并将这些模型组件组装与融合，搭建了时空混合残差网络，用于事故黑点预测。在对真实数据进行预处理后载入模型进行实验，训练效果良好，损失最后降到0.862 4，随机选取序列的预测事故图平均误差为-5.45%，与其他模型相比损失最小，结果表明本网络具有较好的事故黑点预测能力。

交通事故；事故预测；深度学习；事故黑点

0 引言

当前随着交通的不断发展，事故也间接地有所增加，事故受到道路交通发展的影响。事故黑点是交通安全研究的重要方向，在高效整治交通事故方面可起到关键作用。

当前研究事故黑点的方法多为线性回归方法或多元统计分析方法，Lord等[1]研究表明采用广义估计方程比普通数学模型能更好地分析交通事故的时间相关性；MA与Gill[2，3]建立了多变量泊松-对数正态回归模型来进行事故数的预测与事故黑点的探测；考虑位于同一交通通道的交叉口之间的空间相关性，WANG等[4]采用广义估计方程分析Central Florida地区的交叉口安全影响因素；Huang与Fawcett等[5，6]应用贝叶斯进行事故黑点识别；Murat[7]考虑事故类型和事故产生的影响因素，采用香农熵方法确定黑点的安全水平；孟祥海[8]研究了滑动窗窗体长度及滑动步长对事故多发路段鉴别影响；Bham[9]基于主成分分析方法提出一种综合分级度量来识别高速路上的事故黑点；Wang[10]建立一元负二项条件自回归模型和二元负二项空间条件自回归模型来分析单车事故和多车事故的影响因素以及这些因素在事故黑点中的一致性情况；Harirforoush[11]提出网络核密度估计的空间分布与临界事故率网络筛选综合方法来探测事故黑点；Ulak[12]比较了常用的基于网络的热点检测方法，深入了解所选热点检测方法在使用不同空间权重时的异同；Zahran[13]对比了基于风险水平的空间交通事故分析方法与道路审计方法的差异，并确定了所研究道路的危险水平；石小林等[14]运用二元Logit模型对事故严重程度进行了分析。

现阶段深度学习在图像识别、自然语言处理等方面取得了重大的突破，而在交通领域的应用还不太广泛，主要应用于交通流的研究。Shi[15]对时空序列预测问题的机器学习方法进行了系统的回顾；Li[16]将交通流建模为有向图上的扩散过程，并引入扩散卷积递归神经网络，建立了将交通流的空间与时间相关性结合的深度学习框架；Zhao[17]将图卷积网络和门控递归单元相结合，提出了时态图卷积网络模型进行城市交通量的预测；Zhang[18]基于深度学习的方法提出ST-ResNet模型，用来集中预测一个城市每个区域的人群流入和流出情况。

本文在分析事故数据时空特性的基础上，将深度学习技术应用于事故黑点预测研究中，建立了时空混合残差网络来预测事故黑点，并以真实数据进行实验，验证了模型的有效性。

1 深度学习相关技术

1.1 卷积神经网络

卷积神经网络是一种前馈神经网络，是处理位置相关信息的有效深度学习结构，通过卷积神经网络，可以提取出事故数据空间维度的特征。

对于某些问题，我们关注的重点在于部分较为重要的输出节点与输入节点之间的关系，这部分重要的节点以图像的形式表现出来就称为感知域。此时层与层之间并非全连接，而是仅连接到感知域。此外，使用权值共享的思想，可将参数量再进一步的减少。例如使用权值矩阵：

与感知域的输出相乘累加，作为相应位置的下一层输入；同时滑动感知域窗口，对于其他的感知域也采用该权值矩阵与感知域的输出相乘累加，作为对应位置的下一层输入。这种共享权值的“局部连接”网络其实就是卷积神经网络。每个输出节点用权值相乘累加的方式提取对应感知域的特征信息，其实就是离散卷积运算：

1.2 深度残差网络

网络模型层数的增加是一把双刃剑，虽然可以提高网络泛化能力，但另一方面网络的层数越多就越难训练，这主要是由于梯度弥散和梯度爆炸现象造成的。为了解决深层神经网络这两个问题，深度残差网络通过在卷积层的输入和输出之间添加跳过连接或残差连接建立回退机制，如图1所示。

图1 ResNet结构

经过添加这样一个跳过连接后，即使出现梯度弥散或者梯度爆炸问题，也可以通过此跳过连接的回退机制，将梯度以线性的方式回退到之前的输出中进行梯度更新，完成残差学习。即最差的效果也不会低于上一输出层的效果，大大提高了模型的训练效率与表达能力。

2 事故数据时空特征分析

事故数据，本质上是一种时空数据。在时间维度上记录事故发生的时间，在空间维度上标记事故发生的位置。时空数据相对于文本数据、图像数据、视频数据等一系列在深度学习研究中常见的数据，具有以下特点：

（1）时间维度的周期性和趋势性。事故数据在一定程度上具有周期性，这本质上跟随交通流量的变化而表现出来。同时事故的重复性变化不是严格的发生，而是具有趋势性的上扬和下降，例如随着冬天的到来气温逐渐降低，事故的发生相对于天暖的时候有所增加，这不是严格的周期性，而是趋势性的上扬问题。

（2）空间维度的距离性和层次性。根据地理学第一定律可知，距离越远，其相似度越低，这是空间相关性的基础。空间粒度的划分可以有不同的大小，以反映不同层次的信息。大粒度可以反映整体的网络结构信息，小粒度可以反映局部的细节信息，空间层次性划分的意义在于：有的事故的相似度，或称为相关性，可能在较小的一层很低甚至不存在，但是往上归纳一层即可找到；而有的事故的相似度在较大的一层比较高，但是在较小的一层中能分析出它们之间的差异。距离和层次是空间数据的特有属性。

3 时空混合残差网络

3.1 基于空间维度的建模

在交通事故预测问题中，发生在不同地点的交通事故存在相似之处，这其中的空间相似性主要包括道路线形（横纵曲线）、周边环境特征、道路限速等空间特征的相似性，这些空间特征会不同程度的影响事故的发生，在不同的地点隐性表达。

相邻区域的地理和环境特性具有一定的相似性，卷积神经网络可以通过卷积操作，利用过滤器，即前文所述的感知域来捕获这种相似性。如图2所示，浅层的网络层负责捕获附近地点和距离较近地点的空间相似性，并将这种特性编译到输出中，深层的网络层基于之前的输出，捕获距离较远地点甚至是全城范围内的空间相似性。经过以上的处理，整个城市的空间相似性就已经被提取出来，并储存在最后的网络图中。

图2 多层卷积

3.2 基于时间维度的建模

这样的处理，具有以下三点优势：

（1）保证时间维度仍然具有一定的连续性，可以提取出序列信息；

（2）刻画时间维度的特性；

（3）减少总序列的长度，从而间接减少单个卷积层所需要处理的图像数量，提高学习效率。

3.3 残差单元

为了解决深层网络训练效果差的问题，本文在模型中使用残差学习。对于每一个卷积神经网络，堆栈了个残差单元，如图4所示。

图4 残差单元

残差单元的处理过程可表示如下：

3.4 时空混合残差网络

前文分别对空间和时间维度建模后，构建了相关的组件，为了组建完整的神经网络，将上述组件按一定的规则或连接方式进行组装，最终的网络结构如图5所示。

图5 时空混合残差网络

不同的地点所发生的事故在一定程度上表现出周期性和趋势性，但是各自地点所体现出的周期性属性和趋势性属性的强度却不完全相同，为了能够准确地在不同地点反映出这两种特性，本文使用了基于参数矩阵的融合方法：

最后，预测值与真实值之间的损失（loss）用均方差来计算：

4 模型实现与实验

4.1 架构与运行环境

本文的模型实现代码结果如图6所示。

图6 模型的代码架构

各模块所实现的具体功能如表1所示。

表1 模块与功能

4.2 数据预处理

本文使用的数据是美国弗吉尼亚州的事故数据，该数据集包含了弗吉尼亚州从2010年1月1日至2017年3月18日所发生的事故，从总共79万条数据中筛选18万条北弗吉尼亚地区数据用于实验，数据坐标范围如表2所示，分别为东南角和西北角的坐标数据。

表2 数据范围顶点坐标

为满足多层卷积神经网络输入格式的要求，需将所在区域划分为×的空间网格，作为后续事故数据映射的框架。在实际研究中，网格划分标准的确定需要权衡数据覆盖率、计算复杂度和预测难度三者之间的关系。本文在综合考量上述三者关系的基础上经过多次实验，最后选择表3所示的网格划分方式。

表3 网格划分概况

这样的网格划分方式既避免了数据稀疏问题的出现，同时降低了计算复杂度与预测难度，提高了网络的训练效率与预测精度。

图7 事故映射图示例

4.3 实验结果分析

本文分别对16×16和32×32的网格规模模型进行了实验，发现16×16的网络规模更加适合本数据集，故以下的分析均基于16×16网格规模的实验结果。

图8为模型的训练损失变化图。浅色折线为实际损失变化曲线，但是不便于分析，故进行了平滑处理，得到平滑后的训练损失变化曲线。为了有更好的展示效果，未将损失的高位部分展示出来，模型损失值的最高点位于8.234，随后迅速下降，约于150步附近达到0.885 8处，随后在波动中整体呈现出损失下降的趋势，说明模型在不断地被训练与优化，且符合深度神经网络模型训练的普遍情况，约于2790步处达到模型的最优点，损失值为0.658。

图8 训练损失

图9为模型的测试损失变化图。浅色折线为实际损失变化曲线，但是不便于分析，故进行了平滑处理，得到平滑后的测试损失变化曲线。可观察到，经过训练后的模型，刚开始损失值就较低，起始为0.960 1，后有所上升，属于随机情况，最高值为10步附近的1.019，随后也迅速下降，约于130步附近达到0.922 3，随后在波动中呈现下降趋势，在328步附近达到最低值0.862 4。

图9 测试损失

测试损失略高于训练损失属于正常情况，因为测试损失不仅包括了模型的泛化能力，还包括了训练集上的损失。根据训练损失和测试损失，可说明该时空混合残差网络具有预测事故黑点的能力。

从真实事故数据中随机选取4个时间序列的事故映射图，并同时选取对应序列的预测事故图，用于实验结果的绝对误差分析。实验结果的具体绝对误差如表4所示，其中绝对误差的定义为（预测值-真实值）/真实值。

表4 绝对误差

由表4可知，事故黑点预测效果整体非常好，其中效果最好的地区误差甚至降到了1%附近。现无法做到准确的定位、预测每一起交通事故，更多的是尽可能准确地去预测在何时、何地会出现大量的交通事故，即事故黑点，故总体而言，预测准确度均在较高水平。对于本次选取的4个随机序列，平均绝对误差为-5.45%，除去效果最差的序列a，其余3个序列的平均误差仅为-2.89%，已经达到非常高的准确度。

除了进行本文所提出的时空混合残差网络实验，为了对比模型的效果，还应用了自回归模型（AR），有时序选择的长短时记忆网络（S-LSTM），卷积长短时记忆网络（ConvLSTM）进行对比实验。实验的损失计算仍用均方差，其结果如表5所示。

表5 实验效果对比

由上表可知，本文的时空混合残差网络优于其他几个模型，验证了本模型的有效性。

5 结束语

使用深度学习方法时对数据有不同的要求，故本文首先分析了事故数据相对于文本数据、图像数据，在时间和空间维度所呈现出的特性，在此基础上对时间和空间维度分别建模捕捉其时空特征，并将上述建模得到的组件进行组装与融合，构建时空混合残差网络。在对真实数据集进行预处理后，输入模型进行实验，训练效果较优，随机选取的序列事故映射图的平均误差在-5.45%，同时和其他模型相比损失最低，表明该模型具有较好的事故黑点预测能力。但本文的研究中未能将事故产生的经济损失，人员伤亡等属性囊括在内，后续的研究可将事故严重程度和其他影响因素作为输入对象，以提高预测的准确度。

[1] LORD D, PERSAUD B N. Accident prediction models with and without trend: application of the generalized estimating equations procedure [J]. Transportation Research Record, 2000, 17 (1): 102-108.

[2] MA J, KOCKELMAN K M, DAMIEN P. A multivariate Poisson-lognormal regression model for prediction of crash counts by severity, using Bayesian methods [J]. Accident Analysis & Prevention, 2008, 40 (3): 964-975.

[3] GILL G S, CHENG W, ZHOU J, et al. Comparative analysis of cost-weighted site ranking using alternate distance-based neighboring structures for spatial crash frequency modeling [J]. Journal of Transportation Safety & Security, 2019, 11 (1): 79-101.

[4] WANG X, ABDEL-ATY M. Crash estimation at signalized intersections along Corridors: analyzing Spatial Effect and Identifying Significant Factors [J]. Transportation Research Record, 2006, 1953 (1): 98-111.

[5] HUANG H, CHIN H C, HAQUE M M. Empirical Evaluation of Alternative Approaches in Identifying Crash Hot Spots: Naive Ranking, Empirical Bayes, Full Bayes Methods [J]. Transportation Research Record, 2009, 2103 (1): 32-41.

[6] FAWCETT L, THORPE N, MATTHEWS J, et al. A novel Bayesian hierarchical model for road safety hotspot prediction [J]. Accident Analysis & Prevention, 2017, 99 (1): 262-271.

[7] MURAT Y S. An entropy (shannon) based traffic safety level determination approach for black spots [J]. Procedia-social and Behavioral Sciences, 2011, 20: 786-795.

[8] 孟祥海, 张道玉, 吴佩洁. 滑动窗窗体长度及滑动步长对事故多发路段鉴别影响 [J]. 交通运输系统工程与信息, 2018, 18 (4): 148-155.

[9] BHAM G H, MANEPALLI U R, SAMARANAYKE V. A composite rank measure based on principal component analysis for hotspot identification on highways [J]. Journal of Transportation Safety & Security, 2019, 11 (3): 225-242.

[10] WANG X, FENG M. Freeway single and multi-vehicle crash safety analysis: influencing factors and hotspots [J]. Accident Analysis & Prevention, 2019, 132 (1): 52-68.

[11] HARIRFOROUSH H, BELLALITE L. A new integrated GIS-based analysis to detect hotspots: a case study of the city of Sherbrooke [J]. Accident Analysis & Prevention, 2019, 130 (1): 62-74.

[12] ULAK M B, OZGUVEN E E, VANLI O A, et al. Exploring alternative spatial weights to detect crash hotspots [J]. Computers, Environment and Urban Systems, 2019, 78 (1): 13-98.

[13] ZAHRAN E-S M M, TAN S J, TAN E H A, et al. Spatial analysis of road traffic accident hotspots: evaluation and validation of recent approaches using road safety audit [J]. Journal of Transportation Safety & Security, 2019, 2 (1): 1-30.

[14] 石小林, 李涵, 黄子富. 基于二元Logit模型的直角事故受伤严重程度分析[J]. 交通运输工程与信息学报, 2020, 18 (1): 106-110.

[15] SHI X, YEUNG D-Y. Machine learning for spatiotemporal sequence forecasting: A survey [J]. ArXiv Preprint ArXiv: 2018, 1808 (1): 65-68.

[16] LI Y, YU R, SHAHABI C, et al. Diffusion convolutional recurrent neural network: Data-driven traffic forecasting [J]. ArXiv Preprint ArXiv: 2017, 1707 (1): 19-26.

[17] ZHAO L, SONG Y, ZHANG C, et al. T-gcn: a temporal graph convolutional network for traffic prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 9 (1): 3848-3858.

[18] ZHANG J, ZHENG Y, Qi D. Deep spatio-temporal residual networks for citywide crowd flows prediction[J]. ArXiv Preprint ArXiv: 2016, 1610 (1): 81-100.

Accident Black Spot Prediction Based on Spatio-Temporal Heterogeneous Residual Network

MA De-ming，LIANG Hong-bin

(School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China)

Deep learning has progressed rapidly in theresearch areas of image recognitionand natural language processing. Additionally, its application in the field of transportation isincreasinggradually. Currently, it is mainly utilized in the prediction of the traffic flow and demand. However, the research on accidents is yet insufficient. In this study, we analyzed the difference between accident data as a type of spatio-temporal data and compared it with otherspatio-temporal data studied through deep learning. Building a spatio-temporal heterogeneous residual network for accident hotspot prediction requires spatial and temporal dimension modeling, extraction of corresponding features and attributes, and assembly and fusion of these model components. The real data were pre-processed and loaded into the model, which was then experimented on. The training effect was satisfactory, and the loss had decreased from 8.234 to 0.862 4. The average error of the predicted accident map of a randomly selected sequence was -5.45%, and the loss in this case was minimal when compared with other models. The results indicate that the proposed network exhibited a superiorcapability of predicting accident hotspots.

traffic accident; accident prediction; deep learning; accident hotspot

1672-4747（2020）04-0068-08

U491.31

10.3969/j.issn.1672-4747.2020.04.009

2020-03-15

马德明（1995—），男，云南楚雄人，主要研究方向为交通安全、事故黑点，E-mail: chdrailmdm@163.com

梁宏斌（1972—），男，四川成都人，副教授，博士，研究方向为移动云计算、信息安全等，E-mail: 14273385@qq.com

马德明，梁宏斌. 基于时空混合残差网络的事故黑点预测研究[J]. 交通运输工程与信息学报，2020, 18(4): 68-75

（责任编辑：刘娉婷）