基于改进长短时记忆神经网络-自适应增强算法的多天气车辆分类方法*

2020-10-09张照生王震坡董昊天

汽车工程 2020年9期

李达，张照生，刘鹏，王震坡，董昊天

（1.北京理工大学机械与车辆学院，北京 100081； 2.北京理工大学，电动车辆国家工程实验室，北京 100081；3.北京市电动车辆协同创新中心，北京 100081）

前言

智能交通系统是指将信息通信技术、电子传感技术、控制技术和计算机技术等有效集成运用于整个地面交通管理系统而建立的一种在大范围内、全方位发挥作用的，实时、准确、高效的综合交通运输管理系统［1］，已成为未来交通的必然发展趋势［2］。作为智能交通系统不可或缺的组成部分，车辆的特征检测和分类已经成为现在研究的热点［3］。车辆检测与分类主要有以下应用：（1）准确的车辆分类是实现交通负荷分析和预测的基础，进而可对未来的交通路线进行提前调度并优化；（2）为评估道路的使用寿命和潜在风险提供依据，进而对道路保养维护提供依据；（3）通过计算不同类型车辆的碳排放，进而评估车辆对某地区环境的污染程度；（4）对警车、救护车等紧急性和优先级较高的车辆进行识别并优先引导；（5）通过识别车辆类型实现自动收费。

国内外的一些学者通过视频检测实现车辆的分类［4］。Li等提出一种基于卷积神经网络（convolutional neural networks，CNN）视频检测的车辆分类方法，通过采用双交叉熵损失函数的CNN来对小样本细粒度车辆数据达到较好的分类效果［5］；Ma等提出一种基于通道最大池化CNN和视频检测的车辆分类方法，通过在全连接层和卷积层之间插入新层提高细粒度车辆分类任务的分类精度［6］；Wang等提出一种基于快速区域—卷积神经网络和视频检测的车辆分类方法［7］。基于视频检测的车辆分类方法具有较高的准确率，但是受天气、光照等环境因素影响较大。此外，视频信号数据量较大，对数据的传输和处理要求较高，训练模型所需时间也较长。

近年来一些学者提出基于磁传感器采集车辆磁场信号来实现车辆的分类。Taghvaeeyan等通过决策树和支持向量机（support vector machine，SVM）将车辆分为小型、中型、大型和特大型车辆4类，准确率达到了83%以上［8］；Yang等采用决策树将车辆分为5类，准确率达到90%以上［9］。但决策树需提取的特征较多，当采集的车辆信号特征较少时，不能获得较高的准确率。王卿分别利用最邻近结点算法（K-nearest neighbor，KNN）和反向传播神经网络算法（back propagation neural networks，BP）实现车辆分类，平均准确率分别达到77.6%和76.3%［10］；温美玲采用分层决策树算法将被检测车辆分为4类，准确率最高达到85.3%［11］。上述文献基于车辆磁场信号通过机器学习方法实现车辆分类，但都没有考虑磁场信号的时序特点，因此准确性不高。

随着人工智能和深度学习的发展，循环神经网络（recurrent neural networks，RNN）被广泛应用于情感分类［12］、市场预测［13］和语音识别［14］等领域以生成或预测序列［15］。而长短时记忆循环神经网络（long short-term memory neural networks，LSTM）作为最广泛应用的一种RNN，在避免梯度消失和梯度爆炸方面表现良好，对较长的时间序列训练效果更好［16-17］。本文中将LSTM与自适应增强算法（adaptive boosting，AdaBoost）结合，提出一种基于改进LSTM-AdaBoost的多天气车辆分类方法。对LSTM的隐藏层进行改进，并提出一种“多层网格法”以准确确定改进LSTM的超参数。首先建立地磁车辆检测系统平台和车辆分类方法，然后分析了基于改进LSTM-AdaBoost的车辆分类结果，并对不同车辆分类方法以及不同天气下的分类准确率进行了对比。

1 车辆地磁信号的采集与处理

1.1 车辆地磁检测系统平台构建

车辆地磁检测系统平台是实现车辆分类的基础。本文所设计的地磁车辆检测系统平台包括地磁车辆检测器和个人计算机两部分，其系统框图如图1所示。地磁车辆检测器主要由电源、微控制器（microcontroller unit，MCU）、磁传感器和蓝牙通信模块构成。系统运行时，地磁车辆检测器与计算机通过蓝牙进行数据通信，计算机将获取的数据保存在数据库中。

图1 地磁车辆检测系统

1.2 磁传感器布置高度确定

在车辆磁场信号测量的相关研究工作中，磁传感器布置高度没有统一的标准［10］。由于不同车型的构造也有所区别，从理论上建立车辆铁磁性物质分布模型的难度较大。因此，设计并实施了在不同传感器放置高度下的车辆磁场信号测量实验，在5～25 cm区间内每隔1 cm进行一次实验。图2展示了10、15、20、25 cm 4个不同高度的波形形状。

车辆信号越明显，信号的波动应越大，因此用X、Y、Z 3个方向磁场强度的标准差的平均值λ来定量描述信号采集效果。λ越大，则采集效果越好。不同布置高度下磁场强度的标准差的平均值如图3所示。从图中可以看出，当布置高度为20 cm时，λ最大，为12.41×10-7T，因此选用20 cm布置高度，以达到最高的车辆区分度。

图2 传感器不同布置高度下的波形形状

图3 不同布置高度下磁场强度标准差的平均值

综合考虑美国联邦公路局（federal highway administration，FHWA）车辆分类标准、实际测试过程中观察到的车型、车辆分类准确度和实际规划需求等因素，根据车长、车宽、车高等车辆外形几何参数将车辆分为小型、中型和大型车辆3类。各类型车辆划分标准如表1所示。

表1 车辆类型划分标准

车辆信号是指当某一车辆经过检测器附近时，对地磁场基准值产生扰动的部分。须通过对无车状态下的磁场强度进行测量，进而给X、Y、Z三轴的磁场强度做出补偿，使无车情况下的三轴磁场强度在0附近波动。经过磁场补偿以后3种类型车辆的典型波形如图4所示。

2 改进LSTM-AdaBoost方法

2.1 改进LSTM网络模型

LSTM是一种改进的RNN，隐藏层结构如图5所示，其中yt、ht为t时刻的输出，ct为t时刻的状态，xt为t时刻的输入，相比于普通的RNN，LSTM隐含层结构多了遗忘门ft、输入门it和输出门ot。这3个门决定了循环神经网络要记忆哪些重要信息和遗忘哪些不重要的信息，因此LSTM在避免梯度消失和梯度爆炸方面表现良好，对较长的时间序列训练效果更好。

图4 经过磁场补偿以后3种类型车辆的典型波形

图5 LSTM的隐藏层结构

根据Gers等的研究，若将细胞的状态添加到“门”输入中，LSTM训练效果会更好［18］。LSTM通过遗忘门ft、输入门it、输出门ot决定记忆哪些重要信息和遗忘哪些不重要的信息，如果把隐含层的状态也作为门的输入，那么LSTM也能通过遗忘门ft、输入门it、输出门ot决定记忆哪些重要状态和遗忘哪些不重要的状态，从而提高LSTM的效果。本文中将t-1时刻的状态输入到遗忘门ft、输入门it、输出门ot中。改进LSTM的隐藏层内部结构如图6所示。

图6 改进LSTM隐藏层结构

改进后的LSTM中各参数满足如下关系式：

式中：Wf、Wi、Wo、Wc分别为遗忘门、输入门、输出门、输入单元状态权重矩阵；bf、bi、bo、bc分别为遗忘门、输入门、输出门、输入单元状态偏置矩阵。

2.2 改进LSTM-AdaBoost方法

AdaBoost是由Freund等提出的一种用于解决二分类问题的集成学习方法［19］。经过改进产生的AdaBoost.M1算法将二分类扩展到多分类问题，Ada-Boost.M2算法不仅可处理多分类问题，还引入置信度来进一步提高分类效果。由于本文中将车辆分为小、中、大3种类型，是一个多分类问题。因此采用AdaBoost.M2算法对多个改进LSTM弱分类器进行集成，通过迭代更新各样本的权重，结合策略形成改进LSTM-AdaBoost强分类器，提高车辆分类的准确性。改进LSTM-AdaBoost方法整体框架如图7所示。

图7 改进LSTM-AdaBoost方法

2.3 基于改进LSTM-AdaBoost的车辆特征检测与分类方法

当车辆经过地磁传感器时，产生的地磁信号服从时间序列分布，因此改进LSTM模型的输入为一段时间内X、Y、Z三轴的磁场强度，输出为车辆的类型，因此选择“多对一”架构。AdaBoost将10个改进LSTM分类器进行集成，通过各LSTM分类器车辆分类的错误率对训练样本的权重进行更新迭代，最后再通过各改进LSTM分类器的车辆分类的错误率确定各改进LSTM分类器的权重。车辆分类流程如图8所示。

图8 基于改进LSTM-AdaBoost的车辆分类流程

设样本训练集为

式中：yi∈Y＝｛1，…，k｝，i为训练样本的编号，k为车辆类型数，k＝3；N为样本数量。

具体步骤如下。

（1）预处理：提取X、Y、Z三轴的磁场强度数据，并进行磁场强度补偿。

（2）设置初始条件

设置AdaBoost的初始条件：设置迭代次数T为10，初始化分布权重D1（i）与样本权重为

式中：i＝1，2，…，N；y∈Y-y。

设置改进LSTM的结构与超参数：定义损失函数与优化方法。本文根据车辆磁场信号来识别车辆类型，实质上是分类问题，因此选用交叉熵函数作为损失函数。使用Adam作为优化方法，根据损失函数的梯度更新权重和偏置。设定学习速率、时间步长、样本数量、输入维度、输出维度、全连接层神经元个数、全连接层激励函数和正则项。

（3）更新分布权重，令

则标签加权函数为

则分布权重为

（4）训练改进LSTM网络

初始化权重和偏置，并通过反向传播算法训练改进LSTM网络。当N＞Nmax时停止训练，保存模型，得到弱分类器ht，ht的输入为加权后的X、Y、Z 3个方向的磁场强度，输出为车辆分类结果。否则返回步骤（3）。N为当前交叉熵连续不低于历史输出最低交叉熵的次数。本文中取Nmax＝10。

（5）计算弱分类器的错误率：

（6）更新样本权重：

式中 βt为第t个弱分类器的修正系数，βt＝εt／（1-εt）。

（7）如果 εt＞0.5且t≤T，则返回步骤（3）继续进行迭代，否则迭代结束，得到强分类器H（x）为

3 结果分析与对比

3.1 改进LSTM超参数的确定

改进LSTM的超参数包括学习速率、时间步长、样本数量、输入维度、输出维度、全连接层神经元个数、全连接层激励函数和正则项系数。神经网络各个超参数的大小对模型的准确性和泛化性有至关重要的作用［20］。本文中将数据划分为训练集、开发集和测试集，在训练集和开发集上对不同的超参数进行试错，通过比较不同超参数的交叉验证的准确率确定最优的超参数，然后用测试集对模型超参数确定的效果和模型的训练效果进行验证。这样既充分利用了数据集，又增强了模型的泛化性。

共测试了640辆汽车信号，按60%、20%、20%划分各数据集，训练集、开发集、测试集车辆数分别为384、128、128。

由于LSTM的超参数有8项，如果对所有超参数都进行试错，则计算量巨大，而一些超参数可通过模型的输入、输出以及数据的格式确定。

模型的输入为车辆X、Y、Z三轴的磁场强度，因此输入维度为3。模型的输出为车辆的类别，因此输出维度为1。测试的车辆信号数据中，最长的信号数据长度为125，因此确定时间步长为125。全连接层激励函数最常用的有sigmoid函数、tanh函数和relu函数。relu函数是修正线性单元，主要作用是将负数变为0，sigmoid函数的作用是把一个实数通过非线性函数压缩至0～1之间，而tanh函数的作用是把一个实数通过非线性函数压缩至-1～1之间，通常，tanh函数在隐藏层中的效果要优于sigmoid函数，因此全连接层激励函数选择tanh函数。

如果学习速率过大，则会使代价函数产生震荡，甚至会超过局部最小值导致无法收敛。如果学习速率较小，则达到收敛所须迭代的次数就会非常多，导致训练时间增长，学习速率取0.000 1。为提高分类的准确率，LSTM共由6层组成：3层改进LSTM隐藏层、输入层、输出层和全连接层。

为准确确定改进LSTM的其他超参数，提出一种多层网格法来对全连接层神经元个数与正则项系数在训练集和开发集上进行试错，首先将正则项系数与全连接层神经元个数划分为不同的区间。

正则项系数取0.000 1、0.001、0.01、0.1和1。全连接层神经元个数取10，20，…，200，经试错发现，当正则项系数为0.001～0.01且全连接层神经元个数为100～110时，交叉验证的准确率最高，为79%～81%。再将区间进行10等分，取正则项系数为0.001，0.002，…，0.01，全连接层神经元个数为101，102，…，110。发现正则项系数为0.005且全连接层神经元个数为102～104时，交叉验证的准确率最高，为85%。因此LSTM的超参数取正则项系数为0.005，全连接层神经元个数为103。

3.2 实车分类结果

采用3.1节中确定的超参数对模型进行训练，训练集和测试集的交叉熵随迭代次数的变化规律如图9所示。由图可见，训练集的交叉熵较低，说明模型得到了充分训练，测试集的交叉熵较低，说明模型未发生过拟合，超参数确定较为合理。训练效果较好。

图9 训练集和测试集的交叉熵

表2为各车型的分类准确率。从表中可以看到，类型一、三均有较好的分类效果，而类型二的分类效果较差，准确率为71.8%。其主要原因是，类型二中的SUV与第一类车型中的轿车由于结构和大小近似，产生的波形也类似，因此难以实现准确区分。

表2 各车型的分类准确率

3.3 不同分类方法对比

为比较不同汽车分类算法的效果，对改进LSTM-AdaBoost、改进LSTM、LSTM、KNN、BP神经网络5种方法的准确率进行对比。KNN方法参考王卿等［10］的研究进行特征提取，改进LSTM、LSTM、BP算法采用本文提出的“多层网格法”确定神经网络隐藏层节点数和正则化系数。最终得到的5种方法的准确率如表3所示。

表3 5种方法分类准确率对比 %

从表中可以看出，5种方法均对类型一和类型三有较好的分类效果，而对类型二的分类效果较差。BP神经网络在类型一的准确率高于KNN，但在类型二和类型三的准确率略低于KNN。改进LSTMAdaBoost在类型一的准确率与BP神经网络相同，但在类型二和类型三的准确率高于KNN和BP神经网络。对比改进LSTM-AdaBoost、改进LSTM和LSTM的准确率可以发现，改进LSTM-AdaBoost类型二的分类准确率有明显提高。改进LSTM-AdaBoost在该数据集上的效果优于其他4种方法。

3.4 不同天气对比

在车辆分类检测的方法中，视频检测器应用最广泛，但视频检测器受恶劣天气的影响较大，在遇到大风、下雪、暴雨和雾霾天气时精度较差［21］。磁传感器在未来的智能交通系统中需大规模布设于各路段以进行全天候的运转，为比较不同天气下改进LSTM-AdaBoost的分类效果，在晴朗、暴雨和雾霾天气3种天气下各测得640辆汽车的磁场信号，采用改进LSTM-AdaBoost进行训练，得到各天气下的分类准确率，见表4。从表中可以看到，晴朗天气和雾霾天气各类型车辆的准确率相差不多，这是因为雾霾天气只会对视野造成影响，对磁传感器的影响不大。暴雨天气下各类型车辆的分类准确率均有所下降，但下降幅度不大，最大下降了3.9个百分点。

表4 3种天气分别训练时车辆分类准确率%

为进一步研究采用不同天气的训练集对分类准确性的影响，将晴朗天气的磁场信号数据作为训练集，将暴雨和雾霾天气的磁场信号数据作为验证集，得到各天气下的分类准确率，见表5。对比表4和表5可以发现，雾霾天气各类型车辆的准确率相差不多，说明雾霾天气对磁传感器几乎没有影响；暴雨天气下（表5）各类型车辆的分类准确率均低于表4，类型一、二、三车辆分类准确率分别降低5.4、14和6.3个百分点，这是因为类型二的磁场信号本来区分度不大，加上暴雨天气的影响，准确率急剧下降。暴雨天气下的结果也说明暴雨天气对磁传感器采集的信号有一定影响。因此如果想要实现车辆准确分类，须采集各天气的车辆磁场信号数据作为训练集。

表5 各天气车辆分类准确率对比 %

4 结论

为提高车辆分类准确率和减小天气对准确率的影响，提出一种基于改进LSTM-AdaBoost的车辆分类方法。对LSTM的隐藏层进行改进，并采用“多层网格法”以准确地确定改进LSTM的超参数。经分析与对比，得出以下结论。

（1）选择不同磁传感器布置高度，对大量交通车辆的实测所得的波形变化程度进行对比，用X、Y、Z 3个方向磁场强度标准差的平均值来定量描述信号采集效果，20 cm布置高度可以获得最好的测量效果。

（2）相比于KNN、BP神经网络、改进LSTM和LSTM，本文所提出的改进LSTM-AdaBoost和多层网格法具有较高的分类准确率，3种类型车辆分类准确率分别为90.6%、71.8%和92.2%，平均分类准确率比KNN高10.1个百分点，比BP神经网络高8.9个百分点。

（3）改进LSTM-AdaBoost、KNN、BP神经网络、改进LSTM和LSTM 5种方法对类型二车辆分类准确率均较低。类型二车辆与其他车辆区分度较差。

（4）对晴朗、暴雨、雾霾3种天气下的磁场信号数据采用改进LSTM-AdaBoost进行训练时，晴朗和雾霾天气下各类型车辆的准确率相差不多，最大相差0.9个百分点；暴雨天气下各类型车辆的分类准确率均有所下降，但下降幅度不大，最大下降了3.9个百分点。

（5）将晴朗天气的磁场信号数据作为训练集，将暴雨和雾霾天气的磁场信号数据作为验证集时，雾霾天气各类型车辆的准确率与将3种天气的磁场信号数据作为训练集时的准确率相差不大，最大相差2.4个百分点；而暴雨天气最大相差14个百分点。因此如果想要实现更为准确的车辆分类，须采集各天气的车辆磁场信号数据作为训练集。