基于GMM-LSTM的车辆切入意图识别研究

2023-05-30杨磊

河南科技 2023年6期

杨磊

摘要：【目的】为了能准确识别出他车的切入意图，同时解决由爆发性增长的无标签行车数据所引起的识别模型落地难的问题。【方法】本研究提出一种双层无监督的车辆切入意图识别模型，该模型由聚类模块及意图识别模块组成。聚类模块采用高斯混合模型对基于NGSIM构造的无标签数据集进行聚类分析，并挖掘其内在的数据关系，从而获取切入时不同驾驶行为对应的特征标签。意图识别模块用于识别车辆切入意图，该模块是基于LSTM搭建的。该模块先结合聚类模块来获取特征标签及无标签数据集，构造新的有标签训练集及测试集，然后将其输入到神经网络中进行训练与测试。【结果】该模型在基于真实路况的NGSIM数据集上表现较好，对驾驶意图的识别准确率达到97%，精度较高。【结论】该模型在无标签数据上具有较好的识别能力。

关键词：自动驾驶；意图识别；高斯混合模型；长短时记忆神经网络

中图分类号：U463 文献标志码：A 文章编号：1003-5168（2023）06-0028-05

DOI：10.19968/j.cnki.hnkj.1003-5168.2023.06.005

Research on Vehicle Entry Intent Recognition Based on GMM-LSTM

YANG Lei

（School of Mechatronics and Vehicle Engineering， Chongqing Jiaotong University，Chongqing 400074，China）

Abstract： [Purposes] In order to accurately identify the cut-in intention of other vehicles and solve the problem of difficult implementing of identification model caused by the explosive growth of unlabeled driving data. [Methods] This study proposes a two-layer unsupervised vehicle cut-in intention recognition model， which consists of a clustering module and an intention recognition module. The clustering module uses the Gaussian mixture model to cluster the unlabeled data set based on NGSIM， and excavates its internal data relationship to obtain the feature labels corresponding to different driving behaviors. The intention recognition module is used to identify the vehicle entry intention， which is based on LSTM. The module first combines the clustering module to obtain feature labels and unlabeled data sets， constructs new labeled training sets and test sets， and then inputs them into the neural network for training and testing. [Findings] The model performed well on the NGSIM dataset based on real road conditions， and the recognition accuracy of driving intention reached 97 %. [Conclusions] The model has good recognition ability on unlabeled data.

Keywords： automatic drive; intent identification; Gaussian mixture models; LSTM

0 引言

他车切入是一种常见的驾驶行为，其对自车的行驶状态会产生影响，尤其是在人机混驾的场景中，自动驾驶汽车能否精准高效地识别出他车的切入意图，是自动驾驶汽车能否实现安全行驶的关键，也是当前自动驾驶汽车研究的热点之一［1］。

目前，国内外对驾驶意图的识别可大致分为两类。第一类是通过建立运动学或动力学模型来对车辆的驾驶意图进行识别［2-4］。该类模型对短时驾驶意图的识别有较高的准确率，而车辆运动是复杂的非线性过程，高度简化的运动学或动力学模型在识别长时驾驶意图时，其准确率较低，精度较差。第二类是基于数据驱动的驾驶意图识别，通常采用机器学习或深度学习算法来识别驾驶意图。刘兴亮等［5］提出一种基于支持向量机的驾驶意图识别模型，其在高速公路场景中对目标车辆驾驶意图识别的准确率较高。刘志强等［6］提出一种基于马尔科夫及支持向量机的双层识别模型，在相同场景中，其识别的准确率要优于单层模型。张海伦等［7］提出一种基于双层连续隐马尔可夫模型及贝叶斯分类器的识别模型，能在他車切入的前期阶段准确识别出其驾驶意图。上述的传统机器学习模型因其具有较高的准确率、较好的实时性，从而得到研究者的广泛关注，但传统的机器学习模型同样存在高维度场景表现不佳、时序捕捉能力较差、训练参数难以确定等问题。为了解决上述问题，研究者将目光投向基于神经网络的深度学习模型，如长短时记忆神经网络（LSTM）等。

车辆行驶是一连串行为的集合，通常表现为与时间相关的数据序列，而长短时记忆神经网络能很好地捕捉该类型数据内部之间的复杂特征关系，能精确提取出连续驾驶行为的时间关系。因此，其在对他车驾驶意图识别领域中得到较为广泛的应用。季学武等［8］、梁凡［9］、闫伟等［10］使用长短时记忆神经网络来识别其他车辆的驾驶意图，在不同场景和条件下，对他车驾驶意图有较高的识别准确率。同时，考虑到人工标注的困难及对数据错标带来的误差，以聚类算法为代表的无监督学习方法在驾驶意图识别中的应用得到重视［11-13］。因此，本研究结合无监督学习的高斯混合模型（GMM）及长短记忆神经网络（LSTM），建立一种基于NGSIM数据集的无监督驾驶意图识模型，从而实现快速高效地识别出他车的切入意图。

1 数据预处理及参数提取

车辆在直线道路上行驶时，通常有车道保持和车辆切入两类行为，如图1所示。在图1中，R为自车，T为自车的左前车，S为自车的右前车。当车辆正常直线行驶时，其横向运动只会发生较小的变化，没有太大的行为波动。而在车辆切入他道的过程中，其横向运动会出现较为明显的变化趋势。因此，为了区分车辆行为是直线行驶、左切入、右切入这三种行为的哪一种，用其横向上的运动变化趋势进行表征，可用其横向运动变化的相关物理量的波动来表示驾驶行为的变化。

车辆的切入意图是一连串驾驶行为的集合。一次完整的切入意图是由大量的轨迹数据点构成的，而选择合理的数据点特征决定了模型的准确率。考虑到横向物理量的多样性，本研究选择具有特征变化明显的侧向速度和侧向位移作为对应轨迹点的特征参数。因此，先从NGSIM数据集中提取以这两种参数为特征参数构成的轨迹簇。NGSIM数据集是由美国FHWA搜集的高速公路行车数据，包含US101、I-80等道路上的所有车辆在一个时间段内的车辆行驶状况，其对应的路段如图2所示。

由于该数据集包含的数据量庞大、参数较多，因此要对数据进行预处理。先从数据集中的单条换道轨迹中提取出一条完整轨迹，由于一次完整的车辆切入行为通常是在5 s内完成的，因此提取目标为车辆在20 s内的完整行驶轨迹，然后利用滑动时窗将行驶轨迹切分成以5 s为基本单位的行为序列集合。

对数据集中的单条切入轨迹，要提取切入起始点及该时刻对应的特征参数。为了避免车辆横向位移的细微变化对切入起始点的干扰，以侧向位移和行驶轨迹的曲率作为车辆是否切入的判断标准。对单次完整的切入过程，其切入的起点、终点处的横向位移和轨迹曲率的计算见式（1）。

式中：y（n）为车辆切入起点处的横向位置；y（n+t）为车辆切入终点处的横向位置，二者之差即为车辆在切入过程中的侧向位移，结合真实的切入过程，本研究以侧向位移等于车道宽作为切入结束的衡量标准之一；t为切入时间；L为车道宽度，在NGSIM数据集中，车道宽为3.75 m；w为补偿值，考虑到测量误差等多种因素的影响，可能出现轨迹曲率皆为0的情况，侧向位移偏离车道宽的情况，进而影响数据的抓取，此时要对侧向位移进行补偿；θ（n）为车辆位于切入起点时车辆的行驶轨迹曲率；θ（n+t）为车辆位于切入终点时车辆的行驶轨迹曲率。当起点与终点的行驶轨迹曲率相等时，可认为车辆停止切入，并进入目标车道，开始直线行驶，二者是否都为0也是切入结束与否的衡量标准之一。

通过公式（1）可限制切入过程中起始点、终止点处的横向位移和轨迹曲率，并根据限制对轨迹数据进行分类，左右切入序列的始末位置是根据横向坐标来确定的。本研究从NGSIM数据集中共提取到左切入轨迹101条、右切入轨迹288条、直线行驶轨迹437条。

在获取到行驶轨迹簇后，考虑到数据样本序列过长会导致模型的训练难度加大，因此要对20 s的完整行驶轨迹进行切分，最终完成数据集的构建，并按7：3的比例将数据集划分成训练集及测试集，从而完成数据集的构建准备工作，并开始下一步的模型搭建工作。

2 切入意图识别模型

2.1 高斯混合模型的搭建

高斯混合模型是一种无监督的聚类模型，其能很好地捕捉到数据隐藏的关联性，可将无标签的数据根据其内在的相互关联特征划分为不同的类别簇。

由于行驶轨迹是由连续的轨迹点构成的，因此高斯混合模型聚类的对象是行驶轨迹中的一系列轨迹点。在聚类前，先对数据集中的相关轨迹点进行可视化处理，如图3所示。

由图3可知，三种行驶轨迹存在轨迹点重叠的情况。采用高斯混合模型，一方面是为了给无监督数据添加标签，另一方面也是为了识别这些重叠的轨迹点属于哪种行驶状态，从而降低人工标注的成本，提高数据的准确率。

在使用高斯混合模型对数据进行聚类前，先要选取高斯混合模型对应的k值数，即高斯模型的个数，k的取值将直接影响最终的聚类效果。为了保证模型的精确性，本研究采用贝叶斯信息准则来确定k值的大小。

贝叶斯信息准则是统计学中常用的模型选择方法，其能在有限的阶数范围内找出相对最优的拟合模型，贝叶斯信息判据值随高斯混合数目的变化情况如图4所示。由图4可知，当k=3或4时，高斯混合模型的贝叶斯信息判据值处于两个较为明显的区分范围。所以，本研究GMM的模型数初步选择为3或4，而具体的模型选取数要根据实际的识别效果来确定。

先选取k=3，对数据进行聚类，效果如图5所示。

由图5可知，当k=3时，高斯混合模型能很好地将轨迹点聚类到各个数据簇中，聚类结果能很好地符合对数据集中三种行驶轨迹数据特性的认知。因此，本研究选取k=3作为高斯混合模型中高斯模型的个数，其对应的聚类结果作为下一步识别模型的标签与数据集，一起输入到有监督学习的LSTM模型中，從而实现对切入意图的识别。

2.2 LSTM参数的选取及训练

LSTM是一种处理时序数据的神经网络，其能很好地捕捉数据在时间上的内在关系，因此其在以时序数据为主的行驶轨迹数据中具有较好的特征捕捉能力，可用来识别他车的切入意图，常见的LSTM模型如图6所示。

在图6中，xt为t时刻输入模型的数据向量。LSTM模型在接收到该数据后，结合上一时刻的细胞状态Ct-1及上一时刻的输出ht-1，对神经网络参数进行更新，然后输出当前时刻的细胞状态Ct及当前网络的输出ht，该输出通过激活函数可计算得到与xt对应的输出yt。而Ct、ht下一刻的输入xt+1将被输入到模型中，从而获取下一时刻的参数，以此类推，循环计算，从而完成对时序关系的捕捉。

在本研究所采用的LSTM网络包含隐藏层、輸入层、输出层，隐藏层单元数设置为100，丢失率设置为0.5，最大迭代次数为50，每次样本输入50批数据，初始学习率设置为0.01。部分训练过程如图7所示。

由图7可知，LSTM模型在训练过程中的损失率在3%左右，准确率维持在97%上下，这说明LSTM模型在该训练集上的表现较好。而为了验证LSTM模型能否对未见过的数据进行识别，可用训练好的模型去识别测试集中的数据，识别结果的混淆矩阵如图8所示。

由图8可知，LSTM模型在测试集上的性能也较为优异，在识别左切入（标签1）时，能准确辨识出1 154组数据，准确率达96.0%。在识别右切入（标签2）时，能准确辨识出1 450组数据，准确率达97.1%。在识别直线行驶（标签3）时，能准确辨识出3 714组数据，准确率达98.1%。在对测试集数据进行识别时，能准确识别出6 318组数据（总数组为6 480组），总体识别准确率为97.5%。这说明该模型的总体表现符合本研究的预期。

3 结论

为了能准确认别他车切入意图，本研究提出高斯混合与长短时神经网络的双层模型，其在基于真实路况的NGSIM数据集上具有较为优秀的表现，模型识别的准确率较高，能有效识别出他车的切入意图，为自动驾驶汽车的行为决策提供参考。

参考文献：

［1］WANG X S，YANG M M.Cut-in behavior analyses based on naturalistic driving data［J］.Journal of Tongji University（Natural ence），2018（8）：1057-1063.

［2］WISSING C，NATTERMANN T，GLANDER K H，et al.Lane change prediction by combining movement and situation based probabilities［J］.Ifac Papersonline，2017（1）：3554-3559．

［3］XIAO W，ZHANG L J，MENG D J.Vehicle Trajectory prediction based on motion model and maneuver model fusion with interactive multiple models［J］.SAE International Journal of Advances and Current Practices in Mobility，2020（6）：3060-3071．

［4］沈航先.车辆换道意图识别和轨迹预测模型研究［D］.哈尔滨：东北林业大学，2021.

［5］刘兴亮，朱西产，李霖，等.基于支持向量机的驾驶意图识别［C］//Infats Proceedings of the 12th International Forum of Automotive Traffic Safety，2015：157-163.

［6］刘志强，吴雪刚，倪捷，等.基于HMM和SVM级联算法的驾驶意图识别［J］.汽车工程，2018（7）：858-864.

［7］张海伦，付锐.高速场景相邻前车驾驶行为识别及意图预测［J］.交通运输系统工程与信息，2020（1）：40-46.

［8］季学武，费聪，何祥坤，等.基于LSTM网络的驾驶意图识别及车辆轨迹预测［J］.中国公路学报， 2019（6）：34-42.

［9］梁凡.基于LSTM网络的自动驾驶意图识别研究［D］.乌鲁木齐：新疆大学，2020.

［10］闫伟，胥凌志，李嘉颀，等.基于大数据的汽车驾驶员驾驶意图识别分析［J］.农业装备与车辆工程，2022（8）：1-5.

［11］严利鑫，贺宜，糜子越，等.考虑生理特性的驾驶行为险态辨识研究［J］.交通信息与安全，2019（3）：12-19，27.

［12］刘思源，喻伟，刘洁莹，等.考虑驾驶风格的车辆换道行为及预测模型［J］.长沙理工大学学报（自然科学版），2019（1）：28-35.

［13］李储岩.基于K-means算法的驾驶行为分析研究［D］.哈尔滨：哈尔滨工程大学，2020.