基于贝叶斯网络的车辆并线意图识别
2021-06-16姜顺明匡志豪王奕轩吴朋朋
姜顺明,匡志豪,王奕轩,吴朋朋
(江苏大学 汽车与交通工程学院,江苏 镇江 212013)
0 引言
车辆并线是一种常见驾驶行为,对于车辆安全行驶有重要影响[1]。在复杂的交通环境中,精确高效地识别旁车并线意图,可为辅助驾驶系统提供决策参考信息。改善并线工况下的控制效果,提升车辆运行效率,减少道路交通事故,是辅助驾驶领域的研究热点之一。
目前,国内外对驾驶意图识别的研究方法可分为两种。第一种是通过建立动力学或运动学模型来识别驾驶意图[2-4],但由于车辆运动的高度非线性以及模型过多简化了车辆并线行为,使得这类方法很难达到较高精度。第二种是基于数据驱动,采用机器学习来识别驾驶意图。文献[5]设计了一种基于长短时记忆网络的驾驶意图识别及车辆轨迹预测模型,用Softmax函数计算意图概率,意图识别模块具有很好的预判性和准确率。文献[6]提出双层连续隐马尔可夫模型-贝叶斯生成分类器预测驾驶意图,能在旁车并线前期阶段识别出驾驶人意图。文献[7]基于模糊支持向量机建立了并线意图识别器,在支持向量机的求解中引入样本模糊隶属度系数,提高了并线意图识别器的准确性。文献[8]采用多分类支持向量机对换道行为进行识别,精度高达97.68%。文献[9-12]使用循环神经网络进行车辆驾驶意图识别。但是,基于神经网络的机器学习往往效率较慢,容易收敛于局部最优解,支持向量机参数不易确定,且很难处理规模大的训练样本。
贝叶斯网络[13]能够充分表征各个影响因素之间的相关性及不确定性,在复杂的交通环境下可以利用较少的样本数据快速识别并线意图, 在车辆行为预测方面有着独特的优势。文献[14]利用贝叶斯网络建立车辆变道模型来识别旁车变道意图,该模型在Cooper-Herskovits(CH)评分的基础上构造了全新的Information-Cooper-Herskovits(I-CH)评分函数,但依靠先验知识获取节点顺序的做法缺乏理论依据,存在搜索空间大、可能收敛于局部最优解的问题。因此,本文在贝叶斯网络结构学习的基础上,引入随机抽样的思想,构建车辆并线意图识别模型,以快速精准识别旁车并线意图。
1 特征参数与数据预处理
车辆并线前后,至少涉及包括自车在内的3辆处在运动状态的车辆。旁车并线场景示意图如图1所示。图1中:S3车为邻车道车辆,S1、S2车为同车道前后行驶的车辆,△dx、△dy分别是S3车与S1车的纵横向相对车距,Sy是S3车与外侧车道线间的横向距离。S3车的并线行为,特别是在高速工况中,会影响S1车的正常行驶,如果S1车能够及时识别S3车的并线意图,并进行有效地纵向控制,则会大大提高行驶安全性和舒适性。
图1 旁车并线场景示意图
用于训练和验证模型的数据选取自美国联邦公路管理局采集的下一代仿真(next generation simulation, NGSIM)数据集。车辆换道时间一般持续3.5~6.5 s,平均每5 s就可以实现一次完整的换道过程[15]。初步筛选出数据集中并线轨迹换道点(图1中P点)前后各3 s的数据。
驾驶员根据自车与其周边车辆的相对位置、相对车速等因素决定是否并线,因此,结合实际交通场景,从数据集中提取6个特征参数作为贝叶斯网络的节点,分别是旁车与自车的纵向相对车距△dx、纵向相对车速△vx、纵向相对加速度△ax、横向相对车距△dy、横向相对车速△vy、横向相对加速度△ay。
针对从数据集中提取的特征参数的值域、单位均不相同,以及计算复杂的问题,文献[16]设计了在K-means聚类基础上无监督学习的简化方法。本文采用卡方分裂算法对样本数据做离散化预处理:将每个特征参数Xi(i=1,2,…,n)的所有数值由小到大生成值域区间[Xi_min,Xi_max];在值域区间中的不同位置插入断点,计算两个区间的卡方值,比较每个卡方值大小,取最大值处为第一次分裂的断点,将值域分为两个区间;重复在新生成的值域区间内插入断点,计算并比较卡方值和分裂区间,直到满足最大分裂区间数目L=6时停止;将[Xi_min,Xi_max]按数值由小到大依次量化成L个区间。
卡方值[17]计算公式为:
(1)
其中:h为类别数目,取值为2;Alg为第l个区间、第g类的样本数目;Elg为Alg的期望。
表1为部分样本数据。表1中:1~6是每个特征参数实际值离散化后的结果,表征车辆运动状态;cf为意图类别,类别1,2分别表示并线和直行意图。
表1 部分样本数据
2 并线意图识别模型
2.1 网络结构学习
通过数据训练确定意图识别模型网络结构,构建网络拓扑关系图。采用评分搜索方法进行网络结构学习,针对可能存在的收敛于局部最优解的问题,加入随机抽样的思想。算法的核心是构建一条接近目标平稳分布为P的马尔可夫链,多次迭代收敛到平稳状态后,从迭代过程中产生的大量模型网络结构中选取与训练数据拟合度最高的网络结构。
具体的抽样过程:先假设当前的模型网络结构为Xρ,根据选定的建议分布Q(X*|Xρ)对Xρ改进,生成下一个模型网络结构X*。计算新网络结构的接收概率,比较接受概率的大小,判定是否接受新网络结构,若新网络结构符合要求,则取代原有的网络结构;若新网络结构不符合要求,则保留原有网络结构,进行新一轮抽样,直到新网络结构符合要求。
新网络结构的接受概率[9]为:
(2)
相应的转移概率[18]为:
T(X*|Xρ)=Q(X*|Xρ)A(X*|Xρ)。
(3)
2.2 节点参数计算
(4)
其中:i∈[1,n],n为网络结构中节点个数;j∈[1,qi],qi为节点Xi的父节点π(Xi)的取值组合数目;k∈[1,ri],ri为节点Xi的取值状态数。
假设p(θij)服从狄利克雷分布,节点Xi和其父节点π(Xi)分别对应的参数也相互独立,则有:
(5)
其中:θij为所有与p(Xi|π(Xi)=j)相关的参数;aijk为先验分布p(θij)中的系数;Nijk为数据集D中符合Xi=k,π(Xi)=j要求的样本个数。
2.3 模型构建
X={X1,X2,…,X6,Xc}为意图识别模型中的7个节点,D={y1,y2,…,yn}为训练数据集。意图识别模型的构建需要先确定节点,并对节点的数据进行预处理。设定抽样算法参数,通过构造马尔可夫链,在上一轮采样结果中随机抽样获得新模型网络结构。计算新模型网络结构的接受概率,判定是否接受新网络结构,若接受,则抽样结束,若拒绝,则重新构造马尔可夫链进行抽样,直至收敛到平稳状态,结束抽样。使用CH评分函数对抽样样本即模型网络结构评分,结果如图2所示。统计各模型网络结构出现的比例,结果如图3所示。结合图2与图3可得到最佳模型网络结构,即出现次数最多的结构为评分最高的结构。
图2 各结构得分
图3 各结构出现的比例
确定各节点之间的依赖关系后,可用贝叶斯估计法计算每个节点的条件概率,得到完整的并线意图识别模型。使用模型计算给定样本的并线概率,以识别旁车的并线意图。
基于上述步骤构建意图识别模型为:
T=BN(G,θ,X),
(6)
其中:T为并线意图识别模型;BN为贝叶斯网络;G为各节点间的依赖关系;θ为每个节点的条件概率;X为意图识别模型的7个节点。
图4为根据上述步骤构建的车辆并线意图识别模型。
图4 车辆并线意图识别模型
3 结果与分析
在实际场景中,意图识别模型需要能够实时地识别旁车的并线意图。为确保检验有效,用于模型训练和验证的样本按照4∶1进行分配,并线样本和直行样本分别有2 320组和2 570组。将测试样本导入并线意图识别模型,识别结果如表2所示。由表2可知:训练得到的意图识别模型能有效识别旁车并线意图。
表2 旁车驾驶意图识别结果
图5a是旁车与外侧车道线的横向距离的变化曲线,P点为旁车与车道线的交点即换道点。为进一步分析模型识别效果,从测试样本中选择一组并线样本,导入并线意图识别模型,计算旁车并线意图识别概率,结果如图5b所示,并线概率从0逐渐增长至1.0。由图5b可知:并线概率从t=0.7 s开始持续增加。在t=2.1 s时,旁车并线概率等于直行概率,随后并线概率大于直行概率,即模型已经能够判定旁车并线有较大可能性;在t=3.0 s时即换道点处,并线概率增至1.0且保持恒定。图6a~图6c分别为旁车与自车的横向相对车距、横向相对车速和横向相对加速度。在旁车并线过程中,两车间的横向相对车距由3.5 m一直减小到0 m,即旁车并线到自车正前方,横向相对车速在0 m/s附近波动,横向相对加速度在并线前段过程波动较大,在后段波动趋于稳定,符合旁车并线规律。
(a) 旁车横向位置
从测试样本中选择一组直行样本,图7a是旁车与外侧车道线的横向距离的变化曲线,图7b为旁车意图识别概率。图8a~图8c分别为旁车与自车的横向相对车距、横向相对车速和横向相对加速度,t=2.0~2.5 s时,横向相对车距骤减,相对应的横向相对车速和横向相对加速度也随之骤减,致使图7b中模型输出的并线概率大于直行概率;但t=2.5 s后,横向相对车距不再减小,横向相对车速和横向相对加速度增大至0后不再波动,模型识别结果又快速切换为直行意图。
(a) 旁车横向位移
图9为各测试样本横向特征的统计结果。由图9可知:直行车辆的横向特征差值分布比并线车辆更集中,且各分位数均比并线车辆小,下边缘更是趋近于0,这说明并线车辆的横向特征差值变化范围大于直行车辆的,直行车辆的横向特征变化范围很小。
图9 横向特征统计结果
图10为减少任意一个参数的模型识别效果对比图。由图10可知:缺少任意一个纵向特征的模型,准确率都在87%以上,且识别效果都高于缺少任意一个横向特征的模型;缺少△dy、△ay和△vy的模型的准确率分别为76%、70%和68%,可见,横向特征对模型识别效果的影响力大于纵向特征,其中△ay与△vy对识别效果的影响最大,为主要影响因素。
图10 减少任意一个参数的模型识别效果
4 结论
(1)本文意图识别模型能有效识别旁车并线意图,且多数都可以在旁车越过车道线前就能识别并线意图,给予驾驶人充裕的时间采取有效的规避决策。
(2)与纵向特征对识别结果影响甚微相比,横向特征对旁车并线意图的识别有很大影响,缺少任意一个纵向特征的模型识别准确率都要大于缺少任意一个横向特征的模型识别准确率。横向特征变化越大,并线可能性就越大,为主要影响因素,△dy、△ay和△vy对模型识别效果的影响力依次增加。