基于小尺度的无灯控交叉口智能车辆驾驶行为决策模型*
2019-09-23杜玉龙龙伟李炎炎俞晓红陈金戈
杜玉龙 龙伟 李炎炎 俞晓红 陈金戈
(四川大学,成都 610065)
主题词:交叉口 重复博弈 驾驶策略 激进度 时间尺度
1 前言
无交通灯交叉路口自动驾驶车辆与传统车辆的交汇问题是现阶段智能车辆研究领域的重要研究内容。Fortelle[1]在完全车联网环境下,获取即将进入交叉口车辆的速度、位置等信息,规划出一条可避开冲突的行驶路径。Lee 等[2]利用车路协同技术,提出了一种单车道无信号灯控制的交叉口单个车辆行驶轨迹冲突消除的控制算法。Perronnet[3]和Ahmane等[4]同样基于车路协同环境,提出了一种规定车辆通过顺序的交叉口排队序列协议。但是,大部分公共交通环境并不具备完善的车联网设施,故以上方案不能解决所有交叉口交汇问题。Lobjois[5]对影响驾驶员驾驶行为决策的年龄及车流密度因素进行分析,结合可穿插间隙理论,提出交叉口安全通行建议,但忽略了车辆速度、加速度对驾驶员的影响。刘小明等[6]用博弈论分析了不同类型的驾驶员在无灯控交叉口的驾驶行为决策和相应的纳什(Nash)均衡,但并未给出具体驾驶策略。宋威龙等[7]基于模糊逻辑建立了驾驶员激进度划分模型,但未能解决加、减速度具体数值的选取问题。
本文基于未安装通信设备的无灯控交叉口路段,对自动驾驶车辆与传统车辆的交汇协同问题进行研究。首先对两车博弈收益情况进行分析,明确交叉口通行博弈只存在混合策略的Nash 均衡,从而引入重复博弈理论对交汇问题进行求解。博弈过程中,通过建立驾驶员激进度模型帮助自动驾驶车辆判断传统车辆驾驶员的驾驶行为,以给出正确的应对策略并建立最佳减速度选取模型,使自动驾驶车辆在减速避让后仍能以较高的车速通过交叉口。
2 车辆间博弈收益情况分析
将机动车之间的博弈视为对称博弈,博弈过程中存在冒进和礼让2 种驾驶行为策略。当一方礼让而另一方冒进时,礼让一方的收益记为-b(b>0),冒进一方收益为b;当双方均礼让时,双方的收益均为-b;当双方均冒进时,则出现两车相撞的交通事故,此时双方收益均为-B(0<b<<B)[8]。当两车同时礼让或同时冒进时,交叉口系统的整体收益分别为-2b和-2B,且双方车辆各自收益均小于零,造成整个交通网络收益下降;当一方礼让而另一方冒进时,存在纯策略的Nash均衡,但此均衡不稳定,因双方存在直接利益冲突,一方得到意味着另一方必定失去,不能作为博弈模型稳定解[9]。根据纳什均衡原理,此模型一定包含一个混合策略Nash均衡,所以需要制定相应的策略集合,以达到双方利益最大化。
3 重复博弈过程分析与更小时间尺度的划分
实际驾驶过程中,为安全快速地通过交叉口,传统车辆双方驾驶员会通过观察对方行驶状态不断地调整车速。因此,本文将交叉口交汇问题视为动态重复博弈过程,在每个博弈阶段,博弈双方均能观察对方的行为策略并同时采取行动。
本文以图1所示的交叉口通行情况为研究对象,假设交叉口视野不受阻。自动驾驶车辆C1自南向北(S→N)直线行驶,传统车辆C2自西向东(W→E)直线行驶,O点为潜在冲突点。
图1 无灯控交叉口车辆交汇示意图
当C1检测到左前方来车C2时记为时刻T0,此时C2的驾驶员也观察到C1,博弈开始。其中任意一辆车通过冲突点O时判定博弈过程结束,记为时刻Tend。将T0到Tend博弈过程划分为N个时间步尺度Δt,在每个时间步[ti-1,ti]内,车辆C1会检测车辆C2在ti时刻的加速度、速度、与冲突点O的距离,同样,车辆C2的驾驶员也会观察此时车辆C1的加速度、速度、与冲突点O的距离。
整个博弈过程中双方均受到安全因素和速度因素约束,即不能发生碰撞或超过路段的最大限制车速vmax[10]。两车是否存在通行干扰以车辆通过交叉口的时间差与碰撞时间(Time To Collision,TTC)判定,当时间差大于规避碰撞时间Tttc时则无干扰通过,否则不能安全通过,根据文献[11],Tttc≥1 s。
C1、C2在ti时刻以当前行驶状态到达冲突点需要的时间分别为,与O的距离分别为:
到达冲突点的时间差ΔTi为:
C2车辆驾驶员对C1的加速度、速度等信息通过经验估计获得,而C1通过自身目标跟踪单元计算获取车辆C2的行驶状态信息,检测一个时间步尺度内车辆C2的移动距离di,可得此时间步结束时C2的加速度和速度:
若ti时刻ΔTi>Tttc,则不会出现通行干扰,双方车辆可保持当前的驾驶状态继续行驶;否则双方车辆需调整各自的驾驶策略。
4 驾驶员类型划分模型
实际驾驶过程中,驾驶员常通过车辆速度和加速度信息判断对方驾驶员的激进程度,在文献[8]基于模糊逻辑构建速度、加速度、驾驶激进程度隶属度函数的基础上,本文通过收集多位驾驶员的驾驶经验,细化汽车速度和加速度对驾驶员激进程度判别的影响,使用曲线拟合的方法获取速度和加速度与激进程度的对应关系,如图2所示。
利用最优值匹配法结合Origin软件拟合曲线,得到速度、加速度与激进程度的函数关系式分别为:
式 中,A1=-0.003 71 ;A2=1.016 13 ;k1=43.197 70 ;k2=41.145 98;h1=0.039 61;h2=0.662 93;P=0.886 44;A=1.014 50;xc=1.870 03;d=1.888 24;k=1.059 86。
通常认为速度和加速度对驾驶员的判断同等重要,故对式(6)和式(7)赋予相同的加权值,加权后的MAP图如图3所示,激进程度综合估计表达式为:
图3 速度-加速度-激进度MAP图
将±0.03 作为激进程度差值的临界值[7],在第ti时刻:ΔK≤-0.03时认为车辆C1相对于车辆C2为相对保守型;ΔK≥0.03 时C1为相对激进型;-0.03<ΔK<0.03 时,则应调整激进程度以达到相对保守或相对激进,当C1以当前行驶状态先到达冲突点则调整为相对激进状态,反之则调整为相对保守状态。
5 驾驶策略选择
5.1 驾驶行为决策
利用激进程度差值判断C1相对于C2的激进状态,若相对保守则根据表1选择驾驶策略,若相对激进则根据表2选择驾驶策略[7]。
表1 智能车辆相对保守时的行为决策
表2 智能车辆相对激进时的行为决策
驾驶员类型分为果断型和犹豫型:果断型驾驶员在博弈初期阶段即可确定驾驶策略,自动驾驶车辆则可制定准确的行驶方案;犹豫型驾驶员对于加速或者减速犹豫不定,为确保行车安全,自动驾驶车辆应主动避让。
5.2 减速度选择模型
加、减速度的选取应该考虑乘坐安全性、舒适性和高效性。车辆纵向加速度直接影响其乘坐舒适性,当加速度超过1.5 m/s2,减速度超过2.5 m/s2时乘员将会感到不适[12]。设加速时的加速度为定值1.5 m/s2。C1选择减速避让时,若以停车怠速方式等待对方车辆通过则会增加污染物排放和起步时间,降低行车效率,若以最小减速度持续减速至对方车辆通过,则C1避让后将以最大速度通过路口。最佳减速度的选取方式为:
式中,a为最佳减速度;(+1)是指依据TTC 规范,自动驾驶车辆应在传统车辆通过交叉口1 s后通过冲突点。
当C1选择减速策略时,减速度参考图4 所示MAP图选取。
图4 最佳减速度MAP图
6 仿真验证
利用CarSim 与MATLAB/Simulink 进行联合仿真,仿真环境见图1。自动驾驶车辆为相对激进型的仿真结果如图5 所示,C1以50 km/h 的速度在距离冲突点60 m 时检测到左侧方的传统车辆C2,此时距离冲突点65 m 的C2的驾驶员也观测到车辆C1,博弈开始。在时速60 km/h 时,人的视野区间为0.3~0.6 s[13],兼顾智能车辆系统稳定性和行驶安全性,取0.4 s 为1 个时间步,第1 个时间步C1监测C2的车速和加速度以判断对方驾驶员的激进程度。通过查询激进程度MAP 图得C1、C2的激进程度分别为0.402 92 和0.372 77,所以C1相对于C2更为激进,查询相对激进行为决策表选取匀速策略。整个博弈过程车辆C2驾驶员选择减速避让,确认车辆C1能安全通过后加速通过。
自动驾驶车辆为相对保守型的仿真结果如图6 所示,C2以54 km/h相对C1更为激进地行驶,故C1通过查询表1采取避让行驶策略,通过查询图4选取最佳减速度a=0.529 m/s2。在第3 个时间步中,C2开始加速行驶,每次博弈结束时,C1计算两车以当前车速匀速行驶是否会产生干扰,若不会则停止减速,选择匀速行驶。第5 次博弈结束时,两车以当前车速匀速行驶并不会产生干扰,故C1从第6个时间步开始匀速行驶以减少速度损失和时间消耗。
图7 所示为犹豫型驾驶员在博弈过程中各项指标的变化情况。由图7a 可见:开始时刻C1匀速行驶并观察到C2加速行驶,C1开始减速避让;第2 次博弈结束后C2也开始减速,至第5 次博弈开始时,C1根据激进程度差值结果查询表2 后选择匀速行驶,C2继续减速行驶;第6 次博弈初始,C1相对于C2更激进,所以C1开始加速,而当C1开始加速时,C2也开始加速,C1调整速度值次数超过5 次后判断对方车辆驾驶员为犹豫型驾驶员,为安全起见选择停车避让。图7a 虚线部分为C1选择停车避让决策后直到完全停车需要的时间。由图7b 可知,C2在第13 个时间步后率先通过交叉口,此时智能车辆可选择新的策略通过交叉口而不再持续减速至停车。
图7 传统车辆驾驶员为犹豫型时的仿真结果
7 结束语
本文通过分析交叉口机动车博弈收益情况,在明确混合策略Nash 均衡存在解的前提下,用重复博弈理论对整个交汇过程进行了分析。博弈过程中建立驾驶员激进程度模型,对不同驾驶行为进行预判,帮助自动驾驶车辆制定准确的驾驶策略。为改善舒适性、提高通过效率、减少污染物排放,提出最佳减速度选取模型使自动驾驶车辆在减速避让后能以较快的速度通过交叉口。经仿真验证,本文提出的驾驶员激进度模型和最佳减速度选取模型能使自动驾驶车辆在无灯控交叉口与传统车辆交汇时安全高效地通过路口。但本文的讨论是在路口无行人和非机动车干扰的前提下进行的,一定程度上简化了实际情况,速度和加速度综合影响加权值的选取需对大量不同类型驾驶员采样评价才更为准确,所以仍需对激进程度模型进行进一步优化。