基于反应式行为的车辆运动意图辨识
2018-03-10孙博华邓伟文王姗姗
孙博华,邓伟文,朱 冰,吴 坚,王姗姗
(吉林大学 汽车仿真与控制国家重点实验室, 长春 130022)
0 引 言
当无人驾驶智能汽车在结构化道路上行驶时,交通车辆运动意图不确定性作为交通环境主要不确定源之一,对控制系统决策规划提出了巨大挑战,已成为影响智能汽车安全性的重要问题。因此,日益受到各国学者的广泛关注[1-3]。
目前典型的车辆运动意图辨识方法,主要在弯道、直线或坡道等特定工况下,通过辨识车辆的转向、油门、制动等操纵意图,来表征车辆的运动意图,如基于多维高斯的转向意图辨识方法[4]、基于Hilbert-Huang的制动意图辨识方法[5]和基于双层隐马尔科夫的转向加速意图辨识[6]等。上述方法在解决交通车辆运动意图不确定性辨识问题时,会出现由于各种道路拓扑结构下车辆耦合区域数量趋于无限大,导致交通车辆运动意图辨识模型无上界的问题,使得辨识模型精度不足,模型普适性和模型规模可控性较差,在部分工况下甚至无法为智能汽车控制系统提供有效解[7]。
本文提出一种基于反应式行为的车辆运动意图辨识策略。通过对车辆运动意图进行描述与分类,建立基于多维高斯隐马尔科夫过程的反应式车辆运动意图模型;搭建车辆运动意图信息采集系统,分别在T形路、环岛、直线路3种典型工况下进行数据采集;利用采集数据对反应式车辆运动意图模型进行训练和辨识测试,并通过正交试验对模型关键参数进行优化。该方法辨识过程不依赖于特定工况,可在全工况条件下为智能汽车决策与规划提供准确、可靠的交通车辆运动意图信息,辨识方法具有普适性和规模可控性。
1 反应式车辆运动意图模型
1.1 车辆运动意图描述
传统的车辆运动意图辨识策略将车辆的运动意图定义为车辆运动意图子模型的集合:
Im={i1,i2,…,im}
(1)
式中:Im为车辆运动意图子模型集合,下角标m代表车辆运动意图子模型数目。
每一个子模型分别对应一个车辆的隐目的地:
Hg={h1,h2,…,hg}
(2)
式中:Hg为车辆运动隐目的地集合,下角标g代表在主车与交通车辆的特定行为耦合区域中,交通车辆运动隐目的地数目。
设在全部道路拓扑结构上主车与交通车辆产生行为耦合的区域集合为:
RA,j={RA,k,k=1,2,…,j}
(3)
式中:RA,k为行为耦合区域集合,下角标k代表行为耦合区域数目。则主车与交通车辆在任意RA,k上,均对应一组交通车辆的隐目的地集合,记为RA,k→Hg,k。
可得所有道路拓扑结构上交通车辆的运动意图模型集合为:
(4)
显然,在所有道路拓扑结构上,主车与交通车辆行为耦合区域的个数j趋近于无穷,则RA,j是无上界变量,对应Hg,k→,即当j→时,Im→。传统车辆运动意图辨识模型会出现随耦合区域数量的增加而无限延展的情况。
为提高辨识模型的普适性和模型规模的可控性,本文通过判断RA,j集合中交通车辆的反应行为建立车辆运动意图模型。如图1所示,当主车和交通车辆沿T形路行驶时,交通车辆会受到主车运动态势的影响,产生避让、犹豫、保持等反应行为,可以通过辨识这些反应行为来辨识交通车辆的运动意图。
在空间演化上,主车与交通车辆的运动均可看作其在特定道路拓扑结构上的平面运动,即存在纵向和侧向两个方向的相对运动意图;在时间演化上,交通车辆的反应行为可以看作是本车状态s0及其与主车相对状态ds0相互作用的响应结果。
因此,交通车辆的运动意图可以表示为:
Im={Ilon,Ilat}=
{f(s0,lon,ds0,lon),f(s0,lat,ds0,lat)}
(5)
式中:Ilon和Ilat分别为交通车辆的纵向和侧向运动意图集合。
由于s0与ds0均不受道路拓扑结构约束,所以总可以找到一个有界的反应式运动意图集合建立车辆运动意图模型。这种通过辨识交通车辆的反应来描述车辆运动意图的方式更具有普适性。
1.2 反应式车辆运动意图分类
在任意道路拓扑结构行为耦合区域RA,k中,在主车刺激作用下,交通车辆会通过感知、推理和判断等内在状态产生外在反应式运动意图,通过聚类,交通车辆的纵向和侧向反应行为意图均可以归纳为:
(1)渐远意图:交通车辆的运动意图受到主车影响,产生躲避主车的反应行为。
(2)犹豫意图:交通车辆的运动意图受到主车影响,产生犹豫判断和动态微调的反应行为。
(3)保持意图:交通车辆的运动意图不受主车影响,保持运动趋势不变的反应行为。
(4)渐近意图:交通车辆的运动意图受到主车影响,产生具有侵略性的渐近反应行为,试图对主车运动进行抑制。
因此,反应式车辆运动意图可以表示为:
(6)
式中:下角标FA、HT、NM、CI分别代表渐远、犹豫、保持和渐近运动意图。
1.3 反应式车辆运动意图模型的建立
交通车辆在特定运动意图下的自身状态s0及与主车的相对状态ds0为一组时间连续的观测序列,且具有影响下一时刻内在状态的作用,故可以采用隐马尔科夫过程(Hidden Markov process, HMP)对交通车辆的反应式运动意图进行辨识。
本文采用多维高斯模型表示观察量的概率密度函数[8],应用多维高斯隐马尔科夫过程(Multi-dimension Gaussian hidden Markov process, MGHMP)建立反应式车辆运动意图模型(Reaction motion intention model, RMIM),如图2所示。
图2反应式车辆运动意图模型
Fig.2Reactionmotionintentionmodelofobstaclevehicle
模型包含车辆纵向反应行为运动意图RMIMlon,r和侧向反应行为运动意图RMIMlat,s两个模块,其中下角标r=1,2,3,4;s=1,2,3,4分别代表纵向和侧向的渐远、犹豫、保持和渐近等4个运动意图子模型,每一个交通车辆运动意图子模型均等价于一个MGHMP。
RMIM模型的输入数据应能够表达交通车辆反应式运动意图的激励特征,同时还应考虑数据维度对计算时间的影响。因此,车辆纵向反应行为运动意图模块选取纵向速度Vx,纵向加速度Ax,纵向相对位移DDlon和纵向相对速度DVlon等4维输入。车辆侧向反应行为运动意图模块选取横摆角速度AVz,侧向速度Vy,侧向加速度Ay,侧向相对位移DDlat和侧向相对速度DVlat等5维输入。
RMIM模型中的各个子模型均等价于MGHMP过程。MGHMP过程包含一组N维隐状态qt及每一状态下κ组可能的观察值输出[9]。RMIM模型精度随MGHMP阶数的增加而提高,但阶数过高会大大降低计算速度。考虑到主车与交通车辆运动模式的时间序列,其下一时刻的运动状态主要受到上一时刻运动状态的影响,故RMIM子模型采用从左至右结构的一阶马尔科夫过程。
初始状态分布定义为:
π={πi}
(7)
其中:
πi=P[q1=i]
(8)
1≤i≤N
状态转移概率矩阵定义为:
A={aij}
(9)
其中:
aij=P[qt+1=j|qt=i]
(10)
1≤i,j≤N
式中:qt表示t时刻的状态。
O为一组可观测序列集合,O={V1,V2,…,Vκ},V代表可能的观察值,下角标κ为每一状态对应的可能观察值数目。
设状态j的观察概率矩阵为B={bj(O)},由于在连续观测序列中κ→+,故B={bj(O)}为状态j输出的观察值概率密度函数[4],表达式如下:
(11)
1≤j≤N
式中:cjk为第j个状态第k次混合的混合权重系数;M表示高斯混合数;N(O|μjk,Σjk)表示均值为μ、协方差为Σ的高斯分布概率密度函数。
权重系数cjk满足:
(12)
cjk≥0,1≤j≤N,1≤k≤M
(13)
1≤j≤N
故RMIM的子模型可以由N个隐状态通过一个元组λ定义:
λ=(π,A,c,μ,Σ)
(14)
辨识过程中,RMIM子模型分别输出交通车辆反应式运动意图模型概率,采用对数似然率表示所得结果:
Loglik(θ)=ln[P(O|λ)]
(15)
分别选取纵、侧向子模型中最大似然函数值对应的反应行为意图作为当前时刻交通车辆的纵、侧向运动意图。
2 车辆运动意图数据采集
2.1 车辆运动意图数据采集系统
为采集用于反应式车辆运动意图模型训练的数据,同时保证试验的可操作性和可重复性,基于dSPACE Simulator实时仿真系统和PanoSim汽车智能驾驶仿真平台建立了驾驶人在环车辆运动意图数据采集系统,原理如图3所示[10]。
图3 车辆运动意图数据采集系统Fig.3 Data acquisition platform for vehiclemotion intention
PanoSim汽车智能驾驶仿真平台是本团队自主研发的集车辆动力学、三维行驶环境、交通和车载环境传感模型等于一体的大型汽车模拟仿真软件平台,具有试验设置主界面、车辆编辑器、场景编辑器、相机雷达安装器、画图与动画工具和模型自动生成工具等6大功能模块,可实现高精度的车辆动力学模拟、道路与场景模拟、交通车辆模拟、雷达与相机模拟、无线通信模拟、天气模拟等,可简便、直观地构建交通场景,并能提供各种视角的动画显示,支持纯软件仿真、硬件在环仿真和驾驶员在环仿真,便于进行车辆运动意图数据采集。
选用dSPACE DS1006系统作为实时仿真模型处理器,并实时接收由真实油门踏板、制动踏板和SensoWheel力矩方向盘输入的真实驾驶员操纵信息,据此实时运行PanoSim软件模型,可以得到交通车辆状态信息以及与主车的相对状态信息。
2.2 车辆运动意图数据采集过程
综合考虑道路拓扑结构的多样性、主车和交通车辆空间相对位置等因素,选取道路轴线夹角α为锐角的T形路、环岛、α角为零的直线路等3种典型工况进行车辆运动意图数据采集试验,如图4所示。试验时,在PanoSim软件中预先设定工况环境,令主车采用恒定速度沿图4中实线路径行驶。
图4 车辆运动意图数据采集工况Fig.4 Test scenarios for vehicle motionintention data collection
选取5名驾龄为2~8年的驾驶员进行车辆运动意图数据采集,每名驾驶员在图4所示的3种典型工况下分别完成主车与交通车辆行为互不影响和主车与交通车辆行为相互影响两种情况的驾驶,如图4中虚线所示,每种工况分别测试10次。记录RMIM模型所需的本车状态信息以及与主车相对状态信息,共计得到300组数据样本。
所采数据量纲不同会导致数值数量级存在较大差异,易影响RMIM模型训练时参数矩阵的非奇异性,故将各输入参数进行归一化处理,在直线路、环岛和T形路下分别选取典型数据,如图5所示。
图5 典型的归一化后的试验采集数据Fig.5 Normalized input data of the test data
3 模型训练与辨识结果分析
反应式车辆运动意图模型训练及辨识流程如图6所示。
图6 RMIM模型训练及辨识流程图Fig.6 Training and identification processfor RMIM model
3.1 模型训练
采用Baum-Welch方法[11]对RMIM模型进行训练,获取交通车辆纵、侧向运动意图模型参数。用于训练的样本数共180组,为采集数据量的3/5。训练时,首先将试验数据进行筛选和分类,交通车辆纵向和侧向反应行为意图分类原则如表1所示,其中,当1.9 s内模型中纵、侧向加速度的波形出现至少两次周期性变化时被视为小波动情况。由表1可见,交通车辆运动意图的分类与道路拓扑结构及特定道路拓扑结构下的任意行为耦合区域均无关,仅与当前时刻交通车辆状态及主车与交通车辆相对状态有关。
表1 模型训练数据分类原则Table 1 Classification principles of model training data
给定模型的隐状态维数、训练时间长度和高斯混合数,对交通车辆的纵、侧向运动意图分别进行训练,即可得到RMIM各子模型对应的模型参数:
λlon,r=(πr,Ar,cr,μr,Σr)
(16)
r=1,2,3,4
λlat,s=(πs,As,cs,μs,Σs)
(17)
s=1,2,3,4
3.2 模型辨识结果分析
利用训练得到的模型参数,采用滚动时间窗方法进行交通车辆运动意图的辨识。将辨识数据输入RMIM模型,分别计算各子模型对数似然率,选取当前窗口纵、侧向子模型中最大似然函数值对应的反应行为意图作为当前时刻交通车辆的纵、侧向运动意图。将每次窗体计算的结果与实际情况进行对比,累加所有正确的窗体数,即可得出辨识准确率。
模型辨识过程中,多维高斯混合数M、MGHMP过程对应的隐状态维数N、模型训练时间长度以及辨识时采用的滚动窗体长度是影响辨识结果的4个主要因素,采用正交试验方法对这4个因素进行优化分析,建立L9(34)标准正交表,如表2所示。
表2 正交试验因素水平表Table 2 Factor level table of orthogonal experiment
(18)
由正交试验结果可知,在交通车辆纵侧向运动意图的辨识结果中,主次因素顺序均为A、B、C、D;分别选择纵向辨识情况下的A3B3C2D1组合,及侧向辨识时情况下的A3B3C3D3组合时,车辆运动意图辨识准确率最高。综上可知,A和B的最优组合均为A3B3组合;作为次要因素的C和D,其最优组合应为训练时间C大于窗体长度D的组合,选择C2D1或C3D3组合均可,最终选择A3B3C2D1作为交通车辆纵侧向运动意图辨识的正交优化参数组合。
表3 纵向运动意图辨识结果Table 3 Longitudinal motion intention identification results
表4 侧向运动意图辨识结果Table 4 Lateral motion intention identification results
利用选定的参数组合,对T形路工况交通车辆运动意图进行辨识,场景如图7所示,主车与交通车辆均沿T形路行驶,在T形路口后,交通车辆驶入主车车道并在主车前同向直线行驶,窗体滚动速度为0.1s/次。
图7 T形路工况交通车辆运动意图辨识场景Fig.7 Test scenario of obstacle vehicle motionintention identification in T-junction
交通车辆纵向运动意图辨识结果如图8所示。如图8可见,开始的10个时间窗内,交通车辆沿T形路向前行驶,交通车辆与主车分别处在不同道路上,交通车辆呈现纵向保持运动意图;在10~48个时间窗内,在T形路口交通车辆转向并超过主车的过程中,交通车辆呈现纵向渐近运动意图。当交通车辆超过主车后的48~230个时间窗内,交通车辆超过主车并依次呈现纵向渐远、犹豫和保持运动意图。经计算,该T形路工况下对应的交通车辆纵向运动意图的辨识准确率为99.4%。
图8 交通车辆纵向运动意图辨识结果Fig.8 Identification results of obstacle vehiclelongitudinal motion intention
交通车辆侧向运动意图辨识结果如图9所示。
图9 交通车辆侧向运动意图辨识结果Fig.9 Identification results of obstacle vehiclelateral motion intention
由图9可见,开始的10个时间窗内,交通车辆沿T形路向前行驶,交通车辆与主车分别处在不同道路上,交通车辆呈现侧向渐近运动意图。在10~48个时间窗内,在T形路口交通车辆转向并超过主车的过程中,交通车辆呈现侧向渐近和保持运动意图,且以侧向渐近反应运动意图为主。当交通车辆超过主车后的48~230个时间窗内,交通车辆呈现侧向渐远运动意图。经计算,该T形路工况下对应的交通车辆侧向运动意图的辨识准确率为99.5%。
综上,基于RMIM模型的交通车辆运动意图辨识方法不依赖于特定工况,可在较大距离范围内为主车提供准确的交通车辆运动意图信息,可有效提高智能汽车的安全性,该辨识方法具有普适性和规模可控性。
4 结束语
交通车辆运动意图不确定性是交通环境的主要不确定源,对无人驾驶智能汽车的安全决策规划提出了巨大挑战。本文提出了一种基于反应式行为的车辆纵、侧向运动意图辨识策略,建立了基于多维高斯隐马尔科夫过程的反应式车辆运动意图模型,搭建了驾驶人在环的车辆运动意图信息采集系统,分别在T形路、环岛、直线路3种典型工况下进行了数据采集,利用采集的试验数据对RMIM模型进行了训练和辨识测试,通过正交试验对模型关键参数进行了优化匹配分析。辨识结果表明,通过合理选择参数组合,辨识准确率可以达到99%以上。同时,该方法辨识过程不依赖于特定工况,可在全工况条件下为智能汽车决策与规划提供准确、可靠的交通车辆运动意图信息,辨识方法具有普适性和规模可控性。
[1] Brechtel S, Gindele T, Dillmann R. Probabilistic decision making under uncertainty for autonomous driving using continuous pomdps[C]∥The 17th International IEEE Conference on Intelligent Transportation Systems (ITSC), IEEE, 2014: 392-399.
[2] Bai H, Cai S, Ye N, et al. Intention-aware online POMDP planning for autonomous driving in a crowd[C]∥The IEEE International Conference on Robotics and Automation (ICRA), Seattle,Washington, 2015: 454-460.
[3] Cai Shao-jun. Online pomdp planning for vehicle navigation in densely populated area[D]. Guangzhou: South China University of Technology, 2014 .
[4] 吕岸, 胡振程, 陈慧. 基于高斯混合隐马尔科夫的高速公路超车行为辨识与分析[J]. 汽车工程, 2010, 32(7): 630-634.
Lv An, Hu Zhen-cheng, Chen Hui. Recognition and analysis on highway overtaking behavior based on Gaussian mixture-hidden Markov model [J]. Automotive Engineering, 2010, 32(7): 630-634.
[5] 唐先智, 王波, 杨树军, 等. 基于Hilbert-Huang变换的制动意图聚类识别[J]. 汽车工程, 2016, 38(5): 580-586.
Tang Xian-zhi, Wang Bo, Yang Shu-jun, et al. Cluster identification of braking intention based on Hilbert-Huang transform [J]. Automotive Engineering, 2016, 38(5): 580-586.
[6] 王畅. 基于隐形马尔科夫模型的驾驶员意图辨识方法研究[D]. 长春: 吉林大学汽车工程学院, 2011.
Wang Chang. Research on driving intention identification based on hidden Markov model [D]. Changchun: College of Automotive Engineering, Jilin University, 2011.
[7] Urmson C, Anhalt J, Bagnell D, et al. Autonomous driving in urban environments: boss and the urban challenge [J]. Journal of Field Robotics, 2008, 25(8): 425-466.
[8] Rabiner Lawrence R. A tutorial on hidden Markov models and selected applications in speech recognition [J]. Proceeding of the IEEE, 1989, 77(2):257-286.
[9] Reynolds D A, Rose R C. Robust text-independent speaker identification using Gaussian mixture speaker models [J]. IEEE Transaction on Speech and Audio Processing, 1995, 3(1):72-83.
[10] 朱冰, 贾晓峰, 王御, 等. 基于双dSPACE的汽车动力学集成控制快速原型试验[J]. 吉林大学学报:工学版, 2016, 46(1): 8-14.
Zhu Bing, Jia Xiao-feng, Wang Yu, et al. Rapid prototype test for integrated vehicle dynamic control using tow dSPACE simulators [J]. Journal of Jilin University (Engineering and Technology Edition), 2016, 46(1): 8-14.
[11] Baum L E, Petrie T. Statistical inference for probabilistic functions of finite state Markov chains [J]. The Annals of Mathematical Statistics, 1966, 37: 1554-1563.