基于驾驶员行为的神经网络无人驾驶控制*
2016-02-14张文明韩泓冰杨珏易筱
张文明 韩泓冰 杨珏 易筱
(北京科技大学 机械工程学院, 北京 100083)
基于驾驶员行为的神经网络无人驾驶控制*
张文明 韩泓冰 杨珏†易筱
(北京科技大学 机械工程学院, 北京 100083)
针对铰接式自卸车的转向特性,提出了一种基于驾驶员行为的神经网络无人驾驶控制方法.建立了以激光雷达、角度传感器为主要环境信息的采集系统,通过分析铰接式车辆转向特征建立铰接式自卸车运动学模型和动力学模型,利用ADAMS动力学软件建立车辆动力学模型并进行车辆稳态测试.建立基于最优预瞄控制的人工神经网络控制算法的驾驶员模型,通过ADAMS-Matlab/Simulink联合仿真验证模型.最后搭建真实巷道环境进行直线路段回正实验和曲线路径跟踪实验,结果显示,该控制模型在变曲率路段中,横向位置偏差小于可通过路径宽度的10%,航向角偏差优化90%,表明该神经网络驾驶员控制模型收敛速度快,稳态特性好,具有良好的无人驾驶能力.
驾驶员模型;神经网络;动力学模型;联合仿真
铰接式矿用汽车[1]因具有良好的灵活性、机动性、高效性等突出优点,被广泛应用于大型露天矿山的矿石及岩土运输,而矿下恶劣的环境,特别是在不适合人员长时间工作的掘进过深区域,直接危害井下驾驶员的健康安全[2- 5].研究无人驾驶铰接式矿用汽车可以减少井下工作人员数量,最大限度保护驾驶员,同时也是矿山设备智能化的必然趋势.
铰接车前后车架间通过铰接轴和摆动架连接,前后车体之间由液压缸驱动进行折腰转向.相对于传统的刚性车,铰接车独特的转向方式具有更复杂的运动模式和特点.由于复杂的线性不确定性,运用神经网络对在建模过程中的假设和简化进行一定程度的补偿,减少模型不精确部分带来的误差,其中驾驶员行为数据的引入,增强了神经网络的准确性,进一步提升了无人驾驶的控制精度.
文中针对铰接车复杂运动特性与环境特点,建立运动学和动力学仿真模型,并提取和模拟驾驶员行为特征,最终设计了一套基于驾驶员行为的神经网络控制系统,并在实验中验证该控制的可靠性.
1 铰接式车辆运动学及动力学建模
1.1 转向运动学分析
文献[6]中以前桥中点为参考点,忽略轮胎的轴向弹性形变影响,假设车体在接地点处不产生横向运动,结合图1分析运动学和几何关系,推导出铰接车等半径稳态转向时前桥角速度:
(1)
式中,vf为铰接车前进速度,θf为航向角,γ为前后车体铰接角,lf为前桥中点到铰接点的长度,lγ为后桥中点到铰接点的长度.
铰接车的前桥中点姿态可表示为Pf=[xfyfθfγ],则得到运动学方程组:
图1 铰接车的轨迹分析图Fig.1 Trajectory analysis of articulated vehicle
(2)
1.2 基于ADAMS的模型仿真
文中控制对象为35t矿用铰接式自卸车,其基本设计参数如表1所示.
表1 35t矿用铰接式自卸车基本设计参数
Table1Basicdesignparametersof35tonminearticulateddumptruck
设计项目设计值空载质量/t28.8满载质量/t63.8载重量/t35设计最高速度/(km·h-1)35轮距/mm2278轴距/mm5120最大折腰角(铰接角)/(°)45轮胎自由半径(mm)/滚动半径(mm)1011.5/961
实际路面情况复杂[7],选用E级路面谱作为三维模型的环境条件.为验证仿真模型的可行性与真实性,进行了两组稳态实验.
第1组以稳态转向半径为参考值,根据铰接车设计参数,设以12°铰接角、3m/s车速完成稳态转向,验证其运行轨迹的重合性与速度跟随性.运行轨迹和车速变化情况如图2所示.
仿真时长80s,完成500°稳态转向,仿真轨迹很好地重合了实车运行轨迹,仿真速度变化跟随实车实际速度,并仿真出进入转向时的速度下降波动,仿真效果良好.
第2组实验以实测铰接角数据作为输入,在相同车速下,考察车辆横向加速度值,铰接角输入值如图3所示.
图2 ADAMS模型稳态转向实验Fig.2 Steady-state steering experiment based on ADAMS model
将仿真数据与实车实验测得的相同铰接角输入下的车体横向加速度值作比较,结果如图4所示.实测数据存在较大波动干扰,仿真数据与实测值均值趋势一致.
图4 稳态转向横向加速度对比
Fig.4 Comparison of lateral acceleration of steady state steering
与实车实验结果相比,仿真实验结果很好地重合了实车运行轨迹,跟随了侧向动力学状态,表明仿真软件能较好地模拟实车运行过程中的动力学特性,这为之后的控制器设计奠定了基础.
2 驾驶员模型与仿真
2.1 神经网络驾驶员模型设计
驾驶员模型是真实驾驶员驾驶操作的数学表示,文中采用的是驾驶员预瞄跟踪模型,根据预估位置与未来时刻理想车辆位置的偏差进行控制,其基本结构框图如图5所示[8- 9],其中P(s)、F(s)、B(s)分别为预瞄环节、前向调整环节和反馈补偿环节,f(t)为道路信息,fe(t)为预瞄路径(即根据当前车辆运行状态预测未来预瞄时间的车辆位置),y(t)为车辆实际位置,yp(t)为预估环节得到的未来预瞄时间的车辆位置,e为两个估计值的偏差,δ为施加到车辆上的控制量.
图5 驾驶员预瞄跟踪模型Fig.5 Driver preview tracking model
引入神经网络来优化预瞄驾驶员模型,简化后的模型示意如图6所示.模型建立过程中需要注意坐标变换,在相关文献[10- 11]中均有详细阐述.
图6 神经网络驾驶员预瞄模型Fig.6 Neural network-based driver preview model
理想跟踪指令为ym(k),则定义跟踪误差为
e(k)=ym(k)-y(k)
(3)
网络权值学习误差指标为
(4)
控制铰接车输出转角量的神经网络输出
u(k)=h1w1+h2w2+…+hmwm
(5)
由梯度下降法,网络的学习算法为
(6)
wj(k)=wj(k-1)+Δwj(k)+αΔwj(k)
(7)
式中:η为学习速率,η∈[0,1];α为动量因子,α∈[0,1];wj为第j个神经突出权值;hj为第j个神经元高斯函数.
经过大量训练实例确定了该神经网络包括如下3层网络:由4个节点构成的输入层、10个节点构成的单Sigmoid隐层、1个节点构成的线性输出层.
输入变量为一个4维向量,分别包含道路信息、车辆侧向加速度、侧向速度和侧向位移,输出层为线性输出,输出量为铰接角δsw.
图7 驾驶员-车辆闭环系统模型Fig.7 Driver-vehicle closed loop system model
在ADAMS中建立车辆动力学模型[12],输入设置为铰接角角度和四轮驱动力矩,输出设置为车体横向加速度值、车速、前车体中心点坐标值.
2.2 神经网络驾驶员模型仿真验证
为了验证该神经网络驾驶员模型的正确性和可靠性,进行了两种理想路径的实验:单移线与双移线.铰接车以恒定车速15 km/h行驶,从侧向位移验证模型的可行性.理想路径如图8所示,其中,变道距离b=10 m,a1-a0=24 m,s2=30 m,s3=25 m,s4=30 m.
图9所示为单移线和双移线的两次仿真结果,仿真轨迹与预期轨迹的重合验证了神经网络驾驶员模型对无人驾驶铰接车有良好的控制效果.
图8 理想实验路径Fig.8 Ideal experience path
图9 神经网络驾驶员模型移线仿真实验结果
Fig.9 Simulation results of neural network-based driver model lane change
3 无人驾驶实车实验
3.1 实车实验设置
模拟巷道由钢管作为骨架支撑,在模拟巷道两侧用不透光的聚丙烯彩条布围成,现场模拟巷道与试验巷道平面图如图10所示.
道路信息采集依靠激光雷达,文中选用的激光雷达测距仪扫描范围为40 m,可视角度为190°,设定分辨率为0.25°,即每一场数据包括了190°扇角范围内的761个点的距离值.角度传感器安装在前后车体中间的铰接体处,测量范围为0°~135°.
图10 模拟巷道与平面图(单位:mm)Fig.10 Simulation roadway & plan(Unit:mm)
为实现无人驾驶,设计相应的控制程序来协调各系统工作,基本的程序流程如图11所示.无人驾驶实验系统从初始化开始顺序执行,通过CAN总线汇总车身状态信息,通过雷达数据生成道路信息,完成数据采集,控制系统输入控制量为车辆横向误差、航向角误差和曲率误差,输出为转向角角度,完成自主驾驶.
图11 无人驾驶主控制器控制流程图Fig.11 Flow chart of the control of unmanned driving
3.2 神经网络训练
通过模拟巷道的驾驶员行驶,获得大量实际车辆驾驶数据,作为驾驶员模型的训练样本.并将驾驶员行驶信息(包括横向位置偏差与航向角偏差)进行统计处理,作为主要监控参数得到驾驶员操作规律.
真实道路与数据显示如图12所示.雷达原始数据经由滤波、补点环节之后显示为图中实线,断点点列为由雷达数据拟合出来的道路中心线;断点直线为拟合的当前航向角偏差.
图12 真实道路与数据显示Fig.12 Real road and data display
根据真实的驾驶员驾驶数据,按照顺时针和逆时针进行分类处理,得到驾驶员横向位置与航向角偏差数据,如图13所示.
从数据统计得到:驾驶员逆时针驾驶时,横向偏差算术平均值为-270 mm,航向角偏差算术平均值为-7.9°;驾驶员顺时针驾驶时,横向偏差算术平均280 mm,航向角偏差为10°,整体出现驾驶员靠弯道内侧驾驶的情况,这种情况的产生与驾驶员预瞄行为模式、道路环境[8]和驾驶车辆本身有关[11- 13].
由雷达传感器的特性,产生761个数据点,改良神经网络输入端为761个节点,设置中间隐层节点数为5[14].实验中单一输出会导致车辆出现“蛇形”行走现象,为削弱“蛇形”现象.将输出定为31个输出节点,每一个节点表示一个输出角度,网络输出为各节点概率.将激光雷达单场761个距离数据和此时的铰接角作为一组样本供神经网络进行学习.
图13 驾驶员驾驶数据Fig.13 Driver’s driving data
神经网络训练样本数据需要进行统一的归一化处理,这样有助于减少神经网络的训练时间.文中采用最大最小法,即
(8)
式中,xk为数据序列中任意值,xmin为数据序列中的最小值,xmax为数据序列中的最大值.
为了提升神经网络的学习速率,改善传统神经网络单一输出数值向量,运用高斯分布函数将单一角度值转化为一系列转角的概率分布,保证车辆在直线段行驶时“蛇形”现象得到改善,
(9)
式中,Pxi为输出值在该节点上的分布概率,di为参考输出值到某个节点的距离.
利用高斯概率分布函数可以很容易地将样本输出向量表示出来,例如,样本输出角度为14.8°时,可以得出其样本输出向量在第20号节点附近为[0.208 5 0.523 1 0.879 9 0.992 0 0.749 8 …0.379 8 0.129 0],向量中的数值可以理解为在该特定节点上的分布概率.
3.3 实车实验结果及分析
运用训练好的神经网络进行直线路径回正跟踪实验和曲线路径跟踪实验.直线回正路径用来测试该控制模型的快速回正性能和直线行驶稳定性,基本测试方案采用将车辆放置在模拟巷道直道入口处,使车头偏离中心线并且使车辆航向角与直道方向呈一定夹角.实验结果如图14所示.
图14 直线回正数据Fig.14 Head back data
在巷道环境中,初始横向位置偏差和航向偏差分别为-737 mm和-21°(车头偏左)、760 mm和22°(车头偏右).从图14可以看到,在车头偏左和车头偏右的情况下,系统回正的数据点均在200 mm左右,表示由控制系统指令发出到车头首次回正的调节时间为3 s.在首次回正之后,超调量均在100 mm以内且迅速回到了系统稳态值附近,而且在之后的行驶过程中,并未出现控制系统发散等现象,能够良好的完成直线段的跟踪回正任务.
曲线路径跟踪任务是将无人驾驶自卸车置于模拟巷道中,按照正常驾驶流程沿模拟巷道逆时针进行自主驾驶,记录驾驶过程中的横向位置偏差、航向角偏差等信息,其实验数据如图15所示.
图15 神经网络驾驶员驾驶数据Fig.15 Neural network-based driver driving data
从图15可以发现,综合横向偏差为-54 mm,综合航向角偏差为-0.47°,相较于真实驾驶员,神经网络驾驶员模型部分区域调节幅度优于真实驾驶员,且显著改善了真实驾驶员靠弯道内侧的驾驶习惯[15].
4 结论
文中提出了一种基于驾驶员行为的神经网络驾驶控制系统,建立了以激光雷达、角度传感器为主要环境数据接收的信息采集系统,通过研究驾驶员驾驶方式和习惯设计的神经网络驾驶员模型完成了基本的无人驾驶实验,改善了驾驶员靠弯道内的不精准驾驶习惯,提高了铰接车的运行平稳性与控制精确度.结果显示该控制模型在变曲率路段中,综合横向偏差为-54 mm,综合航向角偏差为-0.47°,横向位置偏差小于可通过路径宽度的10%,航向角优化90%,车辆运行平稳,无明显抖动、超调,神经网络驾驶员模型能够较好地完成巷道环境下的无人驾驶实验.
[1] 刘晋霞,张文明,董翠燕.铰接式自卸车与刚性自卸车的比较 [J].矿山机械,2003,31(9):21- 23. LIU Jin-xia,ZHANG Wen-ming,Dong Cui-yan.Articulated dump truck and rigid self unloading [J].Mining Machinery,2003,31(9):21- 23.
[2] JOHN Chadwick.Advanced mine automation [J].Mining Magazine,1996,175(5):258- 263.
[3] TASCILLO A,MILLER R.An in-vehicle virtual driving assistant using neural networks [C]∥Proceedings of the International Joint Conference on.[S.l.]:IEEE,2003:2418- 2423.
[4] DEMIRLI K,KHOSHNEJAD M.Autonomous parallel parking of a car-like mobile robot by a neuro-fuzzy sensor-based controller [J].Fuzzy Sets and Systems,2009,160(19):2876- 2891.
[5] SEBASTIAN Thrum,MAREN Bennewitz,WOLFRAM Burgard,et al.A second-generation museumtour-guide robot [J].IEEE International Conference on Robotics & Automation,1999,3:1999- 2005.
[6] 赵翾,杨珏,张文明,等.农用轮式铰接车辆滑模轨迹跟踪控制算法 [J].农业工程学报,2015(10):198- 203. ZHAO Xuan,YANG Jue,ZHANG Wen-ming,et al.Agricultural wheeled articulated vehicle sliding mode trajectory tracking control algorithm [J].The Chinese Society of Agricultural Engineering,2015(10):198- 203.
[7] 马晓.不同轮胎模型对重型载货汽车整车性能仿真的影响分析 [D].吉林:吉林大学汽车工程学院,2013.
[8] 赵阳.基于激光测距仪的井下设备模型车避障研究 [D].北京:北京科技大学机械工程学院,2012.
[9] POMERLEAU D.Efficient training of artificial neural network for autonomous navigation [J].Neural Computation,1991,3(1):88- 97
[10] 郭孔辉,潘峰,马凤军,等.预瞄优化神经网络驾驶员模型 [J].机械工程学报,2003(1):26- 28. GUO Kong-hui,PAN Feng,MA Feng-jun,et al.A preview optimization neural network driver model [J].Chinese Journal of mechanical engineering,2003(1):26- 28.[11] 李英.方向与速度综合控制驾驶员模型及在ADAMS中的应用 [D].吉林:吉林大学汽车工程学院,2008.
[12] 周鑫.基于Adams与Matlab的汽车电动助力转向系统的联合仿真 [D].武汉:武汉理工大学汽车工程学院,2009.
[13] 冀秉魁.基于驾驶员视觉特性的驾驶行为预测方法研究 [D].吉林:吉林大学交通学院,2014.
[14] 王武宏.汽车驾驶员行为模式及其心理因素对可靠性的影响 [J].汽车技术,1994(11):13- 18. WANG Wu-hong.Automobile driver behavior patterns and their psychological factors on the reliability of the impact of [J].Automotive Technology,1994(11):13- 18.[15] 付坤.基于驾驶员与道路环境因素的驾驶行为差错数学分析 [D].吉林:吉林大学交通学院,2013.
A Neural Network-Based Autonomous Articulated Vehicle System Considering Driver Behavior
ZHANGWen-mingHANHong-bingYANGJueYIXiao
(School of Mechanical Engineering, University of Science and Technology Beijing, Beijing 100083, China)
In view of the steering characteristics of articulated dump trucks, an autonomous articulated vehicle system is proposed based on neural networks and by considering driver behaviors. First, a sensor collecting system based on the laser radar and the angular transducer is established, and an articulated vehicle kinematics model and a dynamics model of articulated dump trucks are constructed by analyzing the steering characteristics of articulated dump trucks. Then, by using the ADAMS software, a dynamic model of the trucks is constructed to perform a steady state test. Moreover, a driver model of the artificial neural network control algorithm is constructed based on the optimal preview control, and it is verified by an Adams-Matlab/Simulink co-simulation. Finally, this control model is also verified by establishing a simulation ground tunnel to perform the straight-road-return and curve-road-following tests. The results show that, when the constructed control model is applied to the variable curvature road, the lateral position error is less than 10% of the passable distance, and 90% of the course angle deviation is optimized, which indicates that the constructed control model has a high convergence speed, a good steady state and an excellent unmanned driving performance.
driver model; neural networks; dynamic model; co-simulation
2016- 05- 12
国家高技术研究发展计划(863计划)项目(2011AA060404) Foundation items: Supported by the National High-Tech R & D Program of China(863 Program)(2011AA060404)
张文明(1955-),男,博士,教授,主要从事非公路车辆设计、非公路车辆状态检测与故障诊断研究.E-mail:wmzhang@ustb.edu.cn
† 通信作者: 杨珏(1975-),男,博士,副教授,主要从事非公路车辆设计研究.E-mail:yangjue@ustb.edu.cn
1000- 565X(2016)12- 0074- 07
U 461.1
10.3969/j.issn.1000-565X.2016.12.011