面向智能驾驶行为的机器学习

2014-02-13陈雪梅苗一松

交通工程 2014年6期

陈雪梅，田赓，苗一松

(北京理工大学机械与车辆学院，北京 100081)

1 智能驾驶行为机器学习研究的背景

智能车辆又称无人驾驶车辆，是集环境感知与认知、动态规划与决策、行为控制与执行等多项功能于一体的综合智能系统，涵盖了机械、电子、人工智能、传感器技术、信号处理、自动控制和计算机技术等诸多学科.智能车辆主要通过传感器从周围的道路交通环境进行知识获取，由计算机系统对收集到的数据进行知识表达，然后对车辆的行驶状况进行智能控制.

智能驾驶行为分析一直是智能车辆研究的关键和难点问题.面对复杂动态未知高速公路、城市道路等环境，由于其复杂性和不确定性，车辆对多源信息无法准确、实时地进行知识获取与表示，常常导致错误的行为决策，在行驶过程还需要进行人工干扰.人工智能与真实驾驶员相比，人工智能在道路交通环境中信息处理能力有限.为了保证智能驾驶的流畅性，很多研究人员和学者对基于机器学习的智能驾驶行为展开了大量的研究工作，旨在通过对驾驶行为的知识获取与表示，使智能车辆具有更好的自主性和智能性.

2 机器学习主要研究的问题

机器学习是通过对人类学习过程的研究，建立相应学习论和方法，并应用于机器，以改进机器的行为和性能，提高机器解决问题的能力［1］.简单地讲就是研究机器如何模拟人类的学习活动，让机器具有更好的拟人性、自主性，具有“人类的智慧”.

机器学习的研究方法是从大量的观测数据中寻找规律，利用这些规律对未来数据或无法观测的数据进行预测.依据H.Simon的观点建立起来的简单学习模型如图1［2］:

图1 简单学习模型

该模型包含了机器学习的4个基本组成部分.“环境”部分指外部信息的来源，并为系统的学习提供相关信息;“学习”部分的功能是对获取的信息进行分析、归纳，从而形成新的知识或者对知识库进行完善和改进;“执行”部分是利用知识库已存在的知识，完成相应的任务，并把执行过程中的情况反馈给“学习”环节.机器学习的目的是根据已有的数据样本，求出系统输入与输出相应的函数关系，使之对未知的输入信息能够做出相应的预测［3］.

在智能驾驶行为的机器学习中，主要通过各种车载传感设备和计算机系统实现对人－车－路(环境)信息的感知、认知、决策和控制.具体机器学习建模中主要分为3个部分，包括识别判断、建模预测、智能决策.

2.1 基于机器学习的驾驶行为识别判断

在驾驶行为的研究中，很多研究人员通过传感设备对道路环境、车辆状态等信息进行感知，采用相应的机器学习算法对驾驶行为进行识别判断和决策.

20世纪90年代初期，Hernandez-Gress［4］通过对多感官信息的融合，采用主成分分析(PCA)和神经网络(NN)的方法来初步判断道路环境中的驾驶情况是否正常.王武宏等［5］2002年在建立驾驶恢复度模型过程中，运用了改进的决策树方法，准确快捷地求解驾驶差错状态的恢复概率.郭孜政［6］2009年使用单因子方差分析提取危险状态辨识主因子，构建了基于贝叶斯判别的驾驶行为危险状态辨识模型.

近几年，Claire D'Agostino等［7］根据决策树和线性逻辑分析的方法，构建了一种基于学习的自动识别驾驶行为模型.蔡旻融［8］根据油门踏板受力信号的变化规律，采用决策树分类器算法J48对采集的数据建立分类模型，能够准确的判断油门误踩行为.刘永涛［9］在对危险驾驶行为识别的过程中，通过车载设备获取车道线数据以及前车距离，构建了方差贝叶斯网络模型，提高了危险驾驶行为的识别率.

2.2 基于机器学习的驾驶行为建模预测

对驾驶行为的建模预测，主要是针对一些危险、异常驾驶行为、紧急避障行为，通过对这些行为的预测，可以有效地减小事故发生概率，并为车辆的智能驾驶及决策提供帮助.

20世纪90年代中期，Nagai，M等［10］采用遗传算法研究了驾驶员在紧急避障情况下的行为特性，并进行了相应的建模仿真.在2005年，Tsironis，Loukas等［11］采用决策树的方法对异常驾驶行为进行建模，并测评了模型预测的准确性.随后，Kumagai，T等［12］在对驾驶行为的预测中，采用了贝叶斯网络和联合树算法，提高了驾驶行为预测的准确率.Tezuka，S等［13通过采用静态类型的高斯－贝叶斯网络模型来预测驾驶员的驾驶行为，与隐马尔科夫预测模型相比较，该模型具有更高的预测准确率.秦小虎［14］根据事故统计数据的特点，建立了贝叶斯网络的学习和推理算法，构造了基于贝叶斯网络的交通事故预测模型，并分析了模型的适用范围.张开冉［15］在2006年对驾驶行为环境影响评价过程中，构建了BP神经网络模型，克服了传统评价方法的不足，提高了评价可信度.周立军［16］采用人工神经网络技术建立了车辆跟驰模型，开发了基于粒子群优化算法的ANN训练算法，增强了模型的鲁棒性.

在最近几年，Angkititrakul，Pongtep等［17］通过对减速行为的分析，采用贝叶斯网络来计算驾驶员在特定情况下的减速概率，并通过实际道路试验，证明了算法的有效性.Jinxian Weng［18］等采用决策树的分类回归树(CART)算法对危险驾驶行为与影响因素之间的关系进行了分析，极大地提高了模型的预测精度，解决了常规回归模型存在的问题.Prakash，A.K.［19］构建了一种基于人工神经网络的驾驶员模型，与传统的PID模型相比较，在跟驰加速过程中，它能更好地预测和控制驾驶行为.

2.3 基于机器学习的驾驶行为智能决策

面向智能驾驶的研究现在主要集中在驾驶行为的智能决策，通过对道路交通环境信息的获取和表达，如何在计算机系统中像一名优秀的驾驶员一样做出正确的决策，并做出相应的控制，一直是研究人员研究的重点和难点.

2001年，Ishikawa，K［20］通过人工神经网络和约束逻辑程序(CLP)对机器人周边的环境信息进行处理，提高了机器人的行为决策能力.孔令旗［21］在2007年利用BP神经网络较强的非线性适应能力，建立了多层BP神经网络层，构建了基于人工神经网络的车速与安全关系模型.随后，张强［22］在列车自动驾驶曲线生成过程中，采用遗传算法进行优化融合，得到对列车行驶过程的多目标优化方法.2008年，王晓原、杨新月［23］构建了驾驶决策识别模型，采用ID3决策树分类算法提高了模型推理速度，实现了跟驰、换道等驾驶行为的仿真，具备了一定的实时决策能力.

最近几年，邓涛［24］构建了基于遗传算法优化的驾驶员综合控制模型，利用遗传算法的自动寻优能力，优化了PID比例因子和量化因子，较为准确地描述了驾驶行为特性.段立飞［25］提出了基于遗传算法离线整定和神经网络在线整定的驾驶员模型，对汽车跟随预定轨迹进行了优化控制，与真实的操纵行为有很高的一致性.

复杂动态交通环境下的智能驾驶行为分析仍旧是制约无人驾驶车辆研究和发展的瓶颈问题.梁军［26］针对传统驾驶决策模型对环境感知的不确定性以及判断决策的不一致性，提出了一种基于神经网络的驾驶行为动态集成学习算法——DNNIA，并验证了算法的有效性.颜世伟［27］采用神经网络模型解决了拟线性驾驶员模型不能反映驾驶员非线性操纵的问题.Linsen Chong［28］针对车辆跟驰行为，建立了基于规则的神经网络模型，采用了增强学习算法来训练神经网络，使模型能够有效地模拟驾驶员的驾驶行为.徐涛［29］采用遗传算法对高速列车的距离一速度曲线进行优化，得到了列车在不同工况的最佳转换时机，改善了列车的自动驾驶能力.

3 几种面向驾驶行为的机器学习算法的优缺点

面向智能驾驶的机器学习的算法一般有决策树、贝叶斯、遗传算法、人工神经网络等.它们各有不同，为了解决驾驶行为的相关问题，一般都是1种或者2种算法复合使用.

3.1 决策树

决策树学习是一种逼近离散值函数的方法，一般用来解决驾驶员行为分类问题.它能够通过自身学习获取知识并以决策树的形式表示知识，用决策树表示的知识具有简单直观，检验方便，推理效率高的特点［30］.因此，通过使用决策树的学习方法，也可以实现对驾驶行为决策的模拟.

决策树的优点是易于理解和解释，人们通过解释可以方便地理解决策树所表达的意义;它对噪声数据有很好的鲁棒性并且能学习析取表达式，决策树是一个白盒模型，如果给定一个观察模型，那么根据决策树可以推出相应的逻辑表达式;它的算法很多，如ID3、C4.5、ASSISTANT等，能对大型数据源在相对短的时间内做出可行有效的结果.它的缺点是在处理驾驶行为的多源信息时，由于数据样本数量的不一致，容易形成信息增益，增益的结果偏向于那些具有更多数值的特征，对结果会造成一定偏差;也会出现过度拟合的问题，同时它忽略了驾驶行为信息的相关性，对一些缺失数据较难处理.

3.2 贝叶斯

贝叶斯理论发源于古典数学理论，有着坚实的数学基础以及稳定的分类效率.它是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身，提供了一种计算假设概率的算法，是一种典型的分类方法，主要应用在驾驶行为识别和预测中.

贝叶斯的优点是所需估计的参数很少，对缺失数据不太敏感，算法也比较简单.它的缺点是由于不同的驾驶员所形成的驾驶行为会有很大区别，如何定义一个合理的先验概率比较困难，并且对驾驶行为的分类决策存在一定错误率.

3.3 遗传算法

遗传算法(Genetic Algorithm-GA)是基于自然选择和基因遗传学原理的搜索算法，它在驾驶控制模型中应用得比较广泛.遗传算法的优点是在对加速、超车、换道等驾驶行为分析时具有较好的搜索能力，而且具有潜在的并行性，可以对多个个体同时进行比较;对驾驶行为数据分析时，由于驾驶员特性的差异性和行为的不确定性，遗传算法常常与模糊推理等一些不确定性推理学习算法结合应用，具有良好的可扩展性、鲁棒性.

遗传算法的缺点是:①在对驾驶行为分析中，遗传算法的编程实现比较复杂，需要对问题进行编码，找到最优解之后还需要对问题进行解码;②由于道路交通环境的复杂性、瞬变性，遗传算法的一些参数的选择，严重影响解的品质，而目前这些参数的选择大部分是依靠经验;③不能及时利用网络的反馈信息，算法的搜索速度比较慢，要想求得精确解，需要较多的训练时间;④算法对初始种群的选择有一定的依赖性，需要结合一些启发算法进行改进.

3.4 人工神经网络

人工神经网络是在研究人脑的奥秘中得到启发而发展起来的，主要用于驾驶行为的模拟仿真，在实际驾车过程中，当车辆靠近周围物体时，驾驶员会将注意力集中于靠近的物体［31-32］，当车辆可能出现危险时，驾驶员的生理和心理会有不同程度的紧张，从而影响驾驶行为［33-34］.大部分驾驶员都是根据自己的驾驶习惯(经验)对车辆周围的环境变化做出相应的调整，这些习惯本身具有一定的模糊性，难以建立与实际相符的驾驶行为模型.

人工神经网络的优点是分类的准确度高、并行分布处理能力强、分布存储及学习能力强、对噪声数据有较强的鲁棒性和容错能力，尤其是面对驾驶行为的复杂非线性关系，可以充分逼近，而且还具备联想记忆的功能.它的缺点是:需要大量的参数，如网络拓扑结构、权值和阈值的初始值;不能观察学习过程，输出结果难以解释，会影响到结果的可信度和可接受程度;学习时间过长，甚至可能达不到学习的目的.

4 总结

智能车最近几年发展迅速，但在国内发展时间较短，尤其是面向驾驶行为的机器学习，一直以来都是智能车领域的“瓶颈”.一方面机器学习领域的发展限制了智能车领域的发展，另一方面是由于驾驶行为的复杂性、特殊性.这就要求研究者们在致力于研究驾驶行为的同时，寻找新的学习算法和学习体制，通过集成学习方法、扩大学习规模、强化学习等途径来提高驾驶行为的学习精度，从而构建更为合理的驾驶行为模型，并以此促进驾驶行为在机器学习领域的新发展.

［1］鲍军鹏，张选平，吕园园.人工智能导论［M］.北京:机械工业出版社，2009.

［2］史忠植.高级人工智能［M］.北京:科学出版社，2006.

［3］周艳丽.基于主动学习SVM的智能车辆障碍物检测［D］.南京:南京理工大学，2008.

［4］Hernandez-Gress N，Herrera-Corral A，Esteve D.Multisensory fusion and neural networks methodology:application to the active security in driving behavior［C］∥Proceedings of 2nd World Congress on Intelligent Transport Systems，Tokyo，Japan:Vehicle，Road ＆ Traffic Intelligence Soc，1995，3:1146-1151.

［5］Wang W，Shen Z，Du Q.Modeling for action of recovering from erroneous driving condition based on revised decision tree［J］.Journal Beijing Institute of Technology English Edition，2002，11(1;ISSU 31):61-65.

［6］郭孜政，陈崇双，王欣.基于贝叶斯判别的驾驶行为危险状态辨识［J］.西南交通大学学报，2009，44(5):772-776.

［7］D‘Agostino C，Saidi A，Scouarnec，Chen L.Learningbased driving events classification［C］∥16th International IEEE Conference on Intelligent Transportation Systems(ITSC 2013)，Piscataway，NJ，USA:IEEE，2013:1778-1783

［8］蔡旻融，顾振宇，董占勋.基于非侵入行为监测技术的误踩油门踏板研究［J］.微型机与应用，2014(1):71-76.

［9］刘永涛，乔洁，魏朗，等.危险驾驶行为辨识算法研究［J］.计算机工程与设计，2014，35(4):1322-1326.

［10］Nagai M，Katagiri T，Onda M.Learning transfer function of a driver using genetic algorithm in collision avoidance［C］∥Proceedings of 2nd World Congress on Intelligent Transport Systems，Tokyo，Japan:Vehicle，Road ＆Traffic Intelligence Soc，1995，4:1765-1770.

［11］Tsironis Loukas，Mavropoulos Harry，Moustakis Vassilis，Kontogiannis Tom.Mining aberrant drivingbehavior characteristics［J］.Transactions on Information Science and Applications，2005，11，2(11):1743-1750.

［12］Kumagai T，Akamatsu M.Prediction of human driving behavior using dynamic bayesian networks［J］.IEICE Transactions on Information and Systems，2006，89(2):857-860.

［13］Tezuka S，Soma H，Tanifuji K.A study of driver behavior inference model at time of lane change using Bayesian networks［C］∥Industrial Technology，2006.ICIT 2006.IEEE International Conference on.IEEE，2006:2308-2313.

［14］秦小虎，刘利，张颖.一种基于贝叶斯网络模型的交通事故预测方法［J］.计算机仿真，2006，22(11):230-232.

［15］张开冉.基于BP神经网络模型的驾驶行为环境影响评价［J］.华北科技学院学报，2006，2(4):54-56.

［16］周立军，王殿海，李卫青.人工神经网络及粒子群优化算法在跟驰模型中的应用［J］.吉林大学学报:工学版，2009(4):896-899.

［17］Angkititrakul P，Miyajima C，Takeda K.Analysis and prediction of deceleration behavior during car following using stochastic driver-behavior model［C］∥Intelligent Transportation Systems(ITSC)，2012 15th International IEEE Conference on.IEEE，2012:1221-1226.

［18］Weng J，Meng Q.Effects of environment，vehicle and driver characteristics on risky driving behavior at work zones［J］.Safety science，2012，50(4):1034-1042.

［19］Prakash AK，Patil，Amol.Artificial neural network based driver modeling for vehicle systems［C］∥8th SAEINDIA International Mobility Conference and Exposition and Commercial Vehicle Engineering Congress 2013，SIMCOMVEC 2013，SAE International，400 CommonwealthDrive，Warrendale，PA 15096-0001，United States，2013.

［20］Ishikawa K，Fujinami T，Sakurai A.Integration of constraint logic programming and artificial neural networks for driving robots［C］∥Intelligent Robots and Systems，2001.Proceedings.2001 IEEE/RSJ International Conference on.IEEE，2001，2:1011-1016.

［21］孔令旗，郭忠印.基于人工神经网络的运行车速与道路安全性关系［J］.同济大学学报:自然科学版，2007，35(9):1214-1218.

［22］张强.基于遗传算法的列车自动驾驶系统研究与实现［D］.北京:北京交通大学，2008.

［23］王晓原，杨新月.基于决策树的驾驶行为决策机制研究［J］.系统仿真学报，2008，20(2):415-419.

［24］邓涛，孙冬野，胡丰宾，等.遗传算法优化的方向与速度综合控制驾驶员模型［J］.重庆大学学报:自然科学版，2011，34(9):1-8.

［25］段立飞，高振海，王德平.驾驶员对汽车方向的自适应控制行为建模［J］.机械工程学报，2011，47(8):121-125.

［26］梁军，沙志强，陈龙.基于人工神经网络的驾驶行为动态集成学习算法［J］.交通运输系统工程与信息，2012，12(2):34-40.

［27］颜世伟，高正红.基于人工神经网络的驾驶员操纵行为模型［J］.飞行力学，2012，30(002):105-109.

［28］Linsen Chong，Montasir M Abbas，Alejandra Medina Flintsch，Bryan Higgs.A rule-based neural network approach to model driver naturalistic behavior in traffic［J］.Transportation Research Part C，2012:32(2073)207-223.

［30］史忠植.知识发现［M］.北京:清华大学出版社，2001.

［29］徐涛，余进.遗传算法在优化高速列车自动驾驶中的应用［J］.城市轨道交通研究，2014，17(3):59-62.

［30］史忠植.知识发现［M］.北京:清华大学出版社，2001.

［31］Ishibashi，Okuwa.Driving styles individual characteristic indexes for driving burden susceptibility and driving behavior［J］.Jidosha Gijutsu，2004:58(12):34-39.

［32］He C D，Tangy Z D，Zheng N H.A study of truck driver’s moodstate［J］.Chinese Ergonomic，2010，7(2):18-21.

［33］Akamatsu.Assessments of actual driving using measurement vehicles［J］.Jidosha Gijutsu，2004，58(12):53-59.

［34］Akamatsu，Matsuoka.Humanbehaviormeasurement technologies and understanding behavior-system technologies for creating living environments suited for human behavior.［J］.Human Interface Society，2010，3(3):167-178.