APP下载

面向无人驾驶的数据采集与分析系统研究综述

2021-06-22高振海于桐孙天骏王雨蒙

汽车技术 2021年6期
关键词:驾驶员交通智能手机

高振海 于桐 孙天骏 王雨蒙

(1.吉林大学 汽车仿真与控制国家重点实验室,长春 130022;2.吉林大学 汽车工程学院,长春 130022)

主题词:无人驾驶 数据采集与分析 交通场景 驾驶行为

1 前言

无人驾驶技术可以显著提升道路通行效率、降低交通事故发生率并提高能源使用效率,已成为近年来汽车行业的研究热点[1-2],而无人驾驶技术开发和测试的全过程都离不开数据的支持。标注清晰的数据集可以为算法的开发和训练提供大量的高质量数据,种类丰富的场景库可以使仿真验证更加真实完备,从而降低无人驾驶技术的开发成本,缩短开发周期。

无人驾驶数据库的建立主要由数据采集平台的搭建、数据分析与处理系统的搭建和数据的存储调用平台搭建3 个部分组成。数据采集平台的搭建需要根据不同的任务目标,在不同的车辆上搭载适当的传感器组合,以获取所需的数据流,根据所用设备的不同,其一般可以分为2 种,分别是使用原车已有的采集设备(如行车记录仪、车载GPS 等)和安装专用的设备;数据的分析与处理是指通过计算机或者人工的方式对原始数据进行增强和分类等操作,使其能够生成新的可用数据,并能够按照语义、法规和经验等进行组合、归档和分类,以便于开发者使用;数据的存储和调用是指通过分布式管理等方法,实现海量数据的快速存储、检索和调用。

根据所采集数据种类的不同,无人驾驶数据库主要分为交通场景库和驾驶行为库2种,交通场景库聚焦于车辆行驶时的周围环境,而驾驶行为库聚焦于驾驶员的操作或者车辆本身的行为,两者的并集包含了与驾驶相关的全部数据。

本文对交通场景库和驾驶行为库在数据采集和分析技术上的发展现状进行梳理归纳,并在此基础上提出无人驾驶数据采集和分析技术的发展趋势,为今后的研究提供参考和借鉴。

2 交通场景的数据采集和分析

交通场景是指车辆在道路交通中所处的场景,它是无人驾驶算法开发和测试的基础,也是算法落地应用的具体情境。典型的交通场景主要来源于政策法规、驾驶经验、驾驶环境等。

密歇根大学的Zhao 等[3]将自然驾驶数据分为自由行驶、跟驰、变道、前车插入、前方通过人行横道和侧方通过自行车这6种不同的关键驾驶场景,并据此建立了TrafficeNet 场景库,但是其分类方式没有考虑到城乡环境、交通信号和交通状况等其他的场景信息。中国汽车技术研究中心的刘生[4]提出了按照本车、其他交通参与者、道路交通情况和天气、城区等环境状况这4 个要素进行分类的方式,并提出不同国家的道路交通情况存在差异,自动驾驶的场景数据采集和分类应考虑到相关差异。

2.1 交通场景的数据采集

交通场景的数据采集是指通过某种传感器或传感器组合,将车辆所处场景的交通信息以数据的形式收集起来,以备后续使用。传统车辆的开发对场景本身的数据采集和重构等研究甚少。近些年,随着无人驾驶技术的不断发展,驾驶任务的执行者由人转变为车辆,其开发必须考虑车辆对不同场景的处理能力,因而交通场景的数据采集技术越来越受到重视。

2.1.1 早期的交通场景数据采集系统

早期的交通场景数据采集系统多采用摄像头和全球导航卫星系统(Global Navigation Satellite System,GNSS)来记录和复现场景数据,并搭载在道路车辆平台上,其记录的场景数据较为单一,一般为道路场景的重建,不包含其他交通参与者和城乡环境等交通信息。

苏黎世联邦理工学院的Cornelis 等[5]利用视频流的数据进行城市三维场景重建,为车辆的导航提供城市场景数据。为了丰富场景信息,昆士兰理工大学的He等[6]将车载摄像头拍摄的立体图片与GNSS 提供的定位及地图数据结合,为后续处理提供原始数据。在此基础上,武汉大学的Zhang 和国防科技大学的Lu 等[7]将行车记录仪作为数据采集设备,并用其提供的视频数据进行道路场景重建。

2.1.2 当前的交通场景数据采集系统

随着无人驾驶技术的不断发展,其对场景信息的要求越来越高。当下的交通场景数据采集系统一般将激光雷达、毫米波雷达、双目摄像头、广角摄像头、超声波传感器和GNSS等多种传感器组合使用,搭载在路测设备和飞行器等多种不同的平台上,记录的场景数据较为丰富,包含道路、城乡环境和其他交通参与者等多种交通信息,数据种类也涵盖了点云和图像等多种常见类型。

俄亥俄州立大学的Koppanyi 等[8]使用配备了激光雷达、GNSS 和不同分辨率的主、被动摄像头的车辆采集典型交通场景的数据,并开发了一个简单的界面导出这些高冗余的数据。相应地,中国汽车技术研究中心[4]也已经在多款车型上搭建了多传感器融合的数据采集平台,其上搭载了单目视觉、双目视觉、激光雷达、毫米波雷达和高精度惯性导航系统等多种传感设备。

考虑到自动驾驶车辆开发对场景数据的大量需求,一些机构和学者制作了相关的数据集,如CityScapes 数据集[9]、Oxford RobotCar 数据集[10]和CARLA数据集[11]等。这些数据集使用了大量的传感器,在不同的周期内对不同类型的场景进行了采集。以Oxford RobotCar 数据集[10]为例,其聚焦于交通场景的时空特性,使用了4个相机、3个激光雷达和GPS,对不同天气、行人和道路交通状况下的同一段连续道路进行了数据采集,采集时间长达1年,采集里程达到1 010 km,它提供的场景时变数据为长途自动驾驶的测试提供了基础。但上述数据集采集的均为国外交通场景,与国内的道路交通状况仍有一定差别,国内与之相似的开放数据集目前较少。

除路测设备外,基于飞行器的数据采集系统也开始应用。Apeltauer 等[12]使用无人机采集十字路口的航拍图像,并从中提取了车辆的行驶轨迹。在此基础上,Chen等[13]将飞行器采集的航拍视频用于交通流的建模,取得了较好的效果。

为了提高安全性和效率,Khan等[14]提出了使用无人机等飞行器进行交通场景数据采集的一般工作流程。南京理工大学的张楚东[15]采用高分辨率的航拍数据进行道路场景的重建,西安电子科技大学的赵凯迪[16]也使用无人机采集的实时视频图像作为场景数据进行分析处理。与路测设备相比,以飞行器作为搭载平台的数据采集系统具有视野广、灵活性强、透视变形低等优点,而随着无人机的广泛应用,飞行器类平台的成本得到了进一步降低,但其目前所采集数据的种类仍以图像为主,与路测设备相比较为单一。

此外,场景数据不仅可以从真实环境中采集,也可以通过数据增强技术生成和获取。数据增强技术通过对原有数据进行适当的平移、旋转、抖动和插值等操作来获得新的数据。例如:哈尔滨工业大学的张耀隆[17]通过生成对抗网络来扩充自动驾驶图像数据;湖南大学的Wu等[18]采用遮掩和改变光照度等方法对交通标志数据库进行了扩充;文献[19]使用基于插值的数据增强方法,对不完全的道路点云数据进行了补充。

交通场景的数据采集技术在近10年,尤其是近5年中迅速发展。早期的数据采集系统所用传感器类型单一,所用平台以路测设备为主,采集场景的种类较少。随着技术的不断发展,现有的数据采集系统使用不同的传感器组合,搭载在飞行器和车辆等不同平台上,能对多种类型的场景进行采集,并且使用数据增强技术对原始数据进行有效扩充,以丰富数据集中的数据。不过目前适应于中国交通环境的开放场景数据集仍较为缺乏,这方面的研究工作将会推进交通场景库的建成和自动驾驶的落地应用。

2.2 交通场景的数据分析

交通场景的数据分析是指通过一定的方法,由采集的场景数据对场景中的元素进行识别、分类和标注,并由此实现对交通场景的理解的一系列技术方法。场景元素的识别、分类和标注技术发展较早,而场景的理解技术近些年才得到较快发展。

2.2.1 场景元素的识别、分类与标注

早期的场景元素识别方法,即传统计算机视觉目标检测方法,主要基于数字图像处理的相关知识[20]。近年来,随着机器学习的兴起,识别、分类和标注方法将传统理论方法与机器学习技术相结合,提高了开发效率和算法性能。2种方法的典型算法如图1所示。

图1 典型的场景识别和分类算法

场景元素的识别和分类始于计算机视觉理论的提出。20 世纪80 年代,麻省理工学院的Marr 教授等[21]最早提出了人的视觉计算理论,为传统计算机视觉检测方法奠定了理论基础。在此基础上,利兹大学Mardia等[22]提出了基于阈值法的图像分割算法,通过设定特征阈值对像素点进行分类,南佛罗里达大学的Hall等[23]提出的聚类法通过对像素点进行聚类实现图像特征的提取和识别。传统计算机视觉检测方法研究开展较早,相关研究较多且理论基础成熟,但只能对数字图像进行检测和识别,不能处理点云等类型的数据,且存在准确率低、工作量大等缺点。当前主要使用的是基于机器学习的识别方法,其沿用了传统方法的部分理论框架,如尺度不变特征变换(Scale Invariant Feature Transform,SIFT)和方向梯度直方图(Histogram of Oriented Gradients,HOG)特征向量,并在此基础上使用神经网络等技术进行特征提取,这种方法不仅能处理包含点云在内的各种类型的数据,而且其准确率也超过了传统的检测方法。因此,当前机器学习技术广泛应用于无人驾驶的识别算法。本文根据识别目标的不同,对应用于不同交通场景的识别分类方法进行研究综述。

在其他交通参与者的识别和分类上,苏黎世联邦理工学院的Cornelis 等[5]采用基于隐式形状模型(Implicit Shape Mode,ISM)的车辆检测方法,其具有较强的鲁棒性,可以在模糊、有部分遮挡和光照度急剧变化的情况下检测出车辆的具体位置。武汉大学的Zhang 和国防科技大学的Lu等[7]提出了基于AdaBoost分类器的Haarlike 特征,可以在数秒内完成对车辆前、后表面和部分交通护栏的检测与识别。北京邮电大学的Fu等[24]设计了基于层次多支持向量机(Support Vector Machine,SVM)的分类方法,并实现了拥堵交通场景下车辆的检测和识别。华中科技大学的Yang等[25]考虑到交通场景的复杂性和多变性,提出了基于卷积神经网络的场景自适应车辆检测和识别算法。

在道路场景的识别和分类上,昆士兰理工大学的He 等[6]设计了大规模生成精确密集三维道路场景语义图的方法,以满足无人驾驶对语义地图的巨大需求,其使用车载摄像头拍摄立体图片,并采用数据驱动和非参数化的方法来解析场景并实现语义分割。加拿大滑铁卢大学的Sun等[26]考虑到高精度语义地图及相关数据采集所需的成本较高,提出了一种基于接近度的由图像到地图的数据收集和注释框架,其使用神经网络和在线数据库中的可用标签进行学习,并实现了不同天气下道路场景的自动标注。在道路线形特征提取方面,吉林大学的Gao 等[27]提出了基于前方车辆雷达信息来估算道路曲率参数的方法。此外,湖南大学的Wu 等[18]基于YOLOv3神经网络框架,提出了目标定位和分类识别的双级检测方法,并实现了对道路场景中的小型物体(如交通标志等)的实时检测。

考虑到车载处理器可能没有足够的算力,一些任务需要上传到远程服务器进行处理,而上传的压缩数据在重建时较为耗时,针对这一问题,麻省理工学院的Kwan[28]等提出了像素编码曝光(Pixel Coded Exposure,PCE)的方法,并结合深度学习实现了车辆的实时检测和分类。

考虑到实际交通场景中存在多类目标,且它们会对识别算法产生干扰,西北工业大学的Yao等[29]提出了在同一框架下,用双目摄像机对道路、汽车和行人等多种目标进行自动检测和分类的方法。南京大学的郭建朋[30]按照数据校验提交、数据标注和数据统计3个模块建立了自动驾驶场景数据库,其中数据标注模块使用了YOLO 神经网络算法,可以实现图像和点云等多种数据的目标检测和语义分割。文献[31]研究了在车队管理的特定要求下的交通场景分类。中国科学技术大学的钟泽宇[32]将激光雷达点云转化为距离图像,并通过二维卷积神经网络对其进行语义分割,再将得到的语义标签反投影到点云上,结果表明该方法具有较高的准确性。

此外,考虑到各交通元素随时间的变化,以及在移动车辆上拍摄视频所产生的视点时变问题,哥伦比亚大学的Dwivedi 和本田研究院的Narayanan 等[33]提出了一种具有时空一致性的动态交通场景分类方法。该方法利用数据集的时空特性进行语义分割和场景分类。试验结果表明,相较于直接使用场景元素的静态图像,该模型所捕捉到的场景元素的运动能更好地描述实际场景。

2.2.2 交通场景的理解

交通场景的理解建立在交通场景语义分割和元素识别的基础上。部分学者认为,场景的理解任务是通过分析和预测场景内各元素的交互行为和运动行为[34],实现对整个场景区域的语义理解[35]。随着以神经网络为代表的统计学习方法的兴起,场景理解在近些年取得了较快的发展。

达姆施塔特工业大学的Roth 等[36]较早地进行了交通场景理解的相关研究,其使用三维概率模型对场景内各对象间的交互行为进行理解。在此基础上,东北大学的金雪梅[35]基于条件随机场理论,建立了能对场景区域进行识别标注的模型。

卡尔斯鲁厄理工学院的Geiger 等[37]提出了基于移动平台的多目标交通场景理解的概率生成模型,该模型仅使用视觉数据进行分析和理解,并在推断场景布局方面取得了较好的效果。

考虑到元素识别等基本感知模块输出的环境模型会侧重于表达特定的感知任务,由此产生模式不同但信息冗余的现象,Oeljeklaus 等[38]基于卷积神经网络构建了多任务环境模型,提供了以集成方式生成互补表示的有效方法。

为了增强场景理解模型的泛化能力,北京邮电大学的Di等[39]建立了基于稠密对应关系的转移学习方法,并在不同的天气和光照环境下进行了训练。文献[40]、文献[41]则使用不同的卷积神经网络来完成交通场景的理解任务,但上述研究未能对整个场景区域进行语义分类和理解。

综上所述,随着神经网络等技术在相关领域的不断突破与应用,交通场景的数据分析技术已取得了长足发展。场景元素识别和分类的相关研究已日趋成熟,但场景理解技术的发展仍处于较为初步的阶段,交通元素识别与交通场景理解的任务划分不完全明确,场景的语义分类标准也不完全统一,而解决上述问题,对场景库的建立和无人驾驶的落地具有重要意义。

3 驾驶行为的数据采集和分析

在道路状况、周围环境等交通元素不同的场景下,驾驶员对车辆的操作会有所不同。为了开发更符合驾驶员驾驶习惯的车辆决策和控制算法,就需要收集日常状态下驾驶员面对不同交通场景时对车辆的操纵行为数据,即驾驶行为的数据采集和分类。利兹大学的Barnard 等[42]把在没有试验控制的情况下,以不引人注意的方式记录驾驶员、车辆和周围环境的数据并对其展开研究的方式定义为自然驾驶研究(Naturalistic Driving Study,NDS)。

为了估计描述驾驶员行为所需的数据总量,雅典理工学院的Stavrakaki等[43]提出了一个方法学框架。分析表明,驾驶员的攻击性、波动性和旅程的总时长都会对数据量的需求产生影响。因此,为了准确描述驾驶风格并理解驾驶员的驾驶行为,有必要进行长期、大量且广泛的驾驶行为数据采集和分析。

3.1 驾驶行为的数据采集

昆士兰大学的Grimberg 等[44]把用于自然驾驶研究的数据采集系统(Data Acquisition System,DAS)分为基于智能手机的驾驶行为数据采集系统和基于车载设备的驾驶行为数据采集系统,并指出基于智能手机的驾驶行为DAS 的测量误差相对较大,但其在研究动态驾驶动作(如加速、制动和转向)上具有较好的表现。

考虑到成本和部署便捷性等问题,在一些项目的前期开发中,常使用驾驶模拟器进行驾驶行为的数据采集。例如:吉林大学的高振海等[45]基于从驾驶模拟器中采集的数据,确定与驾驶行为相关的状态集和动作集,并由此建立了纵向自动驾驶决策过程的因果推理机制;考虑到多任务下的驾驶员认知负荷问题,吉林大学的Gao[46]利用驾驶模拟器设计模拟工况,并同步采集驾驶员的心电、皮电和呼吸等信号,经过统计分析找到了驾驶任务、认知负荷与生理信号间的关系;同济大学的时恒等[47]采用8自由度驾驶模拟器分析雾霾天气下的驾驶行为;文献[48]~文献[51]所进行的研究均采用了驾驶模拟器来收集相关数据。

基于驾驶模拟器的驾驶行为数据采集系统具有方便部署、成本低廉等优点,但这种方法得到的数据与真实的自然驾驶行为数据仍有一定的差别,仅作为参考,因此本文主要介绍基于智能手机和基于车载设备的数据采集系统。基于车载设备的驾驶行为数据采集系统的相关研究开展较早,早期其采集的数据主要用于事故分析,随着传感设备与自动驾驶技术的发展,目前车载驾驶数据采集设备所采集的数据精度更高、种类更多,用途也更为广泛。与此同时,由于近年来智能手机的广泛普及和其内置传感器精度的提高,基于智能手机的驾驶行为数据采集系统的相关研究越来越多。当前关于驾驶行为数据采集系统的研究,处于两者共存、各有优劣、互为补充的阶段。

3.1.1 基于智能手机的驾驶行为数据采集系统

基于智能手机的驾驶行为数据采集系统是近年出现的新兴技术,一般是指利用手机内置的先进运动传感器、GPS接收模块、摄像头和光传感器等,配合相应的手机应用,采集并存储或上传数据的技术。智能手机为传感器网络、驾驶员辅助系统和其他智能交通系统的应用提供了新的平台[52],其在驾驶行为数据采集方面得到了大量应用。

加州大学的Johnson等[53]最早提出了基于智能手机的驾驶行为监测系统,其利用智能手机中的GPS接收模块、加速度计、陀螺仪和磁强计获得位置、速度、加速度和偏转角等信息。文献[54]、文献[55]也采用相似的方法记录了驾驶行为数据。Freidlin等[56]对iOS系统、安卓系统和车载小型DAS 所采集的数据进行了比较,结果表明,在与算法相配合的情况下,手机内置的传感器精度与车载小型DAS精度相当。

考虑到智能手机在车辆中以不同的位姿摆放时,重力会对其他传感器的测量产生影响,中国科学院的Zhang 等[57]提出了评估手机摆放位姿,并据此对数据进行修正的方法,成功抵消了重力的干扰,进一步降低了智能手机DAS 的部署难度,提高了其所采集数据的准确性。

此外,智能手机DAS 还可以方便地根据所研究的问题进行调整和定制,如艾瑞尔大学的Botzer 等[58]开发了一款只记录制动事件的智能手机应用,以研究高强度制动与事故发生率的关系。

当前,智能手机具有极高的普及率,而基于智能手机的数据采集系统充分利用已有设备,只需要驾驶员安装相应的应用程序即可完成部署,显著降低了系统的安装成本,并使得采集大量且不同的自然驾驶数据成为了可能。此外,虽然智能手机DAS 在数据收集上存在一定的局限,但通过一些方法可以对其进行有效弥补,因此基于智能手机的驾驶行为DAS越来越广泛地应用在自然驾驶数据的收集和研究中。

3.1.2 基于车载设备的驾驶行为数据采集系统

基于车载设备的驾驶行为数据采集系统是相对传统的数据采集方式,由于其不仅能够采集驾驶行为信息,还能够采集与之相关的驾驶员生理信号,因此仍未过时。早期研究所记录的数据量一般较少,如弗吉尼亚理工大学的Neurauter等[59]开展的相关研究,通过面向车内的摄像头,记录了100 辆汽车总计700 h 的驾驶员手部行为数据。

随着传感及数据处理技术的不断发展,当前的车载驾驶数据采集系统主要包括2种:为研究定制的车载驾驶数据采集系统和非定制的车载驾驶数据采集系统[44]。为研究定制的采集系统配备特定的传感器,采样频率高,通常高于10 Hz,且测量误差低[60-61],但是其成本较高,且会对驾驶员的自然驾驶产生影响;非定制的数据采集系统可以降低成本,并且减少对驾驶员自然驾驶的影响,但是其收集的数据相对受限,且只记录超过一定阈值的驾驶事件。定制的车载数据采集系统多应用于大型项目中,如澳大利亚自然驾驶研究(Australian Naturalistic Driving Study,ANDS)项目[62],欧洲的自然驾驶、车辆安全和环境基础设施项目UDRIVE[42,63]和上海自然驾驶研究[64]等。这些项目都部署了大量且类型多样的传感器,并在数月的时间内收集了众多驾驶员的驾驶数据。其使用的传感器包括但不限于GPS接收模块、加速度计、前置雷达和摄像头。其收集到的信息包括:本车相关信息,如油门和制动踏板开度、挡位信息、转向盘转向角、ABS反馈信息、车速、转向灯标志位和安全带信息等;驾驶员生理信息,如酒精传感器信息、眼动信息等;光照度信息;车载音频信息等。这些信息会被存储为数据集,以备后续处理。

在研究某些特定问题或者特定群体时,车载数据采集系统可以设计得稍简单些,参与的驾驶员数量也可以相对减少,如密歇根大学Sayer 等[65]对轻型车辆安全性的研究和Nodine等[66]对货车驾驶员的自然驾驶研究等。

非定制的数据采集系统又分为加速度数据采集系统(g-Force DAS)和与摄像机结合的加速度数据采集系统(g-Force with a Camera DAS)。加速度数据采集系统通常只能记录超过某一加速度阈值的事件,而与摄像机结合的采集系统还可以记录事件前后一段时间内的视频流。爱荷华大学的Harland等[67]利用与摄像机结合的采集系统,记录并分析了青少年的驾驶行为和注意力分散情况。文献[68]、文献[69]也利用这类系统对日常生活中的危险驾驶行为以及自然驾驶中的分心情况进行了研究。

定制的车载数据采集系统所采集的数据具有种类全面、测量精度高等显著优点,具有极高的科研价值,但是其整体成本高且安装复杂,一般的科研机构很难独立地大范围安装和运行。非定制的数据采集系统利用已有的设备收集数据,优势在于便于部署且成本较低。

智能手机驾驶数据采集系统与车载驾驶数据采集系统相比各有优劣。基于智能手机的DAS具有部署迅速、成本低廉、方便定制等优点,且由于智能手机已经在生活中广泛使用,因此基于智能手机的DAS 不会给被测者带来额外的成本负担,这为大规模采集驾驶数据提供了可能。基于车载设备的DAS使用的传感器种类更多,采样频率更高,所获取的数据更加准确,在某些问题的研究上有着无可替代的作用,但由于其高昂的成本,很难被广泛地安装于不同地区的不同车型上,这也为其进一步发展带来了一定的阻碍。

3.2 驾驶行为的数据分析

驾驶行为的数据分析主要包括驾驶事件的识别和分类以及驾驶风格的测评。其中,驾驶事件的识别和分类是随着智能手机DAS发展起来的,其作用是从速度、加速度和角加速度等信息中识别出转向、加速和制动等驾驶事件,并对相关数据进行标注,以备后续使用,其发展历程如表1 所示。驾驶风格的测评主要用于绘制驾驶员行为画像,并据此进行个性化算法优化、风险驾驶提醒和事故关联分析等。

表1 驾驶事件识别技术发展历程

3.2.1 驾驶事件的识别和分类

驾驶事件识别和分类的相关研究始于2012 年,加州大学的Johnson 等[53]提出了基于动态时间规整(Dynamic Time Warping,DTW)算法和传感器数据融合的驾驶事件识别技术,其对车辆运动的检测精度与汽车CAN 总线的精度相当,且其所有的处理和运算均能在智能手机中完成。Eren等[54]也利用类似的算法,利用智能手机采集的加速度等数据,实现了对驾驶事件的检测和识别。在此基础上,2015年,卢森堡大学的Castignani等[55]基于模糊逻辑算法实现了对加速、制动、转向以及风险驾驶行为的精确检测。

为了充分挖掘驾驶行为的时间特征,中国科学院的Zhang 等[57]基于融合的卷积神经网络和递归神经网络,于2019年提出了一种能考虑高维传感器数据间的相关性、捕获显著结构特征并对时间特征进行建模的方法。该研究还据此建立了数据集,并对直线行驶、静止、左转弯、右转弯、制动、加速6种驾驶事件进行了注释。试验结果表明,该模型在识别驾驶事件方面,有明显优于其他模型的泛化能力。

3.2.2 驾驶风格的测评

在驾驶风格测评的相关研究上,早期的测评方法主要是基于心理学调查问卷和量表的主观评价法,随着人们对此重视程度的提高,现有的测评方法主要是基于驾驶行为数据的客观评价法[70],其发展历程如表2 所示。

表2 驾驶风格测评技术发展历程

20 世纪90 年代初,圣乔治医学院的West 等[71]将人们的典型驾驶方式定义为驾驶风格,并指出驾驶风格会受到个人性格特征的影响。早期的驾驶风格测评问卷和量表中,较为典型的有驾驶员行为问卷[72]、多维度驾驶风格量表[73]和驾驶员类型问卷[74]等。

当前的驾驶风格测评主要是通过对驾驶行为数据(如强制动次数等)的分析和处理实现的,这种方法基于仪器采集的数据,而不是被测人对自己的主观评价,因此其客观性较强,能更好地描绘驾驶员的驾驶行为特征。

克兰菲尔德大学的Martinez 和中国科学院的Wang等[75]认为模糊逻辑、K最近邻(K-Nearest Neighbor,KNN)分类算法和人工神经网络(Artificial Neural Network,ANN)是识别驾驶风格最常用的分类器。加州大学的Johnson 等[53]在前述驾驶事件识别算法的基础上,开发了测评驾驶风格的MIROAD 手机应用,其通过计算常规驾驶事件和攻击性驾驶事件的出现频率来评估驾驶员的驾驶风格。考虑到不同的车辆特性会对驾驶员的操纵产生影响,卢森堡大学的Castignani 等[55]提出了基于模糊逻辑的算法,成功地将驾驶风格与车辆特性独立开来。

在上述研究的基础上,马德里理工大学的Silva等[76]提出了对驾驶风格分类算法的性能进行评价的方法,其对SVM、随机森林(Random Forest,RF)、模糊逻辑、KNN和ANN 5 种算法进行了测评。结果表明,SVM 算法在精度方面优于其他算法,而ANN 算法在显著性检验上具有明显优势。

驾驶行为的数据分析是高级驾驶辅助系统(Advanced Driving Assistance System,ADAS)和无人驾驶车辆算法优化及个性化定制的基础,其作用主要有:利用驾驶事件识别和分类方法自动标注驾驶行为数据集,标注清晰的数据集对ADAS以及无人驾驶的算法开发和优化具有重要意义;通过驾驶风格测评描绘驾驶员的驾驶行为画像,可用于无人驾驶的个性化定制技术,也可用于车队管理和事故分析等。

早期对驾驶行为数据分析的研究较少,随着相关技术的发展,当前对其的研究越来越多,且主要是基于机器学习的方法进行识别、分类和评价。但现有研究所覆盖的数据量较少,且较为分散,未来的研究应建立在更广泛且多样的驾驶行为数据集上,并建立算法性能的评价体系,以便于找到不同情况下的最佳处理方法。

4 结论与展望

本文概述了面向自动驾驶的数据采集与分析技术的研究现状,并总结得到了以下结论和展望:

第一,交通场景的数据采集。当前交通场景的数据采集系统主要搭载在地面车辆和飞行器等平台上,其通过激光雷达、毫米波雷达、GNSS和摄像头等传感设备的组合收集数据,并配合使用数据增强等技术适当地增补可用数据。但目前针对中国交通环境建立的场景数据集较少,相关工作的推进会对无人驾驶技术在中国的落地应用具有重大意义。

第二,交通场景的数据分析。场景数据的分析,主要是对场景内的元素进行识别、分类,并对场景整体进行理解。当前的场景元素识别分类方法结合了传统计算机视觉和机器学习的相关知识,在识别算法的准确率和效率上取得了较大的突破。但现有的场景理解方法发展并不完善,在理解任务的具体定义和场景区域的分类标准上仍存在争议。对上述问题的研究讨论,将会促进交通场景理解技术的发展,并对交通场景数据库的建立起到较大的推动作用。

第三,驾驶行为的数据采集。驾驶行为数据采集的设备主要包括基于智能手机的数据采集系统、基于车载设备的数据采集系统和基于驾驶模拟器的数据采集系统。当前的驾驶模拟DAS 已经具有较高的模拟精度,但其仍不能够取代实车试验,车载DAS 仍存在成本较高的问题,而现有的智能手机DAS 虽然已经显著地降低了成本,但仍未能充分地利用智能手机设备的巨大基数。建立基于智能手机的分布式传感及数据采集系统,将能大幅提高驾驶行为数据的采集量和采集效率,并为驾驶行为数据库的建立奠定基础。

第四,驾驶行为的数据分析。驾驶行为的数据分析主要包括驾驶事件识别和驾驶风格测评,现有的主流方法均基于机器学习的相关知识,如支持向量机和神经网络等。驾驶事件的识别已实现了较高的准确率,但其尚未在大规模的原生自然驾驶数据中进行验证。驾驶风格测评的相关方法较多,但由于风格分类存在主观性,因此目前仍未形成统一的算法性能评价标准。进一步在大规模数据中验证分析算法,并建立算法性能的统一评价标准,将是驾驶行为数据分析技术未来的发展方向之一。

完备的数据库体系是无人驾驶的基础设施。无人驾驶数据采集与分析技术的发展和进步,将会推进交通场景数据库和驾驶行为数据库的建立,并对无人驾驶的开发、优化和个性化定制起到至关重要的作用。

猜你喜欢

驾驶员交通智能手机
基于高速公路的驾驶员换道意图识别
基于眼动的驾驶员危险认知
驾驶员安全带识别方法综述
An Evaluation of Chinese to English Translation in Light of Skopos Theory
全球智能手机出货量连续四个季度下滑缓
请你发明
智能手机
图说交通
发达交通之磁悬浮列车
阅读理解三则