浅析无人驾驶中的感知技术
2018-12-19周丁涛
周丁涛
摘 要 无人驾驶作为当前科技热点,需要包括控制理论、机械、图像处理在内的多种技术相互协作。一般而言无人驾驶技术分为三大模块:感知、决策与控制。其中赋予汽车“感官”,使其正确认识周遭环境的感知技术是三大模块中的基础模块。感知技术一般分为“定位”和“识别”两个方向,GPS导航、惯性导航常被用于定位;激光雷达、计算机图像处理与CNN技术常被用于识别。文章介绍三大模块各自作用,并着重讲解感知模块技术。
关键词 无人驾驶;惯性导航;GPS;激光雷达;计算机图像处理
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)224-0157-03
当前,新一代信息技术与制造业的深度融合,正引发影响深远的产业变革。《中国制造2025》明确提出要把智能制造作为两化深度融合的主攻方向,尤其要推动智能交通工具等产品的研发和产业化。无人驾驶技术作为智能交通工具的核心支撑和汽车产业未来转型升级的重要方向之一,正在发挥着越来越重要的作用。
无人驾驶,又称自主车或自动驾驶,是指通过为汽车装配雷达、激光、GPS、里程计、摄像头、传感器等多种感知设备,经智能软件集成处理后,具备对行驶环境进行感知和判断的能力,从而规划合适路径并控制汽车自主驾驶,安全抵达目标地的技术。
从国外来看,从20世纪50年代开始,美国、英国、德国等发达国家就已经开始了对无人驾驶汽车的研究[ 1 ]。1950年美国贝瑞特电子公司研制出了世界上第一辆自主导航车,该车能够在贝瑞特公司设计的轨道上行驶。1987年慕尼黑国防大学在奔驰公司的赞助下设计出智能车,车速最高可达96千米/小时;该校还在1994年研制出两台自动汽车,该车在巴黎的一条三车道公路上以最高130千米/小时的速度行驶了1?000多千米。2007年一辆由卡内基梅隆大学改装的雪佛兰塔荷无人驾驶汽车,完成了在城市复杂障碍赛道上的比赛。2010年谷歌研制的无人驾驶汽车通过城市道路的驾驶测试,体现了感知能力的完备性和人工智能的高水平;2015年谷歌完成了全球首次真正意义上的无人驾驶旅程,一位乘客独自乘坐名为“萤火虫”的无人驾驶汽车并对该车没有任何干预,最后的结果是该车安全地行驶过奥斯汀市街区。
从国内来看,20世纪80年代我国开始研究无人驾驶汽车及其相关技术。中国第一辆真正意义上的无人驾驶汽车于1992年由国防科技大学研制成功。2005年,上海交通大学研制出了首辆城市无人驾驶汽车。2011年,国防科技大学与一汽集团共同研制出了红旗HQ3无人驾驶汽车,完成高速全程无人驾驶试验,行驶里程达286千米,人工干预距离仅为总里程的0.78%。2012年,军事交通学院的“军交猛狮Ⅲ号”以无人驾驶状态行驶114千米,最高时速达到105千米/小时。2015年12月,百度无人驾驶汽车在北京进行了国内无人车领域迄今为止所进行的难度最大、最接近真实路况的开放道路程自动驾驶测试,通过完成多次调头、上下匝道、跟车减速、变道超车等驾驶行为,实现了从进入高速到驶出高速等不同道路状况的变换的功能,最高时速达100千米/小时。
1 无人驾驶技术三大模块
无人驾驶运用到的技术大致分为三大模块:感知、?决策和控制。其中,环境感知技术是实现完全无人驾驶的关键,也是如今限制无人驾驶汽车发展的主要因素之一。
感知模块是指无人驾驶汽车实时获取周围环境信息并加以处理,主要依赖于激光雷达、GPS定位导航、车载摄像头以及超声波等多种传感器,其中激光雷达往往在无人驾驶的信息获取中占据主要地位,其获取的信息占到总信息的60%到75%。激光雷达的优点在于精度高、抗干扰能力强,但也存在成本高昂、数据处理复杂等问题。
决策模块是指无人驾驶汽车在收到传感器送来的信息后对其进行识别与整理,其中可以按照机制分为外部行为预测、最佳路径规划和障碍碰撞规避3部分。其具体展开如下。
1)通过分析已知的物体位置和速度,可以粗略得到其移动规律并计算出移动范围和概率,达到预测行为的效果。
2)路径规划则要使用多种数学模型,其中之一是完全规划模型,但复杂性较高,因而有时也考虑使用概率性模型。
3)障碍规避分为两类,一类是远离危险和拥堵区域,预先减少碰撞的可能;另一类则是当雷达检测到碰撞即将发生时,采取紧急刹车等措施。
除此之外,在做出最佳选择时还需要用到增强学习算法,该算法的基本原理是促使系统不断与外界进行互动,根据外界给予的反馈(奖励或者惩罚)以更新评估函数,从而不断优化算法,使自己在实际情况中将错误降到最少。但由于实际行驶时路况复杂程度较高,实验室模拟往往无法全面覆盖可能出现的情况,因此也需要汽车具有根据已有知识自主解决问题的能力。
控制模块是指无人驾驶汽车根据传感信息和决策做出实际反应,此类技术相对其他两项而言已经相对成熟,其中自动泊车技术、适应巡航控制系统、车道偏离矫正系统和超车警示等技术已广泛运用到商业用途中。其中主要运用到的是基于反馈理论的PID技术,通过比例、积分、微分环节对汽车的行为进行控制。
2 无人驾驶感知技术
无人驾驶包括环境感知和车辆控制两项关键技术,其中环境感知技术是基础,没有对车辆周围三维环境的定量感知和精准识别,无人驾驶决策系统就失去依托。为提高感知的安全性和准确性,无人驾驶系统集成了GPS导航、惯性导航、激光雷达、计算机视觉(CNN卷积神经网络)等技术。其中GPS和惯性雷达往往只用于定位,而激光雷达和计算机视觉既可用于定位也可用于识别,并且主要是识别。
2.1 定位
无人驾驶汽车在空间上的定位主要依靠的是GPS与惯性导航,二者相辅相成。
GPS技术最大的优点是准确性,这种准确性依靠多个导航卫星的协作定位来实现。GPS的原理是通过被动地接收卫星发出的空间与时间信息从而推算自己与某颗卫星的距离(根据光速和时间编码进行计算),假如汽車能够接收到三颗或以上的轨道卫星所发出的信息,就可以在数学上推算出该车在空间中的具体位置,但实际运用时由于卫星与接受对象存在时间差,需要第四颗卫星辅助校正。除了卫星与接受对象的时间差外,影响测量精度的还有多路径效应、大气传播阻碍等,但由于GPS发展时间较长,技术已日趋成熟,其民用精度也可以控制在一米以内。
应该注意的是GPS也存在其劣势,由于车辆与卫星的距离过远,GPS的更新频率过低,存在路况复杂时无法满足汽车对实时定位的要求以及无法在隧道等封闭空间内接受信号的问题。目前我国也在研发相对应的北斗卫星导航系统,预计到2020年会正式向全球提供服务。
惯性导航则是通过输入由陀螺仪、加速度计测量的角速度、加速度,计算出相对原来位置所移动的方向和距离,具有连续性、不依赖外界、不易受干扰等优点。但由于测量和计算存在相对于实际的误差,并且在积分的过程中该误差一直在累积,因此惯性导航的精确度会随时间增加而下降,因此需要GPS对其加以矫正。
运用卡尔曼滤波整合二者数据,将GPS与惯性导航结合起来,惯性导航就能弥补GPS两次更新之间的数据空缺,同时修正存在的误差,达到以较高的频率和精确度进行车辆的定位的目的。
相机在定位过程中也作为以上两种技术的补充,通过分析双目相机传来的立体图像(视差图),可以计算出图像上点的相对深度,综合多幅立体图像的深度信息,可以估计在此过程中汽车的运动情况,从而计算出速度、加速度以及当前位置等。但由于汽车一直处于运动过程中,双目相机对物体的捕捉不够精确,输出的三维信息也不够可靠,所以一般只作为无法接受到GPS信号时的替代品使用。
2.2 识别
无人驾驶汽车对周围目标的识别主要依靠激光雷达与相机,这两种硬件设备都需要相应的软件作为后台,并各有其优劣。
激光雷达的原理与无线电雷达类似,运用远程测距技术,向目标发射激光并获取反射光,通过分析反射光的各个参量和反射时间来计算目标到汽车的距离。激光雷达分为单线和多线[ 2 ],单线激光雷达只发射一条激光,在水平面上进行激光测距,多线雷达则发射两条及以上的激光束,可以增加一定的垂直角度,形成扫描面,获取更为全面的信息。当然,安装多个单线雷达也能达到类似效果。当激光雷达的计算速度和准确度达到一定程度时,就可以实时呈现出汽车周围的高精度地图。
与普通雷达相比,使用激光束作为媒介的激光雷达具有精度高、实时性好、抗干扰能力强和比普通雷达体积更小等诸多优点。但仅依靠激光雷达无法完成识别任务,这是因为当障碍物处于同一平面时,激光雷达无法将其区分,同时难以穿透障碍物,遇到恶劣天气时其精确度也会受到影响。从工业设计的角度上看,安装多个激光雷达会造成成本的高昂,不适合商业推广。因此,现在也有用微波传感器来代替激光雷达的做法,该做法可以进一步缩小传感模块的体积,但就国内而言这方面技术还稍显落后。激光雷达企业Velodyne于2017年推出的激光雷达产品几乎可以满足自动驾驶的所有需求,而且体积缩小到原有的五分之一。
相機分为单目相机、双目立体相机和全景相机等。利用小孔成像原理,相机将周围景物投射到传感器内,根据光照强弱的差别,产生不同强度的电流信号,采样后可以利用计算机视觉技术对图像进行分析。单目相机与一般相机相比,图像输出速度和质量都有明显提高,同时为了减轻数据处理负担,单目相机往往自带调节光积分时间和图像简单处理的功能。双目相机可以将二维图像重构为三维,比单目相机的应用范围更广,但也存在三维信息不够完整和不够可靠的问题。
全景相机拥有多达6个相机,可以实现对周围360度同时成像,通过矫正和拼接处理后得到全景图像。以色列Mobileye公司开发的单目相机产品专为自动驾驶汽车设计,自带运算部件,可以直接辅助汽车行驶。
相机得到图像后对图像的分析处理是识别的关键。卷积神经网络在计算机视觉中运用较广。由于相机得到的图像数据量较大,全链接层很难直接处理,因此首先要对数据进行降维,其中运用到了模拟人脑结构的神经元,每一个神经元就是一个筛选函数,对图像进行初步分析,并提取部分重要信息。分析图像的过程中,非常重要的一步是卷积:一个感受野在图像上不断滑动,使得在每个位置都会完成一次卷积(即相应数值乘相应权重),最终输出此部分的特征要素。
系统会先学习并存储特征至数据库,保留在权重中,以达到识别的作用。每个卷积核会同时打开对应三原色的三个通道,将多个局部的数据综合起来,得到“feature?map”(也就是经过特征提取的图象),这样就可以在减小计算量的基础上得到更为全面的信息。卷积中还运用到了池化技术,为进一步减小数据量并提取特征,例如在相邻四个部分中取数据的最大值(或最小值),即可将数据量缩为原来的四分之一,并提高数据稳定性。得到图像数据后,系统会将其与数据库进行比对,得出结论。
3 结论
无人驾驶不是一项单独的技术,其中运用到的原理和设备是多方面的,而感知技术则是无人驾驶技术的关键,本文对无人驾驶中运用到的感知技术进行了浅析,介绍了GPS、惯性导航、激光雷达、卷积神经网络等技术。
无人驾驶汽车的发展关系到每个人的生活,在提高驾驶安全性、减少交通拥堵和提高能源利用效率等方面具有重大意义。但无人驾驶技术距离成熟还有很长的一段路要走,除了科技研发之外,也需要很多其他行业的通力协助(例如法律的完善)。当无人驾驶真正实现时,也许会标志着一个新时代的到来。
参考文献
[1]华南,王碧清.智能驾驶,离我们究竟有多远[J].中华儿女,2017(13):70-71.
[2]吴毅华.基于激光雷达回波信号的车道线检测方法研究[D].合肥:中国科学技术大学,2015.