无人驾驶系统中的关键技术浅论

2018-06-13张俊元

时代汽车 2018年11期

张俊元

南宁三中广西南宁市 530021

1 无人驾驶系统的结构

1.1 感知层

无人驾驶系统最底层的就是由大量传感器构成的感知层，通过对各种复杂路况的环境感知转化为数据并进行处理再传入到决策层，再进行安全合理应对措施。这里的环境感知主要是包括对交通标识、路况、车道线标识以及车流的感知（高速公路上，城市交通更为复杂），最常见的是对获取到周围环境的图片信息，进行简单的去噪和二值化操作后，通过对比数据库得到交通标识等信息，再传入到决策层。

1.2 规划层

无人驾驶系统的规划主要是对路径的规划，通过感知层得到的路况和路标信息，生成一条安全且可行的路径。首先是全局路径规划，通过设定起始点，确定一条最优的路径，再是局部路径规划，比如说遇到前方车辆需要超车时的行驶路径、前方拥堵需要换道时的换道路径等，目前最常用的局部路径规划算法主要是随机采样算法，在某时刻初始位置通过随机采样寻找到周围无障碍的点，在这些点中寻找一条最短路径，但是在某些时刻运算量较大，可能达不到实时性。

1.3 执行层

整个执行层主要包括对油门、刹车、方向盘等汽车部件的自动控制，在决策层规划处路径后发送指令到执行层来控制这些部件的统一运行来实现车辆的安全行驶。

2 环境感知

一辆车在驾驶的过程中，最重要的是通过驾驶员的人眼感知外部环境传送到大脑，大脑做出相应的反应通过身体控制汽车来保证安全的行驶，但是无人驾驶系统中由于没有驾驶员的存在，那么感知外部环境并做出相应的反应这一过程就交由系统自动的完成，在高速公路上行驶时，由于交通状况较为简单，只需要感知到明显的交通指示牌即可，但是在城市道路上，交通状况极为复杂，不仅需要注意红绿灯，还有人行道上的行人以及别的车的变道指示，那么就需要复杂的判断。

一般来说的环境感知是指对车身上的传感器所识别的外部环境的图像进行识别和处理，一般来说，是对图像的像素点的分类，在上个世纪，图像识别主要使用的是一个随机场算法，但是在近年来卷积神经网络理论的发展和GPU的普及，可以很大程度上提高图像的识别效率，来保证无人驾驶系统反馈的实时性。

2.1 卷积神经网络

2.1.1 神经元模型

神经网络组成的最基本单元是神经元，也称为感知器，其简化模型如图1：

图中x1、x2、x3为输入信号，w1、w2、w3为输入信号各自对应的权值，b值是一个偏置项，对输入加权求和后得到z，g泛指为激活函数，y为输出[3]。可以看到一个感知器有如下3个部分：

（1）输入信号：可以接收多个输入，每个输入上有一个权值；

（2）激活函数：感知器的激活函数可以有很多选择，常见的激活函数有Sigmoid、tanh、ReLU等；

（3）输出：获取神经网络输出数据。

感知器的作用主要是用来提取图像的每一个像素值并将其作为一个权值输入到卷积神经网络中进行下一步处理。

2.1.2 卷积层

二维图像的卷积操作较一维信号的卷积操作而言较为复杂，首先我们将一张二维图像类比于图2-2的网格图，其中，每一个网格代表一个像素，图中蓝颜色的网格表示卷积层中的一个卷积核，可看出卷积核的大小为3*3。卷积操作如下：每一次卷积核延X轴方向行进一个步长，直至行进到图像边缘后卷积核又返回至最左端并向下移动一个步长继续如上操作直至遍历整个网格。卷积核中每一个单元均代表一个权重，在卷积核遍历整个网格过程中，卷积核中的权重将会与对应网格中的权重相乘相加，如果假设步长为1，那么图1-2经过卷积操作后将会成为一个6*4的图。

图2 卷积操作

读取大小为6*4的生成图中每一个元素的值，对每一个值通过激励函数进行非线性化处理，处理方法有许多种，本文使用ReLU函数作为激活函数。ReLU函数具有许多独特的特性，该函数是扭曲线性函数且是一种非线性的非饱和函数。相对于饱和函数来说，ReLU函数的训练时间更快且更具效率，而相对于线性函数来说，ReLU有更强的表达能力，且它的扭曲线性的性质不但保留了非线性的表达能力，而且在正值部分具有很好的线性性质。除此之外，由于ReLU函数的非负区间的梯度为常数，这就是得它较tanh和sigmoid函数而言的优异性在于不存在梯度的消失问题。

2.1.3 池化层

池化层进行下采样操作，目的是减小特征图、减少特征值、降低运算量和降低数据维度。常用的方法有三种：最大池化（Max Pooling）、最小池化（Minimal Pooling）和平均池化（Average Pooling），池化规模一般为2×2。最大池化（Max Pooling）是目前关于卷积神经网络处理常用的池化方法，它取四个点中的最大值。

2.2 基于卷积神经网络的环境感知

对于从传感器接收到的图片，我们遇到的最大问题是对单一像素点的分类问题。对于一个单独的像素点，比如说车身的白色像素点和一个高光区域的白色像素点，我们是很难具体的判断出这个像素点代表的是车身还是高光区域，那么我们就需要结合这个像素点周围的像素进行判断，尤其是边缘区域的判断，那么我们就可以使用卷积神经网络，使用不同的卷积核得到不同的特征图类型经过与训练的数据集对比从而进行图像识别[3]。

3 检障避障

实际上，障碍物检测也可以属于环境感知的内容，但是比较特殊，可以归为一个单独的整体，因为对于汽车的检障和避障是保证汽车安全行驶的前提。

3.1 检测障碍物

一般来说，检测障碍物分为静止的障碍物和动态的障碍物，静止的障碍物的检测较为简单，运动的障碍物检测较为复杂，一般是使用激光雷达作为传感器，主要有地图差分法，将运动的障碍物看成质点，通过对比不同时刻的地图信息，所不同的区域即是障碍物的轨迹。

3.2 预测障碍物轨迹

对于障碍物的轨迹预测是比较困难的，充满了不确定性，目前的方法效果都不是特别显著，主要的方法2004年提出来的假设原状法和2007年的概率轨迹法[4]。假设原状法主要是通过传感器获得某一时刻障碍物的运动状态（距离、速度等），然后假设该障碍物会以此时的运动状态保持下去，即以此时刻的速度为初速度做匀速直线运动，这种方法在高速公路等路况环境下是有一定效果的，但是对于城市交通这种复杂路况的效果是非常不显著的，而概率轨迹法是在假设原状法的基础上引入了概率分布，对轨迹的可能性做出概率预测，再加上一些与路况有关的基本信息的先验概率，可以较好的获得更真实的预测结果，但仍然无法满足复杂路况的障碍物判断。

3.3 躲避障碍物

在通过检测障碍物以及获取了障碍物的轨迹预测后，决策层会发送指令来避开障碍物，常用的方法有势场法和区域划分法。势场法是借鉴了物理中保守力场的形式，比如说重力场，以地面为0势能面，距离地面越远则重力势能越大，这里是以障碍物为一个基准点，距离障碍物越远，势能越小，我们对这个势能经过实验测定一定的阈值，如果小于这个值，那么就属于安全行驶区域，从而构建一条安全的行驶路径。