APP下载

面向激光雷达点云的三维目标识别算法研究综述

2022-12-16刘桂宇

信息记录材料 2022年4期
关键词:激光雷达视图障碍物

刘桂宇

(一汽解放汽车有限公司 吉林 长春 130011)

0 引言

随着自动驾驶技术的不断发展,三维目标识别技术的重要程度不断提升,自动驾驶领域对点云目标识别算法的可靠性和鲁棒性需求日益迫切[1]。在城市、港口和高速等复杂环境中,准确识别目标和感知环境内障碍物信息是自动驾驶汽车行驶安全和决策控制的重要基础[2],直接决定了自动驾驶系统的可靠性和安全性。因此,研究面向激光雷达点云的三维目标识别算法尤为关键。

在自动驾驶领域,基于激光雷达点云的感知任务可分为低层次感知和高层次感知两个层次。低层次感知即障碍物检测,只需探测到前方存在障碍物即可,无法感知障碍物类别。高层次感知即目标识别,需要在障碍物检测的基础上,对障碍物信息进一步分类,感知障碍物具体类型和空间信息。经典点云目标识别流程包括点云预处理[3]、区域分割[4]、障碍物聚类[5]、物体类型识别和包围框拟合等过程。整体流程较为复杂,需要对点云进行分割、聚类和分类等多步骤处理。此外,由于点云数据具有不均匀、噪声等特点[6],经典点云目标识别算法在目标物体类型识别方面存在劣势。

近些年人工智能技术发展迅速,在二维图像深度学习算法的基础上,三维点云深度学习算法研究取得了一系列显著的成果[7-8],促使点云目标识别算法不断推陈出新。在自动驾驶场景语义分割[9]、场景理解、目标检测[10]和目标分类[11]等多项任务中,深度学习算法得到了广泛应用。与经典点云目标检测算法相比,基于深度学习的点云目标识别算法能够满足更多的目标感知需求,目标类型识别准确率更高[12],算法鲁棒性更强,具备广阔的应用前景。

1 经典点云目标识别算法

经典点云目标识别算法可从激光雷达等传感器获取的点云数据中识别出障碍物目标,并解算出其空间位置、尺寸大小、几何形状、运动朝向等数据信息,并通过拟合边界框或多边形轮廓实现目标轮廓信息描述。

其中,点云预处理主要通过应用滤波算法实现点云模型数据量的减少,并剔除点云模型中部分噪声点,减少噪声数据对后续分割、聚类算法的处理过程和运算结果产生影响。常用的滤波算法包括直通滤波、体素网格[13]和统计滤波等。在实际应用过程中,可根据噪声类型和场景需求选取合适的滤波算法。

区域分割算法主要通过将点云划分为多个同质区域,实现道路、建筑等区域划分,实现相同区域内的数据点具有一致属性。常见的区域分割任务主要为地面分割,用于减少后续障碍物聚类过程中地面点云对非地面点云产生的干扰。地面分割算法主要包括基于统计量的地面分割算法、基于角度的地面分割算法[14]、平面拟合算法[15]和基于面元的区域生长算法等。获取地面点云并分割后,保留地面上的非地面障碍物点,用于后续聚类算法。

点云模型经过区域分割处理后,仅保留非地面点云,背景区域以及地面已被移除。通过应用聚类算法,可实现单独的车辆、行人等障碍物提取。在障碍物聚类过程中,通过对点云分割结果应用无监督聚类算法,可将障碍物点云聚类为不同的类簇,每个类簇即代表一个障碍物目标。常用的聚类算法包括基于欧式距离的聚类算法[16]和基于密度的聚类算法[17]。结合激光雷达点云数据特点,可针对不同范围的点云设定相应的聚类条件,提升点云聚类效果。

物体识别过程可以采用特征提取配合分类器实现障碍物分类,获取目标类别信息。由于点云数据较为稀疏,且通常不完整,仅依靠特征提取和匹配的方法,目标识别效果一般,容易出现障碍物类型识别错误的现象。

在聚类基础上,对每一个类簇进行包围框拟合处理,并计算障碍物属性,具体包括中心点、质心点、长宽高等。包围框拟合共有三种拟合形式,包括外接矩形、最小外接框和最小包围框。为最大程度表征出真实的障碍物大小,常用最小外接框和最小包围框进行障碍物包围框拟合。

经典点云目标识别算法整体流程较为繁琐,需要对点云进行分割、聚类和分类匹配等处理。此外,由于点云具有目标物体数据不完整性、数据密度低等特点,经典的点云目标识别算法可以支撑低层次感知任务实现,但在目标识别准确率方面存在一定不足,难以满足自动驾驶系统对目标识别准确率的需求。

2 基于深度学习的点云目标识别算法

针对经典点云目标识别算法在激光雷达点云目标感知与识别方面的不足,近些年国内外学者开始深度学习算法应用于点云目标识别过程,实现点云目标识别效果的提升。然而,与二维图像数据相比,激光雷达点云数据存在点云密度不均匀、数据不完整、噪声等特点。此外,点云模型无特定方向,数据量大,应用深度学习算法处理大量点云数据会产生较高时间成本,无法保证自动驾驶系统对目标识别的实时性需求。

为了解决上述难题,国内外学者提出了一些创新性的深度学习模型构建方法[18-19],实现了深度学习算法在点云目标识别领域的创新性应用。目前大多数三维点云深度学习网络主要集中在以体素(Voxel)、点云(Point Cloud)、图(Graph)、和视图(View)等四种点云表示方式来构建网络。

基于体素的深度学习网络[20]通过将点云划分为具有一定大小的规则网格,借助网格模型描述点云数据的三维空间分布。其中,网格尺寸大小取决于点云模型整体数据量大小。为了降低算法运算量,提高算法运行效率,需要对每个网格中数据点进行随机采样。经过网格化处理后,可以将主要适用于具有规则数据结构的卷积神经网络应用于点云,并在体素网格中直接应用卷积[21]和池化操作。然而,点云经过网格化处理后,并不是所有的网格中都存在数据点,该数据表达方式仍存在优化空间。此外,网格尺寸设定需要十分谨慎,因为其容易导致点云数据输出尺寸发生变化,破坏本属于同一目标物体的数据点几何关联关系。

基于点云的深度学习网络[22]可以保留点云三维空间信息和内部局部几何关系,既可以学习全局点的特征,也可以学习局部点的特征,可以满足多种三维目标识别需求。通过直接将三维点云数据输入网络并进行训练,可以在一定程度上减少数据信息缺失。目前,基于点云的深度学习网络的难点主要在于解决点云输入排列问题,研究如何避免丢失点云局部特征,以及忽略点及其相邻点之间的几何关系。

基于图的深度学习网络[23]通过将点云表示为图结构,并在此基础上应用卷积神经网络,实现特征提取和目标识别。图是一种非欧氏数据结构,在用于表示点云时,节点代表点云中各个数据点,边则代表各相邻点之间的数据关系。随着卷积神经网络技术的发展,越来越多的图卷积网络被应用于三维数据。相比于其他深度学习网络,基于图的深度学习网络具备一定的优势,能够完整保留点及其相邻点之间几何关系。然而,构建基于图的深度模型同样具备难点,需要定义适用于动态邻域大小的卷积神经网络,并建立权重共享机制。

基于视图的深度学习网络通过从不同方向对三维点云进行二维投影[24],并应用完善的卷积神经网络和基于图像数据集的预训练网络对二维投影视图进行运算处理,例如AlexNet、VGG 和ResNet 等,最终实现目标识别。与基于体素的深度学习网络相比,该算法可以对感兴趣区域进行多视角识别,并对识别结果进行融合分析,输出最佳识别果,提高三维目标检测准确性。二维视图投影与点云或体素网格等三维数据格式相比,由于减少了一维数据信息,因此可以大大降低计算成本,且目标分辨率更高。此外,通过应用现有的深度学习网络,可以更好地利用点云投影视图中的局部和全局信息,提高算法适应性。然而,从三维空间到二维视图投影会导致部分几何空间信息丢失,且多投影视图相互之间存在数据冗余问题。

综上分析,基于深度学习的点云目标识别算法在目标识别准确率方面具备一定优势,但由于点云数据具备无序性、不均匀等特点,因此在网络构建和模型训练方面存在一定挑战,上述各类深度学习网络在减少信息丢失方面仍存在优化空间。

3 总结与展望

在自动驾驶技术领域,基于三维点云实现障碍物目标是目前主流研究方向。相比于二维图像信息,激光雷达获得的三维点云数据包含了物体空间位置和几何信息,获取目标信息更加丰富,可以帮助自动驾驶车辆更好地规避行驶风险。本文针对三维点云目标识别技术,分别对经典点云目标识别算法和基于深度学习的点云目标识别算法进行了分析,并对两种算法的优缺点进行了总结。

总体而言,相比于经典点云目标识别算法,基于深度学习的点云目标识别算法在目标识别准确率和鲁棒性方面更具优势。近几年,国内外研究学者在三维点云深度学习模型构建方面取得了一定成果,提出了多种创新性的深度学习模型构建方法。然而,由于点云数据自身的无序性、遮挡、噪声和数据量大等特点,如何进一步完善深度学习网络在点云目标识别任务中的应用仍然具有挑战。

基于深度学习的点云目标识别算法发展时间尚短,未来仍有非常多的方向值得研究和探索。为弥补点云数据无序性、不均匀的缺陷,可研究面向多源数据融合的深度学习网络构建,将包括图像、激光雷达点云和毫米波雷达数据融合后,基于统一的深度学习网络实现目标识别,提升目标识别准确性。研究多尺度特征融合策略,提取激光雷达点云前后帧关键信息,实现深度学习网络对目标对象数据的充分利用。为解决点云无序性问题,研究鲁棒性的点云数据表示方法,在体素、点云、图和视图表示方法的基础上,探索更加新颖的三维数据表示方式。通过对以上方面的研究和探索,不断提升激光雷达点云目标识别智能化程度。

猜你喜欢

激光雷达视图障碍物
激光雷达实时提取甘蔗垄间导航线
法雷奥第二代SCALA?激光雷达
高低翻越
赶飞机
月亮为什么会有圆缺
Velodyne激光雷达宣布将GaN技术用于小型化低成本固态激光雷达传感器的新设计
视图
Y—20重型运输机多视图
SA2型76毫米车载高炮多视图
Velodyne激光雷达公司推出Puck高分辨率激光雷达传感器;更高的分辨率以辨认更远距离的物体