偏度特征约束下的机载激光雷达点云数据分类
2023-09-28刘正坤林思娜吴丹妮
刘正坤,林思娜,吴丹妮
(1.广州中科智云科技有限公司,广州 510660;2.武汉大学 遥感信息工程学院,武汉 430072)
0 引言
激光雷达技术的本质是通过光源识别定位目标信息的一种技术,技术涉及激光器、雷达信号接收器、影像成像器。激光器会向需要识别的目标发送一个特殊的信号脉冲,脉冲达到需要定位目标后依旧返回发射一个频段的脉冲,从而实现监测目标的定位。机载激光雷达[1]三维信息获取是当前社会中一种崭新的探测技术。与传统的摄影测量方法相比,机载激光雷达的探测效果更具精准性。机载激光雷达在获取地形信息数据时,会优先取得以空间分布为主的离散点云数据[2]。但由于现在点云数据在处理过程中不够完善,因而会降低最终探测效果。所以为了避免这种问题的发生,需要对机载激光雷达点云大容量实时数据分类展开相关研究。
释小松[3]等利用神经网络方法设计了城区机载激光雷达点云分类算法。在压缩处理初始点云数据的基础上,从中提取新的点云数据,并采用改进Point Net方法分类提取结果,最终以实验测试结果验证分类效果,从而实现最终分类。该方法的压缩效果不理想,存在分类效果较差的问题。王果[4]等通过航空影像的辅助提出了一种新的机载LiDAR植被点云分类方法。依据植被光谱特征,利用K均值聚类算法对航空影像实行聚类及图像增强等操作,将处理结果与点云数据融合后处理融合结果,依据处理结果分类点云数据,从而达到最终分类的目的。该方法的融合结果不够完善,导致该方法存在分类精度差的问题。李永强[5]等提出了车载LiDAR点云数据中杆状地物自动提取与分类。在消除点云数据中的地面点的基础上,依据地物特征提取地物并对点云数据实行规则化操作,并通过分类模型分类地物实现最终的分类。该方法构建的分类模型存有欠缺,存在分类效率低的问题。SUN[6]等针对草方格屏障地区植被资源调查中点云的自动分类问题,提出了一种改进的随机森林点云分类算法。该方法在随机森林分类之前,基于点云数据的特征,根据点云数据空间分布特征,共选择了20个点云单点特征和多点统计特征参与点云分类,基于点云密度设置了三个不同的尺度来选择点云邻域,构建了不同尺度的点云分类特征集,优化了点云的重要特征,使其在变量重要性评分后参与点云分类计算。Bulatov[7]等提出了一种无监督和旋转不变的方法,并对三个具有非常不同特征的数据集进行了评估。该方法允许通过过滤和聚类所谓的叠加点来检测平面斑块,因此,经过适当修改的随机抽样和一致性(RANSAC)方法在富含异常值的数据中的平面估计中发挥了关键作用。Guo[8]等旨在在没有任何监督训练数据的帮助下,从移动LiDAR点云中共同定位3D对象。为了实现这一点,该方法提出了一种新的框架来实现3D对象协同定位,以从不同的点云场景中自动提取相同类别的对象。具体来说,为了搜索和利用来自不同点云场景中对象的协同信息,将3D对象协同定位问题表述为最大子图匹配问题。在图形构建过程中,为了处理不同场景中对象的不一致表示,提出了一种多尺度聚类方法,以金字塔结构表示对象。此外,由于最大子图匹配问题是NP困难的,提出了一种随机搜索算法来生成共定位结果。
由于上述方法没有考虑激光雷达数据中的无序性特征,为提高激光雷达云点数据的分类效果,避免数据无序性对分类性能的影响,提出考虑数据无序性的激光雷达点云数据分类方法。本文在机载激光雷达点云大容量实时数据预处理的基础上,有针对性地在对激光雷达数据进行去噪处理后,结合RBF径向基核函数与SVM分类器,二次训练、滤波、分类激光雷达点云数据,反复判断对应相似点是否为非地面点,在保证可以处理大容量实时数据的基础上,使得分类后的激光雷达点云数据有序化,这也是本文的创新点。
1 机载激光雷达点云大容量实时数据预处理
机载激光雷达是一种获取地球空间信息的高新技术手段。该技术可以通过数据滤波处理获取地面和非地面的点云数据,并将其分离,从而获取实际的建筑物等信息。该技术具有探测灵敏度高、数据精度高等优点。然而,在对机载LiDAR点云数据的处理中,由于所用算法不同,导致处理效果不同。为此,本文在机载激光雷达点云分类前,对其进行预处理。
1.1 机载激光雷达点云系统工作原理
基于机载激光雷达的介绍,将机载激光雷达系统用作研究对象,对其工作原理展开如下阐述。
机载激光雷达系统主要由激光测距仪、INS惯性导航系统、接收机三部分组建而成。激光测距仪的功能在于测量发射点与目标点之间的距离;INS惯性导航系统用来对参数实行测量;测量完成后利用接收机确定信号发射时的空间位置,它主要根据时间量测确定当前目标对象的距离。
当信号处于连续波状态时,首先需要确立信号的波形及接收信号波形的相位差。时间与相位差之间的关系用下述方程描述:
tL=φ/2π+T+nT
(1)
式中,tL表示信号传播时间,T表示周期,φ标记为相位差,n表示整波数。
在信号处于脉冲模式时,机载激光雷达系统可以直接获取tL,此时距离与时间之间的关系定义为:tL=2m/c。其中,m为扫描仪与目标点之间的距离,c为光速。通常来说,系统会利用脉冲信号获取高分辨率数据。与传统测量技术对比,机载激光雷达系统更能精准地得到三维数据,而三维数据中就包含离散点云数据及多类地物信息,这也是机载激光雷达独有的特点。
三维激光扫描系统由多种硬件构成,需要通过全球定位系统(global positioning system,GPS)控制扫描目标空间位置。通过三维激光扫描系统扫描目标后,采用定位定姿系统(position and orientation system,POS)坐标系转换到大地坐标系,以此获取三维激光扫描点的边坡三维坐标解算,通过下述公式定义:
(2)
公式(1)也可以表示为目在POS坐标系中的旋转矩阵,为此设置c为获取的航向角,进一步获取航向角旋转矩阵Lrow,表示如下:
(3)
根据上述获取结果可知,三维激光扫描时会出现一定的误差,其主要原因是激光扫描精度时主要体现在测交精度及距离精度上,同时扫描设备各个部件要以刚性固定集成为主,惯性测量单元(IMU,inertial measurement unit)、激光扫描仪中心、GPS中心之间存在偏移关系,所以在扫描时三维激光扫描系统的扫描轴会出现一定偏差,容易产生误差。
1.2 点云数据滤波
普遍来说,系统会利用脉冲信号获取高分辨率数据。机载激光雷达系统更能精准得到三维数据,而三维数据中就包含离散点云数据及多类地物信息,这也是机载激光雷达独有的特点。根据公式(1)可知,由于飞行器飞行过程的随机性,采集的数据也会呈现较强的随机性。这种随机性就会造成无序化问题。在自然状态下,机载激光雷达所测量到的样本点云数据要遵从于正态分布,以正态分布原理为基础,假设机载激光雷达的非地面点会对正态分布情况带来一定的干扰,若想得到标准的地面点,就需要剔除非地面点,即滤波去噪。
利用偏度衡量对称性正态分布的关键度量,如公式(4):
(4)
式中,sk表示偏度,J表示机载激光雷达点的总数量,Si表示单一对象点,σ表示样本标准方差,μα表示样本均值,i表示系数。
而机载激光雷达sk偏度正态分布的σ、μα用方程表达式定义如下:
(5)
当sk的取值要比0大时,就说明正处于正偏态分布,当sk的取值要比0小时,就说明正处于负偏态分布。由于标准的正态分布sk取值为0,所以sk的绝对值越大,就说明偏置距离越远。
普通的偏态平衡滤波算法对机载激光雷达点云样本数据展开滤波时,极易出现地面点分类错误的问题[9],会给滤波处理效果带来干扰,为了解决这种问题的发生,需要对偏态平衡算法实行改进,在原有算法的基础上引入多光谱数据指导滤波流程,加强数据去噪效果。
以上述偏态平衡滤波为基础,优先灰度化处理多光谱数据[10],基于偏态平衡算法对非地面点的过滤结果,将其与灰度图像相结合,从中建立一个窗口,以建立的窗口为中心寻找出与中心点光谱具有相似性的点,这些相似点归类后就会成为非地面点。根据改进后的偏态平衡滤波算法,利用该算法对机载激光雷达获取的点云大容量实时数据展开滤波处理,具体流程如图1所示。
图1 点云数据滤波流程
点云实时数据滤波处理流程如下所示:
1)引入多光谱数据及DSM数据实行灰度处理。计算DSM数据中的sk值,若sk>0,则进入到步骤2),若sk≤0,则步入到步骤3)。
2)对比光谱相似性[11]。具体表现为当sk>0时,获取DSM数据最高点Q(i,j)及多光谱数据中与Q(i,j)相对应的点,即G(i,j)。根据Q(i,j)与G(i,j)的光谱相似度对比结果滤除G(i,j)存有相似性的点。滤除完成后即可返回至步骤1)。
3)sk≤0时,滤除的点就属于非地面点,而余下的点就属于地面点,以此完成滤波处理,得出滤波后的结果。
通过分析机载激光雷达工作原理,利用机载激光雷达获取点云大容量实时数据。由于获取的数据存有空洞数据,所以需要对其实行滤波处理,以此增强后续分类效果。
2 点云大容量实时数据分类算法设计
2.1 选取点云大容量实时数据特征
点云大容量实时数据的训练特征决定着数据分类效果,而优质的训练特征则会提升点云实时数据分类精度。通过提取机载激光雷达点云特征,并采用F-score方法对提取的特征实行有效性评估,从中选取优质特征以此构成一个以特征向量为主的训练分类器[12-13],利用该分类器对点云大容量实时数据展开分类,从而实现最终分类方法。
一般情况下点云数据中主要包含四种点云特征,因而待选取的点云大容量实时数据特征定义如下:
1)点云数据经滤波处理后[14]提取机载激光雷达地面点,对地面点归一化后获取地面点高程值h。根据归一化结果获取地表模型,利用该模型区分高矮不同的物体或建筑物。
2)设置机载激光雷达高程方差HV的中心点为激光点,在圆形范围内以R1为半径,其周围所有的点都是机载激光雷达的高程值方差,可以有效地3反映出物体表面的平整度。
3)机载激光雷达点云大容量实时数据法向量偏角β。主要表现在人造物体、建筑物等β保持不变,而植被表面β变化明显。
4)点云回波率[15]f。设定点云实时数据中的回波率主要以该点的中心为主。假设在圆形范围中半径R2是平均点距的2倍,那么点云大容量实时数据回波率f通过计算得到:
f=nball/ncolumn
(6)
式中,nball表示圆形范围内的点云数量,ncolumn表示柱形中的点云数量。
对上述四种机载激光雷达点云实时数据特征向量选择完成后,需要对其实行差异处理操作,以此消除具有差异性的特征。实行差异处理的特征用方程表达式定义如下:
(7)
式中,I′表示差异处理后的点云特征值,I初始特征值,Imin表示最小特征值,Imax表示最大特征值。
2.2 点云大容量实时数据分类
以“一对一”分类方法为主,基于选取的点云特征建立一个为N(N-1)/2的二分类器,式中N表示点云种类数量。
依据RBF径向基核函数[16-17]复杂性低的特点,将RBF核用作构建的SVM分类器内核,以此对点云大容量实时数据实行分类模型的训练。此时RBF核的方程表达式用下述方程标记:
K(p,q)=φ(p)T+φ(q)=
(8)
式中,p、q表示点云实时数据低维特征向量,φ(p)、φ(q)均标记为高维向量[18],γ表示核参数,T表示时刻。
在RBF核函数中选择核参数γ及惩罚因子C,利用训练样本对SVM分类器[19-20]实行训练,其训练结果即为分类结果,再对分类结果实行粗分类,以此得出点云数据共分成建筑物、植被、人造物体三类。
机载激光雷达点云大容量实时数据分类流程如图2所示。
图2 点云大容量实时数据分类流程图
点云大容量实时数据分类流程如下所示:
1)确定地面点坐标位置。
2)提取目标对象点云要素。
3)对获取的点云要素进行F评分。
4)选取点云大容量实时数据特征并进行去差分处理。
5)使用一对一[21-22]的策略进行粗分类,以此得出点云数据共分成建筑物、植被、人造物体三类。
6)输出分类结果,实现偏度特征约束下的机载激光雷达点云数据分类。
3 实验与分析
为了验证所提出偏度特征约束下的机载激光雷达点云数据分类方法的分类性能,设计对比测试。
3.1 实验设置
实验过程中,分别利用所提方法(方法1)、文献[3]神经网络方法(方法2)、文献[4]航空影像辅助方法(方法3)进行实验测试,实验使用的机载激光雷达扫描示意图如图3所示。
图3 激光雷达扫描示意图
图3左侧无人机为由GPS模块、惯性测量仪、无线网络适配器、激光扫描头和存储控制单元组成的精灵 4 RTK 小型多旋翼高精度航测无人机扫描过程。该无人机具体参数为轴距350 mm,最大旋转角速度150°/s,可控转动范围俯仰:-90°~+30°,角度抖动量±0.02°。本次实验测试选取机载激光雷达用作实验对象,利用该设备获取地区点云数据。扫描仪参数如表1所示。
表1 扫描仪参数表
3.2 实验过程及方法
实验之前的准备工作如下:
1)开启无人机,确保各个仪器能够正常获取数据;
2)初始化调试体系,调节相机白平衡后开启激光。
3)为使成像结果更为精确,要将整个成像体系标定好,保障所得数据为有效数据。
根据上述过程,在实验过程中,由图3所示的无人机扫描目标实验区域获取相关数据,当无人机飞行至雷达扫描范围内时,基于激光雷达的无人机地形跟随系统,向四周发生电磁波在碰到目标后反射,通过雷达采集处理单元接受反射波获取飞行环境的相对高度信息,继而判断机载激光雷达的距离高度速度等指标,并将数据结果传输给飞行控制系统,完成激光雷达点云数据扫描与采集。机载激光雷达点云大容量实时数据分类时,其训练耗时及分类精度均能体现出机载激光雷达点云大容量实时数据分类效果。
3.3 实验结果分析
为证明三种方法的分类效果,展开下述实验测试。
1)本次实验设置点云密度为2.36 pts/m2,利用机载激光雷达获取建筑物、地面点云数据,点云总数为6 000个,并在点云总数中选取10%的数据用作训练样本,其余用作测试样本。采用方法1、方法2和方法3分别对测试样本数据实行训练,根据训练时间验证分类耗时,训练时间越短,说明分类期间消耗的时间越少,表明该方法的分类效率快。具体测试结果如图4所示。
图4 不同地物类别测试样本数据训练时间测试
图4(a)为建筑物测试样本数据训练时间测试,选取的建筑物测试数据共为2 500个,随着测试数据的不断提升,三种方法对应的训练时间均不相同。测试时,方法1的训练时间要处于5 s以下,而方法2和方法3的整体训练时间要超出5 s,其中方法3的训练时间增长速度最快,因而可以表明方法1的训练时间最短、方法3的训练时间最长。
图4(b)为地面点测试数据训练时间测试,其测试数据总量为1 000个。与图4(a)相比,测试数据有所减少后,三种方法都提升了自身训练速度,大幅度降低了训练时间,但依旧可以看出方法1的训练时间最短,以此证明了方法1的分类耗时少、分类效率高。
综上所述,方法1在实验测试中的训练时间最短,这主要是因为方法1对点云数据实行滤波处理,达到消除数据噪声点的目的,以此降低训练时间、提升分类效率。
2)机载激光雷达点云大容量实时数据的训练速度快不代表分类精度高,所以需要进一步利用三种方法展开分类准确率测试,以此证明分类效果。以水平方向为x轴和z轴,以竖直方向为y轴,绘制任意目标点的直角坐标为:
(9)
式中,Hx、Hy、Hz分别表示三维激光扫描技术在x轴、y轴、z轴方向的坐标值;S1和S2表示图1中的两条线段长度;α表示仪器所发射激光的水平角度;θ表示该激光的竖直角度。引入建筑物、植被、人造物体三类激光雷达定位目标,通过图5展示不同定位目标的坐标变化情况,匹配原始建筑物、地面点云数据,分析点云数据的偏差特征计算结果。
图5 扫描云数据的偏差特征计算结果
通过图5可以看出,本文的方法可以很好的区分动态与静态云数据的偏差特征,特征偏差区分度很好,有利于进一步分类。对建筑物、植被、人造物体三类点云特征混合后,进行分类,结果如图6所示。
图6 数据分类结果
图6中,在点云数据分类下,不同定位目标与地面点云数据较为匹配,精准划分出多类地物信息,且各点云数据间的重叠性较低,使得具有无序性的点云数据有序化,表明该方法可以较为精准的分类效果优化激光雷达的应用过程,保证机载激光雷达的探测效果。
具体测试结果如表2所示。
表2 不同方法的分类准确率测试
分析表2中的数据可知,整体测试实验中方法1和方法3的分类准确率要高于方法2,而方法1的分类精度下降较慢,始终保持最高。将本次实验结果与实验1结合,得知方法1的训练时间短、分类精度高,由此可见方法1的分类效果最佳,具有较好的实际应用价值。
3)RDV(相对差异值)可以衡量不同算法在机载雷达点云数据分类过程中的收敛速度,RDV值越低,表明对应方法具有越优的收敛速度。分别利用方法1、方法2和方法3对6 000个目标机载激光雷达点云数据进行分类,获取不用算法的RDV值如表3所示。
表3 不同算法RDV值对比
由表3可知,不同运算时间下,方法1均具有较低的RDV值,说明本文提出的机载雷达点云数据分类在保持较高分类准确率的同时具有较快的收敛速度,再次验证了本文所提出的机载激光雷达点云数据分类方法具有较高的分类有效性以及收敛速度。
考虑到激光雷达扫描形成点云数据的过程中,会存在大量的干扰数据。为了保证不同方法的分类性能统计采用三种算法机载激光雷达点云数据在加入不同干扰情况下的分类精度,统计结果如表4所示。得到不同方法分类的误分率结果如表5所示。
表4 干扰情况下分类精度对比
表5 不同分类方法误分率对比表
表4实验结果可以看出,相较于方法2和方法3而言,方法1在不同白噪声干扰下具有较高的分类精度,分类精度高于80.72%,分类精度均明显高于两种对比方法,验证了本文提出的机载激光雷达点云分类方法具有较高的抗干扰性能。本文算法可有效抵御机载激光雷达点云获取过程中存在的众多噪声干扰,可应用于点云数据分类中。为验证所提方法的分类性能,以误分率为指标,与方法2、方法3进行对比实验,结果如表5所示。
从表5中可以看出,随着干扰强度的不断升高,三种方法对机载激光雷达点云数据的误分率变化趋势不一致,方法1的误分率低于0.05%,方法2的误分率位于0.05%~0.75%之间,方法3的误分率位于0.08%~0.20%之间。因此,方法1的误分率更低。
4)以Kappa系数为指标,分别对比方法1、方法2和方法3的分类性能。利用式(10)表示Kappa系数:
(10)
式(8)中,N表示数据总数;nir表示混淆矩阵第i行的总和,ni=j表示对角线元素,c表示类别数,nic表示混淆矩阵第i列总和。
同时为凸显本文方法的分类性能,分别利用方法2和方法3在同一环境中进行测试,结果如表6所示。
表6 总体精度与Kappa系数实验结果
通过对表6的分析得出,在采用本文方法进行分类时,建筑物机载激光雷达点云数据显示的总体精度为97%,且Kappa系数都高于两种对比方法;在植被机载激光雷达点云数据中,本文方法的Kappa系数为0.96,与方法2和方法3结果相比,Kappa系数明显提高;在人造物体机载激光雷达点云数据中,本文方法的Kappa系数为0.97,与方法2和方法3结果相比,Kappa系数明显提高。
4 结束语
机载激光雷达点云若处理不当,会对最终探测结果造成影响,为了解决上述问题,本文提出了机载激光雷达点云大容量实时数据分类方法,详细分析了机载激光雷达中的点云系统工作原理。为了消除数据空洞给点云数据带来的干扰,根据获取的点云大容量实时数据,依据偏差特征滤波处理无序化的点云数据。通过提取点云大容量实时数据特征,从中选取最优有序化特征。结合SVM分类器,创新性地采用RBF径向基核函数二次规范无序数据,对点云大容量实时数据分类。通过对该方法实行分类效果测试,测试结果表明,所提方法达到了最佳分类效果,解决了地面点分类错误的问题,优化了分类时间与分类准确率,在机载激光雷达点云数据分类方法中发挥着重要作用,在实际应用中具有较好的发展前景。