APP下载

一种利用三维HOG特征的建筑物点云分类方法

2021-12-17刘如飞侯光强王旻烨杨继奔

遥感信息 2021年5期
关键词:噪点格网邻域

刘如飞,侯光强,王旻烨,杨继奔

(山东科技大学 测绘与空间信息学院,山东 青岛 266590)

0 引言

建筑物是城市建设与管理的基础单元,从三维激光扫描数据中分类建筑物对更新城市基础地理信息具有重要意义。建筑物包括顶面和立面两部分,空基激光扫描数据缺乏立面的细节信息[1],而地面固定扫描、车载移动扫描、背包移动扫描等地基激光扫描系统可以快速获取建筑物立面的高精度点云数据,为建筑物分类研究提供了新的数据源[2]。但扫描距离不同以及地物遮挡导致地基点云存在密度不均匀和缺失现象,给地基点云中建筑物分类带来了巨大的挑战[3-4]。

目前从地基点云中分类建筑物的方法大体可以分为四类。一是依据点云自身特征及其邻域特征分类建筑物点云[5],常用特征包括高程纹理、反射强度、几何形态等,该类方法避免了图像转换和体素划分的信息损失,但受点云密度不均匀的影响,局部特征计算时邻域范围难确定[6],且点云的海量性导致该类方法计算时间较长。二是依据建筑物点集在扫描线上的分布特征分类建筑物点云,常用特征包括z方向坐标方差、y方向坐标差值、非离散分布等,但该类方法对点云的上下文特征利用不足,且难以处理散乱点云。三是将点云投影到水平面,划分二维格网[7-8],通过最大高程或点云个数等单一属性定义格网值[9-10],或通过高程差异、密度差异等多种属性定义格网值,生成特征图像[11-12],然后利用图像处理技术进行建筑物分类[13]。此类方法中,点云转为图像处理加快计算速度的同时会造成精度损失,且格网大小对分类结果影响较大。四是将点云过分割为体素,对体素进行分割实现建筑物分类[14-15],加快了计算速度,但分类效果受体素分割影响较大。

针对以上问题,本文通过分析多尺度特征格网中建筑物立面的邻域梯度分布,提出一种利用三维HOG(histogram of oriented gridients)特征进行建筑物点云分类的方法,从复杂的环境中准确分类建筑物点云。

1 三维HOG建筑物分类

本文提出的建筑物分类方法主要包括多尺度特征格网生成、三维HOG特征设计和建筑物点云分类三个步骤,算法流程如图1所示。

图1 算法流程图

1.1 多尺度特征格网生成

首先,确定点云范围和格网边长,建立多尺度格网索引;然后,利用格网索引和统计滤波去除噪点;最后,利用格网内点云的空间分布特征计算格网特征值,得到整个扫描区域的多尺度特征格网。

1)多尺度格网索引建立。根据点云的坐标最值xmax、xmin、ymax、ymin、zmax、zmin以及格网边长d,得到点云与不同尺度格网的对应索引关系,计算方法如式(1)所示。

(1)

式中:int[]表示向下取整;mod[]表示取余数;某一点P(Xp,Yp,Zp)对应的三维格网的行列层号为row、col、layer;某一小尺度格网(rowa,cola,layera)对应的大尺度格网的行列层号为rowb、colb、layerb。

2)噪点去除。将三维空间中的坐标点垂直投影到xy水平面上(即令z值为0),投影点在固定邻域内的邻近点个数表示投影密度。统计显示:建筑点投影密度较大,呈连续线性分布,而噪点投影密度较小,散乱分布在建筑点周围,如图2所示。为防止噪点影响特征值计算,本文利用格网索引和平面坐标对格网进行统计滤波。

图2 建筑物点云投影示意图

3)格网特征值计算。通过格网(i,j,k)内ni,j,k个点的坐标加权计算格网特征值Ii,j,k,该值由格网内点的个数、空间分布形式(投影形状、高程差异等)决定,投影形状越接近线形则权值越大,距离最低点的高差越小则权值越小。

格网内点pr(0

(2)

式中:wsijkr、whijkr分别为投影形状权值以及高差权值;λ1、λ2为格网内点利用主成分分析得到的特征值。

根据上述权值公式计算格网值Ei,j,k,并归化到0~255灰度空间得到格网特征值Ii,j,k,生成突出表达立面目标的多尺度特征格网,计算如式(3)所示。

(3)

1.2 建筑物立面HOG特征

1)立面空间分布。以建筑物立面为中心的局部范围内,立面两侧通常不存在点,存在点的情况有三种:窗户位置的散乱噪点、地面点、灌木等植被点。图3为不同方向的建筑物立面空间分布示意图,立面在竖直方向分布连续,因此只对绿色层进行展示,红色方形代表中心立面,蓝色方形代表邻域立面,灰色圆形代表非立面地物或无地物。

图3 建筑物立面空间分布示意图

2)邻域梯度分布。首先,利用边缘算子[-1 0 1]计算格网(i,j,k)沿坐标轴方向的梯度GXi,j,k、GYi,j,k、GZi,j,k;然后,计算三维梯度Gi,j,k,并通过水平方向θHi,j,k和竖直方向θVi,j,k共同描述梯度方向,计算如式(4)所示。

(4)

图4为以建筑立面格网为中心的邻域梯度分布示意图,各层立面的邻域梯度多为水平分布,因此只对绿色层梯度进行展示,蓝色箭头代表梯度,绿色星形代表较小梯度或无梯度。可以看出,立面两侧梯度分布大致对称,而延伸方向梯度较小。

图4 立面邻域梯度分布示意图

3)HOG特征分析。HOG是一种描述图像局部纹理的特征,广泛应用于图像处理领域。基本原理是根据图像区域内每个像素点的梯度方向,将幅值利用双线性内插法累加到直方图中,形成HOG特征向量,但HOG特征不具备旋转和尺度不变性,通过统计多尺度下不同方向立面的邻域梯度,发现立面两侧梯度的对称关系在一定程度上不受旋转和尺度变化的影响。图5为接近水平方向的梯度统计图,蓝色矩形代表相应方向的梯度统计值。

图5 方向梯度统计示意图

为充分反映上述对称关系,对HOG特征进行改进,如图6所示。图6(b)将竖直方向划分为3层,图6(c)将水平方向均匀划分成8个扇形区间,统计26邻域内格网的梯度,按方向分配给图6(a)中对应层的区间。具体统计方法为采用夹角为90°、步长45°的滑动窗口遍历不同层的区间,统计每个窗口的梯度,选取最大值记为F1并记录层号L,然后选取同层剩余窗口的最大值记为F2,同时要求F1和F2所属窗口的区间相离(假设F1位于红色窗口1,则F2在剩余绿色窗口4、5、6中产生),最后用邻域总梯度减去F1、F2,结果记为F3。使用F1、F2、F3、L描述中心格网的HOG特征。

图6 HOG统计示意图

1.3 建筑物点云分类

1)立面格网识别。对格网进行HOG特征判断,当格网满足条件时标记为1,否则标记为0,判断条件如式(5)所示。

(5)

式中:Tsym、Text为特征阈值。

不同尺度下的建筑物立面均满足上述判断条件,如图7所示。图7(a)为数据1局部原始点云,图7(b)、图7(c)分别为使用单一尺度格网提取的立面点云,图7(d)为多尺度求交结果。由于植被影响,单一尺度下提取结果存在噪点,而多尺度求交在保留建筑物立面点的同时,能够剔除噪点。因此,构建多尺度HOG特征识别模型提取建筑物立面点(式(6))。

图7 求交结果

S=Sa∩Sb

(6)

式中:S为建筑物立面点集合;Sa、Sb分别为在尺度a和尺度b下提取的建筑物立面点集合。

2)约束生长去噪。分析发现,属于同一立面的格网不仅空间上相邻,而且具有相似的投影方向和特征值。将空间相邻定义为邻域格网重心到中心格网拟合线的平面距离小于阈值dT,约束生长的条件如下。

①种子格网选取。从未聚类的格网中选取标记为1的初始种子格网。

②生长准则。在空间相邻的基础上,对于标记为0的格网,生长准则为投影方向夹角小于阈值θT0且特征值之比小于阈值rT;对于标记为1的格网,生长准则为投影方向的夹角小于阈值θT1。

③立面筛选。统计立面高度,大于2 m时,认为属于建筑物立面。

3)相邻立面聚类。建筑物通常由多个相邻立面组成,将距离相近的立面进行聚类,具体过程如下。

①选取未聚类的立面g0,新建集合类S。

②若存在立面g1,其包含格网与g0包含的格网距离小于3 m,则将g1添加到S中;以g1作为g0,重复②;否则返回①。

2 实验分析

2.1 实验数据

为了验证本文方法的有效性,采用地基激光扫描系统采集两组数据进行实验,数据点位精度优于5 cm。如图8(a)所示,数据1共4 705 426个数据点,覆盖范围大致为150 m×60 m,该区域包括建筑物、树木、花坛、车辆、宣传栏、围栏等地物,其中建筑物阳台为弧状立面。如图8(b)所示,数据2共11 195 112个数据点,覆盖范围大致为200 m×120 m,该区域包括高层建筑物、大型树木、车辆等地物,其中建筑物内部存在大量噪点。

图8 实验数据

2.2 实验结果与讨论

利用本文方法进行实验,参数及阈值设置如表1所示。

表1 参数及阈值

建筑物立面不完全垂直于地面和扫描误差导致立面投影线存在宽度,格网边长应至少为线宽的三至四倍,以保证格网内立面投影线的长宽比符合线状特征,因此格网边长d设置为 0.1 m和0.5 m。权值参数α、β值的选取依赖于感兴趣的目标特征,为体现建筑物投影点线状分布且高差较大的特征,设置α=0.6、β=0.4。上文分析,立面两侧的梯度相差最大时接近4∶3,远大于延伸方向的梯度,因此设置HOG特征商阈值Tsym=0.5、Text=3。通过验证,区域生长时距离取值略大于投影线宽度,生长方向的夹角取值在5°~20°之间可以取得理想结果,因此设置dT=0.15 m和0.6 m、θT1=15°和20°。对于标记为0的格网,与中心格网的特征值相似时加入聚类,设置θT0=10°和5°、rT=0.5。

对数据1进行建筑物点云分类,结果如图9所示。图9(a)为原始点云局部示意图。图9(b)为利用HOG特征识别的建筑物立面点,去除树木、车辆等地物的同时,基本完整地保留了建筑物。图9(c)为区域生长提取建筑物立面的结果,进一步去除了噪点,并且对漏提的立面点进行了补充。图9(d)为建筑物点云分类的最终结果。

注:原始点云按高程赋色;立面点云按立面ID号赋色;建筑物点云按建筑ID号赋色。

数据1分类结果如图10所示,提取的建筑物按照ID号随机赋色。图10中I为A区域的局部放大俯视图,其中#1为平直立面,#2为拐角立面,#3为弧状立面。可以看出,各类型立面提取完整。图10中Ⅱ为B区域的局部放大图,上方为提取立面,下方为原始点云。可以看出,本文方法在去除噪点的同时完整保留了窗户边缘点,存在缺失的立面根据生长条件也被完整提取。图10中Ⅲ为C区域的局部放大图,该区域存在树木、车辆等多种地物。从放大图左图可以看出,经本文方法处理后,车辆等低矮地物被去除,与树木紧邻的立面能够完整被提取。

注:原始点云按高程赋色;立面点云按立面ID号赋色;建筑物点云按建筑ID号赋色。

数据2分类结果如图11所示,提取的建筑物按照ID号随机赋色。图11显示,建筑物点云被准确分类。图11中I为A区域的局部放大图,其中左侧为提取建筑物的立面,右侧为原始点云。由原始点云可以看出,立面的高差和投影密度变化较大,本文方法搜索种子格网邻域内距离拟合线较近的格网,计算特征值比rT,以1/2作为生长条件,保证了建筑物的完整提取。图11中Ⅱ为B区域的局部放大图,其中左侧为提取建筑物的立面,右侧为原始点云。可以看出,建筑物内部存在大量玻璃折射产生的噪点,但建筑物被完好提取,如放大图左图所示。图11中Ⅲ为C区域的局部放大俯视图,可以看出 #1处弧状立面被漏提,主要因为本文方法较好地适用于平直立面提取,当格网尺寸较大时,弧状立面格网方向变化较大,不满足生长条件导致漏提。

注:原始点云按高程赋色;立面点云按立面ID号赋色;建筑物点云按建筑ID号赋色。

对数据1和数据2的建筑物分类结果进行立面级的定量分析,利用正确提取率(right draw proportion,RDP)、完整提取率(all drow proportion,ADP)两个指标对结果进行评价。如表2所示,本文对两组数据中建筑物立面的正确提取率分别达到94.02%和94.55%,完整提取率分别达到90.91%和85.25%。数据2中,建筑物立面在延伸过程中多次转折,转折处立面梯度情况复杂,与数据1相比,立面级的完整提取率下降。

将本文方法与文献[16]方法进行对比。由表2可知,对于数据1和数据2,本文对建筑物立面的提取正确率和完整率均高于后者,其中数据1分别高出4.8%和15.7%,弧状阳台的漏提是造成完整率差异的主要原因;对于数据2,分别高出3.81%和4.92%,可见本文方法的适用性更好。

表2 实验结果评估对比

3 结束语

本文以地基激光点云数据为研究对象,提出一种利用三维HOG特征的建筑物点云分类方法。根据格网内点的分布特征进行加权计算,生成显著表达立面目标多尺度特征的三维格网;通过分析建筑物立面的空间分布和邻域梯度分布,结合HOG算子对梯度对称性进行描述,设计三维HOG特征,对不同尺度下方向各异的立面进行准确识别;最后利用区域生长对立面进行提取,聚类相邻立面实现建筑物点云分类。实验结果表明,本文方法能从地基点云中有效分类建筑物点云,稳健性较强,研究成果为城市建筑信息快速采集提供了新的思路,但对于存在曲折立面的建筑物点云分类存在局限性,需要进一步改进。

猜你喜欢

噪点格网邻域
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
相机学院
实时电离层格网数据精度评估
稀疏图平方图的染色数上界
基于邻域竞赛的多目标优化算法
低相噪点频源的设计与验证
技术橱窗
关于-型邻域空间
用Lightroom降低画面的噪点表现
基于时序扩展的邻域保持嵌入算法及其在故障检测中的应用