基于无人机激光雷达点云数据的单木分割研究
2022-02-23刘浩然范伟伟徐永胜林文树
刘浩然,范伟伟,徐永胜,林文树
(东北林业大学 工程技术学院,黑龙江 哈尔滨 150040)
森林资源调查对国民经济建设和人民生产生活具有极其重要的作用,而森林结构参数的精确获取是其基本工作之一[1]。在面临较大规模的林业调查需求时,野外测量方式工作强度大,耗时长,效率低,工作人员难以完成既定的工作任务;而传统的光学遥感影像易受天气影响,只能获取植被表面信息且精度较低[2-5]。近年来,新型遥感技术发展迅速,尤其是激光雷达技术的推广应用为高精度和高效率的森林信息获取提供了新的思路[6]。
无人机激光雷达作为一种新式的三维点云获取设备,具有成本低廉、操作性强、空间分辨率高、能快速获取高精度点云数据等优点,相对于机载激光扫描数据,无人机激光雷达则提供了更高的点云密度,在郁闭度较低的林区也可以精确获取林下三维信息[7-8],同时基于无人机技术的特点使得研究人员可以在短时间内多次对研究区林地进行更大范围的覆盖扫描[9-10]。在森林信息提取研究中,若实现从大量的激光雷达点云数据中分离出高精度单木点云信息,将对后续提取单木结构参数具有重要意义,也为后续的森林生物量反演以及森林三维模型构建提供有力支撑。
机载或无人机激光雷达获取的森林树木点云数据进行单木分割一般分为两类方法,一类是基于冠层高度模型(Canopy height model,CHM)分割单木,常见的有分水岭算法、局部极值法和多尺度分割法等[11-12]:多数利用CHM 高度变化进行单木分割的研究主要通过局部极大值滤波来寻找树顶[13-14],然后采用边缘检测和特征提取的图像处理算法来勾画树冠[15]。Chen[16]提出了一种标记控制的分水岭算法,通过可变大小的动态窗口检测树顶来分离单木。Liu 等[17]把基于点的垂线剖面分析算法和基于多尺度CHM 算法两种方法相互融合,提高了单木的分割精度。虽然该类单木分割算法快速高效,但CHM 算法本身更多的是描绘冠层上部信息,缺乏对冠层下部垂直结构的描述;另外,由数字地面模型和数字高程模型差值生成的CHM 模型会导致个别空间位置的不准确,从而影响样地中单木点云数据分割精度[18-19]。另一类分割方法是直接基于点云进行聚类或者通过划分体素利用离散点云进行分割[20]。如Wang 等[21]依据森林垂直冠层结构首次提出对原始点云数据进行体素划分,基于体素内的高程分布划分不同高度的树冠区域并进行单木分割。Vega 等[22]提出一种多尺度动态点云分割方法,依据不同的评价标准确定最优树顶位置点作为初始聚类中心进行树冠聚类,正确分割率达82%。Wang 等[23]针对林下乔木难以识别的问题提出一种多阈值的分割算法,根据不同冠层中点云密度的变化设置阈值,从而实现冠层分离,结果表明研究区单木总体识别率为82.6%,林下植被的识别率明显提高。Yan等[24]基于高密度的无人机激光雷达点云首先利用均值漂移算法对非地面点进行粗略分类,然后依据归一化分割(Normalized cut,NCut)算法对欠分割区域进行迭代分割直至得到单株木。随着机载激光雷达技术的不断更新换代,更多研究趋向于利用点云数据直接在三维空间中进行单木识别。与基于CHM 的单木识别方法相比,基于点云分布识别单木不仅能减少单木错误分割,提高识别精度,还能从分割得到的单木模型中反演出更为精细的森林参数[25]。
关于基于激光雷达的森林样地单木点云数据分割的研究大多基于低郁闭度林分,但面对复杂林区的冠层重叠、树种多样等问题时分割效果不太理想,尤其是单一的分割方法往往不具有普遍性,难以移植到其他林区。因此,本文的研究目的主要为:1)改进单木分割算法使其应用于高郁闭度的林区样地;2)根据不同树种之间的差别寻找与其特征相适应的单木分割算法。基于无人机激光雷达点云数据,本研究选取了哈尔滨城市林业示范基地内的阔叶林和针叶林两块样地作为研究区,分别采用改进的均值聚类算法和基于相对间距的阈值分割算法对样地单木点云数据进行分割。
1 研究区概况及数据获取
1.1 研究区概况
本研究以黑龙江省哈尔滨城市林业示范基地(126°37′15″E,45°43′10″N)作为研究区,该基地占地面积43.95 hm2,其中林地面积27.50 hm2,人工林呈块状混交,区块面积约为0.5 hm2,现有主要树种包括水曲柳Fraxinus mandshurica、黑皮油松Pinus tabuliformis、樟子松Pinus sylvestris、兴安落叶松Larix gmelinii、核桃揪Juglans mandshurica、蒙古栎Quercus mongolica、白桦Betula platyphylla等[26]。本研究中选取了研究区内的水曲柳和樟子松两块样地为研究对象,水曲柳林在0.5 hm2林地面积上有树木440 余株,林分郁闭度在0.8 以上;樟子松林在0.5 hm2林地面积上有树木520 余株,林分郁闭度在0.8 以上。根据林分密度,分别在两块样地内各选取了3 块边长为20 m × 20 m 的样方。
1.2 无人机激光雷达数据的获取
本研究采用的无人机激光雷达系统为南方测绘公司的SZT-R250,具体参数如表1所示。数据采集时间为2018年9月27日,天气状况良好,晴朗无风,平均飞行速度28.8 km/h,飞行高度70.2 m,扫描速度为10~100 线/s,点密度为40 点/m2,采用标准LiDAR 格式(.las)进行存储。
表1 SZT-R250 主要技术参数Table 1 Main technical parameters of SZT-R250
2 研究方法
2.1 预处理
无人机激光雷达点云数据中往往存在一些明显高于地物的噪点,称为孤立点。本研究采用基于距离的孤立点算法进行去噪处理[27-28],将点云数据看作空间中点的集合,孤立点则是距离其他多数对象均较远的点。根据扫描样地的点云数据实际分布情况,设置邻域点个数为5,邻域搜索半径为10 m,并将最终处理结果加以一定的人工修正。同时,采用渐进加密三角网滤波算法[29](Improved progressive TIN densification,IPTD)将点云划分为地面点和非地面点,然后将分离后的点云进行归一化处理以便更好地反映出树木的真实高度。经过多次尝试,当迭代角度为4°、迭代距离为1.4 m 时,地面点分离效果最佳。
2.2 改进的k-means 算法
k-means 是一种基于距离的聚类算法,判断每个样本元素与聚类中心的距离大小并将它赋给最近的类簇,同时K个聚类中心位置的不断迭代变换以达到最佳的聚类效果[30]。因此,通过上述迭代过程可将点云数据划分到不同的空间聚类中来实现单木分割。根据k-means 算法的原理可知,该算法更适合于球状簇的聚类,相比于针叶树,阔叶树树冠更接近于球形或椭球形[31]。因此,本研究中的水曲柳(阔叶树)将采用k-means 算法进行单木分割。
在k-means 算法中,初始聚类中心的位置对数据聚类效果影响很大。研究区中的水曲柳样地单木多有偏冠现象,甚至个别树木存在多个冠顶,如果按传统方法将局部点云的Z值最大值作为初始聚类中心,不仅会造成错误聚类情况增多,也会导致计算效率的降低[32]。因此,本研究利用树干位置寻找初始聚类中心,具体步骤如下:
1)根据水曲柳样地(图1a)的平均冠层高度将地面点分离后得到的点云数据进行裁剪(图1b),利用局部极大值法识别树干点云中的极值点,计算每个树干点到所有极值点的距离,并将该树干点划分到距离极值点的类簇中,同时记录类簇数目即算法所需K值(K=54);2)分别求取每木树干点云X、Y方向的平均值作为初始聚类中心的横纵坐标值,Z值的确定则依据样地平均树高值并适当下调,尽可能使初始聚类中心处在单木重心位置(图1c);3)按照点云高程值以1∶1.25 的比例缩放点云高度,使样地单木点云的分布更接近于球形;4)计算样本数据中每个点与初始聚类中心的距离,并将该点分配到距离聚类中心最近的聚类簇中;5)重新计算每个聚类簇的均值,对于聚类均值有变化的,将变化后的聚类均值作为下一步迭代的聚类中心;6)不再使用以往的函数收敛作为循环终止条件,而是控制迭代次数,原因在于初始聚类中心的选择较为准确,提前结束循环迭代可避免因算法运算过程导致的中心异常偏移,同时也可提高计算效率。
图1 样地点云数据图Fig.1 Data map of plot point cloud
2.3 基于相对间距的阈值分割算法
研究区中的樟子松样地属于针叶林,冠型整齐且多为锥状。该样地单木之间本身存在一定的林隙,即使部分树木之间会出现树冠重叠现象,但随着高程的增加,树与树之间的水平间距会越来越大[33]。依据樟子松样地树木点云的分布方式,本研究采用基于相对间距的阈值分割算法对樟子松样地进行单木分割。
为了准确寻找单木点云数据中可能存在的树顶点,首先采用动态的最大值滤波器进行树顶探测,并依据以下3 种方法提高探测精度:1)基于樟子松样地的单木平均冠高及枝下高对点云数据进行适当地裁剪,保留树顶点的同时尽可能删减下层点云。该处理的目的是当滤波器窗口较小时,避免因处在树木之间的空隙中而错误地探测树顶位置。2)滤波器窗口直径的设定小于相邻树木的相对间距,因此会出现图2中的3 种情况,依据窗口中点云密度将点数稀少的a 类型排除。3)b、c 窗口类型会得到相应的局部极大值点,对所有得到的树顶点位置进行比较,若出现相邻顶点间距过近的情况(d<1.5 m),则将Z值最大的点作为新的树冠顶点,同时删除其余相邻点。
图2 滤波器窗口显示示意图Fig.2 Schematic diagram of filter window display
当树顶点最终位置确定后,将依据相邻树木间距进行分割。对点云集中任意一点到所有树顶点的距离进行比较,把该点分配到离它最近树顶点的聚类中,然后遍历样地点云中所有点,直到每个点都被划分到对应的类簇中为止,从而实现樟子松样地树木点云数据的单木分割。
2.4 模型评价指标
基于样地尺度的单木分割效果评价将从识别率R、召回率r、精确率p以及调和值F[34]四个方面进行,如式(1)~(4)所示。其中,识别率R反映了样地中树木的检测情况,数值越接近1 检测出的样地树木比例越高;召回率r表示正确分割单木占样地实际单木的比例,数值越接近1 表明正确分割的单木越多,分割效果越好;精确率p表示算法分割出的单木为正确分割的比例,数值越接近1 表明算法分割越准确;调和值F则是从整体上评估分割的优劣,数值越接近1 表示整体效果越佳。
式中:N表示样地实际的单木数;n表示算法分割的单木数;TP 表示正确分割的单木数;FN 表示漏检的单木数;FP 表示过检的单木数。
依据刘会玲等人[24]采用的单木匹配率(RMAT)、欠分割误差(ECOM)和过分割误差(EOM)等评价指标,本研究基于单木点云数量使用NTP(正确分割点云比例)、NFN(欠分割点云比例)、NFP(过分割点云比例)3 个指标,从单木点云完整度方面对单木分割效果进行评价。指标计算公式如下:
式中:n为人工判读获取的单木点云数量;n1为算法获取的单木点云数量;n2为正确分类的单木点云数量。
3 结果与分析
3.1 样地尺度的单木分割效果评价
水曲柳和樟子松两块样地的单木分割结果如图3所示。从图3中可以直观地看出,本研究采用的改进算法对样地中存在低矮、树冠较小的单木具有一定的检索能力,而在传统分割方法中,这类树木往往被漏检或错误分割。由表2中各项评价指标可知:水曲柳样地内实际单木数量为93株,算法提取出的单木数量为85 株,相应的识别率为0.91;樟子松样地实际单木数量为102 株,算法提取的单木数量为89 株,则识别率为0.87。两块样地的F值分别为0.91 和0.88,说明单木分割的整体效果较好。其中,水曲柳样地r=0.87,p=0.95,表明算法分割过程中产生的欠分割与过分割现象均较少,即通过树干点云获取单木位置具有较高的精确度。同时,樟子松样地算法分割的单木多为正确分割(p=0.94),而r=0.82 说明单木的漏检造成较多的错误分割。
图3 单木分割结果Fig.3 Results of single tree segmentation
表2 样地单木分割准确性评估Table 2 Evaluation of the accuracy of single tree segmentation in the plots
3.2 单木点云完整度的单木分割效果评价
样地尺度评价指标多是从单木分割数量上进行描述,对于某一株单木而言,分割质量的优劣则难以体现。因此,本研究引入单木点云完整度作为评价指标来对算法的单木分割效果进行详细的描述。
因无法准确获得每棵树原始的点云数据,所以单木点云完整度是基于目视解译进行的,即通过人工分割的单木点云数据作为单木原始点云数据。图4和图5分别显示了两块样地随机抽取的部分单木算法分割和人为分割结果的对比情况。从图4可以看出,水曲柳样地单木存在多冠、偏冠等现象,导致单木点云错分的情况增多,而且该样地郁闭度较高,树木之间多有交集,因此欠分割和过分割点云均有存在;从图5发现樟子松样地存在的错误分割多为点云欠分割,由于樟子松冠型为锥状,随着高程的增加相邻树木之间存在的重叠现象就越少,因此在单木分割时过分割现象不明显。
图4 水曲柳样地部分单木错误分割示意图(红色代表欠分割点云、黄色代表过分割点云)Fig.4 Schematic diagram of wrong segmentation of some single trees in Fraxinus mandshurica plot (red color represents under-segmented point cloud,and yellow color represents over-segmented point cloud)
图5 樟子松样地部分单木错误分割示意图(红色代表欠分割点云、黄色代表过分割点云)Fig.5 Schematic diagram of wrong segmentation of some single trees in Pinus sylvestris plot (red color represents undersegmented point cloud,and yellow color represents over-segmented point cloud)
表3为定量统计了两块样地单木点云的分割情况。结果表明:水曲柳样地点云平均正确分割率为75.6%,个别单木错误分割率达到了31.8%。单木点云欠分割率范围为13.9%~32.9%,过分割率范围为8.7%~31.1%,表明其分割稳定性不佳,不同单木之间分割精度有较大差异,进而导致整体点云的分割质量存在偏差;樟子松样地在正确分割的树中取得了较好的分割效果,点云正确分割率范围为79.8%~91.0%,平均欠分割率为16.3%,平均过分割率为9.0%,表明单木点云不存在大量错误分割的情况。
表3 单木点云完整度评价指标Table 3 Evaluation index for integrity of single tree point cloud
通过两种不同的评价结果不难发现:不同评价方法所显示的结论并不一致,水曲柳在样地尺度评价中表现较好,但在单木点云完整度分割评价中存在大量错误分割;樟子松则表现出了良好的分割精度稳定性。该结论的得出与数据获取、算法处理和树木形态结构等因素有关,因此森林样地或区域尺度的单木点云数据分割算法的选择需要结合样地实际情况和研究中的尺度要求来进行。
4 讨 论
本研究采取两种不同的单木分割算法分别处理两块高郁闭度阔叶林和针叶林样地的无人机激光雷达点云数据,研究的目的在于确定每种分割算法的适用性,例如,k-means 算法对球状或椭球状簇更加敏感,所以难以应用于针叶林的锥状树冠;而阔叶树树冠体积大、多重叠,基于相对间距阈值算法分割单木会造成大量误差,若在此基础上对分割效果进行对比意义不大。因此,本研究针对不同树种的形态结构特征,探索适用于该树种的分割算法并对其进行分割算法改进,从而达到提高森林样地单木分割的目的。
基于k-means 算法对水曲柳样地进行单木分割取得了较好的效果(F=0.91),算法提取的85 株单木多为正确分割。其主要原因在于初始聚类中心的确定是依据树干点云位置进行推算的,能直接与单木位置相联系。当处理大量样本数据时采用分层聚类的思想,首先对获取的样地树干点云进行一次聚类并统计数量,随后采用二次聚类进行单木分割,能够大大提高工作效率,节约时间成本。然而,当点云密度较低或林区郁闭度过高时,会出现树干部分的点云稀少甚至丢失的情况,造成大量欠分割现象的产生,从而影响单木分割精度。
本研究对樟子松样地进行单木分割时充分考虑了冠形、树形以及点云分布方式,采用了基于相对间距的阈值分割算法。该算法在树顶探测时采用了多阈值的动态最大值滤波器,同时依据几何知识利用相邻树木间距确立分割规则,识别了样地中大多数单木(F=0.88)。另外,在多阈值和分割规则确定时原理简单,适合于大部分中等复杂程度的针叶林型,具有一定的可移植性。樟子松样地分割误差大部分来自于单木欠分割,分析原因主要为树顶探测时容易忽略低矮树木,尤其在样地树木高度差异较大时更为明显,后续可根据实地情况改变阈值设定范围或者从全局变量的角度设计探测精度更高的算法。
由于仅从样地尺度难以全面地评价分割效果,因此本研究引入单木点云完整度作为评价指标。不同于样地尺度的评价结果,水曲柳样地在单木点云完整度的评价指标中表现不佳,多数单木点云出现不同程度的欠分割和过分割现象。这主要是由于阔叶树树冠体积大小不一,更容易出现树冠重叠、遮掩的情况;同时,水曲柳样地存在偏冠、多冠等现象,容易将该类点云划分到相邻树木中去,从而影响点云分割精度。而樟子松样地整体表现出较好的稳定性,95%以上正确分割的单木均未出现严重的点云错分,其分割误差主要来源于漏检低矮树木所导致的点云欠分割;针叶木冠型整齐、结构单一,相邻树木之间空间较大是分割效果较好的重要因素。
李平昊等[35]对阔叶复杂林型采用基于距离的算法进行单木分割,F值为0.83;Li 等[33]利用树木之间相对位置识别了混交针叶林型样地86%的树木,其中94%为正确分割;白少博等[36]采用区域生长算法和Hough 变换分割针叶林和阔叶林,其中,针叶林样地分割正确率为87%,阔叶林样地为86.8%,然而当研究区为高郁闭度原始森林时,算法的分割精度普遍很低。因此,对比其他研究者采用类似分割算法的研究成果,本研究得到的单木分割精度较高,并且具有相对完善的评价体系。然而,本研究选择的样地为单一林型的人工林,采用的单木分割算法地域特征明显,具有一定的局限性。在今后的研究中,将尝试以针阔混交的天然林作为研究对象,在该分割算法的基础上加以优化,以期提高算法的适用性,同时也可以考虑融合不同分割算法或联合其他遥感手段来解决复杂林分下的森林样地单木点云数据分割。
5 结 论
本研究基于无人机激光雷达获取点云数据,采用改进的k-means 算法和基于相对间距的阈值分割算法分别对研究区内水曲柳和樟子松样地进行单木分割,并从样地尺度和单木点云完整度两个方面进行了分割效果评价。具体结论如下:
1)通过研究针阔林型特点,有针对性地采用改进的k-means 算法和阈值分割算法分别对水曲柳样地和樟子松样地进行单木分割。其中,水曲柳样地单木存在偏冠、多个冠顶等现象,在充分考虑阔叶树树冠结构多样性的基础上,通过树干定位法确定初始聚类中心的位置,提高了算法的分割精度;对于结构相对单一的针叶林型,采用效率较高的阈值分割算法同样能取得较好的分割效果。
2)本研究从两个方面对单木分割结果进行评价,更为全面、直观地描述了算法分割效果。在样地尺度方面,引入召回率、精确率、调和值以及识别率,通过统计正确分割、欠分割和过分割的单木数量比例,初步评价了两种算法分割效果。为进一步对单木分割结果进行比较,又通过引入单木点云完整度,分别从每株单木点云的正确分割比例、欠分割比例以及过分割比例三个指标,对算法的分割进行了评价。统计结果显示,本研究所采取的改进算法具有较高的分割精度。
综上所述,本研究基于树木形态结构特征设计改进了两种单木点云数据分割算法,实现了森林样地树木无人机激光雷达点云数据的单木精确分割。