基于多源遥感数据的输电线走廊树种分类
2021-04-13王瑞瑞李文静苏婷婷
王瑞瑞 李文静 石 伟 苏婷婷
(1.北京林业大学林学院,北京 100083; 2.中国航天系统科学与工程研究院, 北京 100083)
0 引言
输电线走廊的树木生长会对电力线构成威胁,自动高效地获取输电线走廊的树种信息对树障隐患智能预警具有重要作用[1]。
随着遥感技术的不断发展,高分辨率卫星和航空遥感影像上更加丰富的影像纹理细节信息和地物光谱空间结构优势,使获得单株立木尺度参数和树种类别成为可能[2],但遥感影像只能根据不同树种的水平信息进行识别分类[3-4]。林业遥感的重点与难点在于如何利用遥感技术自动获取精确的树种信息。近年来,机载激光雷达(Light detection and ranging,LiDAR)因具有受天气影响小、生产周期短、精度高等优势而被广泛应用,在获取单木高程信息方面具有很大潜力[5],为树种分类提供了新的数据源。就树种分类而言,高分辨率航空遥感影像和机载LiDAR点云均有各自独特的数据优势[6],可以通过两者结合实现两种数据的优势互补,得到更丰富的特征信息,从而提高树种分类的精度[7]。YANG等[8]通过对光学影像和LiDAR数据的协同使用研究了树木分割和分类的准确性,结果表明,两个数据集协同使用比单独使用的准确度高;LINDBERG等[9]以LiDAR和多光谱影像为数据源提取多光谱图像的光谱信息和LiDAR数据的树木特征,对瑞典南部地区进行了树种分类,总体精度达96%。
目前,相关的树种分类研究大多针对林分结构单一的树种进行识别,对复杂森林类型进行精细树种识别的能力尚不明确,尤其是对输电线走廊树种分类的相关研究较少,而且特征表达与分类也没有形成较为通用可靠的方法。因此,在以上研究基础上,本文以机载LiDAR点云数据和同步获取的高分辨率多光谱航空影像为数据源,协同两种数据优势,从中提取多维特征,并进行特征筛选,以非参数的机器学习算法为核心,基于面向对象方法框架进行输电线走廊的树种分类。
1 研究区与数据
研究区位于安徽省池州市东北部,海拔1.8~112.2 m,地理位置为117°46′~117°56′E,30°39′~30°41′N,属于暖湿性亚热带季风气候,四季分明,雨量充足,年平均气温16.5℃,年均降水量1 400~2 200 mm,日照时间长,无霜期短,梅雨期40 d左右。研究区内植被种类丰富,优势树种包括杉木、毛竹、枫杨和栎树等阔叶树种,以中龄林和成熟林为主。研究区具体位置如图1所示,选择其中一个杆塔的输电线下行通道作为试验区。
本研究所用数据包括机载LiDAR点云数据及同步获取的高分辨率航空数码影像数据。飞行时间为2016年6月,在晴朗、能见度较好的天气条件下获得。机载LiDAR点云数据使用Optech ALTM Galaxy 系统收集,激光扫描仪的波长为1 064 nm,激光发散角为0.25 mrad,最大点云密度为93点/m2,最小为0.6点/m2。LiDAR点云数据的投影坐标为UTM(带号为50),以m为单位。图2为研究区内一块激光点云数据高程信息的3D模型图,高程由蓝色至红色逐渐递增。
航空影像数据由同一平台搭载的CCD相机传感器获取,空间分辨率为0.1 m,区域内 0.1 m分辨率的航空正射影像如图3所示。
2 研究方法
本文研究方法主要分为:①研究使用可见光波段差异植被指数VDVI和双边滤波进行树冠分割前预处理的可行性,并探讨如何优化最优分割尺度参数的选择。②使用XGBoost选择最佳特征组合用于单木树种分类,分析比较特征选择对树种分类的影响。③设计12种分类方案,研究多源遥感数据在单木树种分类中的效果,并评估不同非参数学习算法在单木级别进行树种分类的能力。技术路线如图4所示。
2.1 冠层高度模型获取及优化
冠层高度模型(Canopy height model,CHM)的获取是以数字高程模型(Digital elevation model,DEM)和数字表面模型(Digital surface model,DSM)作为数据基础。为获取DEM和DOM,需要先进行点云滤波和分类。一般来讲,滤波就是剔除非地面点数据,仅将地面点数据保留下来,以便快速地构建数字高程模型;分类主要是根据研究需要将不同类型的地物点数据进一步划分,比如将建筑物、植被、电力线等目标数据点提取出来[10]。
通过对DSM 与 DEM 进行栅格差值运算并归一化处理生成正规化数字地表高程模型(Normalized digital surface model,nDSM),可以表示去除背景后地物的绝对高度[11],在林区,nDSM可以被看作冠层高度模型,用来获取林区树冠高度信息。但生成的原始CHM上会出现局部凹坑,这些凹坑的像元与临近像元相差较大,被称为无效值[12]。因此,在使用CHM之前,需要先对CHM的局部无效值进行填充[13],使用平滑滤波进行处理是目前最常用也是最便捷的方法,平滑运算方法主要包括中值滤波、低通滤波和高斯滤波等。本研究通过选用不同模板进行平滑滤波处理发现,使用低通滤波后的图像较平滑,图像中的无效值也可以很好地被去除,因此最终选择低通滤波去除无效值。
2.2 单木树冠提取
单木树冠提取是树种分类的基础和关键[14],树冠分割结果的准确度会直接影响树种分类效果[15],因此自动提取林区内高精度的单木树冠信息非常重要。针对目前树冠提取中背景的影响和易出现的过度分割问题,先对获取的航空正射影像提取树冠区域并优化,然后结合优化后的DOM与CHM,利用多尺度分割方法进行单木树冠的提取。
2.2.1单木树冠提取方法
根据植被指数可以在遥感影像上将植被与其他地物区别开[16]。常见的植被指数大都是利用影像的可见光和近红外波段进行计算。但本研究获取的影像仅含可见光波段,需要选择一种可以综合红、绿、蓝3个可见光波段的植被指数用于树冠区域提取。汪小钦等[17]基于仅含可见光波段的无人机遥感影像,利用可见光波段差异植被指数(Visible-band difference vegetation index,VDVI)提取植被信息效果较好,提取精度达90%以上,验证了VDVI提取植被的适用性和可靠性。本文借鉴NDVI的构造原理与形式,构造可见光波段差异植被指数VDVI,VDVI的数值范围为[-1,1]。利用直方图熵阈值法确定阈值,对VDVI进行二值化处理,设置阈值为0.25,VDVI值小于0.25的像元归为非植被,用0表示;VDVI值大于等于0.25的像元归为植被,用1表示,生成掩膜图像后,对原始影像掩膜处理,可将树冠区域提取出来。
双边滤波是一种具有边缘保持功能的非线性滤波方法,和其他滤波一样,也是采用加权平均的方式,不同的是其将位置对中心像素的影响和辐射差异加入到权重中[18]。该方法可以有效解决传统滤波方法中滤除噪声和保留边缘信息的矛盾。
多尺度分割算法是一个从下到上、逐级合并的过程,其能够在最大化每个对象同质性的同时,最小化对象的平均异质性,并且分割速度快,参数可灵活调节设置[19]。该算法的核心参数主要包括波段权重、同质性准则组合参数和分割尺度参数3部分[20]。本文保留eCognition软件中各波段权重为1的默认设置,采用固定单一因子法依次确定最优形状因子和紧致度,规则是其中一个参数固定不变,不断调整另一个参数目视对比分割效果,最后进行最优尺度参数的判断。分割尺度是直接决定生成分割对象尺寸的参数,它可以控制影像对象的异质性[21]。本研究结合目视判别法对尺度评价工具(Estimation of scale parameter 2,ESP2)得到的多个尺度值分析比较,最终确定最优分割尺度数值,最大限度降低了人为主观因素的影响,且提高了效率。ESP2通过不同分割尺度下影像对象层的平均标准差确定最优分割效果,平均标准差由计算分割对象同质性的局部变化(Local variance,LV)得到,同时最优分割尺度是当LV的变化率(Rate of change-Local variance, ROC-LV)出现峰值时对应的分割尺度,得到的ROC-LV折线图如图5所示。
由图5可以看出,ROC-LV出现峰值时对应的分割尺度分别是62、78、93和131,通过对比分析尺度为62时,分割效果最好,因此确定62为最优分割尺度。综上,最终确定最优参数组合为:各波段(DOM+CHM)权重为1、1、1、1;尺度为62,形状因子为0.2,紧致度为0.7。
2.2.2树冠提取精度评价
为了分析本研究提取单木树冠的效果,通过实地调查与目视判读结合的方式得到参考图,将2个区域提取的树冠分别与参考树冠进行对比分析,评价分割精度。根据参考图中树冠与分割图中树冠的空间关系,将其分为匹配、丢失、过分割和欠分割4种类型[22],如图6所示,其中黄色为参考图的树冠,红色为分割的树冠。
利用分割准确率(Ad)、分割召回率(Ar)和F测度(F)3个指标进行精度评价,其计算式为
(1)
(2)
(3)
式中Nc——匹配的树冠总数
Nd——本研究分割得到的树冠总数
Nr——参考图中分割的树冠总数
2.3 特征提取与选择
特征提取是在单木树冠分割的基础上进行的,主要基于LiDAR点云提取高度特征,基于航空影像提取光谱、形状和纹理特征。具体如表1所示。
表1 对象特征信息Tab.1 Object feature information
当特征数量超过一定界限后,分类器的性能会随着特征数量的增加而下降,主要是因特征维度太高导致冗余,特征选择可以通过去除无关和冗余特征,选出最优特征集,解决此问题[23]。本文使用XGBoost算法进行特征选择,得到特征重要性排序,再选出最优特征组合。XGBoost属于Wrapper方法,它是基于梯度提升树(Gradient boosting decision tree,GBDT)算法进行提升,包含一个迭代残差树的集合,每棵树都在学习前N-1棵树的残差,然后将每棵树预测的新样本输出值相加就是样本最终的预测值[24]。相较于传统的GBDT算法,XGBoost对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶函数;定义树的复杂度,为了简单化学习出的模型,避免过拟合问题,通过在代价函数里加入正则项来控制模型的复杂度;该算法可以处理稀疏、缺失数据,对于特征值缺失样本的分裂方向可以自动学习出来;XGBoost算法还提出了一种可并行的近似直方图算法,可以高效地生成候选分割点,并且可以并行处理,提高运算效率。得到特征重要性后,再对各特征变量间进行相关性分析,若某2个特征之间相关性大于0.8,则剔除重要性排序比较低的特征变量,最终确定用于后续分类的特征组合。
2.4 单木树种分类
2.4.1分类方案
为了研究多源数据和使用XGBoost算法进行特征选择在树种分类中的作用,并评估随机森林(Random forest,RF)、支持向量机(Support vector machine,SVM)和人工神经网络(Artificial neural network,ANN)3种非参数分类器进行单木树种分类的能力,共确定了12种分类方案。不同组合的具体方案如表2所示。
表2 不同组合的分类方案Tab.2 Classification schemes of different combinations
RF、SVM和ANN都属于非参数分类算法,无需对数据的概率模型做出假设,比参数分类器有更好的优越性。RF是以决策树为基础,各个决策树输出类别的众数决定了随机森林最终的输出类别[25]。SVM的基本思想是基于结构风险最小化原则,旨在找到n维分类空间中具有类之间最高边界的最优超平面[26],可以将原来样本的非线性问题转换为线性问题,具有较好的泛化能力[27],对小样本数据具有较好的学习能力。本文选择高斯径向基核函数作为模型的核函数,核参数(γ)和惩罚因子(C)2个变量参数通过单一参数固定法逐步调节确定。ANN可以描述为一个并行计算系统,由大量具有互连功能的简单处理器组成[26]。ANN可以进行并行处理,具有非线性映射、自适应学习和容错能力等特性,且能很好地适应含有噪声的数据[28]。ANN的主要参数包括激活函数和训练迭代次数,激活函数选择效果较好的逻辑函数;迭代次数如果过小会导致训练结果不理想,如果过大会增加训练时间,需经过试验设置合适值。
2.4.2分类精度评价指标
得到不同方案的树种分类结果后,验证正确性以评价各方案单木树种分类的效果。采用分层抽样方法,通过实地调查和目视判读结合选取验证样本,每类树种最少30个样本,构建混淆矩阵是一种量化分类精度的常用方法,用来衡量的指标有用户精度(User accuracy,UA)、生产者精度(Producer accuracy,PA)、总体精度(Overall accuracy,OA)和Kappa系数。
3 结果分析
3.1 数据预处理结果
植被高度可以直接通过 CHM 中的像元值来反映,像元值随植被高度的增加而增大,研究区域的 CHM 如图7所示,随着植被高度增大,影像呈现由黑到白的亮度变化。
3.2 单木树冠分割结果
基于可见光差异植被指数VDVI的树冠区域提取,需要经过VDVI计算、冠层掩膜得到树冠区域。各过程结果如图8所示,图8a、8b为计算得到的VDVI影像数据和冠层掩膜结果,提取出的冠层区域如图8c所示,可以看出杆塔、输电线和树隙等非树冠区域都被有效去除;双边滤波结果如图8d所示,可以看出树冠内部的纹理细节被有效平滑,同时树冠边缘轮廓得到了保护。
将优化后的树冠区域影像和CHM结合,利用多尺度分割算法,确定最优分割参数组合后,进行单木树冠分割,结果如图9所示。
经过统计分析,参考树冠共1 327个,本研究改进方法分割树冠数量为1 261个,直接对原始影像进行多尺度分割得到的树冠共1 522个。精度评价结果如表3所示,对比发现,改进后的单木树冠分割准确率得到有效提高,准确率为84.21%,分割召回率为80%,F测度为82.07%,均高于直接采用多尺度分割的传统方法,且过分割现象明显减少,说明了本研究改进方法的可行性。
表3 单木树冠分割精度Tab.3 Single tree crown segmentation accuracy
3.3 单木树种分类结果
经特征选择后,保留的特征重要性排序如图10所示。
根据单木树冠分割及特征提取的结果,分别基于设计好的12种方案进行单木树种分类,通过实地调查和目视判读结合选取样本,选择70%做训练集用于训练模型,30%做验证数据用于测试模型的可靠性。得到树种分类结果后,对结果进行精度评价,分析比较后确定最佳分类方案,表4为分类精度评价结果。
根据表4中数据分析各方案的精度可知:仅使用航空正射影像数据时,方案A3(经XGBoost算法特征选择后使用ANN分类器)分类精度最高,总体精度为70.59%,Kappa系数为0.530 2。经特征选择后,与未经特征选择的方案相比,利用RF、SVM和ANN分类的精度分别提高了4.83、5.98、4.59个百分点。
表4 分类精度Tab.4 Evaluation of classification accuracy
使用航空影像与LiDAR数据结合分类时,方案B3(经XGBoost算法特征选择后使用)分类效果最好,总体精度为86.19%,Kappa系数为0.826 6,经特征选择相较于未经特征选择的方案中,利用RF、SVM和ANN分类的精度分别提高了5.03、10.75、10.19个百分点。方案B3树种分类结果如图11所示。
综合分析不同方案的结果可以得出,将LiDAR数据与航空影像结合能够提高树种分类精度;无论使用哪种数据源,经特征选择后的方案(A1~A3和B1~B3)分类效果都优于未经特征选择的方案(A4~A6和B4~B6),说明使用XGBoost进行特征选择结果可靠,可以减少或避免特征冗余和休斯效应产生,适用于不同的数据源和分类器;且在3种非参数分类器中,ANN分类器有很强的非线性拟合能力,在训练样本有限的情况下,能表现出更好的性能,能更好地利用光谱、纹理和高度等多维特征,比RF和SVM分类器对现有类型的树种分类效果最好,其中RF分类器的分类精度最低,因其容易出现过拟合现象,而SVM分类器的核函数选择存在主观因素,会影响最后的分类精度,对于SVM分类器核函数及参数的设置仍需进一步改进。
3.4 讨论
本研究综合利用机载LiDAR点云和航空影像数据,基本实现了输电线走廊内单木树种的分类,但在研究过程中仍存在一些不足,所用点云数据密度较低,无法有效直接根据点云划分单木树冠,后续研究可以尝试利用LiDAR点云数据直接提取单木树冠,与使用影像的结果对比选出提取单木的最佳方法,再进行单木树种分类;由于缺乏大范围的实地数据,本次研究所选试验区尺度较小,且区域内树龄、郁闭度相似,后续还需要对本文研究方法推广至大范围地区的树种识别做进一步验证。在单木尺度上进行树种识别,虽已经被证实可以有效避免混合像元问题,抑制分类结果的斑块化,但对分割对象的特征提取仍需进一步改进,需要选择更多数据源,挖掘更为有效的能够区分树种的有力信息,比如结合高光谱影像以提取多种植被指数参与分类或使用合成孔径雷达数据。
4 结束语
利用机载LiDAR点云数据和同步获取的高分辨率航空影像的优势,提取多类特征,以非参数的机器学习算法为核心,基于面向对象的原理,对输电线走廊的树木进行了单木树种分类。利用VDVI和双边滤波尽可能减小了背景地物的影响、减少了过度分割现象,采用ESP2工具选取最优尺度参数,最大限度降低了主观因素的影响。改进的单木分割方法可以有效提高树冠提取精度,得到的树冠分割精度在80%以上;将LiDAR数据和航空正射影像相结合,采用XGBoost算法进行特征选择后,使用ANN分类器的分类方案精度最高,总体精度为86.19%,说明多源数据协同作用和特征选择可以提高树种分类精度,在单木尺度上ANN分类器对现有树种类型的分类能力最强。