基于无人机可见光影像的树种和树冠信息提取
——以晋西黄土区蔡家川流域为例
2021-08-26邬宁珊王佳希元慕田高驰宇
邬宁珊,王佳希,张 岩,*,元慕田,张 琪,高驰宇
(1.北京林业大学 水土保持学院,北京 100083; 2.山西吉县森林生态系统国家野外科学观测研究站,北京 100083)
黄土高原地貌独特,生态环境脆弱,是我国生态环境建设与保护的重点区域。自1999年实施退耕还林工程以来,黄土高原植被恢复效果显著[1]。植被可以保持水土、涵养水源,能够反映陆地的生态环境变化[2-3],也是衡量黄土高原自然环境状况的重要生态指标[4]。探索快速、准确的植被调查方法,有利于及时反映林业生态工程所取得的效果,并为后续工程的实施提供理论参考和技术支撑[5]。现阶段,树种的判别和树冠信息的更新主要依靠人工实地调查和卫星遥感影像获取。然而,人工实地调查耗时、耗力、周期长,无法满足植被信息快速更新的需求;卫星遥感因分辨率较低、重返周期过长,以及云层遮挡影响清晰度等原因,实际应用受到制约。随着无人机遥感技术的发展,其影像周期获取时间灵活和分辨率高的优点,弥补了人工调查和卫星遥感的不足。但利用无人机遥感进行林地植被信息提取时,其在不同区域的适用性,以及信息提取的精度等仍有待进一步研究。
基于无人机影像的树种判别方法主要可分为基于像元分类法、面向对象分类法和机器学习分类法。基于像元分类法依靠影像的光谱信息,在像素层次进行分类[6],被广泛应用于低中分辨率遥感影像的信息提取[7-8],但该方法未考虑到地物间的空间信息,分割过于破碎,分类易产生混淆,无法满足高分辨率影像信息提取的需求。面向对象分类法是基于完整的目标对象进行分析,可以有效地避免基于像元分类法导致的同一地物范围内像元错分的问题,提取的纹理、光谱、形状等信息更完整[9-10],又可细分为阈值分类法和最邻近分类法[11-12]。在对地物分类时,这两者的精度差距不大,但最邻近分类法的计算效率更高。机器学习分类法包括支持向量机算法[10,13]、随机森林算法[14-17]、决策树算法[18]和神经网络算法[19-20]等多种方法,可以实现植被的高精度分类。这几种方法在一定条件下都可以实现良好的效果,但也都具有一定的局限性[21]:支持向量机算法在样本数量很大时难以实施;随机森林算法在样本过少时分类效果较差;决策树算法需要建立复杂的知识规则,在处理大训练集时缺乏伸缩性;神经网络算法具有“黑箱”性质,无法知晓分类依据,且多应用于基于像元的影像分类中。
树冠提取方法主要包括人工判读、分水岭分割法和面向对象最邻近分类法。早期采用的人工判读的方法,效率低下[22]。分水岭分割法可以大大提升树冠提取效率,保证低郁闭度区域的树冠提取精度[23-24],但当研究目标处于高郁闭度区域时,该方法的树冠提取精度下降[25]。面向对象最邻近分类法是目前基于无人机可见光影像提取冠幅的主流方法,已有较多研究基于样地尺度使用该方法提取单一树种纯林或稀疏针叶林的冠幅特征[26-27];但在复杂林层和高植被郁闭度条件下,利用面向对象最邻近分类法提取树冠特征的精度能否满足实际需求,且在流域尺度下该方法是否仍有较高的性能等,还有待进一步的探究。
本文以晋西黄土区蔡家川流域为研究区,基于无人机可见光遥感影像,探索面向对象最邻近分类法在高郁闭度复杂林分条件下提取树种和树冠特征的精度和适用性,并分析晋西黄土区生态恢复背景下的林分特征,探讨流域尺度提取林分特征参数的快捷方法,以期为黄土高原区森林资源的调查提供经济、高效和精准的方法。
1 材料与方法
1.1 研究区概况
研究区位于晋西黄土区吉县蔡家川流域(36°14′27″~36°18′23″N,110°39′45″~110°47′45″E,图1),地处黄土高原西南部,海拔为900~1 513 m,属于黄河的三级支流,流域面积39.33 km2,属暖温带大陆性气候,年平均降水量575.9 mm,年无霜期170 d左右,年平均气温10 ℃,年均日照时数2 563.8 h[28]。
图1 研究区无人机遥感影像Fig.1 Unmanned aerial vehicle imageof study area
流域内含有人工林子流域、农地子流域、农牧复合子流域、天然次生林子流域,以及封禁子流域。土壤类型主要为褐土,黄土母质,呈碱性。山地的斜坡、梁顶和塬面等为第四纪马兰黄土覆盖,沟底为淤积黄土母质,沟坡脚为塌积黄土母质,底层常混有红胶土母质。天然植被主要有辽东栎(QuercuswutaishanseaMary)、山杨(PopulusdavidianaDode)、侧柏[Platycladusorientalis(L.) Franco]、胡枝子(LespedezabicolorTurcz.)等,人工植被主要有油松(PinustabuliformisCarr.)、刺槐(RobiniapseudoacaciaL.)、苹果(Malusdomestica
Borkh.)、山杏(ArmeniacavulgarisLam.)、梨(Pyrusspp.)等,农作物以玉米(ZeamaysL.)、小麦(TriticumaestivumL.)、谷子[Setariaitalica(L.) Beauv.]为主[29]。
1.2 数据收集与处理
1.2.1 样地调查
于2019年10月12—21日进行样地调查。调查蔡家川流域若干农地子流域和人工林子流域的树种信息作为真实值,以验证树种分类结果的准确性。具体地:选取10块不同类型的样地(7块乔木林地和3块果园),以验证树冠提取结果的准确性,样地面积均为10 m×10 m,使用集思宝G128BD手持GPS定位仪和DQY-1型地质罗盘仪记录每个样地中心点的坐标、海拔、坡度和坡向(表1),使用800VR/VH手持式激光测高测距测角一体机测量每株树木的树高,同时测量并记录样地内每株树木的位置、类型和胸径,取东西冠幅和南北冠幅的平均值记为冠幅。
表1 样地基本情况Table 1 Information of sample plots
1.2.2 无人机影像获取与处理
由于不同树种的树叶颜色和形态在秋季存在不一致性,在落叶前,无人机航拍下不同类型树种的颜色和形态差异大,比其他季节更易区分,因此本研究定于2019年10月12—21日对蔡家川流域进行无人机影像拍摄。选取天气晴朗、风速小、适宜无人机作业的中午,使用大疆Inspire 2无人机搭载X4云台相机进行拍摄,有效像素1 240万,飞行高度150 m,镜头垂直于地面,设置航向重叠率80%、旁向重叠率70%。无人机拍摄的影像含有红(R)、绿(G)、蓝(B)3个可见光波段,空间分辨率约为0.15 m。
无人机影像通过Pix4D Mapper 4.4.12软件生成正射影像(DOM)、数字表面模型(DSM)、点云数据集。主要步骤包括:(1)对无人机拍摄照片进行筛选,去除模糊、偏色等不合格的照片;(2)提取和匹配影像特征点,生成加密点云数据;(3)重建研究区域三维模型,生成DOM和DSM。
1.3 数据提取与分析方法
1.3.1 树种提取及其精度评价
在传统分类法划分土地利用类型的基础上,将乔木林地中的主要造林树种和经济果木林提取出来,包括刺槐、油松、侧柏、苹果、梨,其他乔木树种不做类别上的详细区分,统归为其他乔木。
灌木林地上的植被统归为灌木。采用面向对象最邻近分类法[30]对样地内的树种进行判别,具体通过eCongnition development 9.0软件实现。首先,进行多尺度分割,并结合实地调查数据选定目标树种,包括刺槐、油松、侧柏、苹果、梨、山杏6种植被。然后,根据具体目标树种的光谱、形状、纹理特征等建立分类规则。其中,特征集合包括光谱特征的平均值、标准差和亮度,灰度共生矩阵(GLCM)提取的纹理特征包括平均值、方差、相关性、异质性和同质性5个纹理参数,几何特征包括形状指数、紧凑型、密度和不对称性4个特征。利用特征空间优化工具Feature Space Optimization自动计算最优的特征空间数量和类别。结果表明:光谱特征的平均值和亮度、纹理特征的异质性和同质性,以及几何特征中的形状指数为最优的5个特征。最后,用最近邻分类法进行自动分类。
本研究选取蔡家川流域中的2个子流域——农地子流域和人工林子流域对不同地物进行分类。结合目视解译和实地调查的情况,选取227个农地子流域样本数据和298个人工林子流域样本数据作为真值,采用混淆矩阵法,对面向对象最邻近分类法的结果进行定量评价。
无人机影像中目标地物的提取精度具有不确定性。通过比较自动提取的影像分类结果和真值之间的吻合度,可以评价目标地物分类结果的精度[31]。本研究使用生产者精度、用户精度、总体精度和Kappa系数[32-33]作为具体的评价指标。生产者精度是指地面上任选一个样本,其与分类结果相同的概率;用户精度是指分类结果中任选一个样本,其与地面实际类型相一致的概率;总体精度是指对每一个随机样本,所分类的结果与地面对应区域的实际类型相一致的概率;Kappa系数是反映提取结果准确性的指标,范围在0~1,越接近1表示精度越高[34]。
1.3.2 单木树冠提取及其精度评价
基于面向对象最邻近分类法进行单木树冠分割、冠幅值提取,主要步骤包括影像多尺度分割、构建并优选特征空间和分类。首先,对影像进行多尺度分割,按照对象内部同质性最大、对象之间异质性最小的原则进行分割,将研究区影像分割为若干个独立对象[35]。影像分割受分割尺度、波段权重、影像同质性参数的影响,分割结果直接影响最终的提取精度[33,36]。本研究利用ESP2(estimation of scale parameters 2)工具确定最佳分割尺度[37]。目标之间异质性局部方差(LV)和局部方差变化率(ROC)的波峰值提示最佳分割尺度的备选值[26]。波段权重参数值在0~1。对特征信息明显的波段赋予较高的权重值,如提取绿地信息时,就可以对绿色光谱赋予较大的权重,而对红、蓝光谱赋予较小的权重。影像同质性参数包括颜色(光谱)特征属性和形状特征属性,两者权重之和为1.0,其中,形状特征属性由平滑度参数和紧凑度参数组成,两者权重之和也为1.0。以上参数的调整,均在eCongnition development 9.0软件中实现。对分割效果进行评价时,采用基于几何对象差异性的评价指标,包括过分割指数(OR)和欠分割指数(UR)[38]。在影像分割的基础上,对特征空间进行自动优化,最终选择特征空间的最佳组合为R、G、B这3个波段上像素的平均值,可见光波段差异植被指数(VDVI)和形状指数。其中,VDVI是一种模拟归一化植被指数(NDVI)的植被指数,其精度高于其他可见光波段的植被指数[8]。最后,将影像分为林隙和林冠2种类别。
进行单木树冠提取时,通过样地定位信息和目视法,将自动提取的树冠与样地数据一一对应,记录多分割(即一株树木冠幅分割成多株)和少分割的情况,从自动提取结果中选择正确分割的树冠,分别计算单个树冠的东西向和南北向冠幅,取二者的平均值作为平均冠幅,对提取出的冠幅值与实测冠幅值进行线性回归,测算其相关系数和决定系数(R2)。
1.3.3 不同类型小流域的树冠特征提取
将上述面向对象最邻近分类法推广到研究区内的子流域,统计自动提取株数和树冠面积。计算树冠面积与流域面积之比,获取郁闭度[39];计算树冠面积与林木株数之比,获取平均冠幅。
2 结果与分析
2.1 树种提取及其精度
农地子流域和人工林子流域的无人机影像和植被信息提取结果分别如图2、图3所示。
图2 农地子流域的无人机影像(a)、树种提取结果(b)和苹果的局部放大效果(c)Fig.2 Unmanned aerial vehicle image (a),extracted tree species (B) and partial enlarged view of apple (c) in farmland sub-watershed
图3 人工林子流域的无人机影像(a)、树种提取结果(b)和油松、刺槐的局部放大效果(c)Fig.3 Unmanned aerial vehicle image (a),extracted tree species (B) and partial enlarged view of Pinus tabuliformis and Robinia pseudoacacia(c) in plantation sub-watershed
农地子流域各地物类型总体分类结果很好,Kappa系数为0.898,总体精度为92.95%。刺槐和苹果的用户精度在90%以上(表2),生产者精度在94.4%以上,自动分类结果与实际类别具有较好的一致性。
表2 农地子流域分类混淆矩阵
人工林子流域各地物类型的总体分类结果较好,Kappa系数为0.728,总体精度为76.51%。梨和苹果的用户精度最高,在86%以上(表3),油松和刺槐的用户精度在75.8%以上,梨、侧柏、苹果、油松、刺槐的生产者精度依次降低,其中,梨、侧柏和苹果的生产者精度均在82%以上,提取精度较高。
表3 人工林子流域分类混淆矩阵Table 3 Classification confusion matrix of plantation sub-watershed
上述结果说明,用本文所提出的结合光谱、形状、纹理信息的面向对象最邻近分类法提取树种是可行的。
2.2 单木树冠提取及其精度
以刺槐为例,由其目标之间的异质性局部方差和局部方差变化率曲线(图4)可知,最佳分割尺度的备选值有64、77、103和131。当分割尺度为131时(图5),树冠之间存在合并,存在欠分割的情况;当分割尺度为103时,树冠被完整且清晰地提取出来;但当分割尺度继续缩小至64和77时,单木树冠逐渐破碎,不能被完整地提取,存在过分割的情况。据此,确定最佳分割尺度参数为103。
图4 异质性局部方差及其变化率曲线Fig.4 Curve of local variance and its rate of change
利用波段集统计工具,统计各波段协方差矩阵和相关性统计矩阵,结果显示,红、绿、蓝3个波段对分割的贡献程度相似,故将此三波段权重均设为1。
基于最佳分割尺度,对颜色(光谱)特征属性和形状特征属性进行调整。随着形状特征属性权重的缩小和颜色(光谱)特征属性权重的增加,分割后的影像边界的破碎程度增大(图6),表明分割效果变差,最终确定形状特征属性权重为0.5。类似地,确定分割对象的边缘平滑度参数和紧凑度参数的权重均为0.5[33]。将上述参数设置推广至蔡家川流域内的不同子流域进行应用。
在表1所示的10块样地上共实地调查了152
a~d的分割尺度依次为64、77、103、131。Segmentation scales of a-d were 64, 77, 103, 131, respectively.图5 不同分割尺度下的树冠分割图Fig.5 Canopy segmentation results under different segmentation scales
株树木,其中有140株树木的冠幅被正确提取,没有多分割或少分割的情况,冠幅株数提取精度为92.1%。从自动提取结果中选择正确分割的树冠,基于提取出的冠幅值与实测冠幅值进行线性回归(图7)。油松、侧柏、油松侧柏混交林、梨、苹果和山杏的树冠清晰,且冠幅提取精确度较
a~c的形状特征参数权重依次为0.5、0.3、0.1。The weight of shape parameter in a-c was 0.5, 0.3, 0.1, respectively.图6 不同形状特征参数权重下的分割图Fig.6 Segmentation result under different weights of shape parameters
a为油松,b为侧柏,c为刺槐,d为刺槐油松混交林,e为刺槐侧柏混交林,f为油松侧柏混交林,g为苹果,h为山杏,i为梨,j为次生林。a is Pinus tabuliformis; b is Platycladus orientalis; c is Robinia pseudoacacia; d is Robinia pseudoacacia L. and Pinus tabuliformis mixed forest; e is Robinia pseudoacacia L. and Platycladus orientalis mixed forest; f is the Pinus tabuliformis and Platycladus orientalis mixed forest; g is Malus domestica; h is Armeniaca vulgairs; i is Pyrus spp.; j is secondary forest.图7 实测冠幅值与自动提取冠幅值的线性回归结果Fig.7 Linear regression result of measured and automatically extracted crown width
高。比较拟合的各回归方程的决定系数,苹果>油松侧柏混交林>侧柏>油松>梨,且均在0.8以上,山杏>刺槐,均在0.7以上。刺槐油松混交林和刺槐侧柏混交林树冠有轻微的重合和遮挡,冠幅提取精确度相对略低,R2在0.5~0.7,其中,刺槐侧柏混交林的冠幅提取效果优于刺槐油松混交林。次生林几乎不能提取出完整的树冠,冠幅提取精确度较差,R2仅有0.422 3。
2.3 不同类型子流域的树种分布与树冠特征
将本文提出的面向对象最邻近分类法应用到研究区内不同类型的子流域,分析不同类型子流域的树种分布与树冠特征。以晋西黄土区主要造林树种油松和主要经济作物苹果为例,提取出不同子流域的油松和苹果的位置和树冠信息(图8),统计自动提取的株数、林分密度、郁闭度和平均冠幅(表4)。经测算,人工林子流域大多林地为混交林,刺槐、侧柏和油松交错分布,经济作物主要是苹果和梨,有刺槐14 339株,林分密度为997株·hm-2,平均冠幅为3.52 m;有油松8 268株,林分密度为1 744株·hm-2,平均冠幅为2.24 m;有侧柏941株,林分密度为1 862株·hm-2,平均冠幅为1.95 m;有苹果491株,林分密度为382株·hm-2,平均冠幅为4.26 m;有梨107株,林分密度为502株·hm-2,平均冠幅为4.01 m。农地子流域以刺槐、苹果为主,共有1 488株刺槐和912株苹果,苹果的林分密度为439株·hm-2,平均冠幅为3.84 m。农牧复合子流域有油松2 155株,林分密度1 051株·hm-2,平均冠幅为2.74 m。
表4 不同子流域树种冠幅统计Table 4 Crownwidth in different sub-watersheds
图8 人工林子流域(a、c)和农地子流域(b、d)油松(a、b)与苹果(c、d)的树冠提取结果Fig.8 Canopy extraction result for Pinus tabuliformis Carr. (a, b) and Malus domestica Borkh. (b, d) in plantation sub-watershed (a, c) and farmland sub-watersheds (b, d)
3 讨论
本研究利用面向对象最邻近分类法,基于无人机可见光影像提取树种和树冠信息,结果表明:
(1)面向对象最邻近分类法适用于基于无人机可见光影像的高郁闭度复杂林分的树种信息提取,树种的自动提取结果和实测结果具有高度一致性。对于郁闭度较低的林分和经济作物的提取效果极好,但复杂的植被类型下提取精度下降。(2)面向对象最邻近分类法适用于基于无人机可见光影像的高郁闭度复杂林分的树冠信息提取,人工林和经济果木林的树冠提取精度较高,次生林的提取效果较差。(3)将本文提出的面向对象最邻近分类法推广到晋西黄土区的蔡家川流域,可以高效并准确地提取出子流域内不同树种的林木株数、郁闭度和平均冠幅等林分特征参数。总的来看,该方法可以及时、高效地获取退耕还林背景下黄土区的植被更新情况。
3.1 树种分类和树冠提取精度
本研究基于面向对象最邻近分类法提取树种,在农地子流域的分类Kappa系数为0.898,在人工林子流域的分类Kappa系数为0.728,自动分类结果和实际类别具有较好的一致性,证明基于无人机可见光影像结合面向对象最邻近分类法提取树种信息是可行的,且具有一定的适用性和推广价值[33]。人工林子流域分类的总体精度为76.51%,农地子流域分类的总体精度为92.95%,接近现有研究结果[11,40]。最邻近分类法与阈值分类法相比,提取精度相差不大,且均处较高水平,已经能够满足大部分用户的精度要求[12]。牛利伟[41]使用最邻近分类法、随机森林法、支持向量机法、神经网络法进行行道树树种分类研究,在这4种分类方法中,最邻近分类法效果最佳,随机森林法次之,支持向量机法再次之,神经网络法效果最差。本研究的结果也表明,面向对象最邻近分类法适用于植被类型复杂、面积分布不均的林地植被信息提取。在研究中发现,农地子流域多为郁闭度较低的林分和经济作物,分类精度极高,人工林子流域植被类型复杂,精度有所下降。今后,可针对植被结构复杂的林地,加入归一化数字表面模型(nDSM)的规则集和DSM的纹理特征,进一步优化特征空间。
本研究利用无人机获取的高分影像,基于面向对象最邻近分类法提取树冠信息,总体来说,人工林和经济果木林的树冠提取精度较高,R2都在0.7以上,油松、侧柏和油松侧柏混交林的树冠提取精度较高,拟合效果较好,但冠幅提取结果偏大。这主要是由于以上树种均以人工林的形式存在,排列规则且整齐,易于识别和提取,但即使在正午拍摄,无人机影像也无法避免阴影问题,导致自动提取冠幅时会将阴影错分到树冠上,从而使得冠幅提取结果略微偏大。梨、苹果和山杏的冠幅提取效果较好,这是因为它们均为经济作物,受到人工培育和修剪,且栽种时为保证充足的阳光,树冠间隔较大,易于分割和辨认。刺槐样地树冠提取值小于实测值。这是由于刺槐林林分郁闭度较高,树冠之间间距较小,树冠和树冠之间存在重叠。刺槐油松混交林和刺槐侧柏混交林的冠幅提取误差主要是由刺槐的冠幅较大且树高高于油松和侧柏,导致油松和侧柏被遮盖造成。次生林的提取效果较差,R2仅有0.422 3,这是由于次生林林分郁闭度很高,种群结构丰富多样,没有人为干预,排列无规则,所以冠幅提取效果不理想。前人研究也发现,树木分布均匀、密度稀疏的纯林,冠幅解译的精度较高;反之,则精度降低[27]。次生林冠幅提取较差的问题是下一步研究的重点方向,可以考虑加入有近红外波段的传感器,加入NDVI和叶面积指数等规则,进一步提高树冠提取精度。乔正年等[42]用目视解译方法,手动勾绘判定单木冠幅边界,万红梅等[39]使用快鸟(QuickBird)影像,对胡杨、柽柳冠幅进行人机交互式解译,其平均精度分别达到84.00%、76.24%。与之相比,本研究提出的半自动化冠幅提取和计算方法精度较高(R2>0.7),且省时省力,说明用本文提出的面向对象最邻近分类法提取冠幅信息是可行的。
3.2 树种分类和树冠提取方法在流域林分调查中的应用
传统的样地法在进行植被信息调查时,除了存在费时、费力和人工测量误差等不足外,还存在一定的局限性,即调查仅能选取部分样地来代表整个区域,而无法对整个区域内的植被信息进行直接的提取。在以往的研究中,面向对象最邻近分类法并未在流域尺度上得到大面积的应用,仅用于在小面积样地中对植被信息进行提取。例如:耿仁方等[15]对面积为0.28 km2的岩溶湿地样地进行植被信息提取,总体精度为86.75%;曾霞辉等[43]在100 m×100 m的样地尺度上进行树冠信息提取,树冠面积相对误差为13.3%。本研究将面向对最邻近分类法推广至流域尺度,自动提取不同类型子流域内不同树种的林木株数、郁闭度、平均冠幅等林分特征参数。相较于通过提取林木南北冠幅、东西冠幅来计算树冠投影面积的方法,直接对影像分割对象进行面积计算,精度更高,信息提取更全面,且效率很高。该方法可以及时、高效地获取流域尺度的植被更新情况,对于苹果、梨等果树长势的迅速监测来说具有实际应用的可能性和推广价值。
本研究仅选择树种判别和冠幅特征提取作为最邻近分类法提取林分特征在流域尺度的尝试,总体来说,结果不错。结合DSM数据对其余林分特征,如林分蓄积量、林分平均胸径、树高等进行提取研究,是下一步工作开展的方向和目标。