APP下载

应用多维遥感信息协同的森林树种分类1)

2023-03-27谢天义潘洁孙玉琳郑光

东北林业大学学报 2023年3期
关键词:植被指数波段纹理

谢天义 潘洁 孙玉琳 郑光

(南京林业大学,南京,210037) (南京大学)

In order to explore the main remote sensing information affecting forest tree species classification, the difference of tree species classification based on different dimension information were analyzed. The research object is the forest tree species in the natural forest area of Panther Creek in the southeast of Portland, Oregon, United States. The principal component analysis and ant colony optimization method were used to select the feature bands, texture features and vegetation indexes of airborne hyperspectral images. The LiDAR data were used to extract the vertical structure parameters of forests, and the random forest method was used to classify tree species. The results showed that the average classification accuracy using one-dimensional information was 69.86%, of which the classification accuracy using texture features was the highest (77.40%), and the classification accuracy using vertical structure parameters was the lowest (62.44%). The average classification accuracy of two-dimensional information combination was 79.68%, and the classification accuracy of hyperspectral feature band and texture feature combination was the highest. The average classification accuracy of three-dimensional information combination was 85.00%, and the classification accuracy of hyperspectral feature band, texture feature and vegetation index was the highest. The classification accuracy of all four-dimensional information was higher than that of one-dimensional, two-dimensional and three-dimensional information, and the classification accuracy was 89.20%. It can be seen that collaborative multi-dimensional remote sensing information can effectively improve the classification accuracy of forest tree species, among which texture information and feature spectrum information extracted from hyperspectral data play an important role in forest tree species classification, while the collaborative vertical structure information further improves the accuracy of forest tree species classification.

森林是陆地生态系统的重要组成部分,对维持生态过程和维护生态平衡起着至关重要的作用[1-2]。森林树种结构与分布则是森林资源可持续经营管理、森林生态系统服务评估以及生物多样性维护的基础[3-5]。

遥感作为目前森林资源调查的主要技术手段,在森林树种分类研究中取得了诸多进展。其中,高光谱遥感在地物精细识别中的优势为森林树种分类精度的提高提供了可能[6]。Richter et al.[7]利用机载高光谱影像采用随机森林和支持向量机的分类方法,对莱比锡河岸天然林进行树种分类的精度为78.40%;申鑫等[8]利用LiCHy集成传感器同期获取的高空间分辨率和光谱分辨率数据,通过信息熵原理提取特征变量对4个典型树种分类的总体精度达到62.90%。

高光谱遥感虽然提供了丰富的光谱信息,但仅限于冠层表面且存在“同谱异物和同物异谱”现象,在一定程度上影响了森林树种识别的精度。激光雷达(LiDAR)作为一种新型的对地观测技术,具有主动性、穿透性及可快速大面积地获取三维信息等特点[9],为获取森林垂直结构特征提供了可能。吴艳双等[10]采用机载高光谱和LiDAR数据构建多特征集合,对广西高峰林场界牌分场树种进行分类的精度最高达到83.70%;Zhao et al.[11]结合机载高光谱和LiDAR数据对东北某天然混交林树种进行分类,平均分类精度达到85.33%。由此可见,结合LiDAR数据提取的垂直信息和高光谱影像数据的光谱信息能够实现优势互补,在提高森林树种识别精度方面具有巨大潜力[12]。

随机森林是一种非参数分类算法,近年来被广泛应用于树种分类。Pu et al.[13]应用美国佛罗里达坦帕市5个季节性高分辨率卫星影像对该地区树种分类,随机森林(RF)分类精度优于支持向量机(SVM)[13];董彦芳等[14]应用机载LiDAR数据建立归一化数字地表模型(nDSM)结合机载高光谱影像提取的归一化植被指数(NDVI),采用最大似然分类法进行森林树种分类的精达到84.0%;Shi et al.[15]应用高光谱和LiDAR数据衍生的光谱和结构特征参数,利用随机森林分类器对德国某天然林树种进行分类,分类精度达到83.70%,分类精度远高于单纯使用激光雷达(65.10%)或高光谱(69.30%)数据。最大似然分类法虽然拥有简单、实施方便的优点,但这种方法更适合波段数少的数据。支持向量机分类法使用核函数避免了维数灾难的问题;在分类过程中少数支持向量决定最终结果,对异常值不敏感,分类更具鲁棒性。然而支持向量机分类法难以对大规模数据进行训练,结果受设定的参数和核函数影响较大。与前两者相比,随机森林分类算法能较好处理高维度数据集,更适合多维数据的处理,其训练时不同决策树之间相互独立互不干扰,泛化能力强。

本研究以美国俄勒冈州波特兰市东南部黑豹溪(Panther Creek)流域天然林区的主要森林树种为研究对象,充分利用机载高光谱影像与LiDAR数据,探索光谱信息、空间信息与垂直结构特征协同作用在森林树种分类中的应用,以期为森林树种分类提供方法借鉴。

1 研究区概况

研究区位于美国俄勒冈州波特兰市东南部黑豹溪(Panther Creek)流域的天然林区(123°14′54″~123°19′24″W、45°17′27″~45°17′57″N,见图1)。波特兰市兼具地中海气候和温带海洋型气候的特征,气候温和,四季分明,冬季温暖多雨,夏季炎热干燥,年平均降水量1 119 mm。该林区主要森林树种有花旗松(Pseudotsugamenziesii)、异叶铁杉(Tsugaheterophylla)、北美乔柏(Thujaplicata)和大叶枫树(Acermacrophyllum)。

图1 研究区分布图

2 研究方法

2.1 数据获取

高光谱数据获取采用CASI-1500紧凑型机载成像光谱仪(加拿大ITRES公司),空间分辨率0.5 m,光谱范围400~1 000 nm,波段96个;由Cessna Caravan航空飞机搭载,并同时集成实时动态(RTK)以记录飞行过程中的位置信息;飞行试验于2014年9月3—5日,飞行航高为1 310 m。

LiDAR数据获取的飞行时间为2014年9月23日,Cessna Caravan航空飞机搭载了Leica ALS60传感器,飞行高度为700 m,视场角为30°,Leica ALS60的发射频率为112 kHz,激光脉冲波长1 064 nm,平均首次回波密度为13.9点/m2,到达地面激光脉冲直径17 cm,激光强度为8 bit,最小分辨率平均8脉冲/m2。

2.2 光谱特征的选择

光谱数据垂直结构信息:利用LiDAR360软件对LiDAR点云数据进行滤波处理后分离地面点和非地面点。对分离的地面点采用不规则三角网插值法(TIN)[16]生成数字高程模型(DEM)和数字表面模型(DSM),并将DSM与DEM进行差值运算得到冠层高度模型(CHM)。由于不同百分位高度(Hp50、Hp75、Hp90和Hp95)信息对树种分类有重要影响[3],因此,利用CHM进行树高信息提取,采用DEM提取不同百分位的高度特征,作为垂直结构(VS)信息进行后续的树种分类。

特征波段:对高光谱数据进行特征波段选择,可以有效降低数据维度,解决数据冗余问题。主成分分析(PCA)依据特征值和贡献率提取光谱数据特征变量,不仅能够不限融合的波段数量,同时较完好的保存光谱特征和空间特征[17],当指标间相关性不显著时,就要选取较多的主成分,导致主成分分析的降维效果不明显。人工蚁群(ACO)是一种模拟进化算法,其原理是寻找一种机率型最优路径[18],但人工蚁群易造成局部最优解,无法更好地顾及全局。因此,本研究综合主成分分析和人工蚁群算法,确定最优特征波段(COD)。

纹理特征:纹理特征(TF)描述了物体表面周期性变化的表面结构排列属性和物体之间的空间关联信息,对树种分类起着重要的作用,利用灰度共生矩阵(GLCM)提取影像不同尺度的纹理特征,能够提高地物的分类精度[26-27]。TF影像的标准差反应了影像各像元灰度值和均值总的离散度,标准差值越大,所包含的信息量越多[28]。本研究应用高光谱影像特征波段,采用GLCM,纹理测度值为0°、45°、90°和135°等4个方向的均值,采用3×3、5×5、7×7、…、17×17的窗口梯度,设置步长为1,提取8个特征值(方差、均值、相关性、差异性、协同性、对比度、熵和二阶矩)作为纹理特征。

2.3 植被指数的选择

植被指数(VIS)是利用植被在不同波段的光谱反射特性,通过数学运算更能突出植被间的细微差异[19]。本研究选取了10个与植被种类区分密切相关的植被指数用于树种分类[20-25](见表1)。

表1 植被指数及计算公式

2.4 对树种的分类方法

随机森林(RF)是一种由多个决策树分类模型集成的分类器,被广泛应用于森林树种分类研究[29]。随机森林算法利用靴带法(boot-strap)重抽样方法从原始样本中抽取多个样本,对每个样本进行决策树建模,然后组合多棵决策树的预测,采用投票的方式,决策树投票的众数为最终预测结果[30]。本研究利用机载LiDAR和高光谱影像数据,结合目视解译进行样本选择。从高光谱真彩色影像中提取单木冠幅50个光谱像元,并求其均值作为一个样本。4种不同树种各提取500个样本(花旗松393棵、异叶铁杉233棵、北美乔柏437棵、大叶枫树97棵),共计2 000个样本。随机筛选各树种75%的样本点作为训练样本,剩余的25%样本作为验证集,对分类结果进行精度评价。

3 结果与分析

3.1 垂直结构信息提取

由图2、表2可知,通过数字表面模型(DSM)和数字高程模型(DEM)的差值运算得到冠层高度模型(CHM),在此基础上提取Hp95、Hp90、Hp75、Hp50、Hp25、Hp10和Hp5等7个百分位高度(每个像素点内95%、90%、70%、50%、25%、10%、5%的高度)。此外,计算平均值差值(不同树种树高平均值的差值)并进行显著性检验以分析不同森林树种在不同垂直高度上的树高分布差异。

表2 不同树种间树高差异

图2 不同树种DEM、RGB和CHM显示图

3.2 光谱特征提取

3.2.1 特征波段选择

根据高光谱影像和LiDAR影像,选取了花旗松、异叶铁杉、北美乔柏、大叶枫树等4树种各200个像元,并提取各树种的反射光谱曲线。由图3(A)可知,各树种间反射率变化趋势具有很强的相似性,但在特定波段处(500~680、720~790、850~970 nm)存在较为明显的差异。

利用PCA和ACO分别提取最能区分树种间反射特征差异的波段作为特征波段。由图3(B)可知,主成分权重系数局部极值对应的波段为差异最显著波段,PCA方法选择出7个特征波段,而利用ACO进行局部最优路径解分析,则筛选出26个特征波段。综合两种方法的波段选择结果,最终在507~977 nm区域确定12个波段,作为森林树种分类贡献显著的特征波段。

3.2.2 植被指数提取

由图3可知,4个树种的冠层反射率与主成分分析权重系数分布清晰,绿峰和红边位置反映树种间的光谱差异明显。根据PCA和AOC筛选的特征波段分布(见表3),最终选择特征波段557 nm和757 nm组成新的植被指数(SV=B757/B557),新的植被指数与其他10个植被指数共同参与后续的树种分类。

表3 高光谱影像特征波段选择

图3 树种反射光谱曲线和主成分权重系数

3.3 纹理特征

由表4可知,随着移动窗口的增大,影像均值标准差不断增大。方差、对比度随移动窗口的增大,呈先增大后减小的趋势,在5×5窗口处达到最大值;相关性、差异性、协同性、熵、二阶矩等纹理测度值随窗口的不断增大而减小;分类精度窗口5×5最高。因此,本研究选取5×5窗口作为最佳窗口尺寸提取纹理特征。

表4 不同窗口大小下各纹理测度标准差和分类精度表

3.4 不同维度信息的树种分类精度

由表5可知,一维信息进行分类时,分别利用5×5窗口提取的纹理特征、高光谱特征波段、植被指数和垂直结构参数进行树种分类。利用一维信息进行树种分类的平均精度为69.86%,其中,利用纹理特征进行分类的精度最高为77.40%,特征波段进行分类的精度为71.47%,植被指数的分类精度为68.55%,垂直结构参数分类的精度为62.44%。

表5 随机森林分类结果

协同二维信息进行分类,相比于一维信息分类,二维信息分类精度明显提高,平均精度达到了79.68%。其中,高光谱提取的特征波段和纹理特征组合的分类精度最高为86.40%,纹理特征和植被指数组合分类精度为85.80%,特征波段和垂直结构组合的分类精度为81.60%,植被指数和垂直结构组合的分类精度为79.80%,特征波段和垂直结构组合的分类精度为75.80%,而特征波段和植被指数组合的分类精度仅为68.70%。

协同三维信息分别进行分类,三维信息组合的分类精度有了更明显的提升,平均精度达到了85%。其中,仅采用基于高光谱数据提取的特征波段、植被指数、纹理特征组合总体分类精度达到87.20%,垂直结构、植被指数和纹理结构组合分类精度为87.00%,特征波段、垂直结构和纹理特征组合分类精度为85.40%,特征波段、垂直结构、植被指数组合总体分类精度仅为79.8%。

协同四维信息进行分类时的精度远高于一维、二维与三维信息协同时的分类精度,分类精度达到了89.20%,与使用高光谱数据提取的特征波段、纹理特征和植被指数相比,加入垂直结构信息后,分类精度提高了2%。

4 结论与讨论

本研究利用机载LiDAR数据和高光谱影像数据,分别提取了垂直结构信息、高光谱特征波段、植被指数和纹理信息,将信息进行不同维度的组合,采用随机森林分类器进行了森林树种分类。结果表明:(1)机载高光谱数据由于同时具备了高的空间分辨率与光谱分辨率,能够很好地提高森林树种的分类精度,纹理特征在树种分类中起到了关键作用;(2)协同LiDAR数据提取的垂直结构信息时,树种分类的精度提高了2%。由此可见,多维信息协同作用能够有效提高森林树种分类的精度。

树种识别精度是森林资源调查关键的指标[11],研究表明高光谱数据的光谱特征及其衍生特征在树种识别上发挥着积极的作用[33,35-36],而将高光谱数据衍生的纹理特征应用于树种分类,达到很好的分类效果[26-27]。同时,机载高光谱数据和LiDAR数据的结合能够大幅度提高树种分类的精度[37]。本研究中,使用LiDAR数据提取的垂直结构信息与高光谱原始波段进行树种分类的精度并不高(不超过65%),而高光谱数据进行适宜的波段选择后发展的光谱信息和纹理特征在树种分类中起到了更重要的作用,垂直结构信息则在充分挖掘高光谱信息的基础上推动森林树种分类精度的进一步提高。

猜你喜欢

植被指数波段纹理
基于BM3D的复杂纹理区域图像去噪
基于植被指数选择算法和决策树的生态系统识别
使用纹理叠加添加艺术画特效
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
TEXTURE ON TEXTURE质地上的纹理
M87的多波段辐射过程及其能谱拟合
消除凹凸纹理有妙招!
日常维护对L 波段雷达的重要性
主要植被指数在生态环评中的作用