基于多尺度遥感影像纹理特征的森林蓄积量反演
2017-12-10汪康宁李崇贵
汪康宁,吕 杰,李崇贵
(西安科技大学 测绘科学与技术学院,陕西 西安 710054)
基于多尺度遥感影像纹理特征的森林蓄积量反演
汪康宁,吕 杰,李崇贵
(西安科技大学 测绘科学与技术学院,陕西 西安 710054)
以国产“高分一号”卫星(以下简称GF-1)获取的遥感影像数据与少量研究区样地数据为数据源,构建以光谱信息与多尺度纹理特征为特征变量的森林蓄积量反演模型,探讨不同尺度下提取的纹理特征对森林蓄积量估测模型准确度的影响,通过对特征变量的优选,寻求一种提高森林蓄积量反演模型的准确度的方法。首先,对覆盖研究区域的GF-1遥感影像进行重采样,得到覆盖研究区域的不同分辨率的影像序列,基于不同窗口大小的灰度共生矩阵提取影像序列的纹理特征,与遥感影像光谱信息共同作为特征变量;然后,使用随机森林(random forest,RF)算法构建森林蓄积量反演模型,对研究区域的森林蓄积量进行估测,分析不同特征变量与窗口大小对森林蓄积量反演模型准确度的影响;最后,通过比较特征变量重要性,确定森林蓄积量反演模型的最佳特征变量与窗口大小选择,对研究区进行森林蓄积量反演,得到研究区域的森林蓄积量分布图。当使用从8m分辨率遥感影像提取的纹理特征与光谱信息作为特征变量时,森林蓄积量反演模型准确度明显优于使用其他特征变量。其中,当灰度共生矩阵窗口大小设置为9×9时,森林蓄积量反演模型准确度最高,为R2=0.70,RMSE=6.317。在根据重要性对从多尺度遥感影像提取的纹理特征进行选择后,所构建的森林蓄积量反演模型的准确度为R2=0.74,RMSE=6.439。使用较高分辨率遥感影像提取的纹理特征作为特征变量,可以有效的提升森林蓄积量反演模型的准确度。将基于不同分辨率遥感影像提取到的纹理特征作为特征变量,其模型准确度优于使用单一分辨率遥感影像所提取的纹理特征。
森林蓄积量;随机森林;多尺度;纹理特征;高分一号卫星
森林是地球生态系统中重要的组成部分,其碳汇功能对维持全球碳平衡起着重要的作用。森林蓄积量作为森林资源调查中的一个重要因子,是评价森林固碳能力的重要指标,及时准确地获取森林蓄积量信息可以为区域生态状况评价提供重要依据[1-2]。传统的一、二类森林资源调查是森林蓄积量重要的测算方法之一,这种方法虽然准确度较高,但在时间与空间上存在较大局限性,调查过程也会耗费大量的人力物力。随着遥感技术的发展,基于遥感影像与少量样地数据的森林蓄积量估测方法得到了国内外学者的广泛研究[3-5],如何提高森林蓄积量估测模型的准确度已经成为了林业遥感新的研究热点。
增加森林蓄积量估测模型中特征变量的数量是提高模型准确度最主要方法之一。已有研究表明,引入纹理特征、纹理指数、植被指数、地形因子作为特征变量均可提升估测模型的准确度[6-9]。纹理特征为遥感影像的可视化特征提供了一种定量化描述,将其作为特征变量,在地物信息的分类与反演中的优良表现,已经得到国内外诸多研究的确认[10-11]。
目前,国内有关森林蓄积量估测的研究大多只提取单一分辨率遥感影像的纹理特征进行森林蓄积量反演,已有文献中对多尺度纹理特征的使用则主要集中于基于不同窗口大小提取得到的纹理特征,这种做法忽略了同一遥感影像不同分辨率下的空间信息,因为地物自身物理大小的不同,并非所有地物都适合在同一尺度下进行分析。本研究以黑龙江凉水自然保护区为研究区,使用8 m分辨率的国产GF-1遥感影像为数据源,提取遥感影像的光谱信息与不同分辨率下的纹理特征,利用随机森林算法构建蓄积量反演模型,探讨不同尺度纹理特征对蓄积量反演模型准确度的影响,证明多尺度纹理特征用于森林蓄积量反演的可行性,并为提高森林蓄积量反演模型准确度提供一种新的思路。
1 研究区概况与实验数据
1.1 研究区域
本研究选取凉水国家级自然保护区作为研究区域。保护区位于黑龙江省伊春市带岭区,地处小兴安岭东坡,地理坐标为 47°06′49″~47°46′10″N,128°47′08″~ 128°57′19″E, 总 面 积约为12 133 hm2,森林覆盖率为98%。保护区属于温带大陆性季风气候区,年平均气温-0.3 ℃,年平均降水量为676 mm,降水主要集中在夏季。保护区的植被类型为温带针阔叶混交林,主要树种有红松Pinus koraiensis、云杉Picea asperata、山杨Populus davidiana、白桦Betula platyphylla、落叶松Larix gmelini等[12]。
1.2 遥感数据
使用覆盖研究区域的GF-1多光谱遥感影像作为数据源,于2013年10月16号拍摄。影像包含四个波段,分别为蓝色波段(450~520 nm)、绿色波段(520~590 nm)、红色波段(630~690 nm)和近红外波段(770~890 nm),分辨率为8 m,影像投影为通用横轴墨卡托投影。
1.3 样地数据
样地数据来源于凉水自然保护区地面调查,在研究区内的有林区域以大约1千米的间隔布设正方形样地,样地大小为24 m×24 m,调查时间为2009年8月。样地调查因子包括每块样地的经纬度坐标、树种组成、林分类型、胸径、树高等,利用数表法计算得到单木蓄积量,累加得到样地蓄积量。在道路、建筑、水体等无植被区域也设立部分样地,蓄积量为0。最终得到研究区样地191块,按照7∶3的比例随机划分为训练样地与验证样地,得到138块训练样地,53块验证样地。样地分布如图1所示。
图1 研究区与样地位置图像Fig.1 Study area and location of sample sites
2 研究方法
本研究的技术路线图如图2所示。
图2 研究技术路线Fig.2 Technological route of this research
2.1 遥感影像预处理
遥感影像在成像过程中,由于传感器平台误差、大气的吸收和散射作用、地形因素等原因,会产生失真与畸变。因此首先使用ENVI 5.3对GF-1遥感影像进行辐射定标,依次进行FLAASH大气校正与正射校正,保证校正误差在1个像元以内。之后利用凉水地区小班矢量边界对校正完成的遥感影像进行裁剪,得到8 m分辨率研究区影像数据,如图3所示。最后将影像数据进行重采样,最终得到一个研究区的遥感影像序列,分辨率分别为8、16、24 m。
图3 研究区的遥感影像Fig.3 Remote sensing image of study area
2.2 特征变量选择
2.2.1 光谱信息的提取
GF-1多光谱遥感影像包含4个波段,可以反映地物最基本的光谱信息。本研究选取24 m分辨率遥感影像的光谱信息作为特征变量。
2.2.2 多尺度纹理特征的提取
灰度共生矩阵(Gray-level Co-occurrence Matrix, GLCM)是Haralick提出的一种基于统计的纹理特征提取方法,目前已经成为遥感影像最常用的纹理特征提取方法[13],8种常用的纹理特征包括均值(Mean),方差(Variance),协同性(Homogeneity),对比度(Contrast),相异性(Dissimilarity),信息熵(Entropy),二阶矩(Second Moment)和相关性(Correlation),这8种纹理特征的计算方法如表1所示。本研究利用灰度共生矩阵进行纹理提取。首先对3种不同分辨率的遥感影像进行第一主成分(Principal Component,PC)提取;之后基于第一主成分在不同窗口大小下进行纹理特征的提取,窗口大小共设置六种,分别为3×3到13×13,得到3种不同分辨率遥感影像在六种不同窗口大小下的纹理特征,最后将其重采样为24 m分辨率。
表1 基于灰度共生矩阵的纹理特征Table 1 Textural feature based on GLCM
2.3 森林蓄积量反演算法
随机森林(Random Forests)是Leo Breiman等在2001年提出的一种基于决策树的机器学习算法[14]。该算法在分类与回归中良好的表现已经得到了诸多研究的确认[15-17]。
随机森林算法的基本思想是:假设原始数据集中有n个样本,每个样本有m个特征变量。首先使用bootstrap抽样方法抽取若干个子数据集,每个子数据集中样本的个数为,剩余个样本作为袋外数据(Out of Bag, OOB)用于误差估计。然后,从样本的m个特征变量中随机无放回选择出m′个特征变量,按节点不纯度最小原则选择出一个最优特征,作为节点构建决策树,最终得到若干棵决策树。最后,用这些决策树对数据集进行回归,最终使用采用简单多数原则确定数据集的反演结果。
2.4 模型精度评价
森林蓄积量反演模型的准确度通过决定系数R2与均方根误差RMSE进行评价,其数学表达式为:
式中:yi为样地蓄积量实测值;yˆi为样地蓄积量估测值;为样地蓄积量平均值;n为样地个数。
3 结果与分析
3.1 特征变量与窗口大小对蓄积量反演模型的影响
对研究区域森林蓄积量的反演与验证通过3个步骤进行:
(1)基于6种窗口大小GLCM分别提取3种不同分辨率遥感影像的纹理特征,与遥感影像波段值组合为特征组合,将表示训练样地的像元的特征组合与蓄积量作为反演模型的输入值进行训练,得到特征组合与蓄积量之间的非线性关系。
(2)将表示研究区域的所有像元的特征组合输入反演模型,参照步骤(1)中得到的非线性关系,得到整个研究区域的森林蓄积量反演结果。
(3)将验证样地的反演结果与实测值进行比较,评价指标为R2与RMSE,其结果如表2所示。
表2 不同灰度共生矩阵窗口大小下的蓄积量反演模型精度Table 2 Precision of volume estimation model based on different GLCM window size
通过比较表2中的结果可知,当使用24 m分辨率光谱信息与8 m分辨率下提取的纹理特征作为特征变量时,其RMSE一直保持最小,R2在窗口大小为7×7、9×9、11×11时为最大,总体上可以认为其是最佳的蓄积量反演模型输入特征变量。这说明较高分辨率遥感影像的纹理特征与森林蓄积量的相关性较强,利用较高分辨率遥感影像的纹理特征作为特征变量,可以有效的提高森林蓄积量反演模型准确度。
同时可以看出,无论采用哪种特征变量,森林蓄积量反演模型的准确度随着窗口大小的变化,也发生了较大的变化,说明生成纹理特征的窗口大小对森林蓄积量反演模型有着较大的影响。通过综合比较可知,当窗口大小为9×9时,无论使用何种特征变量,均取得较高的决定系数与较低的均方根误差,故可以认为其是森林蓄积量反演模型的最优窗口大小。同时不应忽略的是,9×9的窗口大小并没有在所有情况下都取得最好的结果,说明窗口大小对反演结果的影像有着较大的不确定性。
综上所述,当选取24 m分辨率光谱信息与8 m分辨率下提取的纹理特征作为特征变量、9×9作为窗口大小时,蓄积量反演模型达到最佳(R2=0.70,RMSE=6.317)。
3.2 森林蓄积量反演模型特征变量优选
随机森林算法除了可以进行分类或回归分析之外,还可以对参与学习的特征变量的重要性进行度量,其度量结果可以为高维数据的特征选择提供参考[17]。故本研究应用该算法对3种尺度下提取的特征变量的重要性进行分析,所分析的随机森林模型取3种尺度下准确度最高的模型,特征变量重要性结果如图4所示。
由图4可以看出,无论在何种尺度下得到的相关性纹理,其重要性都远远低于其他特征变量。对于剩余7种纹理,比较在不同尺度下提取得到的纹理的重要性,选择重要性较高的尺度,选择结果如表3所示。
将优选得到的特征变量放入随机森林模型中,进行森林蓄积量反演,其反演准确度为R2=0.74,RMSE=6.439。保护区内森林蓄积量分布图如图5所示。
由结果可以看出,使用经过优选的特征构建蓄积量反演模型,其决定系数R2有了进一步的提高,说明所选择的特征变量与森林蓄积量有更高的相关性。其均方根误差却有所下降,但仍然要高于现有以相同分辨率光谱信息与纹理特征作为特征变量的蓄积量反演模型,其原因在于使用随机森林进行特征选择,依据的是各特征的重要性,其与均方根误差并不是完全的相关关系。
图4 特征变量重要性Fig.4 Variable importance
表3 优选得到的纹理特征Table 3 Texture feature which selected
图5 森林蓄积量反演结果图像Fig.5 Distribution of forest growing stock volume
4 结 论
本研究提取多尺度分辨率遥感影像不同窗口大小下的纹理特征,将其与遥感影像光谱信息共同作为森林蓄积量反演模型的特征变量进行蓄积量反演,结果表明:使用基于较高分辨率遥感影像提取的纹理特征作为特征变量,可以有效的提升森林蓄积量反演模型的准确度。当提取纹理特征的窗口大小为9×9时,模型准确度最高。通过对不同尺度下的纹理特征进行优选,所构建的蓄积量估测模型决定系数更高。本研究可为森林蓄积量反演模型纹理变量优选提供参考。
[1]刘 茜,杨 乐,柳钦火,等.森林地上生物量遥感反演方法综述[J].遥感学报,2015,19(1):62-74.
[2]袁 野,刘兆刚,董灵波.基于GIS的大兴安岭盘古林场森林生态功能等级评价与分析[J].中南林业科技大学学报,2016,36(12): 108-114.
[3]Zheng S, Cao C X, Dang Y F,et al.Retrieval of forest growing stock volume by two different methods using Landsat TM images[J].International Journal of Remote Sensing, 2014, 35(1): 29-43.
[4]段祝庚,赵 旦,曾 源,等.基于遥感的区域尺度森林地上生物量估算研究[J].武汉大学学报(信息科学版),2015,40(10): 1400-1408.
[5]郭 云,李增元,陈尔学,等.甘肃黑河流域上游森林地上生物量的多光谱遥感估测[J].林业科学, 2015,51(1) :140-149.
[6]Sarker L R, Nichol J E. Improved forest biomass estimates using ALOS AVNIR-2 texture indices[J]. Remote Sensing of Environment, 2011, 115(4): 968-977.
[7]Rodriguez-Galiano V F, Chica-Olmo M, Abarca-Hernandez F,et al.Random Forest classi fi cation of Mediterranean land cover using multi-seasonal imagery and multi-seasonal texture[J].Remote Sensing of Environment, 2012, 121: 93-107.
[8]Zhu X, Liu D. Improving forest aboveground biomass estimation using seasonal Landsat NDVI time-series[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 102: 222-231.
[9]冯 琦,陈尔学,李增元,等.基于机载P-波段全极化SAR数据的复杂地形森林地上生物量估测方法[J].林业科学,2016, 52(3): 10-22.
[10]刘 俊,毕华兴,朱沛林,等.基于ALOS遥感数据纹理及纹理指数的柞树蓄积量估测[J].农业机械学报, 2014,45(7): 245-254.
[11]Sarker L R, Nichol J, Ahmad B,et al. Potential of texture measurements of two-date dual polarization PALSAR data for the improvement of forest biomass estimation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2012, 69: 146-166.
[12]张 蕾,李凤日,王志波.凉水自然保护区森林景观结构动态[J].东北林业大学学报,2007,35(5):74-76.
[13]Haralick R, Shanmugan K, Dinstein I. Textural Features for Image Classification[J]. IEEE Transactions on Systems, Man,and Cybernetics, 1973, 3(6): 610-621.
[14]Breiman L. Random Forests[J]. Machine learning, 2001, 45(1):5-32.
[15]Gislason P O, Benediktsson J A, Sveinsson J R. Random forests for land cover classification[J]. Pattern Recognition Letters,2006, 27(4): 294-300.
[16]Hutengs C, Vohland M. Downscaling land surface temperatures at regional scales with random forest regression[J]. Remote Sensing of Environment, 2016, 178: 127-141.
[17]Peerbhay K, Mutanga O, Lottering R,et al.Mapping Solanum mauritianum plant invasions using WorldView-2 imagery and unsupervised random forests[J]. Remote Sensing of Environment,2016, 182: 39-48.
[18]姚登举,杨 静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报(工学版),2012,42:1-5.
Inversion of growing stock volume using satellite image multiscale texture feature
WANG Kangning, LV Jie, LI Chonggui
(Collage of Geomatics, Xi’an University of Science and Technology, Xi’an 710054, Shaanxi, China)
Forest growing stock volume (GSV) is one of most important parameters to evaluate forest growth status. In this study, forest inventory data and Gaofen-1 images (GF-1) were used as data sources. The purposes of this study are to explore the effect of multi-scale texture feature on the estimation of GSV, and to improve the accuracy of GSV estimation model. Firstly, a group of different resolution image sequences over study area were obtained by resampling original satellite image. The texture feature of image sequences were extracted using different window sizes Gray-level Co-occurrence Matrix (GLCM). Secondly, a GSV estimation model was structured using Random Forest (RF) algorithm. The GSV of study area was estimated using this model. Finally, the best texture feature and window size were selected by compare importance of feature variables. The distribution of regional forest GSV was performed by the best estimation model. When using texture feature extracted from 8 m resolution image as feature variable, the accuracy of GSV estimation model was better than using texture from low resolution image signi fi cantly. With the GLCM window size was set to 9×9,the estimation model achieved the best accuracy(R2=0.70, RMSE=6.317). According to importance of variable, the best feature variables selected from multi-scale satellite to construct GSV estimate model(R2=0.74, RMSE=6.439). The results shown that using texture feature extracted from high resolution satellite image can improve the accuracy of GSV estimation model effective. When multi-scales texture features were used as characteristic variables, the model achieves higher accuracy than only using single scale.
growing stock volume; random forest; multi-scale; texture feature; GF-1 satellite
S771.8;TP75
A
1673-923X(2017)11-0084-06
10.14067/j.cnki.1673-923x.2017.11.014
2017-05-10
国家自然科学基金项目(51409204、41401496);陕西省自然科学项目(2015JQ4105);陕西省教育厅项目(16JK1496);江西省数字国土重点实验开放基金项目(DLLJ2015604)
汪康宁,硕士研究生
吕 杰,博士;E-mail:rsxust@163.com
汪康宁,吕 杰,李崇贵.基于多尺度遥感影像纹理特征的森林蓄积量反演[J].中南林业科技大学学报,2017, 37(11): 84-89.
[本文编校:吴 毅]