基于主成分分析法的老秃顶子自然保护区森林蓄积量遥感估测
2017-12-11刘明艳王秀兰冯仲科于东海
刘明艳 ,王秀兰 ,冯仲科 ,于东海
(北京林业大学 a. 林学院精准林业北京市重点实验室;b. 森林培育与保护省部共建教育部重点实验室,北京 100083)
基于主成分分析法的老秃顶子自然保护区森林蓄积量遥感估测
刘明艳a,b,王秀兰a,b,冯仲科a,b,于东海a,b
(北京林业大学 a. 林学院精准林业北京市重点实验室;b. 森林培育与保护省部共建教育部重点实验室,北京 100083)
以老秃顶子自然保护区为研究区,采用研究区landsat8 OLI遥感影像、DEM数据、实地调查数据作为数据源,提取11个光谱因子、8个纹理因子、3个地形因子,采用主成分分析法对所有因子进行降维处理,以累积方差贡献率大于80%作为指标,选取4个主成分,并以主成分得分为自变量、以每公顷蓄积量为因变量,建立线性回归估测模型,并检验精度。结果表明:回归方程调整后的R2=0.810,拟合度好。对模型进行精度检验,结果为:蓄积量估测的平均相对误差为12.12%,总相对误差为6.02%,平均预估误差为7.82%,模型预估精度达到92.18%,能够满足林业调查中对于蓄积量遥感估测的要求。
蓄积量;主成分分析法; 模型检验
森林蓄积量能够反映出国家或者地区的森林资源总体规模和水平,作为一项重要依据指标,也能够反映出森林资源的丰富程度,衡量森林生态环境优劣[1-3]。根据少量地面调查样地数据并配合遥感影像数据,建立以地面调查数据为基准的森林蓄积量高精度估测模型,可以尽最大可能地减少外业地面调查的工作量,这中模型的建立与应用具有非常重要的研究价值和实际使用效益。传统的蓄积量的测定主要是通过全国森林一、二类清查[4]获得数据,存在工作量大、耗时、需要经费多等问题,且调查间隔期长。近十年来航天遥感技术(RS)、地理信息系统(GIS)与计算机的发展以及与数学模型的结合应用,为森林蓄积量的估测带来了新的发展方向[5-10]。目前常用的反演蓄积量的方法是利用遥感影像(光学遥感与微波遥感)的光谱信息和纹理信息,将地面调查样地在遥感影像上对应位置的各波段灰度值、植被指数灰度值及由各波段间通过加减乘除等运算得来的衍生波段的灰度值作为影响蓄积量反演的自变量,以地面调查获取的样地蓄积量为因变量,建立蓄积量的反演模型[11-14](线性模型与非线性模型),实现定量估测森林的蓄积量。线性模型一般是指利用多元线性回归的方法拟合得到蓄积量估测模型,而线性模型中变量的筛选不仅对模型的稳定性、拟合效果有影响,对预测精度也会产生影响。主成分分析法[15]能克服自变量间的多重共线性,因此,本研究以老秃顶子自然保护区为研究区,以Landsat8 OLI遥感影像、DEM数据以及50个样点的实地调查数据为数据源,提取影响蓄积量的22个因子,采用主成分分析法建立蓄积量估测模型。
1 研究区概况
辽宁老秃顶子自然保护区属于国家级国家级自然保护区,位于辽宁省东部,华来、八里甸子、平顶山三个乡镇境内,地理坐标为东经124°41′13″~125°5′15″,北纬 41°11′11″~ 41°21′34″。保护区内的气候类型属于辽东冷凉湿润气候区,这种特殊的小气候区是由于北温带大陆性季风气候受到海洋性气候和森林高差的影响而形成的。雨量充沛,年降水量827.8 mm,年平均相对湿度73%,绝对最高气温38 ℃,绝对最低气温-33 ℃,年平均温度6 ℃,年平均无霜期139 d。保护区属长白植物区系的西南边缘,并具有向华北植物区系的过渡性。中山植被垂直分布,尤其北坡垂直分布最为明显,海拔由低到高分别为落叶阔叶林带、云冷杉和枫桦等共建种组成的混交林带、云冷杉暗针叶林带、岳桦林带、中山灌丛带、中山草地。
2 数据与方法
2.1 影像预处理
获取老秃顶子自然保护区2015年9月4日的Landsat8 OLI遥感影像,该数据采用UTM WGS-84投影,是1级标准产品。OLI影像共包含9个波段,其中b1~b7和b9为30 m分辨率的多光谱波段,b8为15 m分辨率的全色波段。由于b1和b9分别为深蓝波段和短波波段,用于观测气溶胶与卷云,因此本研究不考虑这2个波段,只研究b2~b8与蓄积量的相关性。
利用ENVI5.1软件对影像进行预处理。首先用FLAASH工具进行大气校正,使像元灰度值(DN)转化为地表反射率值;然后进行几何精校正,选取分布均匀的30个地面控制点,采用二次多项式模型进校正,使误差控制在1个像元内;最后进行裁剪,得到研究区影像(如图1所示)。
图1 预处理后的研究区标准假彩色影像Fig.1 Standard false color images of the studied area after oreprocessing
2.2 实地调查数据处理
外业数据采用老秃顶子自然保护区3D角规[16]实测数据,数据采集于2015年9月中下旬。在研究区内抽取具有代表性的森林资源样地并建立蓄积量估测方程,能够确保得到的估测模型具有一定的可靠性和稳定性。本研究根据自然保护区的面积,一般选取30~60个样本作为大样本,建立了50个均匀分布的3D角规样点,样点的选取采用随机抽样方法,选在自然保护区内植被分布具有典型性的区域内,其海拔分布范围为427~985 m,坡度范围3.3~44.2°,坡向以正北为0°,样点的坡度分布范围为60~355°,并选取以落叶松、核桃楸、小叶杨、沙松、椴树、榆树、杨树、蒙古栎、辽东冷杉等为优势树种的林分建立角规样点,基本涵盖了保护区内大部分阔叶林林分类型及部分云冷杉和枫桦等共建种组成的混交林。
记录每个样点的坐标信息,并测量各个样点内10棵左右的计数木的树种、胸径、树高等调查因子。依据3D角规林分蓄积量的计算公式M=G·HL·f,得到实测蓄积量,其中,M为林分每公顷蓄积量,m3/hm2;f为平均实验形数;G为林分每公顷断面积,m2/hm2;HL为林分条件平均高,m。用基于聚类的分层抽样抽取其中35个样点数据,作为建模数据,剩余的15个样点数据作为检验数据。
2.3 遥感及地形因子提取
遥感因子分为光谱因子与纹理因子两部分。光谱因子设置为多光谱波段的地表反射率值以及它们之间的线性组合,分别为b2、b3、b4、b5、b6、b7,归一化植被指数NDVI、比值植被指数RVI、差值植被指数 DVI,(b5/b3)、(b7/b4) ,共计11个光谱因子。
纹理因子选取最为广泛的基于灰度共生矩阵的方法进行提取。由于5×5的窗口[17]提取的纹理特征统计量与蓄积量有较强的相关性,因此选取该窗口提取全色波段b8的8个纹理特征统计量,即均值(Mean,ME)、方差(variance,VA)、协同性(homogeneity, HO)、对比度(contrast,CO)、相异性(dissimilarity,DI)、熵(entropy,EN)、 二阶矩(second moment,SM)和相关性(correlation,CC)。
地形因子利用30 m空间分辨率的ASTGTM数据,提取海拔、坡度、坡向3个因子。
利用ENVI 5.1软件,提取50个样点坐标对应的22个自变量因子的取值,将空间数据和地面属性数据进行连接。其中,以10号样点为例,提取的各因子值如表1所示:
表1 10号样点的各因子提取值Table 1 The extraction of factors value of No.10
2.4 主成分分析
主成分分析(PCA)是将多个指标化简为少数几个综合指标的一种统计分析方法,它是通过降维技术,把多个变量化为少数几个主成分的方法,原始变量的绝大部分信息被保留在这些主成分中,通常表示为原始变量的线性组合。利用主成分分析,我们可以从繁琐错杂的事物关系中找到一些可提供研究的主成分信息,从而整合大量统计数据,达到能够有效利用数据做出定量分析、揭示出变量与变量之间的内在关系的效果。通过主成分分析得到的主成分和原始变量之间的关系如下: ①每一个主成分都是各原始变量的线性组合,即Ci=u1iX1+u2iX2+…+upiXp;②主成分的数目相较于原始变量有大大的减少; ③原始变量的绝大部分信息仍然保留在主成分中,这些原始信息的一般累计贡献率可达到80%以上[16];④每个不同的主成分之间相互独立、不相关。通过主成分回归分析方法建立拟合模型原理是:利用主成分分析提取出主成分因子与因变量回归建模。此方法得到的回归方程及方程参数估计更为可靠,是由于主成分间具有的独立性,以及主成分对原始大量相关性指标的综合信息地较好反映。
3 结果与分析
3.1 回归建模结果
将35个样点的因子提取值导入R语言软件中,进行主成分分析,统计分析结果如表2所示,可知前4个特征根的累计贡献率达到82.15%,说明前4个主成分已经反映原来22个自变量因子82.15%的信息,因此确定以前4个主成分作为主成分回归的自变量因子,建立蓄积量估测模型。
表2 主成分分析结果Table 2 The results of principal component analysis
自变量选取前4个主成分的得分,因变量以选取蓄积量的实测值,建立模型如下:
V=103.78+1.029 6C1+1.110 4C2+0.917 30C3+2.332 4C4。
式中:V为蓄积量 (m3·hm-2);C1,C2,C3,C4分别为第1、第2、第3、第4主成分向量。由主成分载荷阵得4个主成分与22个因子提取值的线性关系如表3所示。
模型经方差分析和回归系数T检验,统计数据表明:F值为37.21,p值小于0.0001,回归模型有意义;模型拟合数据显示多元线性模型的决定系数R2为0.832,调整后的R2为0.810,拟合情况良好。
3.2 模型精度分析
为了对该模型的适用性进行有效的验证,将剩下的15个样地的遥感因子及地形因子,代入拟合的估测模型,计算出模型估测的各样地蓄积量。并将模型的预测估测值与实际测量的数据值进行比较分析,检验模型的适用性和模型对林分蓄积量的估测精度如表4所示。选取平均相对误差、总想对误差、平均预估误差作为精度评价指标,对所建立的模型进行精度验证,得到林分蓄积量的模型预估精度达到92.18%。
表3 主成分与因子提取值的线性关系Table 3 The linear relationship between PCA and extraction value
表4 精度检验结果Table 4 The results of accuracy test
4 结论与讨论
遥感数据提供的动态的、综合的植被覆盖信息,极大提高了林业工作效率[1]。本研究以老秃顶子自然保护区为对象,选取了与森林蓄积量关系密切的因子作为自变量,运用主成分分析法得到研究区内中低海拔森林的蓄积量估测模型。结果表明,该模型的精度较高且适用性强,同时克服了因子之间的多重共线性,能为保护区内森林蓄积的调查与管理提供参考依据。
(1)以landsat8 OLI遥感影像、DEM数据为数据源,提取11个光谱因子、8个纹理因子、3个GIS因子,采用主成分分析的方法对所有因子进行降维处理,以累积方差贡献率大于80%作为指标,选取4个主成分,并以主成分得分为自变量、以每公顷蓄积量为因变量,建立线性回归方程,回归方程调整后的R2为0.810,拟合度好。终得到老秃顶子自然保护区蓄积量线性回归估测模型为:V=103.78+1.029 6C1+1.110 4C2+0.917 30C3+2.332 4C4。
(2)对得到的蓄积量模型进行精度检验,结果表明蓄积量估测的平均相对误差为12.12%,总相对误差为6.02%,平均预估误差为7.82%,模型预估精度达到92.18%,能够满足林业调查中对于蓄积量的要求。
(3)本研究在提取纹理因子时,以5×5的窗口对全色波段影像进行提取,纹理信息较少;下一步研究在不同窗口下对不同波段影像的纹理信息进行提取,以增加更多的纹理因子,进一步提高森林蓄积量的估测精度。另外,主成分分析法的优势在于能克服自变量间的多重共线性,与逐步分析法、一般线性回归法比较,精度更高[2]。但国内有相关研究表明,利用偏最小二乘的估测模型拟合森林蓄积量预估模型,同样较好地克服了自变量间相关性,刘琼阁等的利用偏最小二乘回归建立密云区森林蓄积量估测模型,精度达到90.1%,将通过检验的模型反演到整个研究区,精度达到89.2%[1]。但不同研究区内的适用性有待验证,针对老秃顶子再燃保护区可进一步验证偏最小二乘法在本研究区域内的蓄积量预估的精度。本研究针对老秃顶子自然保护区中低海拔森林植被蓄积量进行了研究,高海拔地区植被以针叶林、灌木林及草甸为主,其蓄积量较阔叶林有显著不同,可进一步对该区域的蓄积量估测模型进行研究。
[1]刘琼阁, 彭道黎, 涂云燕. 基于偏最小二乘回归的森林蓄积量遥感估测[J]. 中南林业科技大学学报, 2014, 34(2): 81-84,132.
[2]涂云燕. 森林蓄积量遥感估测研究[D]. 北京:北京林业大学,2013.
[3]王臣立, 牛 铮, 郭治兴, 等. 基于植被指数和神经网络的热带人工林地上蓄积量遥感估测[J]. 生态环境学报, 2009,18(5): 1830-1834.
[4]黄 平, 杨燕琼, 侯长谋. 基于RS、GIS 的杉木林分蓄积量判读模型研究[J]. 中南林业查规划, 2003, 22(1): 25-27.
[5]王 佳, 宋珊芸, 刘 霞, 等. 结合影像光谱与地形因子的森林蓄积量估测模型[J]. 农业机械学报, 2014, 45(5): 216-220.
[6]Widlowski J L, Pinty B, Gobron N,et al. Detection and characterization of boreal coniferous forests from remote sensing data[J]. Journal of GeoPhysical Research- Atmospheres,2001,106: 33405-33419.
[7] Dong J R, Kaufmann R K, Myneni R B,et al.Remote sensing estimates of boreal and temperate forest woody, biomass: carbon,pools, sources, and sinks[J]. Remote Sensing of Environment,2003, 84: 393-410.
[8]Trotter C M, Dymond J R, Goulding C J. Estimation of timber volume in a coniferous Plantation forest using Landsat TM[J].International Journal of Remote Sensing, 1997, 18(10): 2209-2223.
[9]洪奕丰, 林 辉, 严恩萍, 等. 基于偏最小二乘法的平南县森林蓄积量估测模型研究[J]. 中南林业科技大学学报, 2011,31(7): 80-85.
[10] 黄伟平, 谭三清, 张 贵, 等. 估测森林蓄积量的遥感因子选择研究[J]. 中南林业科技大学学报, 2010, 30(4): 112-115.
[11] 郑 刚, 彭世揆, 戎 慧, 等. 基于KNN方法的森林蓄积量遥感估计和反演概述[J]. 遥感技术与应用, 2010,25(3):430-437.
[12] 刘 鑫. 基于RS和GIS的森林蓄积量估测的研究[D]. 南京:南京林业大学, 2010.
[13] 付虎艳, 徐云栋, 李圣娇, 等. 基于SVM方法的高山松林蓄积量遥感估测研究[J]. 西部林业科学, 2014, 43(4): 83-88.
[14] 涂云燕, 彭道黎. 基于RS的森林蓄积量主成分回归估测[J].东北林业大学学报, 2012, 40(10): 75-77.
[15] 王斌会. 多元统计分析及R语言建模[M]. 广州: 暨南大学出版社, 2014.
[16] 高 祥. 森林资源调查监测信息化技术方法研究[D]. 北京:北京林业大学, 2015.
[17] 王月婷, 张晓丽, 杨慧乔, 等. 基于Landsat8卫星光谱与纹理信息的森林蓄积量估算[J]. 浙江农林大学学报,2015,32(3):384-391.
[本文编校:吴 彬]
Estimation of Laotudingzi nature reserve forest volume based on principal component analysis
LIU Mingyana,b, WANG Xiulana,b, FENG zhongkea,b, YU Donghaia,b
(a. Forestry College Precision Forestry Key Laboratory of Beijing; b. Forest Cultivation and Protection Key Laboratory of Ministry for Education, Beijing Forestry University, Beijing 100083, China)
By selecting Laotudingzi as the research area, taking the remote sensing images of landsat8 OLI, DEM data and survey data as the data source, the studied area’s 11 spectrum factors, 8 texture factor and 3 terrain factors in the corresponding sample area were acquired. Putting the cumulated variance contribution ratio to more than 80% as index, the principal component affecting forest reserves were extracted by principal component analysis, and then a principal component regression model was obtained using the principal component. The results showed that the regression equation of the adjusted R2is 0.810, which fits well. To accuracy test, the model precision of the average relative error is 12.12%, the total relative error is 6.02%, the mean prediction error is 7.82% and the model prediction accuracy is 92.18%. It can meet the requirements of forestry investigation for volume of remote sensing to estimate.
stock volume; principal component analysis; accuracy test
S771.8 文献标志码:A 文章编号:1673-923X(2017)10-0080-04
10.14067/j.cnki.1673-923x.2017.10.013
http: //qks.csuft.edu.cn
2016-12-27
北京市自然基金项目“环首都圈森林植被空间环境效应模型与造林决策支持系统研究”(6161001)
刘明艳,硕士研究生
王秀兰,博士,副教授;E-mail:wangxiulan2000@sina.com
刘明艳,王秀兰,冯仲科,等. 基于主成分分析法的老秃顶子自然保护区森林蓄积量遥感估测[J].中南林业科技大学学报,2017, 37(10): 80-83, 117.