基于遥感技术的宜良县云南松蓄积量反演
2022-03-04李紫荆
李紫荆,胥 辉
(西南林业大学,云南 昆明 650224)
1 引言
森林是地球上最大的陆地生态系统,是全球生物圈中重要的一环。它是地球上的基因库、碳贮库、蓄水库和能源库,对维系整个地球的生态平衡起着至关重要的作用,是人类赖以生存和发展的资源和环境。
森林蓄积量多用于统计较大尺度的地区范围各种活立木的材积总量,可按树种、径级、材种等分别统计不同活立木的材积总量。森林蓄积量是反映一个国家或地区生产力的一项重要指标,随树种和立地条件等的不同而发生有规律的变化,也为森林可持续经营与发展、全球气候变化研究提供科学依据。
传统的森林资源调查不仅费时费力,而且难以反映森林的动态发展情况。因此,林业工作者及研究人员一直致力于探索如何利用飞速发展的遥感技术对蓄积量进行估测[1,2]。采用遥感数据估测蓄积量,仍然存在遥感因子选取、生物量建模方法[3]、遥感数据饱和[4]等众多不确定性问题。
滇中区域作为中国的世界自然和文化遗产保护地,拥有丰富的森林资源[7]、较高的生物量和生产力,这些森林资源不仅为当地的社会经济发展提供了直接的物质基础,而且在维护地区生态和碳平衡中起着巨大作用[8],也为遥感估测蓄积量提供了较好的地域条件。
此外,虽然 Landsat 数据具备空间分辨率优势,但由于光学遥感成像易受天气影响,大范围的森林类型识别仍面临数据收集困难、处理效率低下等问题[9]。Google Earth Engine(GEE)遥感云计算平台的出现成为解决遥感数据收集困难和处理效率低下问题的新途径。GEE平台公共数据库中提供了目前广泛使用的地理空间数据集、机器学习算法和JavaScript、Python编程语言接口,方便用户对大规模的多源数据进行高效的分析处理[10]。因此,本研究使用Google Earth Engine云平台 Landsat 8 OLI 影像数据,以宜良县优势树种云南松为研究对象,通过外业样地调查并进行蓄积量计算,提取对应的多种遥感因子,筛选重要性因子,以寻找较为理想的建模方法,为区域生物量遥感估测提供技术和理论更新。
2 研究区概况
宜良县位于云南省中部,也是云南松的中心分布区,地处北纬24°30′36″~25°17′02″、东经102°58′22″~103°28′75″之间,东临陆良县、石林彝族自治县,南接弥勒市、华宁县,西与澄江市、呈贡区和官渡区毗邻,北同嵩明县、马龙区相连。宜良地势北高南低,山地与盆地相间,境内山脉多为东北至西南走向,全县平均海拔在1500~1800 m。宜良气候属北亚热带季风气候区。冬春干旱少雨,夏秋多雨湿润,冬无严寒,夏无酷暑,每年旱季为11月份至次年4月份,雨季为5~10月份,气温年差较小,日差较大,年平均温度16.3 ℃。
目前对其森林资源、生态环境和多树种分布等方面已有研究,但对该区域某单一树种分布变化的研究较少[11]。本研究围绕宜良县云南松空间分布变化展开。云南松(Pinusyunnanensis)分布于西藏东部、四川西部及西南部、云南、贵州西部及西南部和广西西北部,是西南地区的乡土树种,也是该地区的荒山绿化造林先锋树种,多分布于海拔1000~3200 m的地区,常形成大面积纯林。木材可供建筑、家具和木纤维原料业等使用;松根可培养茯苓;树皮可提栲胶;种子可榨油。
3 研究方法
3.1 数据来源
3.1.1 Landsat8 OLI数据源
本研究使用由 Landsat 8 OLI 的大气校正表面反射率(SR)数据。SR数据是由原始影像亮度值转换为地球表面的光谱辐射值,再转换为地球表面反射率值。
3.1.2 样地实测数据
宜良县2007年森林资源二类调查数据,样地信息包括:小班空间信息分布以及蓄积、树种、树龄、树高、胸径、郁闭度等。
3.2 数据处理
3.2.1 遥感影像处理
由于GEE平台提供的遥感影像范围是按卫星的飞行轨道显示,显示范围是正方形,因此分析前需要对遥感影像进行处理,以达到满足研究要求的精度,从而保证后期信息数据提取的真实性。
3.2.2 遥感特征因子提取
森林的构成不相同,则提取的植被参数就有差异,导致不同群落的生物量也各不相同,反映在遥感影像上表现出不同的色调、结构和纹理特征[12]。同时Landsat 8 OLI影像含有不同的波段,需要对遥感影像进行系列的处理、波段计算、变换、主成分提取等步骤获取遥感特征信息指数,并结合地面生物量调查数据建立一定的关系,以便计算或反演大尺度森林生物量。由此,能够反映出遥感影像特征的因子均能够作为遥感估测思茅松林生物量模型的备选变量。本研究将选取Landsat 8 OLI影像的纹理特征和光谱特征因子来构建云南松林的蓄积量反演模型。
3.2.2.1 纹理特征提取
纹理特征反映的是图像或图像区域所对应地物的表面性质,同时还能体现出地物的各种结构与周围不同环境信息的关系,以此反映地表所有的空间变化信息,从遥感影像中提取出纹理特征,以此来获得纹理信息因子定性或定量的描述,结果如图1~6所示。
图1 纹理特征1
图4 纹理特征4
图2 纹理特征2
图5 纹理特征5
图3 纹理特征3
图6 纹理特征6
图1~6说明:纹理特征反应的是图像或图像区域所对应地物的表面性质,同时还能够体现出地物的各种结构与周围不同环境信息的关系,以此反映地表所有的空间变化信息,从遥感影像中提取出纹理特征,以此来获得纹理信息因子的定性或定量的描述,这个过程称为纹理分析。
纹理是以灰度值的空间共生特性来衡量,细纹理的粗细是评价其空间变化的一种方法,纹理越细说明变化越快,随距离的增大,出纹理会有一定的变化。本研究共应用了6种纹理特征:均一性(Homogeneity, HO )、相异性(Dissimilarity, DI )、均值(Mean, ME)、角二阶矩(Angular second moment, SM)、熵(Entropy, EN)、相关性(Correlation, CC)。
3.2.2.2 植被指数因子
从遥感影像的可见光和近红外波段中,进行不同波段的重组,即得到研究中常用的植被指数,是对植被状况的量化。从植被指数中可以清楚了解植被的生长、叶片的发育情况等。近年来,大量研究通过对植被指数的定性和定量评价判定植被覆盖度和生长的活力,同时对森林生物量的变化做出灵敏的反应。因此本研究共选取了8种类型包括VIS234、SAV12,比值植被指数,MV17、MSR,差值植被指数,大气阻抗植被指数和地表反照率植被指数。提取结果如图7~图14所示。
图7 VIS234
图8 SAV12
图11 MSR
图9 比值植被指数
图12 差值植被指数
图13 大气阻抗植被指数
图14 地表反照率植被指数
图7~14说明:植被指数是遥感影像可见光和近红外波段的各种组合运算,是对地表植被状况的简单、有效和经验的度量。在遥感应用领域,植被指数已广泛用来定性和定量评价植被覆盖及其生长活力,同时对森林生物量的变化有灵敏的反映机制。因此本研究在参考国内外生物量遥感估测中所采用的植被指数的基础上,将选取包括多波段线性组合植被指数、归一化植被指数、简单比值植被指数和复杂植被指数等类型。
3.2.3 模型构建
3.2.3.1 变量筛选
筛选与蓄积量相关性高的,可以提高模型拟合效果的变量是研究的关键。特征选择是指在建模过程中通过一定的方法选取一个特征子集建立新模型的过程,这个子集包含更少的特征变量[11],在筛选变量前,变量集合中存在大量特征变量,并且这些变量间可能存在相关性,造成冗余,降低模型的运行效率和拟合精度。因此,为提高模型性能,获得对模型更重要的变量,需要对变量进行处理得到最优变量,本研究通过SPSS.22的皮尔逊相关系数(Pearson correlation cofficient; PCCs)对云南松遥感特征因子进行相关性分析,选取与蓄积量相关性p<0.05的遥感特征因子进行建模。
3.2.3.2 蓄积量模型构建
本研究根据宜良县Landsat 8 OLI遥感影像分布提取光谱特征和纹理特征,通过皮尔逊相关系数筛选后,获取最优的遥感变量参与构建基于遥感变量的生物量估测模型,对比分析多元线性回归的拟合效果和精度。
遥感图像综合记录了森林的各种特征,如森林的光谱特征、结构纹理特征等。这些特征取决于森林的类型、生长情况和场地条件。因此,可以利用统计建模技术来分析森林蓄积量与遥感影像特征之间的相关性。在此基础上,利用多元线性回归技术,森林体积遥感模型可以根据遥感因素的特征间接估计森林体积。
多元线性回归建模方法主要包括模型的参数估计、假设检验、残差分析以及最优回归方程的选取等。多元回归的一般表达式:
y=b0+b1x1+b2x2+…+bnxn
(1)
式(1)中:y为解释变量,b0为常数项,b1,b2,……bn为模型系数,x1,x2……xn为相关遥感特征因子,n为自变量个数。
3.2.4 模型评价与检验
模型评估是检验模型参考价值高低的重要组成部分。本文主要采用决定系数(R2)来对模型精度进行评价,当R2越接近1时,表示相关的方程式参考价值越高。相反,当R2越接近0时,表示参考价值越低。其计算公式如下:
(2)
选取相对均方根误差(RMSE)作为模型的独立性检验指标。其计算公式如下:
(3)
3.2.5 模型反演
利用森林蓄积量预测值绘制整个研究区的蓄积量空间分布图,利用所构建的模型计算云南松蓄积量值,最终反演出研究区云南松林的蓄积量。
4 结果与分析
4.1 遥感变量筛选
本研究通过SPSS.22的皮尔逊相关系数(Pearson correlation cofficient; PCCs)对云南松遥感特征因子进行相关性分析,选取与蓄积量相关性p<0.05的遥感特征因子,如表1所示,得到WLTZ,Albedo,DVI,B3,B1,WLTZ5,B2,B7和B5这几个遥感变量。
表1遥感特征因子筛选结果
4.2 多元线性回归模型构建
多元线性回归模型中(表2),云南松林遥感变量的决定性系数R2为0.259,调整后R2为0.236,标准估算错误为34.5579,拟合效果一般。
表2 多元线性回归模型描述
由模型系数显著性结果可知(表3),模型最终保留变量B1、DVI、Albedo、B7、B5、B3、B2、WLTZ5和WLTZ,以此建立云南松林多元线性回归蓄积量估测最优模型表达式,如公式(4)所示:
Y=91.654+0.007B1-0.09DVI-0.076Albedo+0.095B7+0.138B5+0.087B3+0.104B2+0.016WLTZ5-0.275WLTZ
(4)
4.3 蓄积反演
图15为采用多元线性回归模型进行的研究区蓄积量反演图。
图16为采用随机森林模型进行的研究区蓄积量反演图。
5 结论与讨论
5.1 结论
文中以云南省宜良县为研究区,以森林二类调查数据为基础,遥感数据源来自于Landsat 8 OLI影像,
表3 多元线性回归模型系数显著性
图15 多元线性模型下研究区蓄积量反演
图16 随机森林模型下研究区蓄积量反演
结合地面角规控制样地调查数据,提取纹理特征、植被因子、地形因子和K-T变换这四类遥感特征因子,利用多元线性回归模型和随机森林模型建立基于遥感特征因子的森林蓄积量估测模型,分析模型精度,获得最优估测模型的自变量,以期寻找较为理想的建模方法,为区域蓄积量遥感估测提供一定的理论参考。本研究中多元线性回归模型的R2为0.236,RMSE为34.5579,拟合精度有待提高。经过模型检验,该模型拟合误差较大,精度较低,拟合效果不佳。其原因可能存在于数据采集和模型选择上。宜良研究区地形地势复杂,在影像数据获取过程中存在一定程度的误差,导致在数据获取和处理过程中存在问题,此外,建模模型选择多元线性回归模型,忽略了森林数据的空间效应,导致有偏估计的产生。随机森林模型的R2为0.887,RMSE为1.1954,拟合精度极高,可以作为较为理想的建模方法。
目前,森林蓄积量的遥感估测研究大多集中在多源数据和多种模型的蓄积量估测,本研究尝试结合遥感数据源,建立蓄积量估测模型,并对其进行蓄积量反演,为综合考虑森林的生态学意义的森林蓄积量模型构建提供参考依据。
实测样地数据的获取需要消耗极大的人力物力,且外业成本较高,存在一定的局限性,在研究中通过二调数据与遥感特征因子相结合:一方面,解决地面数据与蓄积量匹配上存在的问题;另一方面,可以从二调数据中获取较为精确的数据来进行研究,进一步提高蓄积量模型的精度和估测能力,以期实现遥感特征因子与森林蓄积量的整合。
5.2 讨论
5.2.1 建模方法
本文采用相关性分析的方法从大量的遥感特征中选取与生物量密切相关且独立性强的变量建立森林生物量遥感估测模型,这种特征的筛选的方法是依据线性相关的大小选取的。而遥感特征与生物量间因子存在明显的非线性特征。某些与生物量相关性较低的特征与相关性较高的特征一起进入模型时,低特征会在很大程度上影响模型精度,所以利用线性相关性大小进行特征因子选取的合理性存在质疑。
随机森林作为非参数模型,可以很好地弥补参数模型的不足,从而大大提高精度,欠缺之处在于不能了解非参数模型的工作原理,但也可以为预测蓄积量提供一种可能性。
5.2.2 模型精度
本文研究所用的建模样本为森林资源二类调查数据,样地调查采用角规控制检尺的方法,还受调查者经验及调查时天气影响等,导致调查精度不高,加之遥感影像在高山峡谷处易变形,导致与地面实际样地的空间位置匹配度降低,影响模型的精度。此外,Landsat8 OLI数据主要是森林植被表层的光谱数据信息,缺少垂直结构信息,并且在一定程度上还会出现遥感信息饱和,导致蓄积量估测精度低。最后,由于地形、大气和传感器的不同等造成遥感数据与地物间的对应关系极其复杂。影像的处理达不到理想的状态,也是导致模型精度不高的主要原因[13~17]。
5.2.3 展望
(1)研究以Landsat8 OLI数据为遥感数据源,但数据所承载的信息有限,容易出现数据饱和现象。在今后的研究中将探索使用多源数据融合方法实现蓄积量估测。
(2)遥感数据是森林生物量遥感估测的基础。但获取的遥感数据普遍存在饱和现象,这也是影响估测精度的主要原因。下一步应加入地形、地貌、海拔等环境影响因素,进一步解决遥感数据估测森林蓄积量饱和点的准确性。