基于Landsat 8 OLI 影像的渭-库绿洲植被地上生物量估算
2021-11-22张殿岱王雪梅昝梅
张殿岱,王雪梅,2*,昝梅,2
(1. 新疆师范大学地理科学与旅游学院,新疆乌鲁木齐830054;2. 新疆维吾尔自治区重点实验室,新疆干旱区湖泊环境与资源实验室,新疆乌鲁木齐830054)
植被地上生物量(aboveground biomass,AGB)可直接反映植被初级生产力的高低以及生态系统结构的优劣,是监测和评价土地荒漠化的重要指标,在维持和改善生态环境方面起着不可替代的作用[1]。植被地上生物量主要用于森林生态系统生产力和群落动态特征等方面的研究,同时对于分析比较森林生物多样性、碳储量以及退化生态系统的恢复等方面具有重要意义[2−5]。与传统的生物量测定方法相比,遥感技术具有快速、准确、对植被破坏性小并能进行宏观监测的优势,已成为目前植被地上生物量估测的主要方法和研究手段[6−7]。
植被指数是对地表植被状况的简单、有效的度量,与地上生物量之间具有密切的相关性,被广泛应用于植被生长状况和地上生物量的遥感估算。对于大范围乔灌木地上生物量反演,Ghosh 等[8]使用多传感器协同数据,利用机器学习算法对印度北方邦境内的热带森林进行了地上生物量的估算。任怡等[9]通过Landsat 8 OLI 数据提取植被指数结合纹理特征构建乔木林地上生物量估算模型,具有很好的估算效果。随着遥感反演方法的进一步深入,乔正年等[10]利用Landsat 8 OLI 和GF−2 影像数据,引入调查样地杨树(Poplar plantation)胸高断面加权平均高构建的杨树生物量估算模型具有较高的估测精度。对于小区域乔灌木林地,杨国强等[11]、丁志丹等[12]和杨雪峰等[13]利用高分辨率遥感影像提取光谱信息、植被指数以及纹理特征,结合实地调查对林地生物量进行了遥感估算。在草地生物量遥感估测研究中,常使用MODIS 植被指数产品数据或Landsat 影像进行大范围草地生物量研究。赵慧芳等[14]基于MODIS−NDVI 数据结合野外调查,构建了青海省草地地上生物量遥感估算模型,为青海省草地资源保护和草地资源利用提供了科学依据。Zhou 等[15]利用MODIS−NDVI 数据集结合机器学习算法构建了三江源地区2001−2019 年草地生物量估测模型,认为高精度曲面模型能更准确反演草地地上生物量的空间分布特征。张雅等[16]利用Landsat 8 遥感数据提取6 种常用植被指数,运用统计分析方法建立了天山北坡紫泥泉牧场阳坡与阴坡的草地生物量遥感预测模型,并进行了生物量空间反演与验证。张爱武等[17]利用Landsat8的光谱衍生数据,通过植被的不同理化特征对青海省海晏县牧草生物量进行了准确估算。目前针对小尺度草地生物量估测常采用无人机多光谱影像、地面激光扫描技术以及高光谱影像数据进行遥感监测研究[18−20]。在农作物生物量遥感监测方面,常使用无人机航拍技术结合高光谱影像数据对农作物地上生物量及其冠层结构参数进行反演研究[21−22]。
综观当前植被地上生物量的遥感估算,发现多数研究主要集中于森林、草地和农作物等单一类型的生物量反演,针对结构复杂的荒漠绿洲植被的研究相对较少。干旱区荒漠绿洲植被地上生物量遥感估算是监测土地荒漠化的重要手段,对准确评价荒漠绿洲生态系统碳汇变化和维护绿洲生态系统的稳定具有重大的科学意义。但由于干旱区植被分布稀疏,类型复杂多样,常面临混合像元难以分解的问题[23]。目前对荒漠绿洲植被地上生物量的调查常通过提取植被信息并结合多种植被指数按植被类型分别构建生物量估测模型,从而提高植被地上生物量的反演精度[24−25]。考虑到新疆渭干河−库车河三角洲绿洲各植被类型的生物量差异显著,采用2019 年7 月Landsat 8 OLI 遥感影像与同期野外调查的植被地上生物量数据相结合,提取表征植被地上生物量特征的遥感因子,分别构建研究区乔木、灌木、草本以及农作物地上生物量的常规统计模型、多元逐步回归和偏最小二乘回归模型,通过验证分析得到各植被类型的最优估测模型,并对研究区植被地上生物量进行空间反演分析,为科学评价该荒漠绿洲生态系统稳定性和碳储量估算提供理论参考。
1 材料与方法
1. 1 研究区概况
研究区位于新疆南部塔里木盆地北缘的渭干河−库车河三角洲绿洲(以下简称渭−库绿洲),北起秋里塔格山,南接塔里木河北岸,西与温宿县接壤,东与轮台县、尉犁县相邻,是一个典型而完整的扇形平原绿洲,行政隶属阿克苏地区管辖,辖区内有库车市、沙雅县及新和县。该绿洲为温带大陆性干旱气候,多年平均气温为11. 6 ℃,多年平均降水量为52 mm,渭−库绿洲土壤类型较多,主要以潮土、灌淤土和灌耕棕漠土为主,且沼泽土、盐土、棕钙土等在研究区分布也较为广泛[26]。 该地区荒漠植被主要以小乔木柽柳(Tamarix ramosissima),乔木胡杨(Populus euphratica),灌木盐节木(Herculaneum strobilaceum)、盐穗木(Halostachys caspica),以及草本植物芦苇(Phragmites australis)、骆驼刺(Alhagi sparsifdia)、白刺(Nitraria tangutorum)等为主;农作物以棉花(Gossypiumspp.)、玉米(Zea mays)等为主[27]。
1. 2 材料获取与处理
1. 2. 1 野外调查与采样 2019 年7 月中到下旬在渭−库绿洲进行了为期12 d 的地面调查,共调查样点100个。其中农作物样点69 个,荒漠植被样点31 个,以各样点为中心进行植被样方调查。分别调查以柽柳为优势种的乔木样方(50 m×50 m)31 个,以盐节木和盐穗木为主的灌木样方(10 m×10 m)112 个,以及114 个1 m×1 m的以芦苇、骆驼刺为主的草本样方、69 个10 m×10 m 以棉花为代表的农作物样方,共调查植被样方326 个。植被调查工作均详细测量和记录每棵标准植株的株高、南北冠幅、基径以及各物种的频数、样方盖度等生长参数,并对各类植被标准株的地上部分进行现场取样,最终通过调查样本的干鲜重计算出整个样方内的地上生物量,在野外调查时对每个样点进行精确定位获取样点经纬度信息(图1)。
图1 研究区采样点分布Fig. 1 Distribution of sampling points in study area
为了不破坏植被生长,在荒漠植被稀少地区,对样地内的乔木和灌木群落分别测量每个典型物种标准株的冠幅长轴、冠幅短轴和株高,选取标准株进行标准直立枝的采样和生物量测定,并通过间接估算法,估测整个标准株的生物量;对草本群落和主要农作物棉花采用标准株直接收获法得到其生物量。在对样品的生物量测定过程中,为了保证测定的准确性,将获取的植株样本各器官进行分离,并用精度为0. 01 g 的天平分别称其鲜重后装入牛皮纸袋子中密封保存;带回实验室在80 ℃恒温干燥箱内烘干24 h,取出冷却20 min 后称其干重。通过标准枝的鲜重和干重计算其含水率,最后在Excel 表格中进行整理并计算标准植株的各器官生物量以及整株植被生物量,从而推算出各样方植被地上生物量以及单位面积生物量。
1. 2. 2 遥感影像获取与处理 研究区遥感数据采用与野外调查同时期的Landsat 8 OLI 卫星影像,成像时间为2019 年7 月26 日,遥感影像完全覆盖整个渭−库绿洲且影像质量良好,本研究使用影像1~7 波段。利用ENVI 5. 3 软件,对原始遥感影像进行辐射定标、大气校正、像元重采样以及图像裁剪和建立掩膜区等预处理。通过对研究区遥感影像基于多尺度分割,结合影像光谱信息、形状信息和植被指数信息构建初始特征空间,在野外调查的基础上采用面向对象的最近邻分类法提取乔木、灌木、草本和农作物这4 种植被的信息(图1)。通过实际调查样点对研究区遥感影像分类结果进行评价,总体精度为96. 64%,Kappa 系数为0. 95,可满足分类精度要求。
1. 3 建模因子的提取
利用软件ENVI 5. 3 的Band Math 工具,对预处理后的影像进行波段运算,计算7 种植被指数,分别为归一化植被指数(normal differential vegetation index,NDVI)、差值植被指数(differential vegetation index,DVI)、比值植被指数(ratio vegetation index,RVI)、土壤调节植被指数(soil adjusted vegetation index,SAVI)、修改型土壤调节植被指数(modified soil-adjusted vegetation index,MSAVI)、增强型植被指数(enhanced vegetation index,EVI)、大气阻抗植被指数(atmospherically resistant vegetation index,ARVI),各植被指数的计算公式见表1。为了使研究更为严谨与规范,在波段组合因子的选取上,选用波段灰度值、波段灰度值倒数、2 个波段比值、3 个波段组合比值和4 个波段组合比值的波段组合因子作为地上生物量估测建模因子,具体计算公式见表2。最终,本研究共选取7 个植被指数变量和37 个波段组合因子共44 个变量作为生物量估测模型的建模因子。
表1 植被指数计算公式Table 1 Calculation formulas of vegetation index
表2 Landsat 8 波段组合计算公式Table 2 Calculation formulas of Landsat 8 band combination
1. 4 生物量估测模型
选择常规的8 种统计模型、多元逐步回归(multiple stepwise regression,MSR)以及偏最小二乘回归(partial least squares regression,PLSR)进行研究区植被地上生物量估测模型的构建(表3)。PLSR 模型集成了多元线性回归、主成分分析和典型相关分析的优点,可避免数据非正态分布、因子结构不确定性和模型不能识别等潜在问题。
表3 常规统计模型的函数表达式Table 3 Function expressions conventional statistical model
1. 5 模型评价
本研究模型拟合效果主要是通过计算模型的决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)对地上生物量估测模型进行精度验证和评价[16,20]。R2值越接近1,表明模型拟合程度越好,RMSE 值越小、MAE 值越小,表明估测精度越高。其计算公式如下:
1. 6 数据分析
利用Excel 2019 软件进行野外实测数据的统计处理,结合ENVI 5. 3 软件提取建模所需的遥感因子,并运用SPSS 22. 0 和MATLAB 2018b 统计分析软件进行4 种植被类型地上生物量估测模型的构建;根据不同植被类型的地上生物量遥感反演的精度验证结果确定最优估测模型,并使用ArcGIS 10. 2 软件进行研究区植被地上生物量空间分布图的制作。
2 结果与分析
2. 1 生物量与建模因子的相关性分析
由于各变量之间存在一定的共线性,通过对生物量与各遥感因子的相关分析结果比较,本研究最终选择了与4 种植被类型地上生物量存在极显著相关关系的变量因子作为构建遥感估测模型的自变量(P<0. 01)。如表4 所示,乔木建模自变量集共有变量15 个,灌木建模自变量集共有17 个变量,草本建模自变量集共有变量9 个,农作物建模自变量集共有变量20 个。其中与乔木实测地上生物量相关最密切的遥感因子为B253,相关系数为0. 755(P<0. 01);与灌木和草本实测地上生物量相关最密切的变量因子为植被指数NDVI 和SAVI,相关系数分别为0. 720 和0. 711(P<0. 01);而与农作物实测地上生物量相关关系最为密切的变量因子为1/B3,相关系数为0. 756(P<0. 01),其次是1/B4,相关系数为0. 742(P<0. 01)。
表4 遥感特征因子与植被地上生物量相关性分析Table 4 Correlation analysis of remote sensing characteristic factors and aboveground biomass of vegetation
2. 2 植被地上生物量估测模型构建
2. 2. 1 乔木地上生物量估测模型及验证 利用各样方中心点坐标在遥感影像上提取出像元点的植被指数与波段组合因子与样方实测生物量,建立乔木地上生物量估测模型。将实测样方随机分为两组,其中21 个用于估测模型构建,10 个用于模型验证。由表5 可知,在常规模型中二次项模型建模效果最好;通过引入和剔除变量的检验,多元逐步回归模型最终选择的建模自变量为单变量因子(B253);以遥感因子B253、B453、NDVI 和B254为自变量的偏最小二乘模型具有较高的估测能力。经检验,上述3 种估测模型的回归效果均达到极显著水平(P<0. 001),估测模型的决定系数R2值依次呈现出二次项模型(0. 893)>MSR 模型(0. 812)>PLSR 模型(0. 745),均方根误差(RMSE)由低到高分别为:PLSR 模型 图2 研究区乔木最优模型验证Fig. 2 Verification map of arbors optimal model in the study area 表5 乔木地上生物量不同估测模型效果评价Table 5 Evaluation of different estimation models for aboveground biomass of arbors 2. 2. 2 灌木地上生物量估测模型及验证 由表6 可知,使用61 个灌木地上生物量的实测样方数据结合遥感因子构建的常规模型中以归一化植被指数(NDVI)为自变量的常规S 形曲线模型具有较好的估测效果;MSR 模型则以归一化植被指数(ND⁃VI)和增强植被指数(EVI)为自变量构建的效果较好;PLSR 模型则以8 个遥感因子构建的估测模型精度较高。为进一步确定植被指数和波段组合因子与实测植被地上生物量之间的回归关系,使用未参与建模的27 个实测样方数据对灌木地上生物量估测模型进行回归效果显著性检验(表6),这3 种估测模型均在0. 001 水平上达到极显著。从模型的拟合效果来看,MSR 模型的决定系数虽略低于PLSR 模型,但远高于常规S 形曲线模型,其验证集RMSE 值和MAE 值虽大于常规S 形曲线模型,却仍低于PLSR 模型。因此,通过综合比较,选择由归一化植被指数(NDVI)和增强植被指数(EVI)构成的多元逐步回归(MSR)模型作为研究区灌木地上生物量的最优估测模型,进一步对实测生物量与估测生物量构成的散点图进行分析,二者具有较高的拟合度(图3)。 图3 研究区灌木最优模型验证Fig. 3 Verification of shrubs optimal model in the study area 表6 灌木地上生物量不同估测模型效果评价Table 6 Effect evaluation of different estimation models for aboveground biomass of shrubs 2. 2. 3 草本地上生物量估测模型 通过遥感影像提取建模因子,并结合28 个实测草本样方地上生物量数据构建研究区草本地上生物量估测模型。由估测模型的建模精度和验证结果可知(表7 和图4),这3 种估测模型的回归效果均达到了极显著水平(P<0. 001)。其中,以NDVI、SAVI 和RVI 等7 个建模因子构成的PLSR 模型具有最高的估测精度,建模和验证集的决定系数均达到最高,建模RMSE 值依次为PLSR 模型<二次项模型 图4 研究区草本最优模型验证Fig. 4 Verification of herbs optimal model in the study area 表7 研究区草本地上生物量估测模型精度评价Table 7 Accuracy evaluation of estimation model for herbs aboveground biomass in the study area 2. 2. 4 农作物地上生物量估测模型 通过44 个农作物实测样方数据和遥感建模因子构建农作物地上生物量估测模型(表8),常规统计模型以S 型曲线拟合效果较好,MSR 模型则选取1/B3作为建模自变量,由5 个建模自变量构成的PLSR 模型具有较高的估测精度。通过分析3 种模型的拟合效果,决定系数较高的是常规S 型曲线模型,其次是PLSR 模型,两个估测模型的决定系数均大于0. 6,MSR 模型的决定系数相对较低;建模RMSE 由小到大分别为PLSR 模型、MSR 模型和S 型曲线模型;MAE 以MSR 模型最小,其次是PLSR 模型,S型曲线模型最大。用19 个实测样方数据对3 种农作物地上生物量估测模型进行验证,结果表明(表8):这3 种估测模型的回归效果均达到极显著水平(P<0. 001)。PLSR 模型的R2大于常规S 型曲线模型,略低于MSR 模型,验证RMSE 和MAE 也属中等水平。 综合比较建模和验证结果,选择精度较高,预测较为稳定的PLSR 模型作为研究区农作物地上生物量最优估测模型,并对该模型估测生物量与实测生物量的散点图分析可知(图5),估测值与实测值具有较好的一致性。 图5 研究区农作物最优模型验证图Fig. 5 Verification map of crops optimal model in the study area 表8 研究区农作物地上生物量估测模型精度评价Table 8 Accuracy evaluation of crops aboveground biomass estimation model in the study area 结合研究区分类结果(图1),采用ENVI 5. 3 软件对研究区4 种植被类型的地上生物量进行遥感反演,并将地上生物量(AGB)估测结果按照取值范围划分为4 个等级,同时利用ArcGIS 10. 2 软件进行研究区植被地上生物量空间反演图的制作和结果统计(图6 和表9)。分析认为,研究区植被地上生物量由高到低依次为农作物>乔木>灌木>草本。农作物具有种植密度大,植被盖度高的特点,其地上生物量总体水平较高,在280~1450 g·m−2分布,且主要以Ⅲ、Ⅳ等级为主,其中第Ⅳ等级分布面积最广,面积占比可达66. 04%,但在不同的种植和管理方式下,农作物地上生物量也存在一定的空间差异。由于乔木形态高大且有明显主干,与灌木和草本相比其地上生物量相对较高,主要以Ⅱ、Ⅲ等级为主,所占面积分别为175. 23 和212. 98 km2,而第Ⅰ等级的乔木生物量占比最低,仅为16. 74%;研究区灌木总面积为2087. 74 km2,地上生物量主要集中在280~950 g·m−2,即在第Ⅲ等级占比可达99. 98%,而在Ⅰ、Ⅱ等级仅有极低的分布。灌木主要分布在渭−库绿洲荒漠过渡带以及荒漠区,植被以盐节木和盐穗木为主,地上多分枝,根系较发达,具有很强的防风固沙和抗旱能力,对防止研究区土壤流失,调节地表生态环境具有重要作用;草本地上生物量主要在280 g·m−2以下,分布在Ⅰ、Ⅱ等级,且在第Ⅰ等级占有较高的比重。草本以芦苇和骆驼刺为主要植被类型,形态低矮无木质主干,由于放牧等人为干扰导致草地退化现象较为严重,地上生物量较低且主要分布于绿洲边缘过渡带和荒漠区域。 图6 研究区植被地上生物量估测Fig. 6 Estimation of vegetation aboveground biomass in the study area 表9 研究区植被地上生物量统计Table 9 Statistics of vegetation aboveground biomass in study area 通过对新疆渭干河−库车河三角洲绿洲提取植被指数与波段因子与实测植被地上生物量进行相关分析,筛选出20 个遥感因子分别构建乔木、灌木、草本和农作物地上生物量估测模型。其中,乔、灌木林地生物量以波段组合B253和植被指数NDVI 与EVI 为建模因子构建的多元逐步回归模型反演效果最佳(P<0. 001),研究进一步证实了叶静芸等[24]在乌兰布和沙漠东北缘荒漠−绿洲过渡带植被地上生物量估算中所得的结论,说明通过提取遥感光谱信息结合线性统计模型可准确估算荒漠植被地上生物量。研究表明综合多波段光谱信息的偏最小二乘模型能准确进行研究区草本和农作物地上生物量的反演,康孝岩等[20]和贾学勤等[28]的相关研究也认为充分利用植被光谱信息的偏最小二乘模型可有效估测植被地上生物量。 随着遥感信息技术的快速发展,对于植被生物量估算的方法和模型也在不断多元化。Ali 等[29]和Nesha 等[30]利用机器学习、随机森林等非参数模型对植被生物量进行估算研究。在常规参数模型的基础上,引入非参数模型将成为植被地上生物量估测的发展趋势。在建模过程中,可对建模因子做进一步优化,综合利用遥感影像光谱特征,还可结合纹理信息以及地形等环境因子,进一步解释植被地上生物量的空间分布特征[31−32]。因此,在未来的生物量估测过程中,需要考虑对影像光谱信息的深入挖掘,引入更多影响植被地上生物量的环境因子,从而提高反演模型的适用范围和估测精度。由于植被的生长随区域自然条件的改变而呈现出不同的区域特征,本研究构建的植被地上生物量估测模型是否适用于其他地区还需进一步调查验证。 以新疆渭干河−库车河三角洲绿洲植被为研究对象,利用遥感影像和野外实测植被地上生物量数据,分别对乔木、灌木、草本及农作物这4 种主要植被类型构建地上生物量反演模型,并通过精度验证对比分析认为,研究区乔木与灌木地上生物量的最优估测模型为多元逐步回归模型,草本与农作物地上生物量的估测模型以偏最小二乘回归模型为最优。进一步验证,4 种模型的决定系数均在0. 6 以上,均方根误差和平均绝对误差值较小,达到了模型估测的精度要求(P<0. 001)。通过反演模型估算,研究区植被地上生物量由高到低依次为农作物>乔木>灌木>草本。地上生物量主要集中在280~1450 g·m−2,以Ⅲ、Ⅳ等级为主,所占比重为76. 54%,分布面积约为6973. 82 km2;低水平地上生物量(ABG<65 g·m−2)区域约占研究区总面积的15. 02%。通过对渭−库绿洲植被地上生物量的空间分布特征进行分析,认为土地利用方式、地形及水文条件不同使得植被地上生物量空间分布格局存在明显差异。2. 3 植被地上生物量的空间分布
3 讨论
4 结论