APP下载

鄱阳湖流域植被覆盖与水域面积遥感监测方法研究

2022-04-26彭彦霖吴风华

关键词:覆盖度植被指数决策树

彭彦霖,吴风华

(华北理工大学 矿业工程学院,河北 唐山 063210)

引言

衡量地表植被最重要的指标之一是植被覆盖度,它被用作土壤侵蚀监测和分布式水文模型的重要输入参数[1]。陈晋等认为利用遥感数据估计植被覆盖的主要方法有2种:经验建模方法和植被指数转换方法。经验模型法基于大量的测量数据,在小范围内具有一定的精度,但在推广应用上存在诸多局限性[2]。2004年李苗苗等人在对像元二分模型2个重要参数推导的基础上改进了已有模型的参数估算方法,建立了用 NDVI归一化植被指数定量估算植被覆盖度的模型[3]。刘海等使用归一化植被指数NDVI对鄱阳湖植被生长覆盖信息进行提取,利用像元二分法计算植被覆盖度[4]。

国际上,Rahmat Zarkami等利用决策树模型对伊朗多个高盐湿地进行了丰度预测;Choudhury与 Gillies等通过植被指数法估算美国西北部针叶林的植被覆盖度得出99%置信度下相关性为0.55;Leprieur等利用NDVI和像元二分模型推算了Sahelian地区SPOT卫星影像的植被覆盖度;Hansen等基于MODIS影像,利用决策树法和线性回归模型的相互结合推算了森林乔木层覆盖度,得出基于分类决策树估算的覆盖度效果更好、精度更高。

1关键技术描述

1.1 水体指数法

水体指数法通过分析水体的光谱特征,与其他地物特征进行分析对比,发现并找出水体与这些地面特征之间的差异和变化特征,然后生成针对提取水体的水体指数模型。学者Mcfeeters创建了归一化差异水体指数(NDWI),通过将绿光波段和近红外波段做比值运算可以在很大程度上减少植被信息,进而达到突出水体信息的目的。其表达式为:

(1)

在Mcfeeters归一化差异水体指数的基础上,重新组合并修改了该指数的几个波段[5],并对不同类型的水体数据进行处理,大都取得良好的结果,其公式为:

(2)

Gudina.Feyisa构建了自动水提取指数AWEI,将TM数据的各波段重新分配权重,然后进行运算,其精度比MNDWI与最大似然分类方法更高[6]公式为:

AWEI=4(b2-b5)-(0.25b4+2.75b7)

(3)

式中,b2、b4、b5、b7分别表示绿色、近红外、短波红外1、短波红外2波段,表示影像波段反射值,此算法可以抑制植被、建筑物信息,减少噪音,使得水体和非水体的反射率值差异明显,可以有效地提取水体。

1.2 归一化植被指数NDVI

归一化植被指数(NDVI)是一种重要的植被指数,其取值范围是[-1,1] ,可以代表植被的覆盖情况,数值越大,植被情况越好,一般绿色植被的NDVI区间为[-0.2,0.8]。

(4)

1.3 植被覆盖度计算

现阶段最为常用的通过遥感手段研究植被覆盖的方法就是通过植被指数来估算植被覆盖度。其中,多种植被指数中归一化植被指数NDVI最为实用且效果最好。李苗苗等在像元二分模型的基础上研究的模型如下:

(5)

式中,NDVISoil为完全是裸土或无植被覆盖区域的NDVI值,NDVIVeg则代表完全被植被所覆盖像元的NDVI值,即纯植被像元的NDVI值。

1.4 决策树法提取植被覆盖

分类决策树模型是一种对实例进行分类的树形结构,决策树由节点和有向边组成。节点有2种类型:内部节点和叶节点。内部节点表示一个特征或属性,叶节点表示一个类。用决策树分类,从根节点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子节点;每一个子节点对应着该特征的一个值。按此方式递归地对实例进行测试并分配,直到达到叶节点。最后将实例分到叶节点的类中。生成与训练数据集矛盾较小的决策树,同时具有很好的泛化能力[7]。在规则的获取和决策树的建立中,根据经验和专家知识可以第一步得到适用于湖区湿地的决策树分类规则,随后设置节点的名称、表达式以及子集。如果所选影像数据具有波长信息,ENVI就能够完成自动匹配计算NDVI所需要用到的近红外和红光波段。如果没有就需要进行手动指定波段。

2研究案例

1.1 研究区概况

地处江西省北部的鄱阳湖是我国面积最大的淡水湖泊,位于北纬28°22'~29°45',东115°47'~116°45',信江、修水、赣江、抚河和饶河等水系在鄱阳湖整合汇聚后进入长江创造了以鄱阳湖为中心的完整生态、水文系统。如图1所示为鄱阳话矢量边界图。

图1 鄱阳湖矢量边界图

2.2 数据来源

采用来自Landsat8、Lansat7以及高分一号卫星的5期影像。选取鄱阳湖2020年8月21日丰水期、2019年1月23日枯水期的两景影像;GF-1 WFV 相机可以获取 16 m多光谱彩色图像(蓝、绿、红、近红外4个波段)。研究采用高分一号卫星2020年06月16日影像。数据来源于地理空间数据云,如表1所示。

表1 影像数据信息

2.3 数据处理

所有通过遥感系统得到的原始影像都经过了投影变换,这个过程一定会产生不同程度的几何形变。因此,需要进行数据预处理,对影像数据进行预处理的内容主要有:Landsat7影像的条带修复工作、辐射定标、大气校正、投影转换。处理流程如图2所示。

图2 数据处理流程

3鄱阳湖水域面积提取

3.1 水体指数法

水体指数法通过分析水体的光谱特征,与其他地物特征进行分析对比,发现并找出水体与这些地面特征之间的差异和变化特征,然后生成针对提取水体的水体指数模型。水体指数处理结果如图3、图4所示,其中各图比例尺均与图3(a)一致。

图3 不同模型处理结果

图4 不同模型处理结果

3.2 NDVI提取水体

在提取水体信息、水域面积等多种方法中,归一化植被指数是较为常见的一种方法。鄱阳湖区经过NDVI计算后,新建感兴趣区选取合适的阈值来进行水陆分离。首先将阈值设置为0,提取-1~0范围内的像元,NDVI<0时提取的像元就是水体。据此可以提取出大部分的湖区、河流等面积较大的水体。但对于湖区边界水陆交接处、泥沙含量较多的水体、面积较小的坑洼和细小河道的提取效果不尽如人意。当阈值为0.150时,可以最为准确地将水体和非水体区别开,提取水体的效果最佳。提取结果如图5所示。

图5 GF-6NDVI提取水体

3.3 水域面积计算

由新建的感兴趣区裁剪得到水体指数计算后的影像,进一步得到水体像元。计算出水体像元的数量,进而根据每个像元的面积计算得到水域覆盖的总体面积。通过归一化差异水体指数模型 NDWI 计算得到表2所示面积。

表2 NDWI模型计算面积结果

在确定水体阈值时,经过反复测试,并通过对比原始影像,最终 L8-1、L8-8、L7-7 三期图像数据的水体阈值确定为0.05,其效果均比较准确合理。L7-2确定阈值为-0.1 时丢失水体信息较少,效果较好。通过归一化差异水体指数的改进模型 MNDWI 计算得出的面积如表3所示。

表3 MNDWI模型计算面积结果

MNDWI 模型中,数据 L7-2 水体阈值的确定也和其他数据稍有不同。其他三期数据取值为 0.15,L7-2 阈值取为 0.05。通过自动水提取指数 AWEI 计算得出的面积如表4所示。

表4 AWEI模型计算面积结果

通过 AWEI 模型计算后,数值均比较大。除L8-8的三期影像水体像元的值均为数值较大的正数,其他像元均为负数,数值上的区别非常明显。当图像阈值取值数据相同时,图像 L8-8水体信息明显丢失较多。最后,经过对比调整确定为-650时效果最好,能够较为全面地涵盖水体像元。

3.4 水体提取结果分析

根据图5不同模型的效果图对比可知,NDWI模型漏提水体最多,其中较小的坑洼、较为细窄的河道被忽略较多,提取到的水体信息最少,其余2个水体指数模型效果较好。MNDWI和AWEI模型精度很高,水陆分离效果明显,漏提信息较少,且二者都在很大程度上抑制了其他地物的影响。如图6所示为不同模型提取结果细节对比,图7为五期图像数据、水域覆盖专题图通过前面的数据处理以及对比分析可以知道,该项试验中 L8-1、L8-8、L7-2、L7-7四期影像数据使用自动提取水体指数 AWEI模型处理的结果最为准确;GF-6数据通过归一化植被指数 NDVI进行水域面积提取,在经过 ArcMap中重分类等操作后进行专题制图。根据以上分析可知,通过自动水提取指数 AWEI 对水体面积信息提取效果最好,故以 AWEI 模型处理结果为准进行分析,其分析结果如表5所示。

图6 不同模型提取结果细节对比

图7 鄱阳湖不同时期水域覆盖专题图

表5 水体面积提取结果

4鄱阳湖植被覆盖信息提取

4.1 利用归一化植被指数提取植被覆盖度

归一化植被指数(NDVI)可有效削弱大气反射等不利影响,增强遥感影像中的植被影响力,精确反应植被信息是当前最常用的指标之一,利用其调查植被生长状态、植被覆盖度等植被相关信息时都能取得不错效果。因此,利用归一化植被指数公式进行计算,NDVI取值范围在-1~+1之间,其计算结果如图8所示。

图8 NDVI计算结果

然后计算植被覆盖度,根据植被覆盖度计算模型可知NDVISoil为完全裸土或无植被覆盖区域的NDVI值,NDVIveg则代表完全被植被所覆盖的像元的NDVI值。根据数学统计原理,选取一般符合正态分布规律下的置信区间的显著性水平α取0.05,所以置信区间取为5%~95%。所以选取计算完NDVI值,置信区间为95%左右的最大值NDVImax为NDVIveg,取置信区间为5%左右的最小值NDVImin为NDVIsoil。利用ENVI中的Band Math工具计算,得出图像数据NDVI置信区间取值范围如表6所示,其中L7-7图像由于鄱阳湖正处在洪水期间,水位大幅上涨水域覆盖极广,影像比较特殊,所以置信区间取值比较极端。

表6 NDVI 置信区间取值范围

图9所示为L8-1的植被覆盖度示例。其属性值在[0,1]之间,调整其注记颜色。图9为一月份枯水期影像所以水体较少大部分是裸地和有植被覆盖的土地,其中颜色越深代表其植被覆盖度越高,相反显色浅接近白色就是水体。丰水期影像,其湖区水域几乎覆盖全部边界,仅仅有靠近边界部分,水陆交界处有极少植被覆盖。

图9 L8-1植被覆盖度

4.2 决策树法提取植被覆盖

决策树法的重点在于分类规则的制定或获取,进行决策树分类大致过程包含:根据知识经验定义规则,编写表达式,分类和分类后处理。在进行分类规则公式化时,表达式中的数学符号、特定函数和语法规则必须符合ENVIIDL的规范。第一步进行规则的获取和决策树的建立,第二步提取植被覆盖度,根据经验和专家知识构建的决策树,分类结果的地物数仅包含5类:裸地、水体和根据NDVI值大小分出3类植被。分类结果如图10所示。

图10 决策树提取植被覆盖

4.3 2种提取植被覆盖方法对比分析

图11所示为归一化植被指数计算植被覆盖度FVC,图12所示为决策树分类提取植被覆盖度。总体来说,基于归一化植被指数计算的植被覆盖度,输出成果比较方便,可以根据需求调整分类等级梯度和不同的注记颜色,成图更加美观。另外,由于基于知识、专家经验的决策树植被覆盖提取受到分类规则获取、分类层次较少等因素的限制,实际应用中基于归一化植被指数计算的植被覆盖度效果更好。

图11 决策树提取植被覆盖 图12 植被指数计算植被覆盖

5结论

(1)将水体信息提取的3种方法:归一化差异水体指数模型及其改进的模型、自动水体提取指数法模型进行比对,通过细节的精度验证,得出自动水提取指数法模型对水体信息的提取精度最高,结果最为准确。

(2)在植被覆盖信息提取中对比了根据植被指数估算植被覆盖度,并依据专家经验、知识的决策树分别对植被覆盖信息进行提取。通过比较两者的提取效果,得出在实际应用中根据植被指数估算植被覆盖度更加方便实用。

猜你喜欢

覆盖度植被指数决策树
基于Google Earth Engine的有色金属资源型地区植被覆盖度动态变化分析
——以安徽省铜陵市为例
植被覆盖度和降雨侵蚀力变化对小流域泥沙连通性的影响
偃师区不同坡度带植被覆盖度分布研究
基于无人机图像的草地植被盖度估算方法比较
气候变化与人类活动对植被覆盖的影响
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
浅谈植被指数的分类与应用
决策树在施工项目管理中的应用