APP下载

时序Sentinel-1和Sentinel-2 数据支持下的鄱阳湖湿地草本植物群落制图分类

2023-07-13张琍罗文庭张皓寰殷秀琬李斌

遥感学报 2023年6期
关键词:植被指数鄱阳湖水体

张琍,罗文庭,张皓寰,殷秀琬,李斌

1.江西师范大学 鄱阳湖湿地与流域研究教育部重点实验室,南昌 330022;

2.江西师范大学 地理与环境学院,南昌 330022;

3.华中师范大学 城市与环境科学学院,武汉 430079;

4.北京师范大学 地理科学学部,北京 100875;

5.联合国教科文组织国际自然与文化遗产空间技术中心南昌分中心,南昌 330022;

6.中国石油大学(华东) 海洋与空间信息学院,青岛 266580

1 引言

湿地是维持水生植物和陆地野生动物生物多样性和环境服务的生态单元(Dahl,2000;Maltby和Acreman,2011)。鄱阳湖是中国第一大淡水湖,是一个过水性湖泊,拥有国际重要湿地保护区,是越冬候鸟和水生植物的重要栖息地。作为“地球之肾”,湿地可以提供多项生态系统服务,具有涵养水土、改善区域气候、固碳和净化水体等功能(Mitsch 等,2013)。近年来,由于气候、水文条件变化和人类活动的影响,鄱阳湖湿地覆盖面积、生物群落组成和结构都发生了显著改变。例如,枯水期延长和水质下降使湖区水生植被覆盖面积逐渐减少,物种组成由5—8 种下降至3—5 种(胡振鹏和林玉茹,2019)。围垦种养、非法采砂以及过度放牧等人类活动也对该地区的生态环境带来了重要影响,造成了湿地植被面积的减少(胡振鹏 等,2015)。所以,对鄱阳湖湿地水体、植物群落的长期高频监测及其变化分析工作迫在眉睫,湿地监测与制图成为了保护湿地环境,及有效评估湿地修复与保护的措施的重要依据。同时,由于鄱阳湖湿地的高动态变化,湿地监测除了大范围全方位监测外,对时间上高频次监测也有较高要求,而传统的监测方式往往会耗费大量的人力和物力。近年来,遥感以其大范围、长时序、高频次监测的优点,被广泛应用于湿地植被监测与湿地制图工作中。

目前,遥感卫星数据已被证明是有助于系统湿地调查的重要手段(MacKay 等,2009;Adam等,2010;Wang 和Yésou,2018)。具有中分辨率和粗分辨率(10—1000 m)的光学数据已被广泛用于湿地遥感制图,例如陆地卫星传感器(Nielsen 等,2008;MacAlister 和Mahaxay,2009;Kayastha 等,2012;Han 等,2015;李大冲 等,2018;朱金峰 等,2019;卢善龙 等,2011)、EOS MODIS(Landmann等,2010;Tana等,2013;Han 等,2018)、SPOT(Davranche 等,2010),Sentinel-2 MSI(Hird 等,2017;Whyte 等,2018)和NOAA AVHRR(Zoffoli 等,2008)。但是,由于目前鄱阳湖分类研究中,利用的卫星图像的分辨率过于粗糙或重访周期较长,其湿地分类结果在分类类型和识别精度上都有一定局限。特别是针对鄱阳湖湿地植物群落分类时,由于其植物群落大部分为禾本科草本植物,因其光谱相似性,单一时相的遥感数据无法对其进行正确的分类,需要多时相的数据来提取物候特征进行分类。但若湿地区域属于多云多雨区,或研究区范围较小或较狭窄时,湿地植物群落分类或湿地制图精度就会大大下降。所以,同时拥有较高空间分辨率和较高时间分辨率的光学数据是进行湿地植物群落制图和变化监测的关键。除此之外,雷达数据受天气影响较小,且能反映植被的结构特征,故光学数据和雷达数据的结合进行湿地分类是提高湿地植被分类精度的一种较好的选择(Slagter 等,2020)。欧洲航天局的哥白尼计划提供的Sentinel系列数据不仅有双极化雷达数据(Sentinel-1)也有较高时空间分辨率的光学卫星数据(Sentinel-2)。此外,Sentinel-2 卫星数据在植物红边区域拥有更高的光谱分辨率,这有利于我们更好地区分不同种类的植物群落。

在湿地分类方法研究中,学者们通常选择植被指数、纹理特征、光谱特征等(Shi 等,2021;Tu 等,2021;张磊 等,2019)进行植被遥感分类特征输入,同时,物候特征也是区分不同种类植物群落的关键。故利用长时序遥感数据产品并结合植被物候特征可以较好地进行植物群落分类。在分类方法选择中,面向对象分类(Dronova 等,2011;张猛 等,2017),机器学习方法,包括支持向量机(Han 等,2015;Tu 等,2021)、随机森林(Shi 等,2021)和深度学习方法,包括卷积神经网络(DeLancey等,2020;Du等,2020)、深度神经网络(Li 等,2015 年;Rezaee 等,2018;Martins 等,2020)已经广泛用于复杂湿地分类与制图中,尤其是使用中高等空间分辨率数据。相较于传统的计算机分类方法,这些分类方法更加高效,且能保持一定的分类精度,并且能同时利用光谱、物候和空间特征对复杂的湿地地类进行分类。

由于遥感数据特征较多,分类方法也各具优势,如何在众多特征和分类方法中,选取一套适合于鄱阳湖湿地草型植物群落分类的方法对鄱阳湖区长期连续的监测工作而言是非常必要的,本文拟探究出一套有效的基于多源多时相遥感数据的鄱阳湖湿地植物群落提取的分类组合方案。本文首先调查了湿地优势植物群落并确定植物群落分类体系,利用2019年长时序监测的Sentinel系列卫星数据,提取不同植物群落月度的光谱、植被长势、物候和植被结构等特征变量,并对比运用随机森林、支持向量机和深度神经网络的分类方法,展示不同特征组合方案和分类方法下鄱阳湖湿地植被制图效果,比较了不同方案的分类精度,探讨出一套适合鄱阳湖湿地植物群落遥感分类方案,以评估多源遥感数据在鄱阳湖湿地植被监测中的应用潜力,为鄱阳湖湿地保护与决策提供有力技术支撑与数据基础。

2 研究区和数据

2.1 研究区域

鄱阳湖是中国最大的淡水湖,其位于江西省北部,地理位置在28°22'N—29°45'N,115°47'E—116°45'E,如图1 所示。鄱阳湖是典型的季节型、吞吐型湖泊。鄱阳湖水主要来自降水和当地五条河流(赣江、修河、信江、饶河、抚河),丰水期可能出现长江倒灌。由于高动态的水文变化,鄱阳湖的湿地景观表现为“丰水一片、枯水一线”的湖泊景观。在枯水期,鄱阳湖水位下降,湖底暴露在空气中,这有利于湿地植被的生长,同时为西伯利亚冬季候鸟提供了重要的栖息地(Kanai等,2002)。近年来,由于气候条件与人类活动的影响,鄱阳湖生态环境正在逐步发生变化,生物多样性下降及沼泽化现象成为了目前鄱阳湖面临的主要问题(胡振鹏 等,2015;Han 等,2015)。为保护鄱阳湖,国家政府在鄱阳湖区域建立了两个国家级自然保护区(鄱阳湖国家级自然保护区(PLNNR)和鄱阳湖南矶山湿地国家级自然保护区(NWNNR)),本文选取鄱阳湖国家级自然保护区为研究区域,其地理位置如图1 所示。保护区内,主要土地覆盖类型为水体、沙地、泥滩和植被,本文通过野外调查和文献分析,根据研究区内湿地优势植物群落分布情况(胡振鹏 等,2010),将湿地植物群落分为南荻芦苇、苔草虉草、菰、蓼及其他等4种植物群落。最终,本文将湿地分类类型定为南荻芦苇、苔草虉草、蓼、菰群落、泥滩和水共6个类别,其中,水体为常年有水的区域。

图1 鄱阳湖及鄱阳湖国家级自然保护区(PLNNR)和样本点示意图Fig.1 Poyang Lake and Poyang Lake National Nature Reserve(PLNNR)and sample points

2.2 数据

在这项研究中,本文使用的数据分为卫星影像数据和样本点数据两大类。

卫星数据包括Sentinel-1 和Sentinel-2 数据。由于鄱阳湖地区多云多雨,光学卫星影像可能因天气限制而无法被应用到分类中。雷达影像具有全天候工作的优点,可以不受天气的限制。所以本文将结合多源遥感数据对植被进行分类,除了Sentinel-2光学数据以外,本文还选择了Sentinel-1雷达数据进行对比分析。Sentinel-1 数据集是欧洲航天局(ESA)提供的一款双极化C-band 雷达数据,该卫星在研究区的重返周期为12 d,A、B 两颗卫星互补可使其重返周期达到6 d,空间分辨率为5 m×20 m,本文将其重采样到10 m。Sentinel-2卫星是光学卫星,携带一个多光谱成像仪(MSI)。该卫星可见光和近红外波段的空间分辨率可达10 m,它在植被红边区域包含3个波段的数据,这些都非常有利于植被分类。Sentinel-2分为A、B两颗卫星,两颗卫星互补可使其重返周期达到5 d。本文使用的卫星数据均在欧洲航天局官网(https://scihub.copernicus.eu/dhus/#/home[2022-03-30])下载。本文对2019年研究区内的卫星影像进行筛选,最终得到高质量影像共21 景,数据相关信息如表1所示。

表1 卫星数据采集表Table 1 Table of Satellite images selection

本文使用的样本点数据主要通过实地采样和Google Earth 目视解译两种方式获取。我们先后于2019 年1 月、2019 年3 月、2019 年7 月、2019 年11 月4 次进入鄱阳湖国家级自然保护区湿地,通过实地采样共获得90 余个精确样本点。同时,本文利用Google Earth 高分辨率影像进行选点,借助Collect the earth 在线平台(https://www.collect.earth/[2022-03-30]),分别提取采样点和各类样本点的年内时序NDVI 曲线,识别不同植物群落的物候变化特征曲线,比对已有样本点的曲线,定义各采样点的类别。最终,得到了南荻芦苇、苔草虉草、菰、水体、泥滩、蓼和其他6 类,共计183 个样本点,样本点的分布如图1所示。

3 研究方法

本文利用预处理后的数据,对水体指数、植被指数、红边指数、纹理特征和雷达极化特征进行提取,并结合光谱波段,最后得到了5组特征变量。然后使用随机森林、支持向量机和深度学习的分类方法进行分类。通过分析,探究出一种最优的湿地植被分类方案。本文的具体流程如图2所示。

图2 技术流程图Fig.2 Flow chart

3.1 数据预处理

Sentinel-1 SAR 数据在SNAP(http://step.esa.int/main/download/[2022-03-30])和ENVI(https://envi.geoscene.cn/[2022-03-30])上完成数据预处理。使用SNAP 软件进行预处理,分别进行辐射定标、噪声去除、几何校正、地形校正后得到VV 和VH 后向散射系数,并进行镶嵌裁剪,得到研究区内VV、VH极化后向散射数据。

Sentinel-2 数据主要利用SNAP 和ENVI 进行辐射定标、大气校正、地形校正、重采样、波段合成和拼接裁剪处理后得到地表反射率数据。其中大气校正主要是利用SNAP 软件(http://step.esa.int/main/download/[2022-03-30])中的Sen2Cor v2.5.5 插件(http://step.esa.int/main/third-partyplugins-2/sen2cor/[2022-03-30])完成。

3.2 分类特征选取

在本次研究中,本文筛选出了9 景Sentinel-2数据和12景Sentinel-1数据,使用的分类特征分为5 组,分别为8 个波段的光谱特征、5 种水体指数及植被指数、3 种红边指数、8 种纹理特征和2 种雷达极化数据。其中除雷达后向散射系数数据来自Sentinel-1 数据以外,其余数据产品均由Sentinel-2 数据提供或计算而来。各分类特征的具体信息如表2所示。

表2 特征变量介绍Table 2 Features selection

本文选取Sentinel-2 的B2、B3、B4、B6、B7、B8和B8a共8个波段作为光谱特征变量输入。选取归一化水体指数NDWI 和能有效反映植被长势的4 种植被指数(NDVI、OSAVI、EVI 和DVI)作为“水体—植被指数组”加入分类特征,帮助区分水体和各植物群落。同时,本文考虑到不同植被的生长状态与物候特征呈现周期性变化,不同植物群落生长期、成熟期、衰落期存在一定差异,故选取了新型倒红边叶绿素指数(IRECI)(Frampton等,2013)、叶绿素指数红边(CIre)(Gitelson 等,2003,2006)、归一化植被指数红边1(Ndre1)(Gitelson 等,2003;Gitelson 和Merzlyak,1994)3 种红边指数作为红边指数组加入分类特征。选择的纹理特征是使用Sentinel-2 数据在ENVI 上计算得到的,为避免冗余,首先对13 个波段进行主成分分析,输出最能反应地物特征的第一主成分,再基于灰度共生矩阵GLCM(Gray-level Cooccurrence Matrix),以3×3的处理窗口,45°的扫描角度,对输出结果进行纹理特征提取,共提取了影像平均值、方差、同质性、对比度、差异性、熵、二阶矩、相关性共8类特征,作为纹理特征组加入分类特征。由于雷达数据能反映植物群落结构特征,所以本文将其纳入分类特征中,以探讨多源遥感数据对湿地植被分类的帮助。

3.3 分类方法选择

本文选取的分类方法共3种,分别为随机森林(RF)、支持向量机(SVM)和深度神经网络(DNN)。

GEE(Google Earth Engine,https://code.earthengine.google.com/[2022-03-30])是一个可以批量处理卫星影像数据的云平台,其具有免费、云计算、数据获取方便等特点。它被广泛应用在时间序列分析或大范围制图等环境遥感领域,本文借助该平台内置的分类函数,实现了随机森林和支持向量机两种分类方法的分类。在分类时,随机选取70%样本点数据作为训练样本,剩余30%样本点数据作为验证数据。

深度学习的分类采用了基于深度神经网络DNN(Deep Neural Networks)的分类方法进行分类。基于DNN 深度学习的遥感影像分类主要分为3 部分:训练数据的制作,模型的训练,模型的推理。本文是基于Pytorch 深度学习框架完成的。其主要优点在于结构简单,训练样本数据量要求较低,模型推理速度快,比较适合于湿地植物群落分类。

3.4 分类实验方案设计

本文进行了3组实验,分别是分类特征单独分类、组合分类和深度学习分类。

本文共有5 组分类特征,他们分别包含72、45、27、72 和24 个特征变量。单独使用每组特征变量,在GEE 平台上分别使用随机森林和支持向量机两种方法对地物进行分类。此外,还尝试研究优选特征变量对提高分类结果精度的效果。借助GEE 平台重要性分析函数,通过量化特征对结果的贡献分别计算得到5 组特征变量的重要性值,对每组分类特征中的各个特征变量进行重要性排序,并优选出每组分类特征中排名靠前的特征变量,得到五组优选特征变量。本文同样将这5组优选特征变量在GEE 上使用随机森林和支持向量机算法进行分类,并做精度评价。

为探究不同分类特征之间的互补性,将五组特征变量进行组合,再使用随机森林和支持向量机算法进行分类。为避免数据冗余和提高特征组合的有效性,选择前文提到的5组优选特征变量而非初始的5组变量进行组合。最终使用穷举法确定了26 种组合分类方案,其中包括10 种“双特征”组合方案、10种“三特征”组合方案、5种“四特征”组合方案和一种“五特征”组合方案。然后在GEE 中对数据进行波段合成,以实现特征变量组合分类。

第3 组实验是基于前两组实验的基础上进行的,本文将根据最后的分类精度对不同分类特征进行排序(包括单独的分类特征和组合的分类特征),并选取最优的两种特征组合,使用深度神经网络DNN对研究区进行训练分类,对比随机森林、支持向量机和深度神经网络3种分类算法的分类精度和分类结果。

3.5 精度评价

在本研究中,本文使用混淆矩阵计算得到的Kappa 系数和总体精度来评价3 种分类方法的分类精度。

4 结果

4.1 湿地植物群落遥感特征分析

由于鄱阳湖湿地植物群落的分布受到水文条件的影响非常大,且水位的波动在年内的差异达到10 m 及以上,湿地植物群落都是禾本科草本植物群落,单一时相的卫星图像无法很好的识别植物群落,故需要通过物候变化特征来解决湿地植物群落识别提取的问题。基于年内湿地植物群落分布变化较小的前提,本文选择年内多时相的遥感参数来提取植物群落的生长变化特征,确定可进行植物群落分类的遥感参数,生成年度湿地植物群落分布图。

图3 展示了研究区内各植物群落NDVI 指数年内变化趋势,可明显发现,4 种植物群落平均NDVI 均在0.7 处达到饱和。苔草虉草,南荻芦苇以及蓼和其他群落的NDVI 值呈现明显的“M”型变化趋势,在丰水期,苔草虉草的NDVI 低于零值。且由于植物群落不同的生长特性,南荻芦苇两个生长季的峰值不同于苔草虉草群落的出现位置,具有明显的“初次生长晚,二次生长早”的特点,该点可用来区分两种植物群落。菰作为一种典型的挺水植被,由于可以通过调整自身生理机能,伸长根部减少水淹胁迫来适应水环境,即使是在丰水期(200 天左右)也能够表现出较平稳的生物量。常年水体覆盖区域水体的NDVI 时序谱均显示为负值,泥滩的NDVI 在全年中大部分时间为负值。

图3 湿地植物群落NDVI变化趋势图Fig.3 The changing trend of NDVI for different wetland plant communities

由于选取了72 个波段、45 个植被指数和水体指数、27 个红边指数及24 个雷达极化指数。按照划分的4种典型植物群落样本点计算特征均值,选取B8(NIR)、NDVI、NDre1、IRECI、Clre、DVI、EVI、NDWI、QSAVI、VV、VH、及纹理(Variance)等12 个指数的典型月份进行差异性分析,结果如图4所示。结果显示除了纹理特征外,其他特征都在不同植物群落上有一定的区分度,植被指数组、红边指数组在各种类间的区分度高于单一遥感(近红外)波段,而在植被指数组合中,OSAVI 的区分度并不明显。综上所述,区分草型湿地植物群落主要特征变量选取应以红边指数与植被指数组合为主。

图4 12种特征变量在不同植物群落中的差异性分析(其中特征名称后的数字表示月份)Fig.4 Difference analysis of twelve characteristic variables in different plant communities(The number after the feature name indicates the month)

4.2 单一分类特征组分类

针对单一分类特征组进行基于随机森林算法的特征重要性排序,在此基础上优选特征变量,从重要性分布图看,在红边指数组中(如图5 所示),排序靠前的10 个指数主要为Ndre1,IRECI和Clre 且出现频次相似,表示3种红边指数对植被分类的贡献类似,从月份来看,5 月、9 月和1 月份的数据为主要时段。而在水体—植被指数组中(如图6 所示),在排序靠前的10 个指数中,DVI,NDVI 的贡献略大于其他植被指数,优选月份分布主要在1 月、10 月和12 月。基于重要性排序图,将特征重要性从大到小进行排序,当后面变量重要性值几乎相等时,将此前的变量确定为优选变量,每组具体数量信息见表3。

表3 5组特征变量优选前后分类精度结果对比表Table 3 Comparison of classification accuracy results before and after optimization of five groups of features

图5 红边指数组各月份重要性值图Fig.5 Importance values variation of red edge indexes of different months

图6 水体—植被指数组各月份重要性值图Fig.6 Importance values variation of water and vegetation indexes of different months

单一特征组的分类精度如表3 所示,其中a 为全部特征变量分类结果,b为优选特征变量分类结果。在单一特征组的分类精度排序中,各组分类特征的排序为红边指数组>水体—植被指数组>光谱特征组>雷达极化数据组>纹理特征组。说明红边指数组和水体—植被指数组在各分类特征中更有利于区分不同植物群落。对比优化前后分类特征的分类精度,可以看到优选特征变量后的分类精度大部分都高于优选前的特征变量。这说明根据特征变量的重要性排序对变量数据进行优选并去除冗余,有利于提高分类精度。对比两种分类算法的分类精度结果,随机森林的分类精度要高于支持向量机。

4.3 组合分类特征组分类

由于随机森林的分类结果要优于支持向量机的分类结果,本文在讨论组合分类时选择随机森林的分类结果为代表进行分析。本文得到了26 种组合分类方案的分类精度结果,并将上文中单一特征组的分类精度与组合特征组分类精度进行对比,做出综合排序。表4展示了综合排序中靠前的10种分类特征。

表4 优选特征变量分类结果Table 4 Classification results of optimal features groups

对比单一特征组和组合特征组分类的分类结果,可以发现,组合特征组并不一定有利于分类精度的提升,单一特征组中红边指数组和水体—植被指数组的精度仍高于其他组合特征组的分类精度。

雷达数据的加入对分类精度的提升有一定作用,但并不绝对。如综合排序中第8种特征组合精度会因为雷达数据的加入而降低。

4.4 不同分类方法对比

将分类精度最优的红边指数组和水体—植被指数组两组特征变量,利用深度神经网络DNN 方法进行分类,分类精度结果如表5所示。对比深度神经网络和前文中两种分类方法的分类精度。可以看到总体精度排序为深度神经网络>随机森林>支持向量机。

表5 基于最优组合的不同分类算法分类结果Table 5 Classification results of different algorithms based on optimal features group

4.5 湿地植物群落分类图

随机森林RF、深度学习DNN、支持向量机SVM 算法的最优特征组合分类结果图如图7 所示,研究区内各植物群落呈环状分布,菰、苔草虉草和南荻芦苇群落在碟形湖周围沿水位梯度依次分布。对比不同分类方案的结果,可以看到,各分类结果中苔草虉草的分布较为一致,南荻芦苇群落、菰、水体与泥滩的提取结果有一定的差异。差异的区域主要分布在不同植物群落的交错带,特征相似性导致不同分类方法在群落交汇处的判别有所差异,总的来说,深度神经网络DNN 的分类结果精度更高。而从特征选择的角度,基于红边指数组的分类精度高于水体—植被指数组,约提高了2 个百分点。不同分类方法对比可以看出,随机森林RF、深度神经网络DNN 和支持向量机SVM 方法在分类精度上,运用较高分类精度的红边指数组作为特征组,不同算法的精度排序为:深度神经网络DNN(0.83)>随机森林RF(0.81)>支持向量机SVM(0.77)。从分类精度来看,随机森林与深度学习网络DNN 的分类精度相差不大,深度神经网络DNN 仅提高了2 个百分点。在水体、植被指数组两种方法的分类精度基本一样。这说明,深度学习分类方法在中等分辨率的遥感数据分类中有效,但是相对于机器学习中的随机森林RF 方法,其分类精度的提高并不显著。支持向量机SVM 的方法整体精度略低于随机森林RF 方法,主要表现在菰与南荻芦苇的分类精度相对较低。

图7 分类图像(RF为随机森林、DNN为深度神经网络模型、SVM为支持向量机)Fig.7 Classification images(RF is random forest,DNN is deep neural network model,SVM is support vector machine)

5 讨论

5.1 数据的选取和处理

综上所述,从单一的光学或雷达遥感数据源进行湿地植物群落分类结果对比,Sentinel-2 光学卫星数据的分类效果要明显优于Sentinel-1雷达数据,故在光学数据充足的情况下,应尽量选取高时空分辨率的光学卫星数据进行湿地植物群落监测与制图,但是在没有足够多光学数据的情况下,雷达数据可以作为一个有效的补充数据源进行湿地制图。

在解决特征数据冗余的问题上,根据特征变量的重要性排序,对特征变量进行优选,可以减少数据冗余,提高分类精度。优选特征变量共有95 个,表6展示了这95个变量随月份分布的结果,结合图5 和图 6中重要性排序的结果,可知优选特征变量主要集中在1月、5月、8月、9月、10月和12 月。对比参与分类的4 类植物群落的物候特征,可以发现优选特征变量的时间分布与不同植物群落在随时间变化的生长状态差异有关。如在10 月份,苔草虉草群落在退水后快速生长,生物量较高,且由于温度适宜,其茂盛的生长状态可以保持到11 月底和12 月初,之后其会因为气温的下降而开始枯黄;而南荻芦苇群落则在10 月就已经进入到了荻花期,群落生物量开始下降,群落整体颜色变黄,两者在10 月的生长状态差异性较大,所以可以较好地对这两个群落进行提取。相反,在各类湿地植被生长状态较为相似的4 月、7 月,优选特征变量的分布则较少。综上,在选择数据时,可以优先选择1月、5月、8月、9月、10月和12 月的数据,这些时段各类植被之间生长差异性较大,更有利于进行区分。对于由于天气原因缺失光学影像的2 月、3 月、6 月,本文认为其中应该也存在优选月份,比如3月份为湿地植物群落的萌发期,不同植物群落萌发时间有差异,故是如果3 月有数据,应该是在优选月份内。但是1 月与2 月,6 月与7 月由于景观相似可能都不算较为理想的优选月份。

表6 优选特征变量月份分布表Table 6 Months distribution of optimal features

5.2 分类特征和分类算法

在众多分类特征组合方案中,红边指数组和水体-植被指数组的多时相组合能更好地区分各湿地植物群落。这说明相较于遥感图像不同的差异化特征,纹理特征在草型植物群落分类中并没有很好的作用,而起关键作用的还是植被生长的物候特征的差异,在物候特征表达的过程中,相较于多种特征的组合方案,单一特征方案更有利于植物群落分类精度的提高,其中红边指数组的特征变量组合分类精度最高。

基于同特征组合,对比3 种不同的分类算法,深度神经网络的分类精度要优于随机森林和支持向量机,但是精度提升比例不高,说明在Sentinel-2 这种中等空间分辨率卫星数据下,相较于深度学习和机器学习方法,深度学习算法并不占优势。对于分类算法的选择上,深度神经网络DNN 和随机森林RF 的算法都可以作为鄱阳湖湿地植物群落分类的优选算法,根据自身需要进行选择即可。

6 结论

本文以鄱阳湖国家级自然保护区为研究区域,从数据、分类特征和算法等方面对鄱阳湖湿地植物群落分类方法进行研究,提出了一套适合于鄱阳湖草型湿地植物群落分类的遥感数据分类组合方案。主要结论如下:

(1)本文选择Sentinel-1 和Sentinel-2 数据进行分类,根据各特征变量的重要性排序和分类结果精度可得,在湿地植被监测中,Sentinel-2 卫星数据的应用效果要优于Sentinel-1 雷达数据。当缺少Sentinel-2 影像时,可以选取Sentinel-1 数据作为补充,但多源数据的加入对提高分类精度的效果并不理想。

(2)在对单一特征变量组和组合特征变量组应用的研究中,分类精度排序为:红边指数组>水体—植被指数组>组合特征变量组。这说明在各特征变量中,红边指数组和水体—植被指数组能更好地反映不同植物群落之间的差异。

(3)基于GEE 重要性提取函数,对特征变量进行优选操作,能减少数据冗余,有利于提高分类效率和精度。其中,优选特征变量在时间上主要分布在1月、5月、8月、9月、10月和12月。

(4)3 种算法的分类精度排序为:深度神经网络>随机森林>支持向量机。深度学习DNN 和机器学习RF 分类精度相差不大,故都可以作为湿地植物群落分类的优选算法。

基于以上结论,本文推荐在进行鄱阳湖湿地群落分类时,选取1月、5月、8月、9月、10月和12 月的多时序Sentinel-2 数据,将计算得到的红边指数组和水体—植被指数组作为主要分类特征,选择深度神经网络或随机森林的算法进行分类。

另外,该分类方案对鄱阳湖、洞庭湖这类水文条件变化较大的草型湿地植物群落区的湿地制图有一定的指导意义,并不一定适用于其他地区的湿地植物群落分类。关于不同湿地的植物群落分类方法,还需要根据实际情况进行深入研究。

最后,特征选择依然是值得探索的问题,例如,本文在提取纹理特征时,窗口、角度设置较为单一,研究不同窗口、角度情况下纹理特征对于分类结果的影响,是我们下一步将要开展的工作。

猜你喜欢

植被指数鄱阳湖水体
鄱阳湖水系之潦河
农村黑臭水体治理和污水处理浅探
生态修复理念在河道水体治理中的应用
《鄱阳湖生态系列插画》
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
广元:治理黑臭水体 再还水清岸美
鄱阳湖好风光
主要植被指数在生态环评中的作用