Sentinel-1时序后向散射特征的海岸带盐沼植被分类
——以长江口为例
2022-05-12赵欣怡田波牛莹陈春鹏周云轩
赵欣怡,田波,牛莹,陈春鹏,周云轩
华东师范大学河口海岸学国家重点实验室,上海 200062
1 引 言
盐沼生态系统以耐盐草本植物或灌木为主,广泛分布于全球中高纬度、沉积物丰富且水动力较弱的河口、泻湖等潮间带区域(Scott 等,2014)。盐沼具有较高生产力,可提供消浪护岸、净化水源、动植物栖息地、蓝碳碳汇等多种生态服务价值(Costanza 等,1997)。已有研究发现,不同盐沼植被在波浪衰减、固碳固氮等生态服务功能上提供的价值具有明显差异(Ysebaert 等,2011;Zhang等,2010)。
由于围垦造陆、海岸带工程、滩涂养殖、外来物种引入、水质污染等人类活动及海平面上升、气候变化影响,全球盐沼生态系统处于退化状态(Crosby 等,2016;Gedan 等,2009)。1980年—2010年,围垦工程、气候变化等原因导致中国海岸带59% 盐沼丧失(Tian 等,2016;Gu 等,2018)。河口入海泥沙淤积、潮滩变化则导致局部区域新生盐沼增长,如长江河口九段沙区域近年来植被面积增速超过500 hm2/a(朱串串,2018)。中国海岸带盐沼不仅面积数量发生变化,植被结构也快速发生变化,典型如互花米草入侵,造成植被种间组成和空间结构快速转变,中国海岸带本土盐沼植被群落受到破坏,对生态系统结构和服务功能造成影响(Liu 等,2018)。因此,准确快速获取盐沼植被空间分布与种间组成信息对于生物多样性保护、湿地生态系统功能提升与海岸带生态环境管理等具有重要意义。
遥感能够实现大范围连续观测,可快速提取植被信息。然而,Landsat、MODIS 等传统光学遥感数据光谱分辨率较低,单景光学影像中“同物异谱,异物同谱”现象显著,简单指数计算方法难以实现种间分类(Lin 等,2015;张猛等,2017)。利用植被物候期分类依赖大量高时间分辨率遥感影像,但海岸带区域受云雾影响,全年可用光学影像数量往往无法满足分类需求(Dong 等,2016;李清泉等,2016)。此外,周期性潮汐会淹没植被前缘,并导致下垫面湿度变化,使得植被外缘无法准确提取且植被光谱混淆难以识别(O’Connell 等,2017)。利用LiDAR、高光谱遥感等辅助信息可在小范围内提升分类准确性,但数据获取难度较大且成本较高,不适用于大范围植被提取(Betbeder 等,2015;Millard和Richardson,2013)。
合成孔径雷达SAR(Synthetic Aperture Radar)具有全天时全天候、穿透云雾特点,能获取长时间序列影像数据,可反映盐沼植被完整生长周期内变化信息,在湿地植被识别中具有潜力。已有研究将时序SAR 数据运用于湿地植被分类,包括提升热带多云雾区域湿地木本、草本植被间以及木本植被种间的分类精度(Jhonnerie 等,2015;Reiche 等,2015)。盐沼种间分类方面,大量实验指出草本沼泽湿地适合采用C波段或X波段,森林沼泽湿地适合采用波长较长的L 波段(Zhang 等,2016)。多数研究使用Radarsat-2、TerraSAR-X 等全极化影像,采用极化分解结合多源数据监督分类方法进行,并已证实此类方法有助于提升盐沼分类精度(Mleczko 和Mróz,2018)。但由于全极化SAR 数据价格高、成像范围小的特点,此类研究多采用小范围单景SAR 影像,不适用于大范围盐沼制图,且无法利用SAR 数据时序性强的优势。因此,探讨使用范围大,易获取的双极化SAR 数据,结合时间序列特征进行大范围盐沼信息提取的方法与技术,具有重要的实践意义。
2014年升空的Sentinel-1 卫星获取C 波段SAR数据,具有时空分辨率高,获取成本低廉优点,适用于时序分析研究。此外,得益于谷歌地球引擎GEE(Google Earth Engine)的云计算功能,大量SAR 数据的快速计算得以实现。基于此,本文以长江口为研究区域,结合植被实测数据,利用时序Sentinel-1 雷达数据,提出了基于植被物候期多时相雷达后向散射特征优选的海岸带盐沼植被分类方法。通过分离阈值法SEaTH(seperability and the corresponding thresholds)选取最优分类特征,利用随机森林方法提取了2018年长江口盐沼植被空间分布,通过精度计算验证了时序SAR 与植被物候特征结合进行海岸带盐沼植被识别提取可行性,对于提升海岸带盐沼植被种间分布识别精度和时效性具有重要意义。
2 研究区与数据
长江口(图1)为中国最重要的河口潮滩区域之一,包括崇明岛、长兴岛、横沙岛3岛与上海最大沙洲九段沙。长江口盐沼分布较为集中区域包括崇明东滩,崇明北部黄瓜沙,崇西西沙湿地、九段沙与南汇东滩。长江口主要盐沼植被群系包括芦苇(Phragmites australis)、互花米草(Spartina alterniflora)、海三棱藨草(Scirpus×mariqueter)、藨草(Scirpus triqueter)。此外,崇明岛南岸分布有以池杉(Taxodium ascendens)和旱柳(Salix matsudana)群落为主的潮间森林沼泽。
图1 研究区位置Fig.1 Location of study area
研究使用雷达数据来自欧洲航天局哥白尼计划GMES (Global Monitoring for Environment and Security)中Sentinel-1卫星上搭载的C波段SAR传感器。长江口Sentinel-1 数据极化方式为VV(vertical transmit/vertical receive)+VH (vertical transmit/horizontal receive),2018年重访周期12 d,选用IW(Interferometric Wide Swath)模式下GRD(Ground Range Detected)数据,分辨率10 m,获取2018年影像数据58 景。Sentinel-1 遥感数据获取及处理在GEE(https://earthengine.google.com[2019-09-23])与ENVI 5.1上进行。
验证数据部分来自2017年、2018年6—10月获取的野外实测数据,调查采用样线样方方法,利用GPS(仪器误差±10 m 获得采样点经纬度坐标,记录植被类型、植被高度、盖度情况。部分区域由于地貌情况复杂无法进入,由无人机拍摄影像获取。
3 研究方法
3.1 雷达数据预处理
本文所采用Sentinel-1 数据预处理包括应用轨道文件、GRD 边界噪声消除、热噪声消除、辐射校正、地形校正。算法均由GEE 通过调用Sentinel-1 工具箱完成。采用5×5 窗口Improved Sigma Lee 滤波器抑制相干斑噪声。该滤波器可保留异质性强的小区域,同时保持匀质的均一区域,适用于植被混生或单一生长的不同情况(Lee 等,2009)。
3.2 典型盐沼植被时序雷达后向散射特征
海岸带盐沼草本植被的雷达信号散射机理复杂,随着植被下垫面潮汐水位逐渐降低,雷达信号依次产生镜面散射、二次回波散射、体散射和面散射,雷达影像后向散射系数大小关系一般满足:二次回波散射>体散射/面散射>镜面散射。细分至植被类型,机理更为复杂,雷达后向散射强度受到不同种类植株特性、植被密度、土壤沉积物、潮水淹没情况等多方面因素综合影响。本文不过多讨论机理问题,主要分析时序雷达遥感数据应用于潮滩植被分类的优势和特点。
图2 技术路线Fig.2 Technical route
长江河口潮滩区域地物主要有6 种类型:芦苇、海三棱藨草/藨草、互花米草、潮间森林沼泽、光滩与水体。根据野外实测数据选取地物典型均质样点,共获得样本像元2408 个。分别统计2018年间每个对应日期中不同地物VV 与VH 极化下所有像元均值,获得典型地物时间序列后向散射曲线(图3)。
图3 VV、VH极化主要地物全年时序后向散射强度Fig.3 Annual time series backscattering intensity of main features in VV,VH polarization
分析时序后向散射曲线可见,盐沼植被后向散射强度与光滩、水体、潮间森林沼泽区别显著。潮间森林沼泽VH 极化后向散射强度明显高于盐沼植被,约在-14 dB 以上,主要由于交叉极化主要贡献为植被冠层之间的体散射,对植被结构敏感(Steele-Dunne 等,2017)。雷达信号在水体与光滩表面多发生镜面散射,VV 与VH 两种极化方式下后向散射强度均低于其他地物,VH 极化水体后向散射强度恒定低于-30 dB。
不同盐沼植被全年时序后向散射特征与植被生长物候和植株形态相关。海三棱藨草/藨草在1—4月内VH极化后向散射强度明显偏低,主要由于其为潮滩地带先锋物种,植株相对矮小且在冬季枯萎倒伏,往往露出下部光滩或受到潮汐淹没,发生镜面散射。4月中后期海三棱藨草/藨草开始生长,后向散射强度出现明显升高,至5月末后向散射强度逐渐趋于稳定。
芦苇与互花米草为多年生禾本科植被,秋冬季节叶片枯萎后茎秆仍保持直立,因而整全年后向散射强度变化程度相对较小。VV 极化3—4月可观察到芦苇后向散射强度出现一定增幅,是由于长江口芦苇3月中下旬从地下根茎长出芽,4月进入快速生长期。相同区域内成熟互花米草植株高度略低于芦苇,在秋冬季节更易倒伏;互花米草为穗状花序,小穗易脱落,而芦苇圆锥花絮膨大宽达10 cm,且能经秋冬而不脱落。由于茎秆、叶片、花序等形态特征不同,芦苇7—12月后向散射强度持续高于互花米草。
3.3 分离度计算与特征选取
对样本点内各像素点2018年全年平均后向散射强度进行直方图统计分析可知(图4),水体与光滩在VV 与VH 极化与其他地物分离性好,VV 极化后向散射强度集中在-16.5 dB 以下,VH 极化集中在-27 dB 以下。潮间森林沼泽在VV 极化与芦苇在-10—-7 dB 出现部分出现混淆,但VH 极化后向散射强度-15 dB 以上部分与盐沼植被分离度好。可见,将全年VH 极化下后向散射强度平均值作为分类特征即能将水体、光滩、潮间森林沼泽与盐沼植被进行较好区分。
图4 VV、VH极化主要地物全年平均后向散射直方图Fig.4 Annual average backscatter histogram of main features in VV,VH polarization
盐沼植被间,3类植被之间在VV与VH极化下均出现不同程度混淆。其中,海三棱藨草/藨草由于受潮汐与下垫面影响较大,在VV 与VH 极化出现不规则双峰。芦苇均质程度最高,呈现明显单峰,且全年后向散射强度保持最高。VV 极化下互花米草与芦苇分离性较好,但二者均与海三棱藨草/藨草出现部分重叠。VH 极化下海三棱藨草/藨草与芦苇分离性较好,但二者分别与互花米草混淆明显。
综合植被生长特性与Sentinel-1 重访周期,以月时间单位进行3种盐沼植被后向散射强度直方图统计,根据植被生长期、茂盛期、枯萎期主要选取1月、4月、7月和11月等4 个月份VV 和VH 极化后向散射强度频率直方图进行分析(图5)。海三棱藨草/藨草后向散射强度变化随季相变化最为显著,芦苇后向散射强度最大且最为稳定。VH 极化下,冬、春两季海三棱藨草/藨草后向散射强度跨度在-45—-15 dB,尤其春季与芦苇、互花米草分离性最好,至夏季后向散射强度出现快速增大。互花米草在VV 极化下,秋冬两季后向散射强度出现明显下降,与海三棱藨草/藨草、芦苇分离性提高。因此,春季VH 极化适合提取海三棱藨草/藨草、春季VV 极化适合提取芦苇、秋冬VV 极化适合提取互花米草。
图5 盐沼植被物候生长期平均后向散射直方图Fig.5 Average backscatter histogram of salt marshes in January,April,July and October of VV,VH polarization
为精确判断不同盐沼植被后向散射强度间分离程度,采用分离阈值法(SEaTH)(Nussbaum等,2006)从类间距离对特征进行评价。该算法基于Jeffries-Matudita 距离进行分类特征选取,利用高斯混合分布模型进行阈值计算。本文通过计算1—12月每月3 类盐沼植被相互间J-M 距离,进行分类特征选取。J-M距离计算方法有以下步骤:
(1)计算巴氏距离B值:
(2)计算分离度J值:
式中,m1和m2表示两个类别某特征均值,σ1和σ2表示两个类别标准差,B为巴氏距离,J为两个类别在某特征下分离度,J∈[0,2),J值越大代表分离度越高。
根据上式计算VV 与VH 极化下3 种植被两两之间直方图分离度,并计算每种植被与另两种植被J-M 值之和,得(表1)。互花米草、海三棱藨草/藨草与芦苇分别在11月VV 极化、4月VH 极化与3月VV极化下分离度最高。
表1 VV、VH极化下盐沼植被相互J-M距离之和Table 1 The sum of the J-M distances between the salt marsh vegetation in VV,VH polarization
3.4 基于最优时序雷达特征的盐沼分类
根据上文分析,将全年VH 极化、4月VH 极化、11月VV 极化、3月VV 极化均值作为盐沼植被最佳分类特征,对3个均值特征波段进行假彩色合成(图6),以九段沙与崇西区域为例,可明显看出各植被间差异,互花米草呈现草绿色,海三棱藨草/藨草呈紫色,芦苇呈灰白色,潮间森林沼泽为亮白色。
图6 时序雷达假彩色合成影像(R:全年VH极化后向散射强度平均值,G:4月VH极化后向散射强度平均值,B:11月VV极化后向散射强度平均值)Fig.6 Time-series false color radar image(R:annual average backscattering intensity of VH polarization,G:average backscattering intensity in April of VH polarization,B:average backscattering intensity in April of VH polarization)
基于最优特征,采用随机森林方法进行盐沼植被监督分类,随机森林方法的稳健性在多个研究中已被证实,全球范围内20%训练样本点出错的条件下,仍能保证精度降低在1%以内(Gong 等,2019)。可有效解决盐沼植被混生现象严重且光谱特征易混淆,GPS误差和高分辨航片目视采样易造成的误判。在研究区域内生成0.5 km×0.5 km网格,每个网格中随机生成1个样本点,根据实地调查与高分辨航片进行赋值,共获得样本点1492 个,随机选择70%作为训练样本输入随机森林模型,30%作为验证样本,建立决策树100棵,实施分类并去噪。所得2018年长江口盐沼植被提取结果如图7所示。
图7 2018年长江口及典型区域盐沼植被雷达分类结果Fig.7 Map of salt marsh in the Yangtze River Estuary and typical area in 2018
4 结果与讨论
4.1 精度分析
运用验证样本建立混淆矩阵(表2),混淆矩阵中将光滩与水体合并为水体类别。总体分类精度达85.8%,Kappa 系数为0.80。水体与潮间盐水沼泽分类精度最高,达94%以上。其中,由于潮间森林沼泽在研究区域内分布极少,仅获得少量样本。研究区内丁坝码头等人工建筑由于后向散射强度较高,往往被误判为潮间森林沼泽,但混淆矩阵中未能体现。
表2 混淆矩阵Table 2 Confusion matrix
3 类盐沼植被中互花米草分类精度最高,海三棱藨草/藨草与芦苇精度次之。主要原因在于海三棱藨草/藨草植被条带往往较窄,且受到潮位和下垫面土壤影响,容易出现错分。芦苇错分主要出现在崇明东滩区域。根据调查得知,崇明东滩在2018年以前受到人类放牧活动影响,区域内芦苇植株大量受到牛群踩踏、啃食,植株高度往往在20—30 cm,远小于芦苇自然生长区域2—3 m 的株高。2018 长江口开展生态修复治理后,崇明东滩芦苇恢复生长,但植株相对其他区域芦苇群落仍较为矮小,多被误判为互花米草。崇明西沙区域局部芦苇植被带直接与光滩、水体相接,边缘区域易被错分为互花米草。
4.2 SEaTH与随机森林方法下最优特征比较
随机森林算法不仅可以实现遥感影像的分类,而且能够基于统计学方法计算不同特征变量的重要性(Genuer 等,2010)。对比SEaTH 与随机森林方法选择的最优特征,以验证本文特征选择效果。
将VV、VH 极化全年和各月共26 个后向散射均值作为特征,5 种地物类型样本点输入随机森林,计算得各特征值精度贡献率(图8(a))。可以看出,随机森林选择出精度贡献率最大特征为VH 极化4月均值与VH 极化全年均值,与上文选择的最优特征一致。
但本文另两个最优特征在随机森林中精度贡献率较低。观察到贡献率最大特征前5 个均为VH极化,是由于VH 极化对于水体信息非常敏感,导致区分植被种间的特征波段贡献率降低。再次使用26 个特征值,仅将4 种植被样本输入随机森林,计算各特征值精度贡献率(图8(b))可见,区分植被种间时VV 极化的贡献率更大,尤以9—12月秋冬季节贡献最为显著。在此条件下,上文选择的VH 极化4月均值与VV 极化11月均值为随机森林前三贡献率特征,匹配程度很高。
图8 不同样本类型下随机森林各特征值精度贡献率Fig.8 Relative contributions of the features of random forest with different types of samples
由此可见,本文所提出基于植被物候期多时相雷达后向散射特征优选的海岸带盐沼植被分类方法,不仅拥有简单易解释的特点,能够获得较高精度,且与基于机器学习的随机森林方法最优特征高度吻合,可信度高。
5 结 论
本研究基于大范围高精度提取海岸带盐沼植被空间分布动态的需要,采用Sentinel-1 雷达数据、无人机高分辨航片及地面样点数据,提出时序雷达后向散射强度及物候特征分析相结合盐沼分类识别方法,实现了长江口盐沼空间分布信息准确提取,得到以下结论:
(1)雷达数据和植被物候特征结合能较好进行盐沼植被种间分类,Sentinel-1 数据时间分辨率高、连续性强,且对盐沼植被不同物候期结构具有敏感性,能够较好捕捉植被生长期,枯萎期特征,在盐沼植被提取方面具有很大应用潜力。
(2)通过时序雷达后向散射特征分析与SEaTH 算法可知,全年VH 极化平均后向散射强度可作为水体、光滩、潮间盐水沼泽与盐沼区分特征,4月VH 极化、11月VV 极化和3月VV 极化下平均后向散射强度分别为长江口海三棱藨草/藨草、互花米草和芦苇最优提取特征。
(3)使用Sentinel-1 数据,结合最优分类特征与随机森林方法,提取2018年长江口盐沼植被种间分布精度达到85.8%,Kappa 系数为0.80,较好反映了长江口盐沼实际分布情况。
与传统盐沼植被遥感分类方法相比,本研究利用了雷达影像数据时间连续性强的特征,考虑了植被生长物候特征与雷达后向散射特征之间关系,解决了光学影像受云雾和潮汐干扰局限,实现了大范围盐沼空间分布和面积信息高精度提取。
由于植被在各区域生长情况不同会导致误判,如崇明东滩区域芦苇因受人类活动影响而被误判为互花米草。此外,Sentinel-1 影像在长江口区域仅有VV 与VH 两个极化方式,此次研究仅分析了后向散射强度特征,全极化雷达数据极化特征、多源遥感信息与雷达影像结合分析需要进一步研究,为盐沼植被动态监测管理提供技术手段和数据支持。