基于高分六号卫星观测数据监测太湖蓝藻水华研究
2024-10-10孙沄沆文军姜文郑嘉树
摘 要:该文基于2018年和2019年的高分六号卫星数据,利用归一化差值植被指数实现太湖蓝藻水华的提取,验证红边波段对蓝藻水华的监测效果。结果表明,蓝藻水华在太湖的梅梁湾、湖心区北部和西太湖北部发生频次最多。但存在有代表性的最小整体和季节阈值范围,且整体阈值与夏季阈值相关性高;红边I波段(0.71波段)阈值范围的稳定性优于红边II波段(0.75波段)和近红外波段(0.83波段),且最小阈值范围呈现为正态分布。因此,高分卫星具有监测太湖蓝藻水华的潜力,在业务上运用高分卫星能够对太湖蓝藻水华的暴发作出快速监测。
关键词:高分六号卫星;蓝藻水华;归一化差值植被指数;太湖;监测效果
中图分类号:X87 文献标志码:A 文章编号:2095-2945(2024)29-0021-06
Abstract: Based on the GF-6satellite data in 2018 and 2019, this paper uses the Normalized Difference Vegetation Index to extract cyanobacteria blooms in Taihu Lake, and verifies the excellent monitoring effect of red edge band on cyanobacteria blooms. The results show that cyanobacteria blooms occur most frequently in Meiliang Bay, the north of the central area of Taihu Lake and the northern part of West Taihu Lake. NDVI has a representative minimum global and seasonal threshold range, and the overall threshold has a high correlation with the summer threshold, and the stability of the threshold range of the red edge I band (0.71 band)is better than that of the red edge II band(0.75 band) and the near-infrared band (0.83 band), and the minimum threshold range is normal distribution. Therefore, the GF-6 satellite has the potential to monitor the cyanobacteria bloom in Taihu Lake and can be used to quickly monitor the outbreak of cyanobacteria bloom in Taihu Lake.
Keywords: GF-6 satellite satellite; cyanobacteria bloom; Normalized Difference Vegetation Index; Taihu Lake; monitoring effect
中国的湖泊蓝藻水华呈现出从南到北逐渐多样化的趋势[1-2],并且已经建立的大规模的综合监测预报系统和应急响应措施可以降低蓝藻水华污染风险,但仍然无法减少富营养化和蓝藻水华问题,这些问题需要几十年才能解决[3]。
卫星遥感因其速度快、范围广、监测周期性短,已经成为湖泊富营养化及蓝藻水华监测和预测预警不可或缺的技术手段[4]。已有卫星遥感研究蓝藻水华的方法有:浮游藻类指数(Floating Algae Index, FAI)法[5],归一化差值植被指数(Normalized Difference Vegetation Index,NDVI)[6]以及随机森林(Random Forest, RF)法[7]。高分六号卫星在监测蓝藻方面的优点主要体现为更高的空间分辨率,更强的时间连续性,更广的覆盖范围、数据质量和应用领域。这些特性将为卫星监测蓝藻水华提供更好的数据来源。汪雨豪[5]分析哨兵2A影像得:NDVI对高、低聚集度的蓝藻水华信息都十分敏感。根据目前对太湖蓝藻提取的研究现状,阈值法计算简单适用性强,但阈值的准确选取是个难点[7-8]。
基于以上论述,结合红边波段对蓝藻水华反射特征更加敏感的特点与水华的发生存在明显的季节性规律[9],本文旨在利用高分六号卫星数据,采用NDVI阈值法提取湖泊区域内蓝藻水华的分布信息,验证红边波段对蓝藻水华的监测效果;寻找最小阈值范围,从而整理出最优整体阈值和季节阈值,得到准确率更高的太湖蓝藻水华影像。本研究结果在业务上能对湖泊水体蓝藻水华的高分辨率监测有一定的参考价值。
1 研究区域和数据来源
太湖位于长江三角洲的南缘,是中国五大淡水湖之一,位于北纬30°55′40″—31°32′58″和东经119°52′32″—120°36′10″之间。太湖分为8个区域分别为:梅梁湾、贡湖湾、胥口湾、东太湖、南太湖、西太湖、竺山湾和湖心区[5]。在2017—2021年间,太湖蓝藻暴发时段主要集中在每年的5月份左右,蓝藻暴发区域主要集中在太湖西北部的竺山湖、西部沿岸区、梅梁湖等湖湾;湖心区蓝藻数量呈明显增长,需要引起关注[10]。
本文研究的遥感数据来自我国具有独立自主知识产权的高分六号卫星(Gaofen-6,GF-6)多光谱中分辨率宽幅相机(Wide Field of View,WFV),该相机共有8个波段,覆盖可见光到近红外光,包括2个红边波段(0.69~0.73 μm,0.73~0.77 μm),空间分辨率小于等于16 m,幅宽大于等于800 km。高分卫星是首次增加的能够有效反映作物特有光谱特性的红边波段的卫星,提高了农业、林业、草原等资源监测能力。
蓝藻水华的光谱在红边波段范围时属于高反射,在红光波段为低反射[5],因此本研究选择GF6 WFV数据。本研究获取的包括2018—2019年期间共9次卫星影像数据。
2 研究方法与数据处理
2.1 研究方法
2.1.1 归一化差值植被指数
NDVI被用来表征地表植被生长情况,它能反映出背景对植物冠层的影响,如土壤、地面、雪和枯叶等。蓝藻水华暴发时,藻类聚集在水体表面,因其对红光波段的强吸收导致产生的红光波段反射率较低,在近红外波段具有类似于植被光谱曲线特征的“反射峰平台效应”,近红外波段反射率较高,而正常水体对近红外波段有强烈的吸收作用,导致反射率较低。NDVI能够反映蓝藻的覆盖度和不同区域蓝藻的浓度,计算较简单,比较适用于业务化运行[6]。所以选用NDVI指示蓝藻水华信息,计算公式如下
NDVI=(R1-R2)/(R1+R2)
式中:R1表示近红外波段的反射值,R2表示红光波段的反射值。通过该公式计算得到水体表面蓝藻水华的NDVI。利用高分六号卫星WFV数据构建的NDVI公式见表1。
2.1.2 与已有结果相似度对比分析
①特征图像法。按照蓝藻水华的特征图像分区集中选取大量的特征点(大于100个像素点),与由哨兵2A处理得到的太湖蓝藻水华空间分布的影像中相同位置的像素点进行重合度的对比检验。②等格距法。按照相等的间隔在8个分区内选取像素点,将本研究处理的图像与哨兵2A蓝藻影像进行重合度的对比检验。在胥口湾的南半区中,太湖周边人类活动的影响因素过大,加之东太湖生长着较多水生植物,较少暴发蓝藻水华。
2.2 数据处理与植被指数计算流程
卫星遥感湖泊蓝藻水华监测技术流程,主要包括数据准备、数据预处理、数据方法计算和蓝藻水华识别验证等,整体流程如下。
使用卫星遥感影像处理软件处理GF6_WFV:L1A数据,进行预处理:区域剪裁、辐射定标、大气校正、几何校正和几何剪裁。区域剪裁是在GF6_WFV:L1A数据上对太湖目标区域进行矩形剪裁,这是为了缩小处理的区域面积,从而减少数据处理量,提高处理效率。利用辐射定标和大气校正处理;之后进行几何校正处理。辐射定标是将图像的亮度灰度值转换为绝对辐射亮度,确保遥感数据能够准确地反映地表的物理特性。大气校正是为了消除大气和光照等因素对地物反射的影响。几何校正用来消除或改正遥感影像几何误差的过程,以确保影像上的地理信息准确无误地反映实际的情况。最后进行几何剪裁得以让数据简化并且提取出太湖清晰的边界。
通过不同通道反射率组合获取NDVI,带入公式进行波段计算,得到每个数据的3种波段的影像,基于哨兵2A数据蓝藻影像进行人工阈值的选定,得到较为准确反应太湖蓝藻水华信息的阈值。
经过对比分析,分波段按照整体(表2)和季节(表3)分别设定阈值,让设定的阈值更具代表性。该阈值代表最小阈值的范围,蓝藻显示的图像范围为NDVI大于该阈值的区域,避免出现因阈值设置最大值,而将太湖蓝藻水华重度暴发的覆盖区域遗漏。因为蓝藻水华在太湖的暴发情况日变化快,所以制定代表年度的阈值范围较为困难,且制定出的阈值非常不稳定或与实际情况误差较大,故本文将按照季度对太湖蓝藻水华图像设定最小阈值范围,从而减小估算误差。
基于地理信息系统进行区域掩膜提取,这是为了进行数据筛选,将数据进行整合,让分析更加深入,最后得以让图像可视化;再对图像进行色彩调节,最后导出专题图像。
选用2种定量化检验蓝藻水华覆盖率的方法,按照特征图像分区法进行检验与按照等格距方法进行检验,得到2幅图像的相似性结果。
结合哨兵2A数据蓝藻影像,分析了在2018年和2019年这2年间太湖蓝藻水华的空间分布。
3 结果分析
为了分析太湖水体蓝藻水华的空间分布,将由GF-6数据各波段在2018年10月28日和2019年8月7日的NDVI影像与已有结果进行比较(图1和图2)。未选取阈值时,0.71波段的NDVI值显示的特征区域较0.75波段和0.83波段的特征区域数值小,且0.75波段和0.83波段的2幅图像更相似。可能在0.71波段,光谱对多种水生植物的反射特征表征更加明显,导致在具有相同波段的情况下0.71波段探测出的水体光谱特征范围较另外2波段更大。0.75波段和0.83波段的光谱特征相似,是因为蓝藻水华在这2个波段的波谱反射率相近,但2个波段对干净水体的反射率仍有不同,在业务上的运用效果较差,不能及时在水华暴发初期反映水体状况。所以需要进一步人工设定阈值,使水体的蓝藻水华在图像上的显示更加准确。
整体阈值(表2)结果表明:各波段的最小阈值范围各不相同,其差值相近,相差都在0.02附近。0.71波段的阈值大小为0.015~0.040处于正值范围内,就该波段整体而言,最优阈值大小为0.025(0.75波段和0.83波段同理得到最优阈值);0.75波段和0.83波段的阈值大小分别为-0.085~-0.065和-0.080~-0.060都处于负数范围内,两者范围十分接近,这与图1和图2显示出来的现象相符。
吴晓东等[11]研究表明:太湖从秋季11月开始蓝藻植物体大量下沉进入底泥越冬,到次年5月后底泥中的蓝藻开始复苏进入水体,这导致冬季蓝藻水华在图像上分布极少。通过对已有数据的处理,得到冬季蓝藻覆盖的时空分布很少,冬季难以设定季节阈值,故冬季的波段阈值将不再考虑。
选择更具代表性的各波段各季节阈值(表3)检验整体数据的符合情况。以2019年8月7日为例,该时刻的3个波段的季节阈值图像(图3)显示:0.83波段整体覆盖范围相对其他2个波段较大,0.75波段整体覆盖范围又较0.71波段的覆盖范围大。在研究过程中发现:当0.83波段和0.75波段的阈值增大后,位于湖心区东北部的特征区域的面积被削减,故不能将0.83波段和0.75波段的阈值增大。
确定季节阈值(表3)后,秋季的0.75波段和0.83波段所显示的影像(图4)在西太湖、竺山湾和梅梁湾都存在漏提现象,其阈值与整体阈值范围存在差异,而且较各自波段整体阈值范围的数值偏小;夏季的0.83波段影像(图3)虽阈值存在于整体阈值范围内,但在竺山湾、梅梁湾、湖心区、西太湖和南太湖的特征区域边界处存在明显的多提现象。NDVI在湖区沿岸位置的结果显示出其对于藻华区域和非藻华区域的划分界限较为模糊[12],对蓝藻水华也会存在漏提现象。
将已处理的夏、秋两季0.83波段的数据进行对比,阈值范围相差较大,从而无法确定夏秋季的阈值范围(0.75波段在秋季同理),故不对0.75波段设置秋季的波段阈值,也不对0.83波段设置夏、秋两季的波段阈值。由于春季3月的特征图像(图5(e))蓝藻水华的覆盖面积显示较少,以5月图像(图5(f))呈现为主,故将5月作为设定春季阈值的主分量,可见春季各波段整体呈现效果良好。
通过设定各波段季节阈值,初步目测季节阈值图像和哨兵2A数据蓝藻影像的符合情况,表现出有波动的产生:0.71波段波动最小,0.75波段稍差,0.83波段的波动最大。
轻度蓝藻水华发生的时间分布比较广泛,4—11月份都有发生,不同区域及不同程度的水华污染集中在不同的时间段内[13]。由表2和表3对比可知:整体阈值范围与夏季0.71波段和0.75波段的阈值范围相近,说明监测蓝藻阈值的大小主要与夏季的多种因素有关,这与蓝藻水华在夏、秋季节生长较为旺盛,水华暴发的频次多、面积广等时空分布呈显著正相关[14]。
因0.83波段指示太湖蓝藻水华信息的能力较差,故只对0.71波段和0.75波段图像进一步定量化检验太湖蓝藻水华的覆盖率。以特征图像相似度最好的2019年8月7日数据为例,对夏季的阈值采用中位数和最值进行检验,由结果分析得:波段整体对比可知,0.71波段较0.75波段的相似率更高,波动更小。在特征图像法中,0.71波段相似率处于73%~86%,0.75波段处于69%~87%,0.71波段较0.75波段更稳定;在等格距法中,0.71波段相似率处于89%~93%,0.75波段处于85%-93%,0.71波段仍然较0.75波段更稳定。0.71波段的2种定量化方法的相似率都大于0.75波段。与此同时,0.71波段中阈值大小为0.02的影像相似率最高,图像符合程度是最准确的;且在0.015~0.025的阈值区间,相似率的分布呈现出正态分布。0.71波段和0.75波段各自的2种定量化方法之间比较:等格距方法检验出的相似度大部分都高于特征图像法,相似率的差值达到6%以上。这表现出0.71波段对太湖蓝藻水华的监测效果优于0.75波段。
综上所述,0.71波段是高分六号WFV数据运用归一化差值植被指数方法监测太湖蓝藻水华的最优波段。
本研究得到的蓝藻水华影像与哨兵2A蓝藻影像存在差异的原因包括以下几点[15]:大气辐射及水陆边界的影响、水体中其他物质的影响、遥感数据的分辨率限制和遥感数据的处理方法等因素[16-17]。在藻华形成后,蓝藻因能改变浮力使其在水体中的垂直分布不均一[18],遥感卫星更易接收到水体浅层的信号,对水面的监测更为准确,仅通过卫星探测不能精准监测到水体中的蓝藻总量。
基于已有图像(图5)进行分析,蓝藻水华在太湖的中心湖区和西北湖区发生的频率最高(不考虑东太湖和胥口湾的南半区),特别是西太湖与湖心区的北部湖区和梅梁湾湖区。在太湖西南部内凹型折角区,湖岸有大型的旅游度假区,图中常年显示在该位置上有蓝藻水华的存在,可能有人为活动造成湖水富营养化,故在该区域暂不分析较小范围内的蓝藻水华发生频次。与此同时,湖心区和西太湖相连且水面面积都较大,大面积的蓝藻水华常常在两湖区水体交界处有覆盖,造成这2个湖区的统计次数都较多。
4 结论与讨论
本文以太湖为研究区,基于归一化差值植被指数和高分六号数据对太湖水体蓝藻水华进行识别分析,得到以下结论:
1)结合各波段的整体阈值和NDVI可以分析得到,高分六号WFV红边II波段和近红外波段的相似性较高。通过季节阈值的校正比对,近红外波段提取蓝藻水华信息的效果较红边I波段和红边II波段的效果更差。验证了红边波段在使用NDVI监测湖泊蓝藻水华方面有着比其他近红外波段更优秀的监测能力。
2)通过分波段定量化检验相似度分析可知:红边I波段是高分六号WFV数据运用在太湖蓝藻水华监测中的最优波段,且最小阈值的区间呈现为正态分布。
3)整理出具有代表性的整体阈值和部分季节阈值,整体阈值的范围大小与夏季阈值的范围大小呈强相关,能快速辨别水华在水体上的大值分布情况,对水体蓝藻水华分布情况的监测预警有积极作用。
4)蓝藻水华在太湖的中心湖区和西北湖区发生的频率最高,特别是西太湖北部、湖心区北部区域和梅梁湾湖区。
本文研究的最小阈值范围显示出的蓝藻水华发生情况仍然与实况存在误差,不能得到精确的水体蓝藻分布情况;使用NDVI监测太湖蓝藻水华需要人工设定阈值,主观因素过大。最小阈值的设定仍然存在定性因素,根据不同气象因子等其他因素的改变,阈值范围仍会发生改变,可以结合大量数据进行阈值的选定,让设定的阈值更加普适。
参考文献:
[1] SHARP S L, FORREST A L, BOUMA-GREGSON K, et al.Quantifying scales of spatial variability of cyanobacteria in a large, eutrophic lake using multiplatform remote sensing tools[J].Frontiers in Environmental Science, 2021(9):612934.
[2] HUO D, GAN N, GENG R, et al. Cyanobacterial blooms in China: diversity, distribution, and cyanotoxins[J].Harmful Algae, 2020(109):102106.
[3] QIN B, LI W, ZHU G, et al. Cyanobacterial bloom management through integrated monitoring and forecasting in large shallow eutrophic Lake Taihu(China)[J].Journal of Hazardous Materials, 2015,287(apr.28):356-363.
[4] 潘德炉,马荣华.湖泊水质遥感的几个关键问题[J].湖泊科学,2008,20(2):139-144.
[5] 汪雨豪.基于哨兵2A影像的太湖蓝藻水华提取方法研究及应用[D].北京:中国地质大学(北京),2020.
[6] 申文熙,丁圣.基于GF卫星的星云湖蓝藻水华监测[J].现代信息科技,2023,7(12):124-127.
[7] 潘鑫,杨子,杨英宝,等.基于高分六号数据提取太湖蓝藻方法的对比及适用性分析[J].湖泊科学,2022,34(6):1866-1876.
[8] 张东彦,尹勋,佘宝,等.多源卫星遥感数据监测巢湖蓝藻水华爆发研究[J].红外与激光工程,2019,48(7):303-314.
[9] 王健,张逸飞,智力,等.基于MODIS时间序列数据的太湖蓝藻水华监测方法比较与分析[J/OL].华北水利水电大学学报(自然科学版),1-11[2024-02-08].http://kns.cnki.net/kcms/detail/41.1432.TV.20231128.1403.012.html.
[10] 徐寅生,赵琳.基于遥感技术的太湖蓝藻水华时空变化分析[J].河南水利与南水北调,2023,52(6):5-6.
[11] 吴晓东,孔繁翔,张晓峰,等.太湖与巢湖水华蓝藻越冬和春季复苏的比较研究[J].环境科学,2008(5):1313-1318.
[12] 胡明涛,陈诚,李港,等.典型风力条件及水力调度下太湖藻华高频时空动态监测[J/OL].湖泊科学:1-12[2024-02-08].http://kns.cnki.net/kcms/detail/32.1331.P.20240117.1129.002.html.
[13] 张艳会,李伟峰,陈求稳.太湖水华程度及其生态环境因子的时空分布特征[J].生态学报,2016,36(14):4337-4345.
[14] 张瑞.太湖蓝藻水华长时序主被动遥感监测及预警研究[D].郑州:华北水利水电大学,2023.
[15] 冯炼.卫星遥感解译湖泊蓝藻水华的几个关键问题探讨[J].湖泊科学,2021,33(3):647-652.
[16] 晁明灿,赵强,杨铁利,等.基于Landsat8影像的蓝藻水华提取方法对比研究[J].大气与环境光学学报,2021,16(6):520-528.
[17] 段洪涛,罗菊花,曹志刚,等.流域水环境遥感研究进展与思考[J].地理科学进展,2019,38(8):1182-1195.
[18] PAERL H W, PAUL V J. Climate change: Links to global expansion of harmful cyanobacteria[J]. Water Research, 2012,46(5):1349-1363.