APP下载

2003–2021 年呼伦湖藻华数据集

2024-01-11黄泽晖许金朵李含含隗晓琪马荣华

关键词:呼伦湖水华蓝藻

黄泽晖,许金朵,李含含,隗晓琪,马荣华,5*

1.中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,南京 210008

2.中国科学院大学,北京 100049

3.国家地球系统科学数据中心,湖泊-流域分中心,南京 210008

4.南京信息工程大学,遥感与测绘工程学院,南京 210044

5.草原生态安全省部共建协同创新中心,呼和浩特 010021

引 言

藻华是指浮游藻类受多要素的影响在水面累积,形成肉眼可见的藻颗粒聚集体,漂浮于水面。从改革开放至今,我国社会经济迅速发展的同时也遭遇频发的污染事件,人类活动导致大量的氮磷污染物排放到河流、湖泊和水库,引发长江中下游诸多内陆水体的富营养化与蓝藻水华问题,严重威胁湖库生态系统健康和饮用水安全[1]。因此宏观准确地掌握藻华暴发程度、覆盖面积、蓝藻斑块位置等相关信息,实时监测水体富营养化变化程度,对生态环境修复以及保障人类生活质量至关重要。然而受蓝藻群体粒径、蓝藻群体密度、群体形状系数以及水的密度、运动黏度等影响,蓝藻能调节其水深分布,达到垂直方向上的上浮、沉降效果;且在风速、波浪高和湖水流速的共同作用下,蓝藻群体还进行着水平方向上的运动[2]。在藻华暴发时,蓝藻水华在一两个小时内就能发生大范围的迁移运动,因此,现场船舶调查通常难以全面捕捉水华影响范围、整体变化等关键信息[3]。

相较于传统的观测手段,遥感卫星监测范围广、速度快、具有周期性便于进行长期实时监测等优势,正好弥补常规手段的不足,从而实现藻华的影响范围、程度、持续时间等信息的快速获取[4]。呼伦湖位于我国五大湖区中的蒙新湖区,属于呼伦贝尔高原的一部分,湖泊面积约为2339 km²,是我国第五大淡水湖,一年四季气候分明[5]。相比典型的严重富营养化湖泊,呼伦湖的蓝藻水华暴发的规模和强度远小于太湖和滇池[6]。但近些年受全球气候变化和人类活动的共同影响,呼伦湖正面临水量减少、面积萎缩、水位下降、富营养化水平增加等问题[7]。因此,迫切需要利用遥感技术实时动态监测湖泊蓝藻水华,为分析呼伦湖藻华发生发展规律和进一步的预防与治理提供参考[8]。

目前,光学遥感识别蓝藻水华的方法主要分为几类:目视解译[9]、单波段阈值法[10]、波段比值法[11]、光谱基线法[12-13]、机器学习[14]等。目视解译利用人的经验和知识,识别解译多波段彩色合成影像,该方法提取精度高,但操作繁琐、耗时耗力;单波段阈值法与波段比值法通过蓝藻水华与背景地物的光谱差异来识别目标信息,但对同物异谱、异物同谱的地物敏感度不高,且会由于阈值设定的差异,出现水华与浑浊水体和水生植被不同程度的混淆;机器学习方法效率高、精度高,但机理难以解释,且需要大量的数据;光谱基线法基于蓝藻的光谱特征,利用影像多波段构建数学表达式识别蓝藻水华,该方法抗干扰能力强,不易受气溶胶的厚度和类型、太阳高度角、太阳耀斑等环境和观测条件变化的影响。

本文以MODIS Aqua 为数据源,利用红光–近红外–短波红外的波段组合光谱基线法,计算FAI(Floating Algae Index)指数[12],设定阈值提取蓝藻水华,生成了2003–2021 共19 年的呼伦湖藻华空间分布时间序列产品。本数据产品可用于分析呼伦湖近年来的蓝藻水华暴发程度和时序变化,为藻华监测与防治提供理论依据和数据支持。

1 数据采集和处理方法

1.1 卫星数据来源

中等分辨率成像光谱仪MODIS(Moderate-resolution Imaging Spectroradiometer)传感器搭载于Terra 和Aqua 卫星,两颗卫星分别于1999 年12 月和2002 年5 月发射登空,至今仍正常运行。MODIS具有较高的时间分辨率,一天内可以覆盖全球两次(部分赤道低纬度地区除外)[15]。此外,MODIS数据光谱范围广、中等空间分辨率适用于呼伦湖这样的大型湖泊,对富营养化湖泊蓝藻水华日常监测,藻华长时序空间分布变化等研究具有重要意义。

本研究数据采用GEE(Google Earth Engine)平台上免费获取的MODIS/061/MYD09GA 数据集(https://developers.google.com/earth-engine/datasets/catalog/MODIS_061_MYD09GA)Aqua 卫星地表反射率SR(Surface Reflectance),本研究使用的6 个波段的分辨率为500 m,重访周期为1 天。

1.2 数据处理

本数据集对MODIS Aqua 数据的处理均在GEE 平台上进行,并使用全球地表水(Global Surface Water)数据对Aqua 卫星影像裁剪掩膜,提取呼伦湖水体边界;剔除影像中云、太阳耀斑、水生植被等非目标地物对藻华提取的干扰,计算藻华覆盖度,具体流程如图1 所示。

图1 数据处理流程图Figure 1 Data processing flowchart

本文从MODIS 数据集中分别选取非藻华水体、藻华、水生植被、云、耀斑、高浑浊水体的样本区,统计分析各类别的样本点反射率光谱和遥感指数,以确定接下来讨论的云和太阳耀斑、水生植被、浑浊水体、遥感识别指数等的阈值。

1.2.1 呼伦湖水体边界提取

MODIS 的SR 产品已经过大气校正处理,可直接用于后续操作。利用呼伦湖边界矢量文件对Aqua 卫星每天的影像数据进行筛选裁剪,获得裁剪后影像数据集。全球地表水(Global Surface Water)数据可从GEE 平台上免费获取,该数据集由Landsat 5、Landsat 7 和Landsat 8 三颗卫星在1984 年3月16 日至2015 年10 月10 日期间采集的3066102 幅影像生成(https://developers.google.com/earthengine/datasets/catalog/JRC_GSW1_1_GlobalSurface Water)。全球地表水数据集中的每个像元被单独分成水体或非水体,从未被检测出水体的像元被掩膜。使用该数据集的频率(occurrence)波段对筛选后的影像进行掩膜,对像元逐一判断,将频率大于85%的像元视为水体。最终获得呼伦湖水体边界数据。

1.2.2 卫星影像去噪处理

由蓝藻的光谱特征来看,蓝藻颗粒出现时,水体反射率增加;随着波长向长波移动,会在绿波段出现一个反射峰;波长进一步增大,反射率随之提升,直至在红外波段形成类似于植被的光谱特征,即陡坡效应,这是藻华水体与非藻华水体在光谱上的最大差异。利用这个差异,构建红波段减去绿波段的波段组合值,对藻华与非藻华地物作初步区分[16]。红绿波段差值小于0 时视为藻华水体。

卫星影像易受天气条件的限制而在成像时出现阴影,以及云和太阳耀斑对目标区域的遮挡,因此在提取藻华前需对数据集进行去云处理。云覆盖是遥感影像处理中最常遇到的噪声之一,给影像识别造成干扰,大大降低遥感影像分类精度[17]。目前研究人员在实际应用中多采用多天数据合成的方式来减少云的影响。然而短周期的合成数据不能完全排除云的干扰,周期过长又丧失时间效率,不适合短期监测[18]。因此最有效的方法是对每天的数据都进行云检测,移除数据中的云像素[19]。

由于云和太阳耀斑都具有高亮的特征,呈现白色或者灰白色,本文采用了蓝绿红三个波段的反射率值,设定阈值剔除云和耀斑的干扰。从统计结果看,云在红绿蓝三个波段遥感反射率的最小值分别为0.1、0.13、0.1,明显高于其他类型。则当MODIS 红绿蓝波段的反射率值同时高于0.1、0.13、0.1 时,认定该像元为云或太阳耀斑。对图像阴影的统计结果分析,当蓝绿波段反射率同时高于0.005时,判定该像元为非阴影像元。

1.2.3 剔除水生植被与高浑浊水体干扰

分析藻华与其他背景地物的光谱特征得出,蓝藻水华与水生植被在近红外波段具有类似的“植被特征”,而且高悬浮物浑浊水体也给蓝藻水华的识别带来干扰。因此,在进行藻华识别前,首先剔除水生植被和高浑浊水体。

(1)水生植被识别指数(CMI)

已有研究基于蓝藻水华与水生植被的光谱特征在蓝光、绿光波段和短波红外波段处的差异,并考虑到短波红外是大气校正的关键波段,构建了蓝藻水华与水生植被水域的判别公式 CMI(Cyanobacteria and Macrophytes Index)[20]:

其中,Rrc,GREEN、Rrc,BLUE、Rrc,SWIR分别为绿光波段、蓝光波段和短波红外波段经过瑞利校正的遥感反射率Rrc。

当CMI 高于0.02 时,认定该像元为非水生植被。

(2)高悬浮物水体识别指数(TWI)

湖泊水体中悬浮物质具有较强的后向散射和水体反射信号,对于高悬浮物水体,蓝藻水华暴发的特征因子叶绿素光谱信息被强的无机悬浮物质掩盖或淹没,导致蓝藻水华识别信号失真,降低识别精度[21]。

为了减小高悬浮物水体对藻华识别精度的影响,本文借鉴相关研究,采用悬浮物特征波段红光和短波红外的差值,构建浑浊水体指数TWI(Turbid Water Index)[22],用于剔除高悬浮物水体像元:

其中,Rrc,RED和Rrc,SWIR分别为红光波段和短波红外波段的Rrc。

当TWI 高于0.09 时,判定该像元为高悬浮物水体。

1.2.4 计算藻华覆盖度(FAC)

本文使用红光–近红外–短波红外的波段组合的基线法,计算FAI(Floating Algae Index)指数以提取藻华信息;FAI 指数不易受气溶胶类型和厚度、太阳高度角和耀斑等环境和观测条件变化的影响,可有更有效地穿透薄云,提取蓝藻水华的阈值也更稳定[12]。

其中,Rrc(λNIR)、Rrc(λRED)、Rrc(λSWIR)分别为近红外波段、红光波段、短波红外波段的遥感反射率Rrc;对应于MODIS 数据,λNIR=859 nm,λRED=645 nm,λSWIR=1240 nm。

利用最大梯度法[23]确定单幅影像FAI 指数的阈值,高于该阈值的像元视为藻华像元。但MODIS较低的空间分辨率,使得单个像元覆盖了多种地物,其他非目标地物会干扰单个像元中藻华含量的准确估算。为精确计算像元藻华覆盖度,Xue 等[24]将Landsat8 OLI 影像计算得出的藻华像元视为纯净像元,后重采样为250 m 计算像元内的藻华比例FAC,构建FAC(Floating Algae Cover)与FAI的关系表达式:

其中m,n都是代求参数。对应MODIS 数据,计算得出m=4.6,n=44.2,故:

本文通过上式计算求得MODIS 影像中单一像元的藻华覆盖度,范围为0–100。

2 数据样本描述

本数据集对2003–2021 年19 年间影像按月统计均值并出图展示,5 月累计589 景、6 月累计570景、7 月累计589 景、8 月累积589 景、9 月累积570 景,由于每年1–4 月份、10–12 月份有冰雪覆盖,没有提取藻华面积。呼伦湖5–9 月份累计19 年的FAC 均值空间分布如图2 所示。呼伦湖5–9月份月均藻华面积没有明显时空差异,南岸在5 月份出现局部高值。从长期来看,呼伦湖南部和西南部沿岸容易发生藻华堆积现象。

图2 呼伦湖月均FAC 空间分布图Figure 2 Spatial distribution of monthly average FAC in Hulun Lake

对2003–2021 年年均FAC 统计结果出图展示,其中10 月至第二年4 月份由于冰雪覆盖未参与统计,最终呼伦湖2003–2021 年19 年FAC 空间分布如图3 所示。可以看出,呼伦湖南岸于2006 年即开始高频次出现藻华,至2011–2012 年达到峰值,之后逐渐好转,藻华年均覆盖度明显下降。

图3 呼伦湖年均FAC 空间分布图Figure 3 Spatial distribution of yearly average FAC in Hulun Lake

最终生成2003–2021 年5–9 月份呼伦湖藻华覆盖度(FAC)月均和年均数据,其中FAC 取值范围为0–100。本数据集为*tif 格式的栅格数据,空间分辨率为250 m,具体信息见表1。

表1 呼伦湖藻华数据集样本信息Table 1 Sample information of the dataset of algal blooms in Hulun Lake

3 数据质量控制和评估

为确保数据集的准确性,选取MODIS 卫星和Landsat 8 卫星同期匹配数据,将Landsat 8 影像提取的藻华结果作为真值,验证本数据的精确度。统计MODIS 单幅影像中藻华覆盖度FAC 的累加值,并乘以单个像元表示的实际面积获得该影响等效藻华面积(equivalent bloom area,EBA);对于Landsat 影像,逐像元计算FAI,利用最大梯度法[23]确定藻华提取阈值,使用该阈值提取藻华面积。最终选取7 天同期配对影像的提取结果用于精度验证。

图4 为MODIS 和Landsat 8 卫星2016 年07 月30 日同期匹配影像提取藻华的对比图。其中,图4 (a) 为MODIS 假彩色合成影像;(b) 为剔除水生植被等干扰因素后计算得到的FAC 空间分布(即经1.2.3 和1.2.4 处理后获得);(c)为剔除水生植被等干扰因素后的MODIS 假彩色合成影像;(d)为基于Landsat 8 卫星影像计算而得的藻华空间分布,用于验证MODIS 藻华提取结果的准确度;(b1)、(b2)、(d1)、(d2)为局部放大图,便于计算结果的比对。由于MODIS 影像分辨率粗糙,会出现目标地物的误提错提,导致藻华面积计算偏大。如图4 (b1)、(d1)对比而得,基于MODIS 影像提取藻华时,未完全剔除的水生植被或近岸陆地像元被识别为藻华,导致藻华面积计算偏大(MODIS 计算得到的藻华面积为7.27 km²,Landsat 8 计算得到的藻华面积为6.35 km²)。虽然会出现误提错提现象,但其占比很小,对湖区内藻华总面积影响十分有限。总体验证结果如图5 所示,其精度基本符合要求。

图5 MODIS 与OLI 提取结果精度验证Figure 5 Verification of the accuracy of MODIS and OLI extraction results

4 数据使用方法和建议

藻华覆盖度数据集直观地表示了呼伦湖每天藻华的暴发程度和空间位置,可实时监测呼伦湖藻华暴发状态。

本数据集下载解压后为tif 数据格式,适配于各GIS 专业软件的文件读取与编辑再加工;其时间范围涵盖2003–2021 年,可以为同行业人员提供数据参考以及为呼伦湖生态环境监测提供技术帮助与数据支持。

数据作者分工职责

黄泽晖(1999—),男,河南省洛阳市人,硕士生,研究方向为湖泊蓝藻水华的遥感监测。主要承担工作:技术路线的设计与实施,数据处理与验证,论文撰写与修改。

许金朵(1982—),女,江苏省睢宁县人,硕士,工程师,研究方向为数据库建设、数据共享和地图学与地理信息系统。主要承担工作:数据准备与预处理,数据整理与上传。

李含含(1997—),女,河南省开封市人,硕士生,研究方向为湖泊悬浮物浓度遥感监测。主要承担工作:算法的调试与修正,数据处理,数据产品质量核验。

隗晓琪(2000—),女,陕西省西安市人,硕士生,研究方向为湖泊固有光学特性的遥感反演。主要承担工作:遥感数据的预处理,数据产品质量控制与核验。

马荣华(1972—),男,山东省临沂市人,博士,研究员,研究方向为湖泊水环境遥感、湖泊-流域数据共享。主要承担工作:数据方法、技术路线总体指导,论文修改与完善。

猜你喜欢

呼伦湖水华蓝藻
坐在呼伦湖畔看星星
坐在呼伦湖畔看星星
藻类水华控制技术及应用
新巴尔虎写意(组诗)
南美白对虾养殖池塘蓝藻水华处理举措
南美白对虾养殖池塘蓝藻水华处理举措
针对八月高温蓝藻爆发的有效处理方案
可怕的蓝藻
油酸酰胺去除蓝藻水华的野外围隔原位试验