2016–2020 年呼伦湖水体固有光学参数遥感产品
2024-01-11隗晓琪许金朵黄泽晖李含含马荣华
隗晓琪,许金朵,黄泽晖,李含含,马荣华
1.中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,南京 210008
2.国家地球系统科学数据中心,湖泊-流域分中心,南京 210008
3.中国科学院大学,北京 100049
4.南京信息工程大学,遥感与测绘工程学院,南京 210044
5.草原生态安全省部共建协同创新中心,呼和浩特 010021
引 言
湖泊是地表水资源的重要组成部分,是以流域为单元的水分循环的重要环节,湖泊可以连接地球表层系统的各个圈层,对经济发展以及区域生态环境的平衡起到重要的作用[1-2]。呼伦湖(达赉湖)位于内蒙古自治区呼伦贝尔草原西部的新巴尔虎右旗境内,是我国内陆高纬度半干旱地区的第一大草原型湖泊[1-3],有涵养水分、改善草原环境等功能,对于草原生产和草原–湖泊生态系统维持具有重要意义[4]。
水体固有光学量(Inherent Optical Properties,IOPs)是指只与水体介质有关,仅由水体特性决定,而与周围水环境光场无关的量,包括吸收系数a、散射系数b、后向散射系数bbp、衰减系数c等[5],是连接水中光学活性成分与可观测的表观光学特性的纽带,决定了水下光场的分布状况,对于水环境生态和水中生物有直接影响[6-7]。对于水体固有光学量的研究有助于估计水体的光学活性物质(Optically Active Components,OACs)和浮游植物的色素浓度等相关水体及水环境参数[8-11]。
内陆湖泊水体的固有光学特性随时空变化十分显著[12],但传统使用实验室分析或实地观测所得到的吸收系数信息难以提供相应的空间位置信息,而水色遥感技术与相应的反演算法相结合,可以有效地解决该问题,获取到具有对应时空信息的水体吸收数据。Sentinel-3A(2016 年4 月至今)和Sentinel-3B(2018 年5 月至今)卫星搭载OLCI(Ocean Land Color Instrument)传感器,包含21 个波段,空间分辨率为300 m,波长范围为400–1020 nm,重访周期为1–3 d,其产品质量相较于其他传感器均有大幅度的提升,能更为精确地反映湖泊水质状况,是内陆水体观测与研究的重要数据源[13-15]。
目前已有的IOP 反演算法主要发展自海洋和沿海水域,多为利用多光谱回归将IOPs 与遥感反射率(remote sensing reflectance,Rrs)相联系的经验算法[16]。基于辐射传输方程和经验公式所得到的半分析反演算法在一些水体光学特性变化较大的区域相较于传统经验算法得到的结果更为准确[17]。其中,准分析算法(quasi-analytical Algorithm, QAA)[18]是应用较为广泛的算法之一,在NASA 的SeaWiFS Data Analysis System (SeaDAS)数据分析系统中被用作处理卫星水色数据的默认模型之一[19]。水体的总吸收主要由:纯水的吸收aw、悬浮颗粒物的吸收ap、浮游植物的吸收apℎ以及有色溶解有机物(Colored Dissolved Organic Matter,CDOM)与非藻类颗粒物质(Non-algal Particulate,NAP)吸收ag(λ)和ad(λ)所组成。QAA 算法不需要预先定义apℎ(λ)或ag(λ)和ad(λ)的光谱形状,并且在算法中使用的波长处,输入和输出的Rrs(λ)值之间不存在残差。
针对于呼伦湖的吸收系数特性,目前缺乏相关的较可靠、长时序的数据。本数据集利用Sentinel-3 OLCI 数据,使用了QAA-750E 算法[6],生成了2016–2020 年间呼伦湖的浮游植物吸收系数和后向散射系数数据,将为呼伦湖流域的水体环境质量监测以及生态环境保护等研究工作提供数据支持。
1 数据采集和处理方法
1.1 卫星数据获取
本数据集使用的是Sentinel-3/OLCI Level-1B 的全分辨率数据(OL_1_EFR,300 m),从欧空局(ESA)的开放存取中心(Copernicus Open Access Hub)(https://scihub.copernicus.eu/dhus/#/home)[20]获取到呼伦湖2016–2020 年的数据。
1.2 数据预处理
依据其他学者对于不同大气校正方法的校正精度和适用性的研究[21-23],本研究选择使用6S(Second Simulation of the Satellite Signal in the Solar Spectrum correction scheme)大气校正模型[24]对所获取的研究区的Sentinel-3/OLCI 数据进行大气校正,以获取研究区的Rrs数据[25]。利用现有的云层检测算法获取云层覆盖的范围,并对其进行掩膜处理。之后计算该区域的浮游藻类指数(Floating Algae Index,FAI)并结合藻类像素生长算法(Algae Pixel-growing Algorithm,APA)获取图像中藻华覆盖的范围,对存在藻华覆盖的范围同样进行掩膜处理[26]。
1.3 QAA-750E 算法
本研究所使用的IOP 反演算法为QAA-750E,是基于QAA-v6 算法[24,27],并结合所收集到的实地观测数据进行改进后所得到的算法。QAA-750E 算法主要包含两个部分:第一部分,利用遥感数据经过大气校正后所得到的Rrs(λ)数据计算总吸收系数a(λ)和后向散射系数bb(λ),该部分是基于将原始QAA-v6 算法的参考波长移至750 nm 处进行改进而得到的;第二部分,由第一部分中的a(λ)和bb(λ)进行计算来分别得到ad(λ)和apℎ(λ),首先基于bb(λ)的经验公式估算ad(675)的数据值,之后利用在湖泊研究中对NAP 和CDOM 的数据值影响较小的波长为665 nm 和675 nm 处的a(λ)数据,推导得到apℎ(675)数据值。具体的算法流程如下图1 所示。
图1 QAA-750E 算法流程(修改自文献[6])Figure 1 Flow chart of QAA-750E algorithm (Revised from reference[6])
1.3.1 总吸收系数和后向散射系数的获取
QAA-750E 算法[6]的第一部分是基于QAA-v6 算法[24,27]的第一部分发展而来的,从大气校正后所得到的Rrs(λ)数据计算总吸收系数a(λ)和后向散射系数bb(λ)(公式1)。
由于内陆水体的光学特性,对于QAA-v6 中的用于从经过预处理的地表反射率rrs(λ)数据获取算法的临时数据u(λ)的两个经验参数g0和g1在QAA-750E 算法中进行了一定的修改,其中g0=0.084,g1=0.17(公式2)。
在QAA-v6 算法中∆a(λ0)表示在λ0(550 nm 或670 nm)处,由rrs(λ)数据所获取到的总吸收参数。但在本研究中使用∆a(550)或∆a(670)所得到的计算结果并不理想,因此在改进后的QAA-750E算法中,将计算总吸收系数a(λ)的参考波长改为750 nm (λ0=750),并假设750 nm 处的总吸收系数a(750)的值与纯水的吸收数据aw(750)的值相等(公式3)。
后向散射系数bbp(750)则通过纯水的后向散射数据bbw(750)和u(750)利用公式4 计算得到:
后向散射数据bb(λ)的数值由443 nm 和560 nm 处的地表反射率数据rrs(443)和rrs(560)的比值得到,其幂指数值Y 在QAA-v6 算法的基础之上,使用无机悬浮颗粒物(SPIM)、叶绿素(Chla)的垂直剖面数据和有色溶解有机物的吸收数据ag(440)模拟了我国内陆水体的水下光场特征,在QAA-750E 算法中对该参数值进行调整,使计算结果更符合内陆水体的特性。
bb(λ)和anw(λ)使用与QAA-v6 算法相同的半解析公式6 和7 进行计算:
1.3.2 浮游植物吸收系数推导
由于内陆浑浊水体中无机悬浮物和CDOM 的含量总体较高,并且CDOM 和NAP 在蓝、绿波段具有较高的吸收系数值,此外,还考虑到浮游植物的特异性吸收和色素组成的变化,所以在算法中,使用红波段的吸收数据anw的值来获取浮游植物的吸收apℎ(675) 数据。
apℎ(675)是利用第一部分所得到的anw(λ)在665 nm 和675 nm 的数据值推导所得:
其中,ε为anw(λ)与apℎ(λ)在675 nm 和665 nm 的差值之比:
并且,在apℎ(675)和apℎ(665),存在定量关系:
其中,S1=0.839,从而可以计算出apℎ(675)的数据值:
2 数据样本描述
基于上述数据处理算法和流程,使用呼伦湖区域的Sentinel-3/OLCI Level-1B 数据得到2016–2020年呼伦湖固有光学参数数据集,具体数据以研究时段内apℎ(675)和bbp(560)的月均数据和月标准差数据来呈现。为了便于数据的处理与展示,将数据存储为img 格式,文件命名规则为:数据类型_month_统计类型_M,其中数据类型包括apℎ(675)和bbp(560)两种类型,统计类型包括mean 平均值数据和std 标准差数据,M 表示数据的月份信息。但由于受到云层及藻华等的影响,数据存在一定的缺失状况,并且考虑到研究区冬季结冰期,本数据集仅包含2016–2020 年,每年4–10 月份的固有光学参数数据。
图2 展示了2016–2020 年呼伦湖不同月份月均吸收系数的空间分布状况,可以看出,在研究时段内,8 月的月均apℎ(675)和bbp(560)数值均偏高,高值均出现在呼伦湖的南部。
图2 数据示例:(a)aph(675)月均值;(b)aph(675)月标准差值;(c)bbp(560)月均值;(d)bbp(560)月标准差值Figure 2 Sample data: (a) monthly average of aph(675); (b) monthly standard deviation of aph(675); (c) monthly average of bbp(560); (d) monthly standard deviation of bbp(560)
3 数据质量控制和评估
3.1 验证方法
通过野外采样与室内实验相结合的方式,获得野外采样位点的实测吸收系数数据。并将该数据与相邻日期的相同位点的遥感反演数据进行对比,计算其相关系数(R2)和均方根误差,验证吸收系数数据产品的精度。
吸收系数apℎ(675)的实测结果是采用定量化过滤技术(quantitative filter technique, QFT),将野外采集到的水体进行过滤,然后利用分光光度计(Shimadzu UV2600 spectrophotometer)对过滤所得到的滤膜进行350–800 nm(间隔1 nm)波段范围的光吸收系数的测定,得到总悬浮物的光谱吸收系数ap(λ)。再用次氯酸钠漂白样品滤膜,得到非色素颗粒物的滤膜,再次使用分光光度计进行测量,计算得到非色素颗粒物的吸收系数ad(λ)。最终,由公式(13)计算得到色素颗粒物的吸收系数apℎ(λ)的具体数据:
后向散射系数bbp(560)是使用HS–6(HydroScat–6 Spectral Backscattering Sensor, 6 通道后向散射仪)进行测量得到,仪器波段配置分别为:412、442、470、510、590 和700 nm,利用仪器自动记录的测量信息,求得后向散射系数bbp(560)的具体数值结果。
由于没有获取到同日的星地同步数据,实测数据为2019 年10 月16 日的野外采样获取的,遥感反演数据为利用2019 年10 月17 日的OLCI 数据得到的,并在这两组数据中选择了相同经纬度的15组吸收系数和后向散射系数进行验证。
3.2 验证结果和精度比较
将实测得到的16 日bbp(560)数据结果和由遥感反演得到的17 日bbp(560)数据,共15 组进行对比,结果如图3 所示,相关系数(R2)为0.59,均方根误差(RMSE)为0.55,平均相对误差(MRD)为0.54,这表明,基于Sentinel-3/OLCI Level-1B 数据,使用QAA-750E 算法反演得到的bbp(560)的数据结果具有一定的可靠性。
图3 实测和模型反演的bbp(560)对比Figure 3 Comparison of measured and model derived bbp(560)
水体中各种组分的含量处于一个动态变化的过程中,使得不同时刻的水体吸收系数值存在一定差异,后向散射系数bbp(560)数据主要与水体中的无机物含量相关,短时间内的数据变化较小,可以采用相邻日期的实测数据进行验证,而吸收系数apℎ(675)数据主要与水体中的叶绿素等物质含量相关,受时间变化的影响较大,使用相邻日期的实测数据对apℎ(675)的遥感反演数据进行验证,所得到的结果并不理想。但综合所基于的QAA-v6 方法计算原理[24,27]以及目前已有的研究结果与结论[28-31],本研究所使用的基于内陆水体特性所改进的QAA-750E 方法反演得到的呼伦湖水体吸收数据apℎ(675)的结果具有一定的可靠性。
4 数据价值
本数据集使用Sentinel-3/OLCI Level-1B 数据,在已有QAA 算法的基础之上,依据实测数据,提出更适合内陆水体的QAA-750E 算法,并进一步计算和制备了呼伦湖流域2016–2020 年间水体吸收系数的数据集,可以为呼伦湖流域以及该区域的水质监测与评估、生态环境保护等研究工作提供数据支持。
致 谢
感谢中国科学院南京地理与湖泊研究所科学数据中心和国家地球系统科学数据中心湖泊–流域分中心对产品生产提供的指导、支持与帮助。
数据作者分工职责
隗晓琪(2000—),女,陕西省西安市人,硕士生,研究方向为湖泊固有光学特性的遥感反演。主要承担工作:方案设计与实施,数据处理,论文撰写与修改。
许金朵(1982—),女,江苏省睢宁县人,硕士,工程师,研究方向为数据库建设、数据共享和地图学与地理信息系统。主要承担工作:数据准备,数据整理与上传。
黄泽晖(1999—),男,河南省洛阳市人,硕士生,研究方向为湖泊蓝藻水华的遥感监测。主要承担工作:实测数据采集与处理,算法调试,数据产品质量控制。
李含含(1997—),女,河南省开封市人,硕士生,研究方向为湖泊悬浮物浓度遥感监测。主要承担工作:遥感数据的预处理,算法调试,数据产品质量控制。
马荣华(1972—),男,山东省临沂市人,博士,研究员,研究方向为湖泊水环境遥感、湖泊-流域数据共享。主要承担工作:数据方法总体指导,论文修改与完善。