利用MODIS多通道反照率产品估算OCO-2氧气A吸收带陆表反照率方法
2023-05-17杨洁李四维王庆鑫
杨洁, 李四维, 王庆鑫
1. 武汉大学 遥感信息工程学院, 武汉 430079;2. 武汉大学 测绘遥感信息工程国家重点实验室, 武汉 430079
1 引 言
卫星接收到的辐亮度由大气各组分与下垫面的反射共同组成,其中下垫面反射率作为大气组分反演的重要干扰项,在痕量气体、气溶胶、云层等卫星遥感中影响着定量反演的精度,通常需要提前确定,例如Veefkind等(2006)反演臭氧总量、Wang 等(2008)反演云量、云高的工作。因此,准确估算下垫面反射率对大气组分的反演至关重要。
基于卫星晴空观测估算陆表反照率或反射率的方法已有较多研究。Herman 和Celarier (1997)首先基于TOMS(Total Ozone Mapping Spectrometer)数据构建了340 nm 和380 nm 下垫面反射率数据库,它能提供几乎覆盖全球范围的1.25°×1.0°分辨率的数据。类似的,Koelemeijer 等(2003)、Kleipool 等(2008)、Tilstra 等(2017)基于GOME(Global Ozone Monitoring Experiment)、OMI (Ozone Monitoring Instrument)、GOME-2 和SCIAMACHY(Scanning Imaging Absorption Spectrometer for Atmospheric Chartography)的数据分别构建了4 个分辨率大约为1.0°×1.0°的下垫面反射率数据库。除数据源差异(不同的中心波长、空间分辨率,以及产品年份)外,它们都基于长时间卫星观测数据,并假设陆表反射在年际间同比不变,采用最小值或众数值等统计方法合成的朗伯等效反射率月平均产品。总的来说,上述产品的时空分辨率较低,并且朗伯等效反射率在大气遥感中可能导致不可忽视的反演偏差(Lorente等,2018)。
云遥感与晴空下大气痕量气体或气溶胶遥感的应用场景不同,卫星视野中的云层会阻碍对陆表的观测,不能直接提供准确的陆表反照率,但基于时序的估算方法能尽可能地填补数据空缺,例如基于MODIS(Moderate-resolution Imaging Spectroradiometer)多日晴空观测构建陆表二向反射率函数的MOD43 和MAIAC(Multi-Angle Implementation of Atmospheric Correction)算法(Lyapustin等,2018;Strahler等,2021)。
除上述基于卫星观测构建自身通道陆表反射数据库的方法外,根据其他载荷或其他通道的陆表反射产品,也能转换得到目标载荷通道的陆表反射率或反照率数据。例如,在Kaufman 等(1997) 基 于MODIS 观 测 和Ge 等(2019) 基 于AHI(Advanced Himawari Imager)观测的气溶胶反演工作中,都基于短波红外波段的表观反射率,通过线性变换得到了暗像元的蓝光和红光波段的地表反射率;在OMI 的NO2柱浓度反演和AATSR(Advanced Along-Track Scanning Radiometer)的气溶胶反演算法中,都直接使用了MODIS 邻近通道的陆表反射产品进行反演(Russell 等,2011;Shi等,2017);此外,在不同载荷的相似通道之间,也能在顾及仪器响应的差异后,通过转换得到目标载荷的陆表反射率数据(Claverie 等,2018;Zhang等,2018;Wang等,2020)。
本文的目标是在考虑陆表各向异性反射的前提下,讨论用于OCO-2(Orbiting Carbon Observatory 2)云属性反演的氧气A 吸收带陆表反照率的估算方法。虽然梁顺林等(2020)提出一种新的陆表反射率和反照率的估算方法,但目前仍缺少可用的OCO-2 氧气A 吸收带陆表反照率产品,一方面是因为OCO-2 卫星的分辨率为1.29 km×2.25 km,远高于上述基于GOME、GOME-2、SCIAMACHY等卫星数据建立的陆表反射先验数据库(包含氧气A 吸收带)的空间分辨率,而使用欠采样的陆表反照率会损害反演的质量(Heckel等,2011);另一方面是因为OCO-2观测的刈幅极窄(不足10 km)、重返周期很长(16日),无法采用基于时序的估算方法来填补有云天气下的数据空缺。因而,当下基于OCO-2 氧气A 吸收带的云反演或者气溶胶反演的研究被局限于海洋区域(Zeng 等,2020;Yang等,2021),即使在陆地区域进行反演,其反演结果也有较大的偏差(Nanda 等,2020)。此外,Worden 等(2017)也指出当前基于OCO-2 反演XCO2的精度也受到陆表反照率的干扰。
获取准确的陆表反照率的难点源于地表的复杂多样性。地表覆盖类型在空间上的差异、在一个月内的变化、陆表的二向反射特性,以及观测通道的中心波长等都是确定陆表反照率所需要考虑的因素(Bacour等,2020)。MODIS的MCD43C3产品能提供与OCO-2 空间分辨率相近的、顾及了陆表反射各向异性的多通道陆表反照率,虽然缺少针对氧气A 吸收带的观测通道,但MODIS 多通道反照率和OCO-2 氧气A 吸收带陆表反照率都是地表覆盖类型在光学性质上的表征,它们受相同的时空因素作用,也服从相似的二向反射规律。本文着重讨论由MODIS 陆表反照率估计OCO-2 氧气A 吸收带陆表反照率的可行性,实现并测试转换精度,分析转换的误差源。基于MODIS 陆表反射产品的转换方法不仅能为OCO-2 的云遥感提供必需的陆表反照率,也可为基于OCO-2 观测的气溶胶或气体反演提供必要的陆表反射率。
2 数 据
2.1 MCD43C3、MCD12C1产品
搭载于Terra 和Aqua 两颗卫星上的MODIS 传感器,装备了0.4—14 μm 波长范围内的36 个观测通道,刈幅宽达2330 km,每日的观测几乎覆盖全球(Justice等,2002)。
MCD43C3 产品由MODIS 观测反演得到,记录了地方时正午时刻多个通道的陆表反照率。反演算法针对可能存在的云层干扰,采用与有云日邻近的无云日观测来生产其陆表反照率数据,以削弱云层等干扰(Wang 等,2018)。单个MCD43C3文件的数据覆盖全球,空间分辨率为0.05°,时间分辨率为1 d。除MODIS观测通道#1—7外,MCD43C3产品还提供了合成的宽波段黑空/白空反照率产品,包括可见光通道、近红外通道和短波通道,各通道的波长范围见表1。此外,产品中还有数据质量标识、正午时刻的太阳天顶角等辅助信息。
表1 MCD43C3产品的光谱通道Table 1 Spectral bands of the MCD43C3 product
MCD12C1 产品是基于MODIS 数据生产的地表覆盖类型产品(Friedl等,2010),包含3种分类方案:国际地圈生物圈计划(IGBP)全球植被分类方案(Loveland 和Belward,1997)、马里兰大学(UMD)植被分类方案(Hansen等,2000)、MODIS叶面积指数(LAI)方案(Lotsch等,2003)。IGBP采用的陆表覆盖类型参见表2。单个MCD12C1 文件的数据覆盖全球,空间分辨率为0.05°,时间分辨率为1 a。
表2 国际地圈生物圈计划(IGBP)全球植被分类方案Table 2 IGBP global vegetation classification scheme
2.2 OCO2_L2_Lite_FP产品
OCO-2 卫星提供了氧气A 吸收带、二氧化碳强吸收带和弱吸收带的辐亮度观测,其晴空观测可用于反演二氧化碳产品,例如OCO2_L2_Lite_FP产品。这3 个通道的陆表反射特性(O’Dell 等,2018) 也与二氧化碳参数一同反演。然而,OCO2_L2_Lite_FP产品只提供了晴空或云量极少时的陆表反射数据,因为只有筛选出的晴空观测才能被用于反演二氧化碳参数。缺少有云时的陆表反照率数据是本文估计OCO-2 氧气A 吸收带陆表反照率的原因。
OCO2_L2_Lite_FP 产品的反演算法采用形状固定的反射率函数(Rahman 等,1993;Dubovik 等,2011),以及反射率函数的幅度来表征陆表的二向反射特性(O’Dell 等,2018)。除了反射率函数的幅度,OCO2_L2_Lite_FP产品还提供了观测时刻的太阳天顶角等辅助信息。
为分析MODIS 通道与OCO-2 氧气A 吸收带陆表反照率的变换规律,可基于时空最邻近原则从MCD43C3 产品中挑选出与OCO2_L2_Lite_FP 产品时空匹配的MODIS 各通道的陆表反照率数据。需要注意的是,MCD43C3 产品提供的是正午时刻的陆表反照率,而OCO2_L2_Lite_FP 产品提供的是陆表反射率函数,所以需要依据反射率函数计算正午时刻的陆表反照率,与MCD43C3 产品的黑空反照率相对应。
3 方 法
本节首先论证由MODIS 向OCO-2 转换陆表反照率的可行性,然后基于香农熵的分析证明MODIS 的多通道反照率数据能提供地表覆盖类型信息,且不影响上述转换所能提供的最优精度,最后介绍能实现上述精度的人工神经网络多通道模型。
3.1 转换的可行性
为分析由MODIS 通道向OCO-2 氧气A 吸收带陆表反照率转换的可行性,本文由2016 年内时空匹配的OCO2_L2_Lite_FP 和MCD43C3 产品统计了两者之间的相关系数,如图1所示。
图1 OCO-2卫星氧气A吸收带的陆表反照率与MODIS多通道反照率间的相关系数Fig. 1 Correlation coefficients for the land surface albedos of the OCO-2 oxygen A-band and of the MODIS channels
图1 中氧气A 吸收带的陆表反照率与通道#2的黑空反照率的相关性最高,因为其中心波长(858 nm)与氧气A 吸收带的中心波长(770 nm)最为接近。两者之间的高相关性(高达0.91)也说明可以由MODIS 通道#2 的反照率通过线性变换估计OCO-2 氧气A 吸收带的陆表反照率(基于样本测试的均方根误差为0.034)。此外,MODIS 的观测通道(#1—#7)与合成的宽波段通道之间的相关系数也很高,说明可以只选择观测通道的反照率作为转换模型的输入。
3.2 地表覆盖类型的干扰
将2016 年的陆表反照率数据按MCD12C1 产品提供的IGBP 地表覆盖类型分组,并对分组后的数据集分别建立基于通道#2 的线性转换模型,可得到16组不同的线性变换参数,如图2所示。图2中的百分比代表各分组中数据的占比,其中分组7、8、9、10、12、16 的占比超过了5%,是主要的地表覆盖类型。图中椭圆代表各分组中反照率散点所聚集的区域,椭圆的长轴是散点的主方向,其长半轴的长度是散点在主方向上标准差的3倍,其短半轴的长度是散点在垂直于主方向上标准差的3倍。
图2 按地表覆盖类型分组建立的线性转换模型Fig. 2 The linear models based on land cover types
椭圆长轴的方向代表对应线性模型的斜率,右侧的箱型图说明了各分组间斜率的分散程度。除雪和冰类型(编号16)外,其他地表覆盖类型的斜率在0.95—1.25,6 种主要地表覆盖类型间的最大斜率差接近0.2。只有当所有分组的线性变换参数(斜率、截距)尽可能地一致时,基于单通道的线性模型才能忽略地表覆盖类型之间的差异。
不一致的斜率说明按地表覆盖类型分别建立的转换模型比统一的转换模型更有利于提升转换的准确度。然而,提供地表覆盖类型的MCD12C1产品的时间间隔是1 a,且即使在年末也不能提供当年的产品,所以不能将MCD12C1 产品中的地表覆盖类型作为转换模型的输入。此外,较长的椭圆短半轴也说明基于单通道的简单线性变换会造成较大的误差,例如雪和冰类型。
若在转换模型中增加与通道#2 相关性较弱的通道#3 和通道#7,三通道的组合可能提供更多的信息。图3展示了由三通道的黑空反照率绘制的散点图,图中横轴是MODIS 通道#3 与通道#2 的比值,纵轴是通道#7与通道#2的比值。
图3 MODIS反照率比值的分布图Fig. 3 Distribution of MODIS albedo ratios
各地表覆盖类型的散点,尤其是6种主要地表覆盖类型的散点分布在图3中不同的位置,且呈现聚集趋势,说明MODIS 通道#2、通道#3 和通道#7的组合中蕴含着地表覆盖类型的信息,那么建立基于MODIS 多通道反照率的转换模型可能提供更加准确的氧气A 吸收带陆表反照率数据。图3 中6 种主要地表覆盖类型的集中区域虽然相互重叠,但若引入更多通道的反照率数据,则可能提升区分地表覆盖类型的能力,也意味着更高的转换精度。
3.3 转换的最优精度
本小节依据香农熵量化不同输入通道转换模型的不确定度,并确定可实现的最优转换精度,以判定多通道反照率能否替代地表覆盖类型,且提供相似的转换精度。
香农熵是对信息所具有的不确定性的度量,其数值越大,说明这条信息的不确定度也越大,那么需要更多的信息才能进一步确定(Shannon,1997)。香农熵(H)被定义为
式中,函数P(xi)指事件xi发生的概率。例如,若已知所有N项事件的发生概率相同,那么由式(1)知,事件x1将发生这一表述的香农熵为log2(N);同理,若已知其中事件x1的发生概率为100%,那么由式(1)知,事件x1将发生这一表述的香农熵为-log2(1) = 0,即无需更多信息就能确认。
与之类似,香农熵的概念也可用于量化氧气A吸收带陆表反照率估值的不确定性。图4展示了以MODIS 通道#2 的黑空反照率间隔0.01 分组的氧气A吸收带陆表反照率的离散概率函数(太阳天顶角为30°)。相比于分组前,分组后各概率函数的跨度明显减小,峰值位置也随通道#2 的黑空反照率逐渐右移。图5(a)中a.1 与之对应,展示了分组计算的香农熵分布,集中在2.6—4.0,峰值位于3.0。除将太阳天顶角作为分组条件外,图例BW#2指代将MODIS 通道#2 的黑/白空反照率也作为分组条件。
图4 OCO-2氧气A吸收带陆表反照率的离散概率函数Fig. 4 Discrete probability function of surface albedo on OCO-2 oxygen A-band
为量化地表覆盖类型信息对减小氧气A 吸收带陆表反照率估值的不确定度的贡献,本节使用MCD12C1产品中的3种分类方案的结果(LC),以及年积日(Day)和经纬度信息(Pos)来综合表征地表覆盖类型的光学特性。引入年积日是为了解释地表覆盖类型在一年内随季节的可能变化,例如落叶林的四季变化等。引入经纬度是为了解释某一类地表覆盖类型在不同地理人文环境中的可能差异,例如不同气候环境中种植的不同农作物等。添加地表覆盖类型后的香农熵分布如图5所示,集中在0.8—3.2,峰值位于2.4。减小的香农熵说明引入地表覆盖类型信息确实能减小氧气A吸收带陆表反照率估值的不确定度,这对在通道间准确转换陆表反照率是有利的。
然而及时获取地表覆盖类型产品是有困难的,所以3.2小节提出使用MODIS的通道#2、通道#3和通道#7 的反照率数据替代地表覆盖类型的信息,效果见图5。使用三通道反照率的香农熵分布与使用地表覆盖类型的香农熵分布(图5)非常相似,也集中在0.8—3.2,峰值也位于2.4 附近。相似的香农熵分布说明使用多通道反照率可以抑制多样的地表覆盖类型对估计氧气A 吸收带陆表反照率的干扰。
本文也将MCD32C3 产品提供的7 个观测通道的黑空反照率都作为分组条件也进行了测试,得到的香农熵更小,主要分布在0.6—3.0,峰值位于1.4 附近,见图5。左移的峰值说明除通道#2、通道#3 和通道#7 外,其他通道中仍蕴含有未被利用的信息。值为1.4 的香农熵等价于跨度为0.026 的均匀分布概率函数的香农熵,这可能是基于MODIS 多通道反照率数据转换OCO-2 氧气A 吸收带陆表反照率所能达到的最高精度。
图5 也展示了同时使用MODIS 七通道黑空反照率和地表覆盖类型信息进行氧气A 吸收带陆表反照率估计的香农熵分布,其分布与不添加地表覆盖类型信息的香农熵分布相似,说明只使用MCD43C3 产品估计OCO-2 氧气A 吸收带陆表反照率是可行的,无需等待MCD12C1产品的发布。
3.4 基于神经网络的多通道模型
前文指出使用MODIS 七通道反照率来估计OCO-2 氧气A 吸收带陆表反照率能获得最好的估计精度,并且由基于样本统计的香农熵分布可以判断多数估值的绝对误差应在0.026以内。
人工神经网络非常适合将由大样本统计的非线性规律转换为计算模型(梁顺林 等,2016)。本文选择BP神经网络作为训练模型,以MCD43C3产品中的MODIS 七通道黑空/白空反照率以及正午时刻的太阳天顶角作为输入,将由OCO2_L2_Lite_FP产品得到的正午时刻OCO-2 氧气A 吸收带陆表反照率作为输出,学习它们之间的映射关系。图6展示了测试结果,OCO-2 氧气A 吸收带陆表反照率估值的均方根误差(RMSE)为0.026,相关系数(R)为0.94。该测试得到的均方根误差(0.026)与3.3小节中得到的香农熵(1.4)吻合,说明训练模型已充分利用输入信息,达到了其所能提供的最佳估值精度。
图6 基于多通道模型的转换结果与参考值的对比Fig. 6 Comparison of the reference albedo and the estimation from the multi-channel model
陆表的性质变化会影响多个波段上的辐射特性,因此多通道模型能更准确地反映陆表的物化特性,并更准确地估算陆表氧气A 带反照率以及其的变化规律。以反照率年变化较大的落叶阔叶林为例,图7(a)展示了位于北温带(23°26′N—66°34′N)内落叶阔叶林的MODIS通道#2黑空反照率(黑点),以及经多项式拟合得到的年变化曲线(蓝线)。此外,还展示了经多项式拟合的氧气A吸收带估算值的年变化曲线(红线)。通道#2 与氧气A 吸收带的反照率在12、1、2 月因叶片完全脱落而位于低值,在3—5 月间因生长出新叶而迅速上升,于6—8 月达到顶峰,在9—11 月因落叶而下降,周而复始。4—9月间,拟合的通道#2与氧气A 吸收带的陆表反照率的差异较小,这与图7(b)中4—9 月红边斜率较大是一致的,因为期间阔叶林的叶面积大,对近红外辐射的反射强。
图7 2017年落叶阔叶林谱反照率的变化Fig. 7 The spectral albedo of deciduous broad-leaved forest in 2017
4 结果与分析
本文提出的多通道模型本质上是一个统计模型,统计模型的训练集和测试集应避免在时间和空间上重叠,否则不利于评价统计模型的可用性。
4.1 基于时空的验证
为说明3.4 小节中提出的多通道模型并不依赖地理因素,即多通道模型不会因为测试数据与训练数据在空间上不重叠而失效,设计如下实验:采用2016 年经度范围180°—90°W、0°—90°E 的数据作为训练集以训练多通道模型,采用2016 年经度范围90°W—0°、90°E—180°的数据作为测试集以评估其准确性,测试结果如图8所示。训练集的均方根误差为0.024,相关系数为0.96;测试集的结果与之非常接近,均方根误差为0.026,相关系数为0.93。
图8 对多通道模型基于空间的验证Fig. 8 Validation of the multi-channel model on new space
为说明多通道模型并不依赖时间因素,即多通道模型不会因为测试数据与训练数据在时间上不重叠而失效,设计如下实验:采用2016 年的数据作为训练集训练多通道模型,采用2017 年的数据作为测试集评估其准确性,测试如图9所示。训练集的均方根误差为0.025,相关系数为0.95;测试集的结果与之非常接近,均方根误差为0.026,相关系数为0.94。若采用2018 年或2019 年的数据测试,氧气A 吸收带陆表反照率估值的均方根误差均为0.025,相关系数分别为0.94和0.95。
图9 对多通道模型基于时间的验证Fig. 9 Validation of the multi-channel model on new time
上述基于时空的验证充分说明多通道模型在实践中的可用性,即使训练数据与测试数据在空间和时间上都不重叠,多通道模型也表现较好。例如,使用2016 年180°—90°W,0°—90°E 范围内的数据训练多通道模型,在2019 年90°W—0°,90°E—180°范围内的数据上进行测试,测试结果的均方根误差为0.025,相关系数为0.94。
在地表覆盖类型有变化的区域,时空无关的模型能基于最新的MODIS 观测资料,依靠其掌握的各地表覆盖类型在多通道反照率上的转换规律,而不是反照率的时空变化规律,对OCO-2 氧气A吸收带陆表反照率进行估计。时空无关的模型能发现地物在时空上的变化,而基于历史、基于地理位置的模型并不适合捕捉这样的变化。
4.2 基于地表类型的验证
图10 展示了多通道模型在各地表覆盖类型上的表现。多数地表覆盖类型的均方根误差小于0.03,均方根误差最小的地表覆盖类型是密灌丛,值为0.015,只有雪和冰类型的均方根误差远大于其他类型,值为0.070。多数类型的相关系数大于0.85,相关系数最大的地表覆盖类型是裸地或低植被覆盖地,值为0.96,雪和冰类型的相关系数最小,值为0.84。雪和冰类型可能与其他地表覆盖类型的二向反射特性有较大的差异,但在OCO2_L2_Lite_FP的反演算法中并未进行区分,使用的是同一个陆表反射率形状函数,这可能是导致雪和冰类型所对应的氧气A 吸收带陆表反照率估值不准确的原因之一。
图10 按IGBP地表覆盖类型分组展示的多通道模型的测试结果Fig. 10 Test results of multi-channel models grouped by IGBP land cover type
改用多通道模型后,OCO-2 氧气A 吸收带陆表反照率估值的准确度在各分组的测试中都有提升(改进前后的对比见表3)。相比于单通道线性模型,多通道模型在所有分组上的均方根误差都有所降低,相关系数也都有所升高。其中,裸地或低植被覆盖地分组的相关系数在两个模型中都是最高的,但多通道模型的相关系数和均方根误差仍有改善。即使在表现不佳的雪和冰分组中,采用多通道模型也能改善估值的相关系数和均方根误差。
表3 单通道线性模型与多通道模型的性能在各地表覆盖类型上的对比Table 3 Comparison between single-channel linear model and multi-channel model in each land cover type
4.3 输入数据质量与转换误差
转换结果的误差来源包括多通道模型的误差和输入数据的误差。作为参考值的氧气A 吸收带陆表反照率来自OCO-2 卫星产品,也可能是不够准确的。
评估转换精度的参考值是由OCO2_L2_Lite_FP产品中假设的反射率函数(ρ)的固定形状和反演的幅度参数(s)决定的。OCO2_L2_Lite_FP 反演不区分陆地上的地表覆盖类型,使用同一个形状函数,真实陆表上形状不同的反射率函数可能是氧气A 吸收带陆表反照率参考值不准确的原因之一。此外,反射率函数的幅度参数是由晴空条件下单一角度的观测反演得到,而反照率是对所有反射方向的积分,缺少多角度观测的约束也是导致氧气A 吸收带陆表反照率参考值不准确的原因之一。
转换结果的误差也可能来自MCD43C3 产品的七通道反照率,它们是多通道模型的输入。在生成MCD43C3 的反照率格网化产品时,按网格内反照率的反演值和空缺值的比例定义了其产品质量。标识0代表最佳的质量,其判定条件是网格内的反照率数据都是由观测反演得到。标识1—4 对应的产品质量逐步下降,其中反演数据的比例逐渐降低。按MCD43C3 产品的质量标识分组统计均方根误差,结果如图11 所示。在输入数据质量最好的分组中,OCO-2 氧气A 吸收带估值的均方根误差大约是0.02,质量标识为3 和4 的输入数据的均方根误差都超过0.05。
图11 基于不同质量的MCD43C3产品估算氧气A带反照率的均方根误差Fig. 11 The RMSE of oxygen A band albedo estimated based on MCD43C3 products of each quality
将上述估值应用于需要最优估计的遥感方法中时,参考图11可由MCD43C3的产品质量标识确定OCO-2 氧气A 吸收带陆表反照率的先验误差。此外,当前也缺少对OCO2_L2_Lite_FP 产品中陆表反照率数据质量的验证研究,而图11 至少可以说明产品中氧气A 吸收带的陆表反照率数据在可能受到云干扰的前提下,均方根误差小于0.06;在晴空天气下,数据的均方根误差小于0.02。
图10的各子图中都存在远离聚集区域的散点,它们对应于MCD43C3 产品中质量较差的数据。按MCD43C3 产品质量标识与地表覆盖类型分别统计各分组中的均方根误差与相关系数,结果如表4所示。当输入最佳质量的数据时,超过半数的地表覆盖类型所对应的均方根误差小于0.02,雪和冰类型的均方根误差也大幅下降致0.029,与其他类型的均方根误差也相差不大。对于产品质量为1—4 的数据,半数地表覆盖类型的均方根误差大于0.035,雪和冰类型的均方根误差为0.076,远大于其他类型的均方根误差。图11 和表4 说明输入的MODIS 七通道反照率数据的质量是决定OCO-2 氧气A吸收带陆表反照率估值精度最重要的因素。
表4 在各地表覆盖类型上不同质量的输入导致的误差Table 4 Error due to different quality of input data
5 结 论
基于相关性的分析可知,根据MODIS 通道#2的反照率数据可以估计OCO-2 氧气A 吸收带的陆表反照率,但地表覆盖类型是干扰通道间陆表反照率转换的重要因素。在不同输入的转换模型间进一步比较香农熵后可知:(1)基于MOIDS通道#2 反照率和地表覆盖类型的OCO-2 反照率估值的不确定度与基于MODIS 三通道(#2,#3,#7)的不确定度相似;(2)基于MODIS 七通道(#1—#7)的不确定度更小,并且再加入地表覆盖类型也不能减小估值的不确定度;(3)基于七通道统计的香农熵峰值为1.4,所以多数OCO-2 氧气A 吸收带反照率估值的绝对误差应在0.026 以内。基于上述分析,本文提出了基于BP 神经网络的多通道模型,该模型以MCD43C3 产品中的MODIS 七通道黑空/白空反照率以及正午时刻的太阳天顶角作为输入,使用由OCO2_L2_Lite_FP 产品得到的正午时刻陆表反照率作为输出进行训练。
为验证基于人工神经网络的多通道模型在不同时间和不同空间上的可用性。本文在覆盖半个地球的数据集训练模型,在另半个地球上的数据集上进行测试;另外在2016年的全球数据集训练,在2017 年全球数据集上测试;两次测试的相关系数都超过0.93,均方根误差都是0.026。此外,本文也验证了多通道模型在不同地表覆盖类型上的有效性。在分组统计的相关系数和均方根误差中,不论是表现最好的裸地或低植被覆盖地类型,还是较差的雪和冰类型,多通道模型都优于单通道线性模型。
多通道模型的转换误差与输入数据的产品质量密切相关。基于最佳质量的MCD43C3 产品的转换结果的均方根误差优于0.02,均方根误差随输入数据产品质量的下降而增大,直至超过0.05。此外,上述统计得到的均方根误差可能与氧气A吸收带陆表反照率参考值的误差有关。
本文提供了一种估算OCO-2 氧气A 吸收带陆表反照率的新思路,该思路不仅可应用于OCO-2对云的遥感中地表反照率影响的去除,还可有助于OCO-2 对气体、气溶胶的反演中地表反照率的确定。