叶面积指数产品真实性检验系统设计与实现
2020-12-05陈勇李静孙林马培培柳钦火董亚冬
陈勇,李静,孙林,马培培,柳钦火,董亚冬
(1.山东科技大学 测绘科学与工程学院,山东 青岛 266590;2.中国科学院空天信息创新研究院 遥感科学国家重点实验室,北京 100101;3.中国科学院大学,北京 100049;4.中国科学院地理科学与资源研究所,北京 100101)
0 引言
遥感影像在获取过程中会受到传感器自身状况和工作状态、大气辐射特性、光照强度等因素的影响,此外在反演时也存在着算法误差和系统误差等。因此,要确定目前所使用的遥感反演产品能否正确、真实地刻画实际地表情况,其精度能否满足要求,需对其开展真实性检验。与参数反演算法的研究相比,真实性检验的研究相对滞后,无论在地面验证数据库的构建以及统一的科学理论与验证方法等方面,都处于不完善的阶段,这在一定程度上制约了遥感产品的发展和应用[1]。
遥感真实性检验是指采用合理的手段对遥感反演产品的精度展开评估[2]。只有在这个基础上确定精度在合理范围内,才能保证可以将产品投入实际应用中[3]。2000年,法国国家空间研究中心组建了欧洲陆地遥感真实性检验项目,逐步开始对各种陆表参数产品进行全球的真实性检验[4]。2014年,在陆地产品真实性检验项目组的支持下,Baret等[5]设计了一套在线真实性验证平台OLIVE(on line interactive validation exercise)。该平台致力于全球生物物理产品的验证,目的是满足陆地真实性检验小组的要求,达到验证的第4阶段。近年来,我国也开始重视并开展一系列真实性检验的研究。1988年,中国生态系统研究网络正式成立,通过地面网络式观测的方式,运用遥感、数学模型的手段对我国各主要植被类型地物进行全面监测和真实性检验[6]。2004年,中国科学院在河北怀来成立遥感综合试验场,主要功能是作为新型遥感对地观测理论和观测系统试验、定量遥感模型研发和数据验证试验场。2007年,为了发展流域尺度的陆面数据融合系统,黑河流域遥感-地面观测同步试验应运而生[7]。虽然在全球广泛开展了LAI地面观测,促进了LAI的标准化观测[8],但仍未构建出标准化的包括直接验证和间接验证的评估流程。
真实性检验技术在国内外得到了广大关注,学者们在这方面投入了很大精力,但目前仍有一些问题亟待解决。首先,国际通量观测网络、欧洲陆地遥感真实性检验项目、BigFoot等多个项目在全球范围内提供了丰富的地面连续观测数据,但这些数据还未集成在一起,未能构建完备的数据库更好地为真实性检验服务。其次,随着国内航空航天技术的飞速发展,诸多国产卫星发射升空,如高分系列卫星、风云系列卫星、环境星等。这些卫星生产了种类多样的遥感产品,但是针对国产遥感卫星产品的验证还未形成系统性的处理流程,阻碍了目前我国遥感卫星产品的持续发展。最后,国际上针对真实性检验技术已经提出了众多的理论和方法,但还未将理论方法归总以实现业务化运行,这极大地阻碍了真实性检验技术的进一步发展[9]。
综合以上因素,同时考虑到遥感产品参数的差异性和真实性验证方法的多样性,本文基于真实性检验数据库,以叶面积指数作为研究参数[10],通过设计遥感产品真实性检验系统,确定客观合理的真实性检验流程,并对遥感产品进行验证。
1 叶面积指数真实性检验数据库
1.1 直接验证数据集
在对遥感产品进行真实性检验时,连续的地面观测数据因其较高的可靠性常拿来作为算法及产品验证的真值结果[11]。通过对国内外各个观测项目多尺度实验数据的收集[12],构建了LAI真实性检验数据库。目前真实性检验数据库中的地面站点实测数据共有1.2万条,覆盖全球,时间跨度从1990—2017年,站点主要项目如表1所示。
表1 项目数据集汇总
在直接验证数据库中,国际上大型的地面观测项目主要包括欧洲陆地遥感真实性检验项目、BigFoot和ImagineS等。2000年,欧洲陆地遥感真实性检验项目正式启动,主要是负责对众多陆地遥感数据产品(LAI、FAPAR、FCOVER)进行全球真实性检验[13]。2015年,由美国国家航空航天局Terrestrial Ecology Program开展的BigFoot 项目开始实施,主要收集了2000—2003年间从阿拉斯加到巴西的9个EOS土地验证站点的叶面积指数数据,同样采用了类似于欧洲陆地遥感真实性检验项目中的二级采样策略[14]。ImagineS是为了支持哥白尼全球土地服务(Copernicus global land service,CGLS)的运作而进行研究和开发的项目[15-16]。目前ImagineS已形成合格的生产线,主要通过处理多元传感器数据生产300 m分辨率的全球生物物理产品。
在国内,中国生态系统研究网络在1988年正式成立。目前该研究网络由36个网络实验站点和6个数据中心组成。这些站点基本覆盖了中国区域内所有的植被类型,同时会定期返回有效的地面观测值。真实性检验像元尺度的差异会产生较大误差,通常地面站点观测数据的尺度远远小于遥感卫星产品的空间分辨率,同时存在地表异质性问题,因此需要在预处理时对站点观测值进行升尺度来消除尺度偏差的影响[17-18]。
数据库中收集的数据一部分是均匀地表测量的点观测,点能够代表面;还有一部分是非均质地表上,通过ESU(基本采样单元)的地面观测构建LAI高分参考图(基于SPOT等高分辨率影像反演得到),再重采样获取1 km的LAI真值,这样的地面观测能够考虑地面非均质性,比如括欧洲陆地遥感真实性检验项目获取的地面真值。
1.2 间接验证数据集
间接验证数据集由2部分构成:LAI产品数据集和BELMANIP站点数据集。本文选取MODIS/LAI产品作为验证产品,GLASS/LAI产品作为参考产品进行间接验证示例。BELMANIP站点数据集在选择样本区时考虑了植被类型和地理位置的代表性,3 km ×3 km范围内土地覆盖类型单一,所以常用于点上的间接验证研究[19]。
MODIS是美国国家航空航天局于1999年发射成功的对地观测卫星TERRA上运载的地表观测传感器之一[20],其生产了一系列标准产品,包括FVC、NDVI、NPP、FAPAR及LAI等[21-23]。GLASS LAI反演算法采用回归神经网络的方法构造GRNN训练数据集反演LAI[24-25]。
在对产品进行时间序列的验证时,通常会选择地表均质性较好的区域进行测量。直接验证只能对站点的观测值进行验证,不能用于大范围空间区域的验证。为了区别于地面实验测量,国际卫星观测委员会于2009年利用从MERIS影像获取的全球植被覆盖图,建立了BELMANIP 2网络。它是BELMANIP 1的更新版本,除了包含现有大型观测项目的站点外,又从GLC2000土地覆盖图中选择了一部分站点[26]。目前BELMANIP 2.1数据集在已有的 BELMANIP 2网络站点外,又增加了25个与裸露的土壤区域(沙漠)和热带森林相对应的站点,站点的空间分布如图1所示。
注:该图基于自然资源部标准地图服务下载的审图号为GS(2016)1665号的标准地图制作,底图无修改。图1 BELMANIP 2.1全球站点空间分布图
2 叶面积指数定量遥感产品真实性检验系统
叶面积指数定量遥感产品真实性检验系统利用地面测量点、网、站、场获取同时相数据[27],通过调用GDAL库和Matlab引擎,基于MFC框架将获取的数据与定量遥感产品进行数据筛选和匹配等操作,并采用不同的真实性检验方法来对遥感产品进行验证[9]。
2.1 检验系统流程框架
检验系统流程图如图2所示。
图2 系统流程图
2.2 检验系统功能性分析与总体架构
叶面积指数定量遥感产品真实性检验系统具备以下功能。
1)能够基于数据库完成多种定量遥感产品的真实性检验,主要针对LAI产品的真实性检验。
2)完成不同分辨率产品的尺度转换,包括不同空间分辨率的尺度转换和不同时间分辨率的聚合。
3)通过读取用户输入参数,自动生成一份经后台处理反馈给用户的真实性检验报告。
4)具备较高的可延展性。定量遥感产品种类繁多且参数不一,因此,不同参数的真实性检验方法不同,不同产品的操作流程可能也有差别。根据不同产品和不同参数,定量遥感产品真实性检验系统具有很好的维护性、伸缩性,使开发人员和用户之间具备一定的独立性。
依据功能需求,定量遥感产品真实性检验系统包含设计完备的数据库[28-29]、功能齐全的精度分析模块和数据的输入输出接口。如图3所示,该系统分为验证数据库、精度分析和系统内外部接口3部分[30]。验证数据库主要包括产品数据库、直接验证数据库和间接验证数据库。精度分析模块主要功能包括数据获取、数据预处理、数据匹配、数据验证处理、精度指标计算和结果报告生成。系统与验证数据库之间的数据信息交换和精度分析部分的信息传递等任务则是由系统内外部接口完成。
图3 系统总体架构设计
2.3 功能模块架构和详细设计
如图4所示,该系统主要由6大模块组成。数据获取模块是通过用户输入参数,从数据库或本地文件中获取遥感数据;数据预处理模块完成重投影、空间尺度转换和时间聚合等工作;数据匹配模块的工作主要分为2个部分,产品数据与数据集的匹配和时空分辨率的匹配;精度指标计算模块则是通过精度指标对产品进行定量的评估,衡量指标主要包括RMSE(均方根误差)、R2(相关系数)、拟合方程等;结果生成模块主要实现产品各项检验指标结果的成图和文档生成;数据处理验证模块是本系统主要的算法模块,下文将对本模块进行详细介绍。
图4 系统功能模块架构
数据处理验证模块主要有直接验证和间接验证2种验证方式。
直接验证是指以单点地面实测数据为真值,将待验证产品与直接验证数据集进行匹配验证,从而对遥感产品进行精度分析。由于地面采样点通常选择均质性较好的区域进行数据采集,样方测量数据可以代表像素大小,因此空间尺度差异和混合像元对结果带来的影响可以忽略。同时,为了减少点扩散函数和几何精度的影响,采用3×3像元范围内有效像元的平均值作为该直接验证数据的匹配像元值。
间接验证是指在没有地面观测数据的情况下,通过产品与产品的比较来评估产品的相对精度[31],主要从空间、时间及产品间差异分析3个方面进行验证。空间尺度又细分为空间连续性和空间一致性2个角度,而时间尺度则是基于BELMANIP 2.1站点在时间连续性和时间一致性2个方面进行验证,下面逐一进行介绍。
1)时空连续性。由于受到大气状况的影响,产品在时空分辨率下通常会存在无效值或缺失值[19],本文通过逐月计算待验证产品和参考产品的缺失像元比例来表征空间连续性;通过计算BELMANIP站点缺失值时间长度的频率分布来表征时间连续性。
2)空间一致性。不同产品采用的反演算法不尽相同,空间一致性就是用来衡量不同产品反演结果是否一致并分析产品参数的变化范围。通过计算待验证参数的有效像元值频率来表征空间一致性,将所得到的有效像元值(计算空间连续性时所得)按照一定间隔计算像元频率分布。
3)时间一致性。产品的时间一致性是指对待验证参数进行长时间序列的统计分析。
季节性变化用来评价产品在长时间序列上是否存在季节性特征。为了减少产品之间的配准误差和不一致性,采用3×3像元区域并选择大于5/9的有效像元平均值作为该时相的像元值。平滑度是评价产品在相邻时相是否存在异常值,平滑度越小,说明产品在长时间序列上越稳定,异常值越少。
4)产品间差异分析。单方面从空间尺度还是时间尺度上对产品的验证都不能全面评估产品的精度,因此,综合考虑时空尺度变得至关重要。基于大量的统计分析来比较产品间的一致性是最常用的方法。通常,将所得到的像元值(计算季节性所得)通过散点图的形式来直观地比较产品间差异,并通过精度指标给出定量评价。
2.4 系统详细界面划分
图5 系统详细界面
真实性检验系统的界面如图5所示。用户通过界面输入所需产品和参数,选择相应的空间分辨率和验证方式,系统后台获取数据后进行计算,并给出真实性检验报告。需要注意的是,数据所需时间范围的间隔要超过一年,才能在验证时体现季节性的变化;空间范围参考右侧的注释格式填写,否则会提示输入错误。
2.5 真实性检验报告单
如图6所示,系统生成的真实性检验报告单是根据输入参数而给出待验证产品的描述信息,包括产品名称、验证参数、时空范围、空间分辨率以及验证方式等。
图6 真实性检验报告单
3 叶面积指数产品验证实例
本文选择2010—2011年中国区域(3°51′N~53°33′N,73°33′E~135°5′E)MCD15A2 LAI产品作为叶面积指数遥感产品真实性检验系统的运行实例[32],并给出真实性检验结果。
3.1 验证产品数据概况
MCD15A2 LAI是MODIS第5版本的LAI产品。产品的空间分辨率为1 km,时间分辨率为8 d,投影是SIN投影。本文在验证实例中,从数据库中收集到包括11个CERN站点共65个产品像元尺度的LAI地面实测值,用于产品的直接验证。
3.2 直接验证结果与分析
第二部分给出的是直接验证结果,如图7所示。可以看出,与GLASS LAI产品相比,MODIS LAI与地面实测值的相关性(R2=0.46)和均方根误差(RMSE=1.09)都比GLASS LAI(R2=0.49,RMSE=0.84)要差一些,主要是因为在反演过程中GLASS产品会对数据进行平滑,反演结果的差异会减小。在离散程度上,MODIS LAI的结果(S=1.090 5)也要比GLASS LAI(S=0.834 7)的要差一些,MODIS在个别森林站点出现了高估现象,可能是因为混合像元造成的地表误分类[19]。在与地面数据拟合程度方面,MODIS LAI(斜率为0.88)的效果要比GLASS LAI(斜率为0.65)的好一些。
图7 真实性检验报告直接验证结果图
3.3 间接验证结果与分析
第三部分是间接验证空间连续性的结果,表2给出了2010—2011年的月合成像元值反演比例。从表中可以看出,GLASS LAI的反演比例高于MODIS LAI的,主要是由于MODIS LAI在反演时有主算法和备用算法之分[22-23],其中备用算法计算的LAI质量较差,且受残云和大气校正差的影响。本系统只采用主算法反演的像元值作为有效像元值,另外GLASS LAI产品的缺失值填充和平滑处理也是影响精度的重要因素。MODIS LAI产品在1月份出现了较高的缺失比例,主要是由于北半球冬季积雪覆盖且大气条件差[33],因此在冬季时,MODIS产品反演LAI时更多的是采用备用算法。由于北半球的植被夏季活动强烈,生长旺盛,MODIS和GLASS LAI产品在7月份的反演比例都要高于1月份。从给出的每个月反演比例来看,2010年和2011年这2年间,MODIS和GLASS LAI产品年际变化都很小,没有明显的异常值出现。
利用MODIS和GLASS LAI产品1月和7月的LAI值频率分布来分析他们的LAI变化范围和取值分布,如图8所示。1月份时,LAI值大部分都不超过1;而到了7月份,LAI值会有显著的提高,这与北半球植被夏季生长的现象一致。1月份时,2种产品都表现出很强的空间一致性,分布很平稳;而在7月份,二者差异较大,MODIS在LAI低值区的比例高于GLASS LAI,高值区比例低于GLASS LAI。MODIS LAI低值的频率比其他产品要小,尤其是在1月份,这在一定程度上是由于MODIS对稀疏植被的高估,以及在休眠期对落叶阔叶林的高估[19]。在7月份,由于GLASS LAI产品对低值植被有明显的高估现象,导致在LAI=2.4处存在一个极大值,同时由于受到云雪等因素的影响,MODIS LAI值有明显的低估。从LAI的变化范围上来看,7月份MODIS LAI的最大值可以达到7。在1月份,MODIS和GLASS LAI产品最大值都没有超过3,这是由于北半球冬季植被活动力减弱。
表2 间接验证空间连续性结果 %
图8 真实性检验报告直接验证结果图
图9描绘的是2010年和2011年MODIS 和GLASS LAI在1月份和7月份的差值频率分布,具体差值是用MODIS LAI像元值减去GLASS LAI像元值得到的。整体上, MODIS 和GLASS LAI在这2年中显示出相似的频率分布和年际变化,像元差值大部分都分布在-1~1,30%的像元值基本相同。从图中可以看出,在LAI为0~0.3左右时,部分像元的MODIS LAI值比GLASS LAI的大,这可能是因为MODIS对阔叶林像元有些高估。一部分像元的MODIS LAI值比GLASS的小,这些像元主要分布在-1~0,这是由于GLASS产品在反演过程中作了平滑处理。在1月份时,2种产品的差值明显比7月份的要小得多,这和北半球植被的生长季节有关,冬季时植被活动少,LAI值变化较小,而在夏季,植被处于生长季,活动旺盛,LAI值变化较大。
图9 间接验证空间一致性差值分布结果图
MODIS和GLASS LAI产品在2010—2011年缺失天数频率分布如图10所示。从图上可以看出, 在2010—2011年MODIS LAI的缺失天数要比GLASS LAI多,这主要归根于MODIS在一定条件下通过备用算法来反演LAI[22-23],这些反演值缺乏可靠性,不能作为有效值来计算。由于GLASS LAI产品对结果作了缺失值填充的处理,其观测值为有效值的频率达到40%以上,更有利于时间序列曲线的重建。
图10 间接验证空间一致性差值分布结果图
图11为部分站点的时间序列曲线。整体上看,MODIS和GLASS LAI产品都很好地捕捉到了LAI的季节性,年际变化较小,LAI值都表现出了夏季高、冬季低的特点,这与北半球植被的生长季节一致。由于GLASS LAI产品对结果中出现的缺失值做了填充和平滑,所以GLASS LAI的曲线变得连续。在a站点,MODIS LAI产品在2011年7月存在低谷现象,可能是系统误差造成的;在c和d站点,MODIS LAI在冬季出现了缺失的情况,这是由于北半球冬季大气差且有积雪覆盖。图12为2010—2011年MODIS和GLASS LAI产品平滑度的频率分布图,由于GLASS LAI产品做了平滑处理,其产品相邻时相的像元值差异变小,因此,MODIS LAI的平滑度要比GLASS LAI稍差一些,这与图12所表达的一致。
图11 间接验证季节性结果图
图12 间接验证平滑度频率分布结果图
图13、表3描述的是MODIS和GLASS LAI产品2010—2011年像元值散点图和精度指标。2种产品在2010年和2011年具有很好的一致性,反演的LAI值大部分差异较小,2年的精度(RMSE)分别为0.66和0.74,相关性(R2分别为0.82和0.75)也都较高。低值区的相关性比高值区的强,当LAI>3时,MODIS LAI比GLASS LAI的值高,这可能是因为MODIS 在个别森林站点出现了高估现象。从LAI值的变化范围上来看, MODIS LAI的最大值可以接近7,而GLASS LAI的最大值不超过5,这说明与GLASS LAI相比,MODIS LAI可以在更大的动态范围内来表征LAI的变化幅度,这与图8所呈现的结果一致。
图13 差异分析结果统计图
表3 差异分析结果精度统计表
4 结束语
受制于遥感传感器的自身工作状态、空间配准精度、大气特性影响以及遥感反演的误差等因素,反演的产品或多或少存在一定的误差,遥感产品精度的准确评价决定产品投入生产应用的深度。本文在综合真实性检验技术和方法的基础上,开发并设计了叶面积指数遥感产品真实性检验系统。用户在界面中输入必要的参数,系统可自动根据数据库中的数据情况完成验证分析,反馈验证结果报告。该报告涵盖了产品的信息描述、验证结果图和统计分析表,用户可以非常直观地判读所要验证的产品精度如何。基于该系统,本文选择2010—2011年中国区域MCD15A2 LAI产品为例,完成了自动化真实性检验。从给出的结果来看,本系统的验证分析与已有参考文献的结果基本相符。
叶面积指数定量遥感产品真实性检验系统的设计与实现有助于流程化和自动化地评价产品精度,促进遥感反演产品快速标准化的质量和精度评估,便于用户快速地根据精度要求确定产品是否可以投入到实际生产应用中。但是首先鉴于地面验证数据集的数量、代表性的差异,该系统的验证结果和分析具有局限性,需要在后期搜集更多的验证数据集存放到数据库中;其次在预处理过程中,采用的算术平均法来进行尺度转换会对结果造成偏差,需要针对不同的产品采用不同的尺度转换方法;另外在真实性检验报告中未能分植被类型显示验证结果,后期还需完善。