APP下载

1996-2015年中国大气无机氮湿沉降时空格局数据集

2019-11-26贾彦龙王秋凤朱剑兴陈智何念鹏于贵瑞

关键词:分布图插值克里

贾彦龙,王秋凤,朱剑兴,陈智,何念鹏,于贵瑞*

1. 河北农业大学林学院,河北保定 071000

2. 中国科学院地理科学与资源研究所生态系统网络观测与模拟重点实验室,北京100101

3. 中国科学院大学资源与环境学院,北京 100190

数据库(集)基本信息简介

数据库(集)组成数据集包括1 2个数据文件,分别为不同时期N H 4+-N、N O 3--N和D I N湿沉降空间格局数据,命名规则为X X X_Y Y Y Y_Y Y Y Y.t i f f,其中X X X代表氮沉降的种类,Y Y Y Y_Y Y Y Y代表时间段。例如:N H 4+_1 9 9 6_2 0 0 0.t i f f是1 9 9 6-2 0 0 0年中国大气N H 4+-N湿沉降空间格局数据。

引 言

大气氮沉降(Atmosphere nitrogen deposition)是指大气气态和颗粒态含氮物质通过大气降水(云滴、雾滴、雨和雪)或在重力、湍流等作用下沉降到地球表面的过程。由于农业、工业和城市的快速发展,中国区域的人为活性氮排放迅速增加,这导致进入生态系统的大气氮沉降量持续增加[1]。大气氮沉降对自然生态系统、人工生态系统和人类都具有重要影响。例如,这些氮素可以促进森林和草地的生产[2-3]、影响温室气体平衡[4]。同时,过量的氮沉降也会引起土壤和水体的酸化[5]、降低土壤的缓冲能力[6]、减少生物多样性[7]。因此,获取一套科学、系统、动态的大气氮沉降的空间格局数据,是研究其生态效应、环境效应的关键和前提。

从全球尺度来看,目前大气氮沉降空间格局的共享数据主要来自于大气化学传输模型的模拟结果。例如,Dentener[8]基于TM3模型得到的1860年、1993年和2050年全球大气氮沉降分布图(空间分辨率:5°×3.75°,http://daac.ornl.gov/)。在中国区域,虽然学者们基于模型法和空间插值法研究了中国大气氮沉降的空间格局[9-10],我们的前期工作也对中国大气氮湿沉降的时空格局进行了探讨[11-12]。然而,迄今为止仍然没有一套符合中国实际情况、空间分辨率高、具有长时间动态变化系列的氮沉降空间格局共享数据出现,某种程度上限制了中国科学家在相关领域的研究工作。

在本研究中,我们基于文献检索获得的大气湿沉降站点数据,通过克里格空间插值法系统地生产了1996-2015年(5年一期,共4期)中国大气无机氮湿沉降的空间格局数据集,其指标具体包括铵态氮(NH4+-N)、硝态氮(NO3--N)、可溶性无机氮(DIN,为NH4+-N与NO3--N之和)。本数据集的公开共享,将为研究中国氮沉降的生态效应、环境效应等提供科学基础,也可为国家层面的氮素管理提供政策支持。

1 数据采集和处理方法

中国大气无机氮湿沉降时空格局数据集生产流程包括站点数据收集和空间数据生成两大部分(图1)。

1.1 站点数据收集和处理

本研究中,用于生成大气无机氮湿沉降空间格局的站点数据来自1996-2015年公开发表的国内外氮沉降文献数据。站点数据集的生成包括数据收集和数据处理两大部分。

站点数据收集的主要流程包括关键词确定、标准制定、文献收集、数据提取、数据核查五个部分(图 1A)。为了尽量全面地收集氮沉降相关的文献,本研究制定的中文检索关键词为“氮沉降”“湿沉降”“降水化学”“酸沉降”,英文关键词为“nitrogen deposition”“chemical composition of precipitation”“rainwater chemistry”“acid rain”,分别从中国知网(CNKI)和Web of Science检索中国区域氮沉降的中英文文献。制定有效数据的收集标准为:(1)观测指标为降水中的NH4+-N、NO3--N和DIN的浓度或氮沉降通量;(2)观测频率为每日、每周或每月;(3)连续一年以上的观测数据。将收集到的文献进行初步筛选后,对含有有效数据的文献进行数据提取。数据提取完毕后,专门组织人员对提取的数据进行核查,确保原始数据的真实性、可靠性。

图1 中国大气无机氮湿沉降空间格局数据集制作流程

站点数据处理的主要流程包括采样方法、坐标转换、单位转换、通量转换和异常值剔除。由于文献数据来自不同学者的观测,具有复杂性、不统一的特点,因此对提取的数据进行精细的处理是形成规范化数据集的关键。具体的处理过程为:(1)采样方法。湿沉降的采样方法主要为雨量桶法和智能降水采集器。如果采用的是智能降水采集器或雨量桶及时收集的方法,那么得到的是湿沉降(Wet-only deposition)。如果每次降水后雨量桶收回不及时,就会有部分干沉降进入样品,则形成的是混合沉降(Bulk deposition)。在收集的文献数据中,既有湿沉降也有混合沉降,为了将所有数据统一为湿沉降,我们把在同一站点同时进行两种观测的数据进行分析,发现二者具有非常显著的相关性(图2),湿沉降占混合沉降的比例约为70%。我们采用这一系数将所有混合沉降数据向湿沉降数据进行了转化。(2)坐标转换。站点数据的空间位置信息非常重要,但是不同文献中的坐标存在单位、坐标系统不同等差异,需要把它们统一为同一坐标系下相同的单位。(3)单位转换。由于文献检索数据氮沉降通量的单位多种多样,我们将不同单位统一为kg N ha-1yr-1。(4)通量转换。对于文献中只有降水氮浓度年均值的数据,通过该浓度数据乘以相对应的年降水量得到年沉降通量。(5)异常值剔除。数据转换完毕后,通过三倍标准差法对异常值进行剔除。

最后,经过上述数据流程和再一次的数据核对后,共获得中国区域湿沉降站点-年有效数据1807条,覆盖中国33个省、直辖市、自治区和特别行政区,不包含我国台湾地区和南海诸岛。其中,1996-2000年、2001-2005年、2006-2010年、2011-2015年的数据分别为368、576、554和309条。

图2 混合沉降与湿沉降的关系(单位:kg N ha-1 yr-1)

1.2 空间数据生成

为了获取中国大气氮湿沉降的空间格局,本研究借助地统计方法来把站点观测数据外推到空间连续的区域内。在本研究中,我们使用克里格空间插值方法得到1996-2015年4个时期中国NH4+-N、NO3--N、DIN湿沉降的空间分布图。

克里格空间插值法是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法[13]。空间连续、存在空间自相关的变量,且数据满足正态分布是应用该方法的基本条件[14]。大气氮沉降是空间连续的变量,其空间自相关性可通过该方法中的块金系数检验,当块金系数≤25%时,变量的空间自相关为强相关。在本研究中,NH4+-N和NO3--N沉降的块金系数均≤25%,因此,在数据满足正态分布的情况下可以应用该方法。克里格空间插值法包括普通克里格(Ordinary Kriging)、简单克里格(Simple Kriging)、协同克里格(Co-Kriging)、泛克里格(Universal Kriging)等多种方法,不同方法有其适用的条件[15]。大气氮沉降满足普通克里格方法的条件,即假设属性值的期望值是未知的,所以本研究采用普通克里格作为插值方法。具体的空间插值流程包括探索性数据分析、数据正态分布检验和转化、最佳变异函数确定等(图1B),详细说明见Jia等人的文献[11]。

为了检验插值结果的准确性,我们对插值结果进行了独立数据的验证。最终,基于收集到的不同时期的湿沉降站点数据,通过克里格空间插值法分别得到1996-2000年、2001-2005年、2006-2010年、2011-2015年NH4+-N和NO3--N的空间格局分布图,然后将各时期的NH4+-N和NO3--N的分布图相加得到DIN分布图。空间格局分布图的空间分辨率为1 km×1 km,数据格式为tiff。

2 数据样本描述

2.1 命名格式

中国大气氮湿沉降空间格局数据集文件的命名遵循如下规则:XXX_YYYY_YYYY.tiff,其中XXX代表氮沉降的种类,如 NH4+-N、NO3--N或 DIN,YYYY_YYYY代表时间段。例如NH4+_1996_2000.tiff是1996-2000年NH4+-N湿沉降分布图。

2.2 数据样本

本数据集包括1996-2000年、2001-2005年、2006-2010年、2011-2015年4个时期NH4+-N、NO3--N、DIN湿沉降的空间格局分布图,共12个文件。图3为2011-2015年NH4+-N、NO3--N、DIN湿沉降空间格局分布图的数据展示。湿沉降单位为kg N ha-1yr-1,颜色由绿到红代表湿沉降通量逐渐增大,白色区域为无数据区域。在此需要特别说明,由于本文是假设大气氮沉降是空间连续的,采用空间插值获得了空间栅格数据;因此,所获得的全国平均氮沉降在数值上会低于前期直接通过站点间的简单算术平均值方法所获得的估算结果。与欧洲或北美不同,我国的区域经济发展不平衡,东南部发达地区氮沉降高、监测站点多,而广袤的西北部经济不发达地区氮沉降低、监测站点少。因此,简单算术平均法对中国氮沉降的估算结果会比空间插值法或模型法高估大约35%-45%,具体讨论详见He等人的文献[16]。

图3 2011-2015年中国大气无机氮湿沉降空间格局分布图(数据不包括我国台湾地区和南海诸岛)

3 数据质量控制和评估

本数据集源于文献检索获取的氮沉降站点数据和基于地统计学方法生成的氮沉降空间格局数据,从氮沉降点数据的收集到面数据的生成,采用了一套完整的数据质量控制和评估体系,能够确保数据的准确可靠。

氮沉降站点数据来自于文献检索数据,如何利用来自于不同研究的文献数据形成一套具有对比性的规范化数据是关键。氮沉降文献中,降水中NH4+-N和NO3--N化学测定方法绝大多数均采用了具有可比性的标准方法(离子色谱法和分光光度计法,中国国家标准GB 11894-89),这是本研究能够进行氮沉降文献数据整合分析的基础。而且,降水样品不同采样方法造成的湿沉降和混合沉降的差异,本研究也进行了有效的统一(图2)。此外,在文献数据检索方面,从检索关键词的确定、提取关键参数的确定、提取表格的制作,到数据提取人员的选择、数据后期处理方法的制定均经过专家论证、认可,确保在文献数据量大、参与人员多的情况下,做到数据提取的准确、完整、规范。在数据收集完毕后,再次校对数据,并进行数据单位转换、相同点数值剔除、异常值甄别等处理,最终形成一套规范化的湿沉降站点数据集。

湿沉降空间格局的生成是在规范化的站点数据集基础上通过空间插值法完成。为了保证插值结果的可靠性,从插值方法的确定、探索性数据分析、最佳变异函数确定到如何在ArcGIS地统计模块的操作均经过专家论证,并且对插值结果进行了独立验证。验证数据提取自中国农业大学建立的氮沉降观测网络数据(43个站点)[17],评价指标包括R2、RMSE、回归系数、p值(图4)。其中,NH4+-N、NO3--N、DIN的R2分别为0.61、0.40、0.61,RMSE分别为3.21、3.22、4.93,回归系数分别为1.03、0.67、0.89,p值均小于0.001。验证结果表明,插值的结果能够较好地表达中国大气氮湿沉降的空间格局分布趋势。

图4 空间插值结果的独立验证(单位:kg N ha-1 yr-1)

本研究中所使用的湿沉降观测数据来自于公开发表的文献,虽然在数据收集、数据整理和空间插值的过程中经过了严格的筛选、质量控制和结果验证,研究结果具有较高的可靠性,但是仍然存在一些不确定性可能会对湿沉降的空间格局评估结果造成影响。这些不确定性主要来源于以下3个方面:(1)样品的保存和测定方法。湿沉降的测定样品主要来自于雨量桶收集的降水,因此不同研究者对样品保存和测定方法的差异可能会对湿沉降的测定结果造成一定的误差。(2)观测点分布的不均匀性。本研究系统地收集了中国湿沉降的文献数据,获得了较大的数据量,但是我国的氮沉降观测在空间上分布不均匀,呈现东部密集、西部稀少的趋势,这会影响空间插值结果的准确性。(3)湿沉降和混合沉降的比例系数。由于该方面研究少,本研究在全国尺度使用了统一的比例系数70%,而且本研究空间插值验证数据集(中国农业大学氮沉降研究网络数据)也是混合沉降的数据,虽然也经过了比例系数的转换,但是这些都在一定程度上增加了中国湿沉降评估和验证的不确定性。因此,应加强我国氮沉降的长期、联网、标准观测,尤其是在我国西部地区,以减少氮沉降空间评估、验证和生态效应研究的不确定性。

4 数据使用方法和建议

本数据集可通过Science Data Bank网站申请下载(http://www.sciencedb.cn/dataSet/handle/607),全部数据均由ArcGIS环境下制作生成,格式为tiff,可在支持以上格式的可视化地理信息系统软件中查看和使用。本数据集主要是提供可共享的大气无机氮湿沉降的空间格局数据,有关中国氮沉降估算的结果可进一步参考我们前期的论文[11-12]。此外,本数据适用于氮沉降及其生态效应、环境效应等研究的空间分布趋势评估,但对于氮沉降及其影响的单点评估可能会存在一定的误差。若需要关于氮沉降、酸沉降的站点观测数据,可参考本研究组的相关论文[12,18-21]。

猜你喜欢

分布图插值克里
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
大银幕上的克里弗
贵州十大地质公园分布图
你今天真好看
你今天真好看
基于pade逼近的重心有理混合插值新方法
混合重叠网格插值方法的改进及应用
中国癌症分布图
要借你个肩膀吗?
浙江省第一批省级特色小镇分布图