基于树轮宽度指数的过去千年美国分区降水变化数据集
2021-10-13白孟鑫郝志新张学珍郑景云
白孟鑫,郝志新,张学珍,郑景云*
1.中国科学院地理科学与资源研究所,中国科学院陆地表层格局与模拟重点实验室,北京 100101
2.中国科学院大学,北京 100049
引 言
树轮是指示过去气候变化的主要自然代用证据之一,利用其重建数百至千年以上的高分辨率降水变化序列,是揭示年代–百年尺度降水变化特征的重要基础,对理解年代–百年尺度气候变化的机制具有独特价值。美国树轮资料丰富,至今已利用这些资料重建了上百个降水变化序列[1],如公元1602 年以来美国96 个站的冬季降水序列[2],过去2139 年新墨西哥州西部地区的冷、暖季降水序列[3-4],过去700 年北落基山地区的夏季降水序列[5]等;还研制了覆盖美国本土、空间分辨率达2.5°×2.5°的夏季PDSI(Palmer Drought Severity Index,帕默尔干旱指数)格网化数据集[6],其中半数以上格点长逾800 年,西部地区的多数格点甚至达公元1000 年之前。特别是最近又新建了几乎覆盖整个北美空间分辨率达0.5×0.5°的冷季(10–4 月)和暖季(5–7 月)降水数据集[7],其中多数格点序列长达500年以上,西南地区的部分格点序列甚至长达2000 年。对这些格网化重建结果的分析发现:在过去1000 多年中,美国降水异常的季节差异及空间格局与厄尔尼诺–南方涛动(El Niño-Southern Oscillation,ENSO)、北极涛动(the Arctic Oscillation,AO)、大西洋多年代际振荡(the Atlantic Multidecadal Oscillation,AMO)密切相关[7-9];且在公元966–985 年、1271–1297 年和1568–1591 年等发生过多次大范围年代际特大干旱(mega-droughts)[8],其中尤以1568–1591 年的特大干旱强度最大、持续时间最长[7-8]。
美国降水呈显著的东多西少分布,其中东部地区气候湿润,但降水自东(年降水1000 mm 以上)向西(100°W 沿线附近区域年降水为500 mm 左右)递减;西部除太平洋东岸沿海地区年降水为500 mm 以上外,其余大部分地区年降水不足500 mm,美国中西部地区(以科迪勒拉山脉为主)年降水甚至低于300 mm,为半干旱气候。最新的降水观测分区资料显示,尽管在1895–2009 年间,美国大多数地区的降水呈增加趋势,但年代际降水变化的位相却存在较显著的区域差异。如20 世纪40–60年代,美国西南部降水显著减少,但东南部及大平原南部却显著增加;20 世纪80 年代,美国西南部降水显著增加,但东南部却无显著变化[10]。加之,不同地点的树轮资料长短不一,对降水异常的响应敏感度也存在显著的季节差异,如西部和南部的树轮主要对冷季(10–4 月)的降水异常响应敏感,而其他大多数地区的树轮则高度受控于暖季(5–7 月)的降水变化[11];因此。本文拟以美国年降水变化分区为基础,结合树轮对降水异常响应的空间特征,分区重建其降水变化序列。较单点降水/PDSI重建,按区域重建降水有利于比较不同区域降水的年代–百年尺度变化特征差异;较格网化降水/PDSI重建,分区重建降水序列可采用更多的树轮样本,从而提升了重建结果的可信度。这对进一步研究美国与北半球其他地区(如东亚、欧洲等)降水长期变化的遥相关特征及机理也具有独特价值。
1 数据采集和处理方法
1.1 数据源
本文研究区域为美国(不含阿拉斯加州和夏威夷州)本土,重建所用的基础数据为树轮宽度指数,校准数据为逐月器测降水格网化数据。树轮宽度指数年表源于全球古气候资料共享网(WDS for Paleoclimatology Data,https://www.ncdc.noaa.gov),共1258 个地点(以西南沿海地区、落基山脉、密西西比平原及阿巴拉契亚山脉等的采样点最为密集),60 余个树种,但以西黄松(Pinus ponderosa)和花旗松(Pseudotsuga menziesii)为主。其中,6 个年表始于公元1 年前,20 个始于公元500 年前,60 个始于公元1000 年前,这些超过千年的年表大多分布于落基山脉和西南沿海地区,仅有少数分布于密西西比平原和东南沿海地区;还有268 个始于公元1500 年前,682 个始于公元1750 年前,205 个始于公元1900 年前,剩余15 个始于1950 年前,它们基本遍布于美国本土(图1)。
图1 美国地形及树轮宽度指数年表起始年份空间分布(三角符号越大表示起始年份越早)
逐月器测降水格网化数据源于英国东安格利亚大学气候研究中心(Climatic Research Unit,University of East Anglia)研制的CRU TS 3.10 数据集,其空间分辨率为0.5°×0.5°,覆盖时段为1901–2015 年;由全球2400 多个气象观测站的逐月降水观测值采用角距离加权法插值得到,同时在插值过程中考虑了站点迁移及观测仪器更换等因素[12]。由于20 世纪初期,美国气象观测站空间分布不均,导致早期插值结果不确定性较大,因此本研究使用其1920 年以后的数据。
由于树轮宽度的年际变化不仅受当年生长期的降水异常影响,还可能受其前非生长期(即上年晚秋及冬季)降水异常引发的土壤含水量影响[13-14]。为与这一特征对应,本文在进行降水变化分区和重建降水量时,将降水的统计年度定义为上年10 月至当年9 月。
1.2 降水变化分区及重建
1.2.1 降水变化分区
本文采用旋转经验正交函数(Rotate Empirical Orthogonal Function,REOF)分析美国本土1920–2015 年降水变化的典型空间模态。较传统的经验正交函数(EOF)分析,REOF 使每个主模态高荷载变量集中于某一区域,而其他的变量荷载接近于零,故能更清晰揭示降水变化的区域差异[15]。其中,在确定分区数量时,除考虑REOF 的累计方差贡献率外,还同时计算了轮宽与所在格点降水变化相关系数,用于揭示与年降水异常显著正相关的轮宽指数地理分布特征,以保证所划分的每个区均含有与降水变化高度相关的树轮年表用于降水重建。结果显示:当取前12 个REOF,即将美国本土降水变化分为12 个区(图2)时,其累计方差贡献达72.51%,揭示了降水变化区域差异的主要特征,且所分的每个区也均含有与降水变化高度相关的轮宽指数样点。因此,本文将美国本土降水变化分为12 个区进行后续的分区降水重建。这些区域分别是:I.西北沿海(NWC);II.落基山北部(NRM);III.落基山中部(MRM);IV.大平原北部(NGP);V.大湖区(GLR);VI.东北沿海(NEC);VII.西南沿海(SWC);VIII.落基山南部(SRM);IX.大平原中部(NGP);X.密西西比平原(MIP);XI.大平原南部(NGP);XII.东南沿海(SEC)。具体分区界线及各区所包含的与该区年降水变化显著正相关(达0.1 显著性水平)的轮宽指数样点(共632 个)分布见图2。其中,除落基山北部和大平原北部2 个区分别只有6 个和4 个与该区年降水变化显著正相关的树轮样点外,其余10 个区均含有多个与对应区年降水变化显著正相关的树轮样点,使得重建各区降水变化序列时有足够的代用数据用于遴选和校准,从而保障了重建结果的可信度。
图2 降水分区及树轮宽度指数与年降水相关系数
1.2.2 分区降水变化序列重建
本文利用逐步回归分析遴选对区域降水变化方差有贡献的树轮年表,然后采用偏最小二乘回归方法,构建降水重建的校准模型,以避免因区内不同地点年表间高度相关而致的冗余贡献。其中校准数据为各区1920–1979 年的器测年降水量,同时采用分段(即分为1920–1949 年和1950–1979 年2 个时段进行互为校准和验证)方法[16],计算回归模型的误差缩减值(Reduction of Error,RE)和有效系数(Coefficient of Efficiency,CE),验证校准方程的有效性[17]。RE 和CE 的计算公式如下:
式中,Xi为第i年的观测值,分别为校准时段和验证时段模型给出的第i年的预测值,分别为校准时段和验证时段的平均值。由于对每个区域而言,时间越早可利用的树轮年表越少,因而为最大限度地利用树轮年表,同时尽可能重建出更长的降水量序列,我们采用分段方法进行重建[18]。即以每个年表的起始年份为节点,依次前推,分时段构建降水重建的校准模型,直至所构建的校准模型的预测方差解释量不足20%时为止。最后采用方差匹配方法,将利用不同回归方程所重建出的各个时段降水量校准为均一的逐年降水量序列。
如在美国西北沿海地区,共有树轮宽度指数年表167 个,其中与年降水变化显著正相关(达0.1显著性水平)的年表39 个,且距今最近的始于1850 年,最远的始于766 年。那么,首先以所有39个年表作为候选自变量,通过逐步回归分析可遴选对该区域降水变化方差有贡献的树轮年表为2 个。然后采用偏最小二乘回归方法,构建降水重建的校准模型(对应的RE、CE 等见表1),用其重建1850–1979 年的降水量。至1849 年,年表数量减为38 个,则以这38 个年表作为候选自变量进行逐步回归分析,其遴选出与上一时段不同的两个年表,用其重建1759–1849 年的降水量。然后依此不断前推。因可用于回归分析的候选年表不断缩减,至766 年前年表减至1 个,用其所构建出的校准模型,其最大者不足20%,则不再进行该区766 年前的降水变化重建。因在重建不同时段降水时,其所用校准模型的方差解释量存在一定差异,故最后需要根据各个时段回归方程所重建出的校准时段降水序列方差,以其中最大时段回归方程所重建出的校准时段降水序列方差为参照,采用方差匹配方法对利用不同回归方程所重建出的各个时段降水量进行校准,以形成方差均一的逐年降水量序列。
表1 美国西北地区不同时段的降水重建校准模型及其所用的年表数和主要统计量
2 数据样本描述
根据上述方法重建的美国本土12 个地区降水变化如图3 所示,包括各区的年降水量重建值及其95%置信区间、预测方差解释量及不同验证期的RE 和CE。相应的数据集存储于1 个excel 文件(“美国分区降水变化重建数据集.xlsx”),其中每个区为1 个表格,以区域名命名表名。每个表的第一行各列为字段名,分别是年份、重建的降水量、95%置信区间、预测方差解释量、验证期为1920–1949年的RE 和CE、验证期为1950–1979 年的RE 和CE、总样本量和构建回归方程的样本量,后续各行为每年的数值。
图3 显示,在12 个分区降水重建序列中,最长的两个区位于美国西南部,其中落基山南部始于公元122 年,长度达1858 年;西南沿海地区,始于公元488 年,长度为1492 年;起始年份达公元1000 年之前还有东南沿海,始于760 年;西北沿海地区,始于766 年;其余各区的序列长度均不足千年,其中最短的位于美国东北部的大湖区,始于公元1689 年,长度仅291 年。所有序列均止于1979 年。
图3 美国各区降水变化重建结果
需要说明的是,由于时间越早,可用于各区降水重建候选树轮年表越少,因而时段越早,参与降水重建的年表数量通常也越少,校准模型的预防方差解释量也越低,重建结果的不确定性范围(95%置信区间)亦越大。
3 数据质量控制和评估
本文通过严格的数据源遴选和统计分析、校准等进行重建结果的数据质量控制。其中在数据源遴选方面,本文只选用了各区内与该区年降水变化有显著正相关(即降水越少,树木径向生长越慢)的树轮年表作为降水重建候选年表。在此基础上又通过逐步回归分析,进一步剔除对各区降水变化方差无贡献的树轮年表,这保障了入选年表可明确指示降水变化。对器测的格网化数据,本文只选用了1920 年以后的数据,避免了因20 世纪初期美国气象观测站少、且空间分布不均而导致的早期插值结果不确定性大的问题,保障了降水变化分区分析和重建降水时所用的校准数据质量。在统计分析、降水重建的校准模型构建方面,本文均按古气候重建和统计分析要求,对其中的各个分析环节进行了严格的统计检验,包括在降水变化分区时对REOF 进行North 独立性检验;利用逐步回归分析进行候选年表遴选时进行95%显著性水平的F 检验;在构建降水重建的校准模型时,采用分段方法严格进行模型的有效性验证等,从而有效保障了重建结果的数据质量。
此外,本文还按0.5°×0.5°格网计算了1920–1979 年各区降水变化重建数据对器测降水变化的方差解释量(图4)。结果发现:这一数据集对美国本土降水变化的方差解释量超过30%的格网占82%以上,超过40%的格网占69%以上,超过50%的格网占59%以上。其中对西南沿海大多数格网降水变化的方差解释量超过了70%。对比最近发表的北美空间分辨率达0.5×0.5°的冷季(10–4 月)和暖季(5–7 月)降水数据集对器测降水变化的方差解释量[3],本数据集对美国东北部降水变化的方差解释量优于该数据集,对其他区域则基本相当。这不但说明本数据集对美国降水变化有很好的空间代表性;而且也说明本数据集对美国东北部等区域降水变化解析精度更优。
图4 本数据在0.5°×0.5°格网上对美国本土器测降水变化的方差解释量空间分布
4 数据价值
本数据集不但为进一步揭示美国本土在过去数百至千年的降水多尺度变化的时空特征提供数据基础,而且对研究北半球、甚至全球降水多尺度变化的时空差异与遥相关型及其关联机制也具有重要价值。同时,其研制思路和方法对利用代用资料研制其他区域过去气候变化数据集也有借鉴作用。
5 数据使用方法和建议
本数据集可以使用Excel、MATLAB 和Python 等数据处理软件直接读取。使用时还需要注意,本数据集在不同区域及不同时段,其重建值的95%置信区间(即不确定性范围)是不同的;因此建议使用者结合自身对数据精度的需求及本数据的这一特点,选用符合自身需求的适用区域与时段。