基于改进U-Net的CMIP5全球气候模式降尺度方法及其在鄱阳湖流域的应用*

2022-01-12李克诚陆建忠张可睿陆呈瑜袁明坤

湖泊科学 2022年1期

李克诚，陆建忠，张可睿，陆呈瑜，陈璞，袁明坤

(1：武汉大学资源与环境科学学院，武汉 430079)

(2：武汉大学测绘遥感信息工程国家重点实验室，武汉 430079)

气候变化问题是当今世界各国关注的焦点[1]. 政府间气候变化专门委员会(IPCC)第五次评估报告指出[2]，1880-2012年，全球表面平均气温上升约0.85℃,全球的气候和环境受到重要影响. 区域气候研究是气候领域的重要研究方向. 由于区域气候受到当地经纬度、地势地貌、土地利用类型等因素影响表现出极强的区域分布特征[3]，全球气候模式并不适合于小尺度上区域气候变化的研究，为此有学者提出全球气候模式降尺度的概念.

当前气候降尺度方法主要分动力降尺度法和统计降尺度法两种：Vannucchi等[4]利用动力降尺度方法对西北地中海地区的风浪进行了分析，这种方法的缺点是模型繁杂、计算量较大[5-6]. 而统计降尺度模型方法相对简便易行，是最常用的方法之一[7-9]，如Pomee等[10]利用多元线性回归法建立统计降尺度模型对巴基斯坦印度河流域气温进行了预测，刘子豪等[11]利用Penman-Monteith(P-M)公式、逐步回归分析法建立统计降尺度模型对鄱阳湖流域未来参考物蒸散量进行了预估. 上述研究中基于线性回归的统计降尺度模型并不能模拟复杂的非线性关系，存在精度不足的问题，目前有部分学者研究基于非线性模型的统计降尺度算法，如申泽西等[12]通过构建非线性回归降尺度模型(SNSDM)分析中国北部农牧交错带及半干旱半湿润气候过渡带的降水情况，罗小波等[13]利用基于局部地理加权回归(NL-GWR)模型的地表温度(land surface temperature, LST)降尺度算法研究了华北地区地表温度.

近年来，以深度学习为代表的人工智能算法发展迅猛，深度学习算法使得机器能够自动地从海量的图像、声音等数据中学习内在规律[14-15]. 在深度学习有关气候水文研究的应用方面，杜方洲等[16]利用深度前馈神经网络分析了中国东北地区降水，徐瑾昊等[17]基于卷积神经网络构建了自动识别石冰川的方法. 目前，相关研究罕见提及基于深度学习的气候模式降尺度方法.

在上述研究基础上，本文提出利用深度学习算法构建降尺度算法，通过改进并运用U-Net网络，建立了基于深度学习的气候模式空间降尺度模型，并利用气象站实测数据在拟合精度和极端气候事件模拟能力两方面验证了方法的性能，基于DLDM方法输出的流域未来的高空间分辨率气候数据研究了温室气体低排放和高排放情景下流域未来的气候变化趋势. 本文能够为鄱阳湖流域气候变化预测及环境保护政策制定提供数据、技术以及理论上的支持，对保护鄱阳湖流域生态环境具有极其重要的意义.

1 研究区域及数据说明

1.1 研究区域

鄱阳湖流域(24°28′～30°05′N，113°33′～118°29′E,图1)整体位于江西省境内，由赣江、信江、抚河、饶河和修水五大河流以及鄱阳湖构成，是我国长江中下游的重要水系. 流域三面环山，中部地区平原、丘陵分布广泛，流域内气候温暖湿润，雨量丰沛，属于亚热带湿润气候，多年平均气温为17.5℃,多年平均降雨量为1664 mm[18-19]. 近年来，随着人类活动的增加，鄱阳湖流域的气候水文过程已经发生了明显的变化，尤其是极端高温低温、洪涝干旱灾害等极端气候事件频繁发生[3].

图1 鄱阳湖流域

1.2 数据

本文使用的数据分为气候模式数据和气象站实测数据. 气候模式数据方面，本文采用CMIP5中IPSL-CM5A-LR模式和BCC-CSM1.1模式的逐月近地表气温数据和逐月降水数据，水平分辨率分别为3.75°×1.9°、1.0°×1.0°，典型浓度排放路径(RCP)包括RCP2.6、RCP8.5两个情景，时间范围包括历史阶段(1965年1月-2005年12月)以及未来阶段(2006年1月-2100年12月)，数据来源于CMIP5数据节点网站(https://esgf-node.llnl.gov/search/cmip5/). 气象站实测数据方面，本研究选取鄱阳湖流域内部及邻近的18个气象观测站的逐月近地表平均气温数据和逐月降水数据，时间范围为1965年1月-2005年12月，数据来源于国家气象科学数据中心(http://data.cma.cn/).

2 研究方法

区域气候具有较大的空间异质性[20-21]，这是全球气候模式无法应用于区域气候分析的根本原因. 气候模式统计降尺度方法本质上是借助大量观测数据，建立大尺度气候模式与区域气象要素的相关关系，方法的一般步骤为[7-11]：(1)气候模式数据的空间插值；(2)插值后气候模式数据的偏差校正. 空间插值方法上，本文采用反距离权重插值法(IDW)，将模式数据和气象站实测数据插值成20 km×20 km分辨率的栅格数据. 偏差校正方法上，本文使用基于改进U-Net网络的偏差校正方法，后文将对此进行详细论述，并以线性回归法作为参照[22]，本研究采用的流域极端气候事件的界定标准如2.3节所述.

2.1 U-Net网络改进与偏差校正模型设计

U-Net是一种全卷积网络设计思想，主要用于图像像素级实例分割[23-24]. 本文对U-Net网络的改进内容包括：(1)降低原始网络复杂度，将原始网络的4次特征图拼接(feature map copy and crop)过程简化为2次，将气候栅格数据视作简单图像数据；(2)通过在网络首部加入插值(interpolation)处理层，将特征图的分辨率从25×24变换为48×48，方便层内进行卷积、池化运算；(3)网络采用反卷积(deconvolution)算法作为上采样(upsampling)方法，与卷积运算形成呼应.

改进U-Net网络(图2)由Encoder、Decoder两部分组成，整体呈“U”型对称结构. Encoder层从气候数据中提取出特征图，蕴含气候数据的高级特征. 随着层数加深，特征图通道数逐渐由1增加到16，较低级特征变为高级特征；由于卷积、池化等操作，气候数据的位置信息发生丢失，特征图数据分辨率逐步由48×48降低到12×12. Decoder层的核心算法为上采样算法，特征图经过上采样后分辨率提升，之后Decoder层会将当前特征图结合与其形成对称关系的Encoder层输出的特征图(如图中A、B两特征图)，从而在保留气候数据高级特征的同时重建位置信息，此过程中特征图分辨率由12×12恢复到48×48，经过网络尾部卷积层输出分辨率为25×24的数据，从而建立起输入输出数据的联系.

图2 改进U-Net网络结构

改进U-Net网络结构中包括特征图拼接、卷积、激活、池化、上采样操作：

1)特征图拼接：改进U-Net网络能够将蕴含气候数据的高级特征与位置信息的特征图进行拼接从而重建气候数据栅格，这一点秉承了U-Net网络的设计精髓.

2)卷积：卷积层利用卷积核(convolution kernel)将气候数据栅格按照预先设定的步长、填充进行卷积，提取出气候数据的高级特征. 设输入特征图高为H，宽为W，卷积核高为FH，宽为FW，填充为P，步幅为S，卷积后输出图像高为OH，宽为OW，则输出特征图大小计算公式为：

(1)

(2)

卷积核个数可以决定生成特征图的通道数，通道数越多特征图包含越高级的特征. 为使改进U-Net网络结构学习气候数据的分布特征，网络中特征图通道数根据网络深度不同分别设置为1、8、16.

3)激活：激活函数层对卷积层的输出作一次非线性映射，将层间加权运算后的信号值通过激活函数转化为输出信号. 由于气候数据总体数据量较大，改进U-Net网络采用ReLU函数作为激活函数，以减少模型运算量、降低参数之间的依赖性.

4)池化：池化作为下采样操作，能够缩小高、长方向上的空间. 改进U-Net网络结构的池化层均采用2×2最大值池化策略，用于特征降维，压缩参数数量，减小过拟合，同时提高系统鲁棒性.

5)上采样：改进U-Net网络采用反卷积算法提高特征图的分辨率，反卷积的计算公式为：

OH=S(H-1)-2P+FH

(3)

OW=S(W-1)-2P+FW

(4)

设气象站数据集SD,气候模式数据集MD,栅格的时空坐标为(i，j，t),其中i，j表示空间坐标，t表示时间. 模型输入气候模式数据，输出改正数据，将对应时空坐标的气象站实测数据作为真值，网络计算输出数据与实测数据的误差，之后进行误差的反向传播以不断修正神经元间权重，使得输出结果与实测数据误差逐渐减小并直至收敛. 经过大量数据训练，网络可视作气候模式数据的复杂非线性时空校正函数f,其中SD(i，j，t)=f(MD(i，j，t)).

2.2 极端气候事件界定标准

极端气候事件的模拟能力是反映气候模式降尺度方法性能的重要参考依据. 极端气候事件是指短时间内某个(或某些)气候要素达到多年一遇的程度，气象学上极端气候事件的界定一般需要根据该地区一段时间气候数据的统计特征[25]，指标包括极端温度和极端降水. 本文将极端高温月份定义为当月平均气温大于历史(1965年1月-2005年12月，共计492个月)月平均气温序列中第90百分位的阈值的月份，极端低温月份定义为当月平均气温小于第10百分位的阈值的月份；将极端强降水月份定义为当月降水量大于历史月降水量序列中第90百分位的阈值的月份，极端弱降水月份相应定义为当月降水量小于第10百分位的阈值的月份[26]. 计算气象站实测数据气温和降水数据的阈值，得到极端高温阈值为29.1℃，极端低温阈值为5.0℃；极端强降水阈值为353.6 mm，极端弱降水阈值为12.7 mm.

3 降尺度方法验证及未来气候变化特征分析

3.1 降尺度方法在鄱阳湖流域的验证

基于气象站点实测数据，利用线性回归方法对比验证DLDM方法的模拟性能；同时对IPSL-CM5A-LR模式和BCC-CSM1.1模式在流域内的模拟性能进行比较.

3.1.1 降尺度方法拟合精度对比验证利用1965-2005年鄱阳湖流域气候模式数据和18个气象站点的实测数据分别训练DLDM和线性回归模型. 采用均方根误差(RMSE)评定DLDM中改进U-Net网络的拟合效果，经过1000次迭代误差均有明显下降并最终收敛，其中IPSL-CM5A-LR模式气温数据最终误差为6.32℃，降水数据最终误差为10091.89 mm(图3a)，BCC-CSM1.1模式气温数据最终误差为5.58℃，降水数据最终误差为12086.71 mm(图3b).

图3 DLDM方法训练结果

线性回归校正模型拟合结果(图4)表明模型拟合气温数据效果较好，其中拟合IPSL-CM5A-LR模式直线的R2值在0.9左右，拟合BCC-CSM1.1模式直线的R2值在0.93左右；拟合降水数据效果较差，两种气候模式拟合直线的R2值均位于0.1～0.3之间. 训练结果表明，DLDM方法和线性回归法训练气温数据误差较小，训练降水数据则都存在较大误差；此外，对于IPSL-CM5A-LR模式和BCC-CSM1.1模式，DLDM方法训练前者的误差小于训练后者的误差，线性回归方法训练两种模式的结果则不相伯仲.

图4 线性回归模型R2的空间分布

验证降尺度方法在各气象站点的拟合精度，将DLDM方法数据、线性回归方法数据与气象站实测数据分别作散点图，并计算均方根误差以及散点拟合直线的R2.以流域北部毗邻鄱阳湖、地势较低的九江(庐山)气象站和流域南部地势较高的赣县气象站为例(图5)，两站点DLDM方法模拟的均方根误差结果中，除IPSL-CM5A-LR模式下模拟赣县气象站气温数据结果的均方根误差大于线性回归方法模拟结果之外，其余7个场景均小于线性回归方法模拟结果；模拟气象站气温数据时，DLDM方法的拟合直线R2均不小于线性回归方法的结果，模拟气象站降水数据时，DLDM方法拟合直线R2在正常取值范围内，而线性回归方法拟合直线R2却都为负值，说明降尺度结果与实测数据几乎没有相关关系. 上述现象表明，DLDM方法拟合精度高于线性回归方法. 进一步比较IPSL-CM5A-LR模式和BCC-CSM1.1模式的拟合精度，前者气温数据的拟合精度不及后者，但降水数据的拟合精度高于后者. 结合前述两种模式在两种模型训练下精度各有高低的现象，并不能比较出两模式模拟性能的优劣.

图5 降尺度方法站点拟合效果

3.1.2 降尺度方法对流域极端气候事件模拟能力的比较验证依据极端气候事件界定阈值，从极端气候事件的数量和空间分布两方面对比各气象站点的记录结果和气候模式降尺度后的模拟结果，评估降尺度方法及气候模式对极端气候事件的模拟能力.

根据极端气候事件的数量，计算不同降尺度方法和气候模式模拟结果的标准相对误差，结果如表1所示. 可看出DLDM方法模拟极端气候事件的标准相对误差范围为-32.7%～56.5%，线性回归方法的相对误差范围为-99.65%～-18.50%，相比之下DLDM方法精度更高；进一步比较经DLDM方法降尺度后的两个气候模式，IPSL-CM5A-LR模式降尺度后模拟极端气候事件标准相对误差分别为2.3%、-25.0%，均优于BCC-CSM1.1模式(56.5%、-32.7%)，前者模拟效果更优.

表1 极端气候事件数量统计及误差对比

极端气温事件的空间分布方面(图6)，经DLDM方法降尺度后两气候模式的模拟结果均与实测较接近，形成极端气温事件主要集中在流域北部和中部的格局，但在数量上存在差异，整体而言模拟效果优良；经线性回归方法降尺度后两气候模式的模拟结果与实测差距较大，主要特征为27°N线北部地区极端气温事件较多，模拟效果不佳.

图6 气温极端气候事件的空间分布

极端降水事件的空间分布方面(图7)，线性回归方法模拟结果与实测结果差异十分明显，模拟效果不佳；经DLDM方法降尺度后的两个气候模式都模拟出极端降水事件主要分布在流域北部、西部的格局，这与实测类似，但IPSL-CM5A-LR模式模拟极端事件在流域南部分布也较多，BCC-CSM1.1模式模拟极端事件主要集中在流域北部，二者都与实测结果存在差异.

图7 降水极端气候事件的空间分布

综上所述，极端气候事件模拟能力方面DLDM方法性能优于线性回归方法，经DLDM方法降尺度后IPSL-CM5A-LR模式模拟效果优于BCC-CSM1.1模式.

3.2 流域未来气候空间分布格局

DLDM方法和IPSL-CM5A-LR模式的性能已得到验证，现依据2006-2100年该模式经DLDM方法降尺度后的气候数据，在RCP2.6和RCP8.5两个情景下分近期(2031-2040年)、中期(2061-2070年)、远期(2091-2100年)3个时期，根据流域各地区在3个时期内的平均值，以1965-2005年流域平均值为参照分析流域未来气候的空间分布格局.

流域未来平均气温的空间分布(图8)方面，整体而言RCP8.5情景下流域气温较RCP2.6情景更高，两情景下不同时期气温的空间分布特征类似，整体表现出南部气温较高、北部气温较低的态势，在流域中北部南昌气象站附近、西部井冈山气象站附近、东部贵溪气象站附近、南部寻乌气象站附近平均气温较高，表现出4个高温中心. 两情景下流域未来气温相较于1965-2006年流域实测气温有明显增高态势，其中RCP2.6情景下未来近期到远期流域各地区平均气温整体表现出先增高后降低的趋势，3个时期平均气温最高值均在20℃左右，流域中部在未来中期相比于该地区在近期和远期的平均气温更高，其余地区变化幅度不大，而RCP8.5情景下未来气温持续升高，流域内各个区域都有较明显的升温态势.

图8 未来鄱阳湖流域气温空间分布

流域未来降水的空间分布(图9)方面，RCP2.6、RCP8.5两情景下流域未来降水相比于历史实测降水有明显下降，不同时期都表现出北部、中东部和南部3个降水集中区域的分布格局，如未来降水较多的RCP2.6情景下的近期，流域北部庐山气象站附近平均月降水量达到120 mm；流域中部南城气象站和南部寻乌气象站附近平均月降水量达到105 mm；其余地区平均月降水量均在100 mm以下. 两情景下流域在近期、中期和远期3个时期平均月降水量均表现出递减的趋势，基本保持与历史实测一致的降水的空间分布态势. RCP8.5 情景下3个时期之间的变化幅度较大，其中近期流域降水较RCP2.6情景更多，中期基本持平，远期较RCP2.6情景更少.

图9 未来鄱阳湖流域降水空间分布

3.3 流域未来气候时间变化特征

基于2006-2100年气温和降水数据年均值时间序列，分析流域未来气候时间变化特征. 流域未来气候时间序列(图10)可以看出，RCP2.6和RCP8.5情景下流域未来年平均气温呈显著上升趋势，RCP8.5情景下流域升温趋势更为明显；RCP2.6和RCP8.5情景下流域未来降水均呈现下降趋势，RCP8.5情景下流域未来降水下降趋势更为明显.

图10 鄱阳湖流域未来气候时间序列

利用M-K(Mann-Kendall)非参数统计法方法和小波变换分析法分析流域未来气候的年际变化特征和突变趋势[27-30].

对流域未来气候进行M-K分析. 气温变化方面(图11a，c)，两种情景下流域未来气温均呈上升趋势，RCP2.6情景下未来气温在2020年前后发生突变，此后UF曲线超过0.05置信水平，气温急剧上升；RCP 8.5情景下气温并无明显突变，但UF曲线自2030年起超过0.05置信水平并一直攀升，说明气温上升趋势极为显著. 降水变化方面(图11b，d)，两种情景下流域未来降水均呈现先上升后下降的趋势，变化幅度不大，RCP2.6情景下降水变化较缓和，RCP8.5情景下降水在2075年左右存在突变，但突变点前后降水上升下降趋势均较为平缓.

图11 鄱阳湖流域未来气候年际变化特征和突变趋势

对流域未来气候进行小波变换分析. 气温变化方面(图12a，c)，RCP2.6和RCP8.5两种情景下流域未来气温变化都以56 a为第1主周期，在2010-2080年出现准两次“冷-暖”交替，RCP2.6情景下未来气温存在43 a的第2主周期，并在2006-2090年呈现准3次“冷-暖”交替；RCP8.5情景下，流域在10～30 a时间尺度下出现了更明显的局部周期变化，2006-2025年之间在15 a时间尺度下呈现两次“冷-暖”交替，2070-2100年在20 a时间尺度下呈现两次“冷-暖”交替. 降水变化方面(图12b，d)，两情景下流域未来降水变化都以56 a为第1主周期，以44 a为第2主周期，2006-2100年均存在“枯-丰”周期变化，其中第1主周期下流域在2010-2085年之间呈现准两次“枯-丰”交替，第2主周期下流域在2006-2090年之间呈现准3次“枯-丰”交替，两情景下流域降水均在28～30 a时间尺度上出现周期振荡. RCP8.5情景下流域降水的局部周期变化特征更为明显，2050-2100年在15 a时间尺度下共呈现5次“枯-丰”交替. 此外，两种情景下5～30 a时间尺度的振荡周期中心不同.

图12 鄱阳湖流域未来气候小波分析结果

4 讨论

本研究中气候模式经DLDM方法降尺度后模拟极端气候事件的空间分布与实测接近，其中极端气温事件主要分布在流域北部、西部和东部，极端降水事件主要分布在流域东北部、东部和南部，这与当前学者对鄱阳湖流域极端气候事件的研究结果一致[31-32]. 需要指出的是，本文定义的极端气温事件包括极高温和极低温事件，极端降水事件包括极端强降水和极端弱降水事件，分别在验证时结合了极高、极低两种极端事件的空间分布，结果与当前流域内降水空间分布的研究结果大致吻合[25].

本文基于DLDM方法降尺度后的IPSL-CM5A-LR模式预测流域未来气候空间分布格局和时间变化特征，未来流域内气温分布表现出4个高温中心且随时间进一步加强，流域中北部、西部、东部和南部气温较高，且整体而言RCP8.5情景下流域相比于RCP2.6情景气温较高；降水的空间分布方面表现出3个降水中心，主要分布在北部、中东部和南部，RCP8.5情景相比RCP2.6情景降水更少，上述结论与严文武[33]、占明锦等[34]的研究结论一致. 未来气候时间变化特征方面，气温方面两种情景下流域未来均呈现升温趋势，且RCP 8.5情景下升温趋势更为明显；降水方面两种情景下流域未来降水变化均呈现先上升后下降的趋势，但RCP 8.5情景降水存在突变点，变化更加明显，这与占明锦等的结论类似. 此外，郭华等[35]的研究指出流域未来降水在50 a内存在30 a的周期振荡，而本文将研究范围扩大至2100年，得到的主周期时间尺度更大，因此两结论大致吻合.

本文研究结果对鄱阳湖流域未来气候变化趋势的预测具有参考价值，但依然值得改进. 本文在验证极端气候事件时只采用了一组阈值，未来研究可以根据气候学中季节、大气环流以及地理位置等要素[25,36]定义多组阈值从而使得结论更加可靠；当前CMIP6全球气候模式数据已经更新，其性能在整体上优于CMIP5数据[37-38]，值得基于本文所提出的降尺度算法做进一步研究.

5 总结

本文基于深度学习算法设计了CMIP5全球气候模式空间降尺度方法，介绍了基于改进U-Net网络校正模型的DLDM方法的原理，并基于鄱阳湖流域1965-2005年气象站实测数据对DLDM方法的性能在拟合精度和极端气候事件的模拟能力两方面进行了验证，同时对比了IPSL-CM5A-LR和BCC-CSM1.1两气候模式的模拟性能. 利用DLDM方法对RCP2.6和RCP8.5两情景下IPSL-CM5A-LR气候模式进行空间降尺度得到2006-2100年流域高空间分辨率气候数据，分析了流域未来气候变化趋势，主要结论如下：

1)DLDM方法能够学习气候数据的空间异质性，在拟合精度和极端气候事件的模拟能力方面优于线性回归方法. 本研究中经DLDM方法降尺度后的IPSL-CM5A-LR模式模拟性能优于BCC-CSM1.1模式，更适用于鄱阳湖流域气候的模拟.

2)RCP2.6和RCP8.5两情景下流域未来气温持续升高，空间分布上表现出4个高温中心，位于中北部、西部、东部和南部，4个高温中心随时间进一步加强；RCP8.5情景下流域气温相比于RCP2.6情景气温更高，且升温趋势更加明显，同时在2006-2025年、2070-2100年表现出更为明显的局部周期变化，两时间范围内在20 a时间尺度下呈现两次“冷-暖”交替.

3)RCP2.6和RCP8.5两情景下流域未来降水均呈现先上升后下降的趋势，整体变化幅度不大，空间分布上表现出流域北部、中东部和南部3个降水中心，RCP8.5情景相比RCP2.6情景流域降水更少且变化幅度较为明显，在2075年左右出现突变并存在周期性振荡，2050-2100年在15 a时间尺度下共呈现5次“枯-丰”交替.