APP下载

基于深度学习的7~15 d温度格点预报偏差订正

2023-07-26胡莹莹王启光

应用气象学报 2023年4期
关键词:方根时效气温

胡莹莹 庞 林 王启光*

1)(中国气象科学研究院, 北京 100081)

2)(中国科学院大学, 北京 100190)

3)(中国气象局气象干部培训学院, 北京 100081)

引 言

伴随人们对大气现象认识的深入、气象观测系统的不断完善、计算能力的飞速提高,数值预报模式不断发展,天气预报技巧得到大幅提升,7 d以内的逐日天气预报已经取得长足进步,目前进一步提高更长预报时效的天气预报技巧一直是大气科学领域的重要目标之一[1-6]。中期天气预报以3~10 d预报为主,而延伸期预报的范围为10~30 d[7],7~15 d 预报处于中期与延伸期的衔接阶段,主要以旱涝、冷暖趋势以及关键性、灾害性和转折性天气预报服务为核心业务[8],提高7~15 d逐日天气预报准确性对于防灾减灾等气象保障服务具有十分重要的研究意义与应用价值[9-12]。

温度预报是天气预报的重要组成部分,也是气象服务的重要内容之一,中长期温度预报是对未来数日到数周的温度进行预测,其预报结果对农业、能源、交通、防灾等领域具有重要应用价值[13]。目前,7~15 d逐日温度预报主要依赖于数值预报模式。数值天气预报模型通过对当前大气状态进行观测和分析,求解大气运动方程预测未来天气发展趋势。但由于大气系统的混沌特性,数值预报模式对初始时刻的误差非常敏感,随着时间的延长,预报误差不断增大[14-15]。另外,数据同化技术目前还不完善,模式动力框架和物理参数化方案尚不完美,导致数值天气预报存在不可避免的系统性误差[16-17],模式对于7~15 d温度预报技巧仍较低。统计预测方法常用于中长期预报[18-19],这些方法通过分析历史气象数据,构建模型预测未来温度变化。但统计方法往往只能预测温度变化的一般趋势,无法对短期变化进行准确预测。此外,统计预测方法的预测精度也受到数据质量和模型选择的影响[20]。为了减小模式预报误差、提高天气预报准确性,业务上常通过偏差订正技术对数值预报产品进行解释应用[21],如Klein等[22]提出PP完全预报法(perfect prognostic,PP),Glahn等[23]于1972年首次提出的基于多元线性回归的模型输出统计方法(model output statistics,MOS)。MOS方法结合大气动力学和统计学方法,是目前在数值预报订正业务中广泛应用的一种方法[24-26]。但该方法需要较长时间的历史数据训练统计模型,当数值预报模型更新后需重新训练,消耗较大的计算资源,在当今模式频繁更新的情况下不利于推广[27]。

人工智能技术作为一种新兴技术,近年在气象观测、预报与产品应用领域迅速发展[28-30]。深度学习方法在温度中长期预报偏差订正方面的应用也逐渐受到关注,相比传统的基于物理模型的方法,深度学习方法具有更好的灵活性和更高的精度,可以捕捉到更复杂的非线性关系[31-36]。对于数值预报偏差订正技术从最初的随机森林、支持向量机[37-38]等方法逐步转变为更有效的卷积神经网络[39]、循环神经网络[40]等方法。在预报订正中,深度学习方法主要应用于构建偏差修正器,通过将历史预报和观测数据输入深度学习模型,获得修正器纠正原始预报偏差。然而,深度学习方法在中长期温度预报中仍然存在问题:深度学习方法需要大量的历史预报和观测数据用于训练,但在某些地区或时间段可能缺乏足够的数据,同时数据质量也会影响深度学习模型的训练效果;偏差订正需要选择合适的深度学习模型,包括网络结构、损失函数等,而这些选择需要根据不同模型和地区进行调整;此外,深度学习模型通常是黑盒模型,可解释性不理想。因此,虽然深度学习方法在7~15 d温度预报偏差订正中具有很大潜力,但还需要解决一些问题以提高其订正效果和可靠性。

由于传统的固定站点预报已无法满足人们对于天气预报精细化要求,近年无缝隙、精细化的智能网格预报技术得到发展与应用[16,41]。智能网络预报的主要特点是在网格化的基础上,结合人工智能、大数据等技术手段,通过对大量气象数据进行处理、分析和建模,进一步提高预报精度和时空分辨率,实现对气象要素的精细化预报。本文将利用深度学习方法对于7~15 d 2 m气温的确定性预报进行偏差订正,以15.75°~55.25°N,73°~136.5°E研究区域内168~360 h时效的2 m气温格点预报为订正对象,检验深度学习模型订正效果,探讨深度学习方法在气象要素中长期预报订正中的应用潜力。

1 数据与方法

1.1 数据简介

2003年世界气象组织(World Meteorological Organization,WMO)提出全球气象观测系统研究与可预报试验研究计划(the Observing System Research and Predictability Experiment,THORPEX),旨在提高天气预报的水平,更好地服务社会经济发展和环境保护[42]。TIGGE(THORPEX Interactive Grand Global Ensemble,全球交互式超级大集合)是THORPEX的核心项目,通过建立交互式预报系统,收集、检验和评估各国集合预报系统的预报产品,促进集合预报领域内各国气象部门合作,提高1~15 d的预报精度。全球共设有3个TIGGE数据中心,分别为NCEP(National Centers for Environmental Prediction,美国国家环境预报中心),CMA(China Meteorological Administration,中国气象局)和ECMWF(European Centre for Medium Weather Forecasting,欧洲中期天气预报中心)。数据中心负责接收储存来自全球13个业务预报中心的数据,预报时效为9~16 d不等[43]。

由于CMA集合预报系统的控制预报模式自2018年12月25日起由TL639L60模式更新为CMA-GFS模式,本研究采用TIGGE数据中心提供的中国气象局全球集合预报系统CMA-GEPS控制预报产品,预报订正对象为2 m气温,试验中使用2018年12月25日—2022年7月5日(共1289 d)2 m 气温、10 m风场,逐日00:00(世界时)起报的168 ~360 h(间隔为24 h)预报时效,空间范围为15.75°~55.25°N,73°~136.5°E, 水平分辨率为0.5°× 0.5°。

采用ERA5 2 m气温产品作为真值,水平分辨率为0.25°× 0.25°,时间和空间范围与CMA-GEPS预报产品相对应。为了统一分辨率,将ERA5再分析数据按水平分辨率0.5°× 0.5°提取。

1.2 数据集构建及划分

不同时效数值预报具有不同的预报误差分布特征,针对168~360 h间隔为24 h的9个预报时效分别构建样本与模型进行偏差订正。本文设计了3类数据集进行对比:第1类为将相同预报时效的逐日2 m气温预报产品作为输入数据,对应预报时刻的ERA5 2 m气温产品作为标签,由此组合为1个样本,构建每个预报时效的数据集,称为数据集Ⅰ;第2类是在数据集Ⅰ的基础上,输入数据特征中加入起报时刻的ERA5 2 m气温产品,称为数据集Ⅱ;第3类是在数据集Ⅱ基础上,输入数据特征中加入CMA-GEPS控制预报10 m风预报产品,称为数据集Ⅲ。其中2018年12月25日—2022年4月7日(共1200 d)为训练集,2022年4月8日—7月5日(共89 d)为测试集。

1.3 深度学习模型

1.3.1 U-Net模型

U-Net模型是基于全卷积神经网络的改进模型,为U型对称结构[44]。U-Net模型被设计用于提取特征的同时将首尾对称的两层联系起来,达到信息充分利用的目的。U-Net模型可以对每个像素点进行分割,获得更高的分割准确率,像素级的图像分割是U-Net网络的自身结构特性,由网络结构决定。其次,U-Net模型在训练过程中使用高梯度下降,可使训练模型学习率处于自我调节过程。且U-Net模型存在权重划分,为了使某些像素点更加具有特征和代表性,对像素点进行权重划分,补偿每个图像中像素点出现概率相同的问题。

U-Net模型结构包含编码器与解码器两个部分,编码器每层由两个连续的卷积层和池化层组成,卷积后通道数目增加,但图像大小不变;经过最大池化层后,通道数目不变,图像大小减半。降采样一共4层,浅层可以抓取图像的简单信息,深层因为感受野增大,且经过多次卷积,能够抓取抽象特征。压缩后的特征图经过解码器恢复原始分辨率,解码器每一层由两个连续的卷积层和上采样模块组成。该过程每层与解码器的对应层进行跳层连接。每次上采样模块输出后,图像大小均加倍,同时通道数目减半。跳层连接将编码器与解码器对应层的输出在通道维度上拼接,并利用两个连续卷积进行通道减半,跳层连接有助于还原降采样带来的信息损失。最后采用1×1卷积,还原通道数为1,得到输出结果。

1.3.2 U-Net残差连接模型

为了充分利用数值预报模式产品信息,将数值模式预报产品与深度学习模型订正过程相结合,在U-Net模型基础上增加从输入到输出的残差连接,尝试将数值预报产品与模型训练结果相加,学习其与作为标签的ERA5产品之间的映射关系。U-Net残差连接混合模型既保留了U-Net模型对于图像处理的优势,又加入了残差连接,充分保留数值预报产品信息。

1.4 检验评估指标

对于本文的确定性预报采用偏差(B)、平均绝对偏差(M)和均方根误差(R)作为检验指标,公式如下:

(1)

(2)

(3)

其中,n为总样本量,fi为第i个样本的预报值,oi为第i个样本的真值。

偏差体现预报结果对真值的偏离程度,值越接近于0代表预报相对真值偏离程度越小;平均绝对偏差与均方根误差衡量预报值与真值之间的偏差,且均方根误差对数据中的极大或极小误差非常敏感,也会对高的差异惩罚更多,其值越小越好。

2 模型和输入参数选择

2.1 7~15 d 2 m气温预报误差特征

为了探究7~15 d 2 m气温预报误差特征,对测试时段2022年4月8日—7月5日内CMA-GEPS模式不同时效的控制预报均方根误差进行统计(图1)。由图1可知,随着预报时效增加,2 m 气温预报均方根误差不断增大,7 d预报均方根误差为3.11℃,15 d预报均方根误差为3.92℃,7~15 d时效的2 m气温预报效果整体较差,模式预报改进空间较大。

图1 2022年4月8日—7月5日CMA-GEPS模式控制预报不同预报时效2 m气温产品均方根误差Fig.1 Root mean square error of CMA-GEPS model control forecast for 2 m temperature with different lead times from 8 Apr to 5 Jul in 2022

图2为研究区域内168 h,240 h,288 h和360 h预报时效的均方根误差空间分布。由图2可知,模式对于研究区域内西部和北部高原以及山地区域的预报效果较差,随着预报时效延长,以上区域预报均方根误差逐渐增大,对于南部与东部海洋区域预报均方根误差较小,预报效果较好。

图2 2022年4月8日—7月5日研究区域内不同预报时效2 m气温产品均方根误差Fig.2 Root mean square error of different lead times for 2 m temperature in the target area from 8 Apr to 5 Jul in 2022

2.2 不同模型订正试验

为了比较U-Net模型、U-Net残差连接模型7~15 d 2 m气温预报订正效果,首先比较两种模型对240 h时效2 m气温预报订正效果。对于两种模型订正效果与CMA-GEPS模式控制预报效果,采用偏差、平均绝对偏差、均方根误差3种指标进行比较,结果及模型训练参数如表1所示。

表1 CMA-GEPS模式控制预报2 m气温240 h预报时效与基于数据集Ⅰ订正结果评价指标(单位:℃)Table 1 Evaluation indicaters of CMA-GEPS model control forecast of 2 m temperature for 240 h lead time and deep learning model correction based on dataset Ⅰ(unit:℃)

由表1可知,CMA-GEPS控制预报及U-Net模型与U-Net残差连接模型对于240 h时效2 m气温订正结果中,U-Net模型表现最优,平均绝对偏差与均方根误差均相对CMA-GEPS控制预报有所减小,在研究区域与测试时段内的平均绝对偏差为2.40℃,均方根误差为3.16℃。这与U-Net模型在学习过程中进行尺度缩放,可以捕获学习数据中不同尺度特征有关。加入残差连接后的U-Net 模型订正效果较差,平均绝对偏差和均方根误差均较CMA-GEPS控制预报偏高,这主要是因为本文所用的残差连接是简化后的模型,只是简单地将模式预报与U-Net模型订正过程中的结果线性相加。

以上两种深度学习模型订正CMA-GEPS控制预报结果时,仅使用对应预报时效的CMA-GEPS控制预报2 m气温产品作为特征,均未使用ERA5 2 m气温产品。由于大气的连续性,起报时刻的大气真实状态与未来预报时刻状态存在一定时空联系,因此众多深度学习方法也被广泛应用于以观测数据驱动天气预报的制作中。本文尝试在数据集特征中加入已知的ERA5 2 m气温产品作为辅助信息,在订正时利用模式预报结果与起报时刻的ERA5 2 m气温产品分别作为输入特征(数据集Ⅱ),学习起报时刻ERA5 2 m气温产品、预报时刻的模式预报结果和对应标签之间的非线性关系,对比U-Net模型与U-Net残差连接模型的预报效果,结果如表2所示。

表2 同表1,但为基于数据集Ⅱ订正结果(单位:℃)Table 2 The same as in Table 1,but based on dataset Ⅱ(unit:℃)

由表2可知,基于数据集Ⅱ的U-Net模型与U-Net残差连接模型对于240 h时效2 m气温预报订正后的偏差、平均绝对偏差与均方根误差均相对基于数据集Ⅰ有所减小(表1)。比较U-Net模型与U-Net残差连接模型的结果可以看到,增加残差连接虽然可以有效减小偏差,但会使平均绝对偏差与均方根误差增大,因此本文选用U-Net模型并在输入数据特征中加入起报时刻的ERA5 2 m气温产品作为多个预报时效订正试验的基础模型。

3 试验结果

3.1 不同预报时效多要素订正效果检验

利用U-Net模型基于数据集Ⅰ、数据集Ⅱ和数据集Ⅲ进行168~360 h时效预报订正试验,分别对平均绝对偏差与均方根误差评价指标进行统计,结果如图3、图4所示。

图3 CMA-GEPS模式控制预报与U-Net模型订正2 m气温平均绝对偏差(折线为基于数据集Ⅱ的订正结果相对CMA-GEPS控制预报的平均绝对偏差减小率)Fig.3 Average absolute errors of 2 m temperature for CMA-GEPS model control forecast and U-Net model correction(the line denotes average absolute error reduction rate of U-Net model correction based on dataset Ⅱ relative to CMA-GEPS control forecast)

图4 同图3,但为均方根误差(折线为基于数据集Ⅱ的订正结果相对CMA-GEPS控制预报的均方根误差减小率)Fig.4 The same as in Fig.3,but for root mean square error(the line denotes root mean square error reduction rate of U-Net model correction based on dataset Ⅱ relative to CMA-GEPS control forecast)

由图3可知,U-Net模型订正效果表现较好,基于数据集Ⅱ订正结果平均绝对偏差减小,基于数据集Ⅲ的订正效果较基于数据集Ⅱ改善较小,且在192 h,216 h,336 h预报时效的平均绝对偏差有所增加。基于数据集Ⅱ,U-Net模型订正结果平均绝对偏差相对于CMA-GEPS控制预报减小率为10%~25%,且随着预报时效增加,平均绝对偏差减小率逐渐增大,对于360 h预报时效的平均绝对偏差减小率达到21.7%,说明本文采用的U-Net模型对于更长时效的预报订正效果更显著,可有效减小模式预报误差随着预报时效增加的分布特征。

由图4可知,均方根误差与平均绝对偏差变化相似,基于数据集Ⅱ的U-Net模型订正结果均方根误差相对基于数据集Ⅰ有所减小,均方根误差从原来的3~4℃降低为3℃左右,且随着预报时效的增加,基于数据集Ⅱ的订正结果均方根误差减小率逐渐提高,对于较长预报时效的订正效果更明显。但基于数据集Ⅲ的U-Net模型订正结果,仅在360 h预报时效表现出较为明显的改进。本文将起报时刻的ERA5 2 m气温产品作为输入数据特征,增加了模型对于实况的估计与学习,有利于U-Net模型进一步挖掘预报与实况之间的关系。

3.2 时间与空间应用效果检验

对于研究区域(15.75°~55.25°N,73°~136.5°E)与测试时间段内(2022年4月8日—7月5日,共89 d)的格点订正效果使用均方根误差作为评价指标,分析测试时段内CMA-GEPS控制预报与U-Net模型订正结果均方根误差时空分布特征。

图5为2022年4月8日—7月5日168 h时效 CMA-GEPS模式控制预报和U-Net模型订正的2 m 气温逐日均方根误差。由图5可知,对于测试期内89 d的2 m气温168 h预报,经过U-Net模型订正后,均方根误差明显减小,基于数据集Ⅱ和数据集ⅢU-Net模型订正效果更为明显。

图5 2022年4月8日—7月5日168 h时效CMA-GEPS模式控制预报及U-Net模型订正2 m气温逐日均方根误差Fig.5 Daily root mean square error of 2 m temperature for 168 h lead time from 8 Apr to 5 Jul in 2022 by CMA-GEPS control forecast and U-Net model correction

图6为2022年4月8日—7月5日360 h时效CMA-GEPS控制预报和U-Net模型订正的2 m气温逐日均方根误差。由图6可知,对于测试期内大部分日期的逐日均方根误差减小较为明显,且减小幅度比168 h时效预报更大,这与图4展示的结果相对应,本文的U-Net模型对于预报误差更大的预报时效订正效果更显著。同样,基于数据集Ⅱ和数据集Ⅲ的U-Net模型订正效果更为明显。

图6 同图5,但为360 h时效Fig.6 The same as in Fig.5,but for 360 h lead time

图7为研究区域范围内2 m气温CMA-GEPS控制预报和U-Net模型订正结果。由图7可知,CMA-GEPS控制预报对于研究区域的北部和西部预报均方根误差较大,预报效果较差。基于数据集Ⅰ,U-Net模型订正改善较小;基于数据集Ⅱ和数据集Ⅲ,U-Net模型有效改善了西部的青藏高原和北部的蒙古高原与部分山地的预报误差,提高了预报效果。基于数据集Ⅲ的U-Net模型订正结果相对基于数据集Ⅱ改善不明显。

图7 研究区域内360 h时效2 m气温CMA-GEPS模式控制预报及U-Net模型订正结果均方根误差Fig.7 Root mean square error of 2 m temperature in the target area for 360 h lead time by CMA-GEPS control forecast and U-Net model correction

4 结论与讨论

本文尝试使用U-Net模型以及U-Net残差连接模型改进CMA-GEPS 2 m气温的168~360 h控制预报结果,并在输入数据特征中加入起报时刻的ERA5 2 m气温产品和CMA-GEPS控制预报10 m风产品,探索深度学习方法在不同样本与模型参数情况下,较长时效预报的订正效果差异。通过偏差、平均绝对偏差及均方根误差关键检验指标对比模型偏差订正的性能,得到以下结论:

1) 7~15 d 2 m气温预报误差随着预报时效增加而增大,模式预报技巧逐渐下降,且在研究区域内,东部与南部的海洋和近海区域预报效果优于西部和北部的高原与山地,误差空间分布差异较为明显,这可能与高原和山地的温度日变化较大、海洋温度日变化较小有关。

2) 研究结果表明:U-Net模型的订正效果优于U-Net残差连接模型,U-Net模型下采样与上采样的倒金字塔结构能够有效提取气象数据中的时空信息,在误差订正方面具有较好应用价值。利用大气连续性特征,在模型输入数据特征中加入起报时刻的ERA5 2 m气温产品可以有效提高U-Net模型的订正效果,增加模型对于实况的估计与学习,有利于U-Net模型进一步挖掘预报与实况间的关系。

3) 89 d的测试结果显示,U-Net模型以及加入起报时刻的ERA5 2 m气温产品可有效订正CMA-GEPS控制预报2 m气温预报产品,明显降低模式在西部青藏高原和山地区域的预报负偏差以及在北方地区的预报正偏差,使研究区域内7~15 d 2 m气温预报的均方根误差减小率达到10%~25%,其中10 d以后的预报改善效果更为明显,展现出较好的中期预报应用价值。

本文仅对2 m气温进行偏差订正应用效果检验评估,未来需要开展多要素订正试验。另外,在试验过程中尝试加入10 m风预报产品作为辅助信息,未提高模型订正效果,对于2 m气温的相关预报因子未来可进行更多探索,以期在中期预报应用中不断改进订正模型。

猜你喜欢

方根时效气温
方根拓展探究
基于FY-3D和FY-4A的气温时空融合
深冬气温多变 蔬菜管理要随机应变
均方根嵌入式容积粒子PHD 多目标跟踪方法
J75钢的时效处理工艺
一种新型耐热合金GY200的长期时效组织与性能
环保执法如何把握对违法建设项目的追责时效?
揭开心算方根之谜
与气温成反比的东西
X80管线钢的应变时效行为研究