APP下载

深度学习技术在智能网格天气预报中的应用进展与挑战*

2022-11-02朱跃建

气象学报 2022年5期
关键词:智能网降水深度

杨 绚 代 刊 朱跃建

1.国家气象中心,北京,100081

2.美国国家环境预报中心/环境模式中心,马里兰,20740

1 引言

中国国家级无缝隙智能网格天气预报业务起步于2014年,至2020年已初步形成全国5 km分辨率0—30 d的逐1 h、3 h和12 h,全球10 km分辨率0—10 d逐3 h的气象要素预报产品体系,实现了天气预报从站点到格点的转变(金荣花等,2019)。该体系根据不同预报时效和气象要素,发展出了相应的客观预报方法,表1是根据预报时效列出的目前中国无缝隙智能网格预报的技术体系。

表1 目前中国无缝隙智能网格预报技术体系Table 1 Current technologies of seamless intelligent grid weather forecasting in China

客观预报方法通常是数值天气模式系统的延伸,是智能网格预报的关键必要技术支撑。数值预报模式是现代天气预报业务的基石,但受初始场误差、有限的模式分辨率、不完备的物理参数化及近似下边界条件等因素制约,预报误差长期存在(Boeing,2016)。在数值预报模式基础上发展合理、客观、定量的预报方法是连接数值模式与精准预报的桥梁。在天气预报业务中,客观预报方法一方面是对海量数值模式预报信息的处理和融合,为预报业务流程提供最优预报起点;另一方面可以推动以智能网格预报为主线的业务流程升级,将预报员从繁重的产品制作中解放出来。然而,随着数值预报模式数据和观测数据呈指数级增长,无缝隙预报产品的精细化要求越来越高,这给进一步发展智能网格预报业务带来了严峻的挑战。

人工智能(AI,Artificial Intelligence)技术的兴起为客观预报方法的发展提供了新机遇(Haupt,et al,2021;Vannitsem,et al,2021)。近些年,AI技术在自然科学各领域均得到了成功应用(Reichstein,et al,2019;Raghu,et al,2020;Bauer,et al,2021;Boukabara,et al,2021)。在天气预报领域,越来越多的研究将AI技术应用于预报业务的各个环节(Geer,2021;Haupt,et al,2021;Kashinath,et al,2021)。AI技术尤其是深度学习,在预报中应用的优势主要体现在天气系统识别、海量数据处理、空间建模、超分辨率降尺度、时空预测等方面。基于上述技术优势,欧洲中期天气预报中心(ECMWF,European Centre for Mdeium-Range Weather Forecasts)在2021年初发布的未来10年发展规划中(Machine learning at ECMWF:A roadmap for the next 10 years,https://www.ecmwf.int/node/19877)阐明了未来AI技术在ECMWF数值天气预报流程中的重要性。AI技术不依赖物理框架,却能够部分替代数值预报模式,这促使AI与数值预报模式的关系成为国际上讨论的热点问题之一(Schultz,et al,2021),有研究从该角度将AI在天气预报中的应用分为“硬AI”“中度AI”和“软AI”(Chantry,et al,2021)。其中,“软AI”是利用AI技术优化或者替代数值模式中的部分参数化方案,以提高模式运行的效率(Kasim,et al,2020);“中度AI”是在模式预报解释应用、统计后处理、统计降尺度等方面应用AI算法改进模式预报;纯数据驱动模型称为“硬AI”,该模型完全替代数值预报模式,形成端到端的预报模型。

中国学者在气象领域应用AI技术上也进行了诸多探讨。许小峰(2018)认为中国气象领域的AI应用展现出了巨大的潜在价值与广阔的应用前景,马雷鸣(2020)回顾了天气预报应用AI技术的进展,孙健等(2021)全面归纳了AI技术在数值模式预报系统中的应用。李扬等(2021)探讨了深度学习在改进数值预报模式方面的研究进展,包括数值预报模式的资料同化、次网格物理过程参数化及后处理等方面的应用前景与挑战。上述研究从不同角度梳理了AI技术在天气预报中的应用,但未能完全体现其对智能网格预报业务的应用价值,尤其未能完全覆盖智能网格预报业务的实际问题和应用场景。AI技术的核心内容主要包括传统机器学习和深度学习两部分,两者都是从有限的观测数据中学习具有一般性的规律,并利用这些规律对未知数据进行预测的方法。传统机器学习可以看作浅层学习,它的一个重要特点是不涉及特征学习,其特征主要靠人工经验或特征转换方法来提取,这个过程称为“特征工程”,常见的传统机器学习算法有:随机森林、逻辑回归等方法。深度学习则是从数据中自动学习有效的特征表示,通常用于解决传统机器学习在高维特征空间拟合能力不足的问题(Hinton,et al,2006;LeCun,et al,2015)。本研究聚焦深度学习技术的相关应用,旨在归纳和总结深度学习技术在智能网格预报应用方面的研究进展和前景,包括数值预报订正和解释应用、集合天气预报、相似集合、统计降尺度、纯数据驱动的预报模型和极端天气预报,同时探讨深度学习在智能网格预报应用中面临的机遇、挑战与应对措施。

2 深度学习技术在智能网格预报中的应用

2.1 数值预报订正和解释应用

模式预报产品的订正和解释应用是在数值模式基础上结合观测资料,构建统计-动力预报方法以体现模式无法分辨的局地天气特征,并获得更加精准的气象要素或其他特需服务产品。在目前中国的智能网格预报技术体系中,针对不同气象要素、不同预报时效采用不同的解释应用方法(金荣花等,2019;曹勇等,2021),如中短期预报等。降水预报主要采用频率匹配、最优百分位等面向非连续变量的偏差订正集成方法;温度、风等连续变量主要采用模式输出统计(MOS,Model Output Statistics)(Glahn,et al,1972)建模方法。然而,MOS等传统客观方法主要面向单点或小区域建模,处理海量数据及精细化网格的能力有限,如逐点建模需要耗费巨大计算资源;同时该方法以回归方程建立预报因子与预报量的关系,难以体现空间信息对预报变量偏差订正的影响。

基于深度学习的数值预报订正和解释应用技术,在挖掘大数据非线性关系和空间建模能力上展现出了显著优势。基于神经网络的深度学习模型可以利用不同来源的异构数据,不仅包括各类气象预报因子,还可应用地形、下垫面等地理信息数据,模型可以从中自动学习预报量与其他协变量的非线性关系。另外,该技术不再局限于单点建模,深度学习算法具有很强的空间建模能力,例如卷积神经网络(CNN,Convolutional Neural Networks),该算法具有优异的空间特征提取能力,近些年在图像识别、数据挖掘等领域取得了巨大成功(LeCun,et al,2015;Krizhevsky,et al,2017)。由于天气预报的空间相关性,将空间化预报产品作为图像输入模型,对一定范围内的所有站点或整个网格构建统一的模型,不仅能够节约相当的计算资源,还能捕捉每个网格或站点的空间信息对预报偏差做订正。因此,基于深度学习的解释应用技术是进一步开展具有局地特征精细化网格预报的有效途径(Vannitsem,et al,2021)。

人工神经网络(ANN,Artificial Neural Network)是深度学习方法的基础,通过可调节的权重将不同节点的非线性函数相互连接,模仿神经系统形成多层网络。早在20世纪末,ANN就在客观预报统计后处理中得到应用(Gardner,et al,1998;Marzban,et al,1998;Marzban,2003;Yuan,et al,2007;McGovern,et al,2017)。Salazar等(2021)基于自动编码结构的ANN建立短期地面风速订正模型,在构建模型时纳入多个天气变量作为输入因子有效提高了不同地形条件下风速预报的订正能力。

目前,数值模式预报订正和解释应用对CNN算法的应用主要以两类模型架构为主(图1)。一类是常规CNN架构的模型,经过堆叠多个卷积层等模块,再链接一个或多个全连接层作为输出层构成,这种架构的CNN模型输出固定长度的特征向量,在图像识别领域常用作对整张图像进行分类的工具。在模式解释应用领域,一类应用是构建分类模型,根据降水的不同等级对降水预报进行订正,陈锦鹏等(2021)基于该架构CNN模型建立了逐时降水分级订正模型,并证明该方法的订正效果优于概率匹配法,CNN模型对晴雨、弱降水(0.1—15 mm/h)和强降水(30 mm/h以上)订正效果显著,TS评分比概率匹配高出0.137、0.066和0.046。另一类应用是构建回归模型,孙全德等(2019)将该架构的CNN模型应用于地面10 m风速预报的订正上。门晓磊等(2019)应用这类CNN模型进行华北地区1—11 d地面气温预报订正,相比ECMWF预报,订正后的气温预报在各预报时效上的均方根误差都有所降低。Zhou等(2019)建立了6层CNN模型应用于分类强对流天气的潜势预报,利用NCEP再分析资料开展强对流天气的分类训练和预报,其预报产品已在国家气象中心强对流天气预报业务中得到应用(张小玲等,2018)。另一类CNN算法的应用是基于语义分割模型,这种模型是一种编码器-解码器(Encoder-Decoder)结构。在图像识别领域,语义分割模型应用于图像分类、目标检测和图像分割。在算法上,这种模型首先经过多个卷积层等模块对输入图像进行特征提取,再通过上采样计算将特征向量进行升尺度,最后得到与原图像分辨率一致的具有逐像素语义标注的分割图像。相较于常规结构的CNN模型,语义分割模型的优势是保留了原始图像的空间信息,常见的语义分割模型有FCN(Long,et al,2015)、U-Net(Ronneberger,et al,2015)等。在模式解释应用中应用最广泛的是U-Net模型,Dupuy等(2021)将U-Net模型应用于云量预报的统计后处理,得到比传统机器学习算法更好的订正效果。Kudo(2021)利用U-Net模型对日本关东地区的气温进行偏差订正,该研究证明了当数值模式对于天气系统(如锋面)的位置预报有偏差时,该模型仍能有效地订正气温预报。Han等(2021)基于U-Net对ECMWF全球模式在华北地区地面气温、相对湿度、风速和风向的24—240 h预报构建订正模型。张延彪等(2022)在Han等(2021)工作基础上,对U-Net模型增加了稠密卷积模 块(Denseblock)(Huang,et al,2017),相对于ECMWF原始预报,订正后的地面气温均方根误差降低了36.39%,相对湿度降低了29.9%,10 m风速降低了27.39%。

图1 基于CNN算法的数值模式预报订正和解释应用的常用结构和流程Fig.1 Flowchart of statistical postprocessing for numerical weather prediction using CNN

此外,有研究利用长短期记忆(LSTM,Long Short-Term Memory)(Hochreiter,et al,1997)算法讨论了时间序列特征在预报解释应用上的优势(Zhang C J,et al,2020),该算法在循环神经网络(RNN,Recurrent Neural Network)基础上加入了门控机制(Gating Mechanism),解决了RNN在处理长序列时会出现的梯度爆炸和消失问题。Zhang C J等(2020)利用ECMWF集合预报模式的对照预报数据,基于LSTM算法构建了中国东部地区12 h不同量级的降水预报订正模型,相对于频率匹配及传统机器学习算法,在订正小雨和暴雨量级时的效果更好。

2.2 集合天气预报

集合天气预报是表达预报不确定性的重要手段。相对于确定性预报,模式原始输出的集合预报常存在一阶系统偏差和二阶离散度偏差。因此,集合预报后处理技术需要纠正系统偏差和调整离散度,产生连续的概率分布或代表连续分布抽样的离散集合成员,以提升集合预报的可靠性和准确度。集合预报统计后处理方法通常包括基于特定概率分布的参数化方法和灵活的非参数化方法,已有学者对应用广泛的集合预报统计后处理方法进行了全面的回顾(Vannitsem,et al,2018;代刊等,2018)。

随着深度学习在集合预报统计后处理方面的应用,参数化和非参数化后处理技术均迎来了新的扩展。Schultz等(2021)全面回顾了目前基于神经网络在阵风集合预报上的后处理方法,包括几种参数化和非参数化方案,并与传统统计学方法和机器学习方法进行比较,参考该工作,图2给出了基于深度学习模型的集合预报后处理常用方法示意。

图2 基于深度学习模型的集合预报后处理的常用方法示意Fig.2 Illustration of current statistical postprocessing methods for ensemble forecasts using deep learning models

相对于传统统计学方法,基于深度学习的集合预报统计后处理展现出三个方面的优势:一是深度学习模型能够灵活地拟合任意预测变量和概率分布函数的非线性关系。二是深度学习模型可以充分利用全部可用的数据作为输入,允许加入其他预报变量以及地形、下垫面等多尺度信息;同时利用“嵌入”方法可以把站点信息转化为向量输入模型,这种嵌入将映射到整个模型训练过程中,从而增加模型的本地化特征,这在传统统计学方法中是较难实现的,这些预报变量或本地化信息的加入对预报的效果有明显提升作用。三是利用深度学习对所有预报站点或整个网格构建统一的、具有局地适应性的模型成为可能,这在计算上更为高效,且更易推广到其他统计后处理的问题中。

参数化集合预报方法将离散的预报成员转变为连续的概率分布,该方法应用最具代表性的是集合模式输出统计(EMOS,Ensemble Model Output Statistics)(Gneiting,et al,2005),预先假定预报量服从某种概率分布,通过建立预报变量与概率分布参数的函数关系进而求解连续概率预报分布函数。基于深度学习的参数化集合预报后处理方法相对于EMOS,不再需要提前指定预报变量与概率分布参数的关系函数,而是直接利用神经网络通过数据驱动方式自动学习任意预报变量和分布参数的非线性关系,避免预先指定关系函数的局限,因此,该方法在拟合集合预报变量和指定分布函数时更加灵活。Rasp等(2018)首次提出基于神经网络的集合预报参数化后处理方案,该工作利用ANN确定地面气温集合预报高斯分布的参数。在构建神经网络模型时,将其他集合预报因子作为输入放入模型,同时嵌入站点信息,利用连续排序概率得分(CRPS,Continuous Ranked Probability Score)作为损失函数进行模型训练。结果表明,相较于EMOS和机器学习等方法,基于神经网络订正后气温集合预报的CRPS改善明显,相对于ECMWF原始预报,EMOS订正后的气温预报CRPS降低了13%,基于神经网络的CRPS降低了29%。Ghazvinian等(2021)将该方法应用于中、短期降水集合预报的订正,利 用ANN拟 合 删 失 偏 移 的Γ分 布(CSGD,Censored Shifted Gamma Distribution)的参数来订正降水概率预报。

基于深度学习的非参数化集合预报后处理方案,目标是预测集合预报变量的完整概率分布。以目前的研究来看,实现这一目标主要有3种方法(图2):一是基于神经网络的条件分位数回归方法(Xu,et al,2017;Cannon,2018),该方法是分位数回归方法(Bremnes,2004)的扩展,这种方法利用神经网络得到分位数函数的近似值,从而拟合预报变量的概率分布。Cannon(2018)提出用单调复合分位数回归神经网络模型估计极端降水。Bremnes(2020)将分位数函数改进为伯恩斯坦多项式的线性组合,其系数通过神经网络计算得到,在训练模型时所用的损失函数是分位数损失。第2种是适用性更强的概率分布估计方法,该方法通过直方图将预报变量进行离散化处理,将预估预报变量的概率分布问题转化为分类任务,通过神经网络预测预报要素在预先指定的分仓值(Bins)内的概率来估计概率密度分布,实现这种方法的方式之一是在深度学习模型的输出层使用softmax激活函数,训练模型的损失函数可以是分类交叉熵(Categorical cross-entropy),也可以是CRPS或负对数似然估计(Negative log-likelihood)等(Veldkamp,et al,2021)。Scheuerer等(2020)利用该方法基于ANN对中、短期降水集合预报进行统计后处理,相对于传统方法得到了更高的降水概率预报可靠性。上述工作主要以ANN建模,然而简单的神经网络并不适用于高维空间数据,越来越多的工作将CNN算法应用于集合预报统计后处理中。Veldkamp等(2021)基于CNN通过直方图订正方法对风速集合预报的概率分布进行建模,构建CNN模型时将站点周围一定区域内的空间变量输入模型进行训练,这项工作还比较了线性回归、分位数回归森林(QRF,Quantile regression forests)(Meinshausen,2006;Taillardat,et al,2016)、神经网络的参数化和非参数化方案对未来48 h风速概率预报的订正能力,结果表明基于CNN且使用softmax作为输出层的订正模型具有最好的订正技能,订正后风速的均方根误差比线性回归方法降低了21.2%,比QRF方法降低了14.8%,且对于较大风速(超过10 m/s)的订正效果好于其他方法。Grönquist等(2021)基于U-Net模型实现了850 hPa温度和500 hPa位势高度集合预报的偏差订正。第3种方法是Finn(2021)提出的将基于自注意机制的Transformer(Vaswani,et al,2017)模型应用于集合预报统计后处理,该方法是逐成员订 正(MBM,Member-By-Member)(van Schaeybroeck,et al,2015)的扩展。Finn(2021)的工作表明,自注意机制可以学习集合成员之间的相互作用,Transformer模型能够从集合成员之间的相互作用中提取额外信息,从而有效订正集合预报的系统偏差和离散度偏差。另一大亮点是,该模型不再利用集合成员的统计量,而是直接处理全部集合成员,并且输出订正后空间连贯的一组集合成员。为了与简单神经网络模型进行对比,该工作引用Rasp等(2018)的 工 作 结果,对ECMWF的 地 面2 m气温集合预报进行偏差订正,结果表明,Transformer模型的订正预报准确率更高,比ECMWF原始集合预报和Rasp等(2018)神经网络模型的CRPS分别降低了21.1%和2.4%。

此外,量化预报的不确定是集合预报的目标之一。Grönquist等(2021)基于ResNet架构建立集合预报的不确定量化模型,ResNet架构是基于残差学习模块的CNN模型(He,et al,2016),相对于一般结构的CNN模型,ResNet可以构建更深的网络层数而不易过拟合,从而有更好的空间特征提取能力。该研究证明了将深度学习应用于集合预报的不确定性量化可以有效提高集合预报不确定性的量化技能,同时,只需少量集合成员就能够提供比原始集合成员更有效的预报不确定性信息,由此大幅度减少集合预报模式的计算量。

2.3 相似集合

相似集合(AnEn,Analog Ensemble)是一种基于相似理论、大数据挖掘和集合预报思路的统计后处理方法(Delle Monache,et al,2011,2013),该方法假设在长期、稳定的数值模式预报中对于同一地点、相同起报时间和预报时效具有稳定的预报性能(即具有相似的预报误差分布特征),通过寻找与当前预报最相似的若干历史预报,由其预报量的观测值组成相似集合,并利用集合预报的概念生成订正后 的 确 定 性 和 概 率 预 报(Delle Monache,et al,2013;Junk,et al,2015)。AnEn方法已在气象要素预报订正、极端天气事件预估、统计降尺度等方面获 得 广 泛 应 用(Keller,et al,2017;Sperati,et al,2017;Alessandrini,et al,2019;王在文等,2019)。

将深度学习技术引入AnEn主要是利用深度学习模型生成概率预报。Cervone等(2017)提出了一种基于ANN的AnEn方法,生成光伏发电站未来72 h发电量的概率预报,首先利用ANN生成确定性预报,再将预报结果作为AnEn中的附加预报因子组成相似集合。Fanfarillo等(2021)利用条件变分自编码器(CVAE,Conditional Variational Auto Encoder)(Sohn,et al,2015)生成基于相似集合的概率预报,CVAE是一种深度生成模型(DGM,Deep Generative Model),DGM是以概率的形式随机生成观测数据的模型,常用于概率密度估计和生成样本。基于CVAE的AnEn方法通过训练模型学习历史气象观测数据集中预报要素的概率分布,相较于原始AnEn方法,在相似集合的组成方式上不再使用一组相似的实际观测数据集合,而是使用预报要素的概率分布直接生成订正后的概率预报。预报性能方面,目前AnEn更好,然而,AnEn方法的计算成本较大,需要将历史预报数据和观测数据集保存在内存里,而CVAE模型不需要内存的消耗,因此能够节省大量的计算资源和时间。

原始AnEn方法在计算历史预报与当前预报的“相似度”时,以两者的欧式距离作为相似性指标(Delle Monache,et al,2013)。Hu等(2021)提出全新的基于深度学习的相似性指标和相似集合计算流程,该流程颠倒了原始AnEn方法的计算过程,首先找到与目标预报相似的一组历史观测值,搜索相对应的历史预报组成相似集合;该流程的实现基于LSTM算法,通过建立模式预报误差与观测之间的模型得到。这项工作优化了原始AnEn方法,突破了计算欧氏距离需要进行特征选择和权重优化的限制,利用深度学习空间建模能力,允许输入更多预报因子,能够灵活地建立模式预报误差与观测的非线性关系。同时,该方法对于数值模式更新具有更高的鲁棒性。

2.4 统计降尺度

统计降尺度用于实现模式预报要素从粗网格到细网格的转化。传统的降尺度方法通过双线性插值实现,忽略了低分辨率和高分辨率预报要素的统计关系,准确度有限。在目前的智能网格预报业务中,降水的统计降尺度采用比例矢量降尺度技术(曹勇等,2016)。有研究(Sachindra,et al,2018;Yang,et al,2018;Vandal,et al,2019)对过去经典的降尺度技术和传统机器学习算法进行比较,结果表明没有哪种算法有明显的优势。鉴于深度学习优异的图像重构能力,给统计降尺度技术带来了可期待的潜力。

深度学习作为擅长挖掘数据间非线性映射关系的技术,已在统计降尺度中得到了应用。Misra等(2018)利用长、短期记忆循环神经网络(RNNLSTM)进行统计降尺度,相较于传统回归方法,RNN-LSTM模型能够更好地反映局地降雨的时、空关系。Pan等(2019)利用CNN进行统计降尺度以改善模式降水预报的分辨率,与线性回归、邻回归、随机森林或全连接深度神经网络相比表现出明显优势。Baño-Medina等(2020)评估了CNN模型在气温和降水统计降尺度上的性能,结果优于线性和广义线性方法,并能在细网格上重现气温极端值。

超分辨率(SR,Super-Resolution)是深度学习在计算机视觉中提高图像或视频分辨率的图像处理技术。近年来,基于深度学习的超分辨率重构技术取得了重大突破,极大提高了图像超分辨率重建的准确度,Wang等(2021)全面回顾了SR技术的发展历程和最新进展,该技术为气象领域统计降尺度提供了新的契机。

超分辨率卷积神经网络(SRCNN,Super-Resolution Convolutional Neural Network)是深度学习在SR技术上的开山之作(Chao,et al,2014)。Vandal等(2017)提出深度统计降尺度技术(Deep Statistical Downscaling,DeepSD),是首次将SR技术应用于气象领域。Deep SD用多尺度输入通道增强了SRCNN,最大限度地提高了统计降尺度的可预测性。至此,SRCNN和Deep SD成为基于深度学习技术在统计降尺度方面的基准模型。Kumar等(2021)比较了SRCNN、堆叠SRCNN和Deep SD三种算法在降水预报上的统计降尺度效果,结果表明基于Deep SD算法的均方根误差最小。Höhlein等(2020)提出基于U-Net架构的统计降尺度模型(Deep RU),结 果 表 明Deep RU能 够 实 现 其他CNN算法降尺度模型无法重建的风场结构,且计算高效。Sha等(2020a,2020b)对U-Net模型进行了改进,实现了美国西部地区从0.258°到4 km网格气温、降水的统计降尺度,与原U-Net相比,该模型的平均绝对误差降低10%以上。

近些年,SR技术的发展趋势由以CNN算法为基础的统计降尺度模型向DGM转变。在统计降尺度中应用最广泛的DGM是生成式对抗网络(GAN,Generative Adversarial Networks)(Goodfellow,et al,2014),GAN是近些年复杂分布无监督学习最具前景的方法之一。GAN由生成模型和判别模型组成,通过两类模型的对抗行为优化模型参数,产生新的样本。增强超分辨率GAN模型(ESRGAN,Enhanced Super-Resolution Generative Adversarial Networks)(Wang,et al,2018)是这类方法在统计降尺度上的典型模型,Singh等(2019)利用ESRGAN模型对地面风速实现4倍分辨率的统计降尺度,与双三次插值和SRCNN算法进行对比,ESRGAN模型结果的峰值信噪比(PSNR,Peak Signal to Noise Ration)有了明显改善,这表明ESRGAN对高频功率谱的信息捕捉得更好。然而,GAN仍存在一定局限,包括模型训练难以收敛、生成样本缺乏多样性且不可控等,针对这些问题,Goodfellow等(2014)提出条件生成对抗网络(CGAN,Conditional Generative Adversarial Nets),对生成模型或判别模型引入额外信息作为约束条件。Leinonen等(2021)分别利用低分辨率雷达数据和卫星数据作为约束条件构建CGAN模型,实现降水预报的时间降尺度。Price等(2022)利用细网格雷达观测数据构建CGAN模型,同时实现了大尺度全球数值模式预报的订正和统计降尺度,输入模型的预报数据是ECMWF集合预报并采用双线性插值至32 km,输出4 km网格美国地区的降水集合预报,其预报性能比线性方法、基于CNN降尺度模型要好,CRPS和各等级降水Brier分数与区域模式区域高分辨率集合模式(HREF,High-Resolution Ensemble Forecast)相当。这是具有启发性和突破性的,利用深度学习技术将大尺度全球模式预报降尺度至高分辨率预报只需要几秒钟,而高分辨率区域模式的计算成本则是较大的,且两者的预报性能相当,由此对运行高成本区域模式的必要性提出了思考。

2.5 纯数据驱动的预报模型

近些年,随着高分辨率、高频率卫星、雷达等气象观测数据和数值天气预报模式输出数据的指数级增长以及深度学习技术的飞速发展,使得天气预报由深度学习模型直接输出成为可能。纯数据驱动预报模型作为“硬AI”,独立于数值预报模式,不再通过求解复杂的物理微分方程,而是通过深度学习算法建立数据间的非线性关系并输出预报结果,形成端到端的天气预报过程,是深度学习技术在天气预报领域的研究热点。

纯数据驱动模型首先在临近预报中获得广泛应用。由于模式启动时间、非高斯数据同化等问题,数值预报模式在0—2 h临近预报上表现不佳(Sun,2005;Buehner,et al,2020);雷达回波外推是气象临近预报业务的重要手段(Germann,et al,2002,2004),目前,投入业务应用的方法主要基于光流法(Optical flow)(Horn,et al,1981),但由于拉格朗日守恒和平滑运动场假设,这类方法仍存在无法判断系统生消演变等特征的局限(Prudden,et al,2020)。

基于深度学习的临近预报模型不依赖物理框架,通过雷达等观测数据训练模型并预报回波的运动过程,可以很好地模拟传统方法难以预测的非线性降水,已有研究对这方面工作做了全面回顾(Shi,et al,2018;Prudden,et al,2020;周康辉等,2021a)。最早应用神经网络做降水临近预报的是French等(1992)的工作,但该研究并没有发现比拉格朗日守恒更高的预报技巧。一个里程碑式的工作是Shi等(2015)提出的基于卷积长短时记忆模型(Conv LSTM,Convolutional LSTM),该模型成功实现了临近降水量预报,ConvLSTM融合了CNN提取图像特征和LSTM处理序列数据的能力,解决了时、空序列预报问题,相比光流法展现出更好的时、空捕捉能力。随后,数据驱动短期临近预报取得了快速发展(Shi,et al,2017,2018)。Agrawal等(2019)把临近降水预报当作图像问题进行处理,利用雷达场数据进行基于CNN的U-Net模型训练,得到未来1小时1 km空间分辨率的降水预报,其预报准确率超过了基于光流法的模型,然而当预报时效超过5 h,数值预报模式将优于U-Net。Google公司提出基于注意力机制的深度学习降水预报模型MetNet(Kaae Sønderby,et al,2020),该模型融合了雷达、卫星、降水等观测数据,实现了1 km空间分辨率、2 min时间分辨率在美国区域提前7—8 h的降水预报,该模型预测的1 mm降水准确率超过了快速更新同化高分辨率数值模式(HRRR,High Resolution Rapid Refresh)的临近降水预报,同时计算效率大幅度提高。清华大学软件学院分别提出预测循环神经网络(PredRNN,Predictive Recurrent Neural Network)和 运 动 循 环 神 经 网 络(Motion-RNN,Motion Recurrent Neural Network)模 型(Wang,et al,2017,2021),对捕捉和预测动作空间和时间内部复杂变化的能力有显著提升,并应用于短时临近雷达回波的预报。针对强对流天气预报,中国的强对流天气研究进展与天气雷达、气象卫星、闪电定位仪、自动气象站等观测密切相关(Zhang X L,et al,2020;俞小鼎等,2020),Zhou等(2020)融合了雷达回波、卫星云图、闪电密度等多源观测资料,基于CNN构建语义分割模型提取中国部分地区闪电时空发生、发展特征,实现了0—1 h的闪电预报,且具备一定的对流系统生消演变的预报能力。

然而,数据驱动临近降水预报出现的普遍问题是随着时间推移,回波会越来越平滑、强度会越来越弱(Shi,et al,2017;Ayzel,et al,2020),这使深度学习模型在预报大量级降水时会出现严重低估的现象。这种现象出现的主要原因是模型训练时为了使损失函数最小化,深度学习的算法策略会减弱对峰值的预测,趋向于用平均值替代。为了改善由损失函数带来的不确定性,有研究者提出应用DGM进行临近预报,这类模型学习可观测样本的概率密度并随机生成新样本,其损失函数是数据分布与模型分布的距离,在估计两者距离上,传统方法通常是求解极大似然函数。GAN(Goodfellow,et al,2014)作为一类典型的DGM,它的成功就在于将难以求解的似然函数转化成神经网络,让模型自己训练出合适的参数拟合似然函数。Deep Mind公司研发了基于CGAN从雷达数据的条件分布中生成临近降水概率预报模型(Ravuri,et al,2021),该模型引入有条件的正则化项用于惩罚真实雷达序列和模型预测平均值的网格分辨率偏差,该模型比平流法(PySTEPS)能更好地捕捉环流系统的强度和结构,在所有降水等级上都具有更好的预报准确率,相对于U-Net生成了更接近实况的大量级降水预报。除了临近降水预报,利用深度学习空间相关的建模能力,有学者还对气象观测数据不足且局地性强的山谷地区进行临近预报,Dupuy等(2019)利用山谷周边的气象观测数据基于ANN生成了局地山谷风速和风向的临近预报。

对于中、短期预报,已有研究(Weyn,et al,2021;Rasp,et al,2021;Chattopadhyay,et al,2022;Keisler,2022;Pathak,et al,2022)探索利用纯数据驱动模型直接预报的可行性。这类模型主要基于数值天气预报模式输出的长序列数据集进行训练,其中,Rasp等(2021)以及Weyn等(2021)构建模型应用的算法都是CNN,这两项工作构建全球天气预报模型的空间分辨率相对较低,分别是5.625°和1.9°,预报性能仅与常见低分辨率数值模式相当。Pathak等(2022)构建了基于傅里叶变换的神经网络预报模 型(FourCastNet,Fourier ForeCasting Neural Network),应用的深度学习算法主要是Vision Transformer(Dosovitskiy,et al,2021),该模型的空间分辨率达到0.25°,能够提供全球短、中期地面风速和降水量等预报,其预报性能与ECMWF综合预报系统(IFS,Integrated Forecasting System)相当。同时,FourCastNet能够以不到2 s的时间生成未来7 d的预报,比ECMWF IFS快了几个数量级。Keisler(2022)利用图神经网络(GNNs,Graph Neural Networks)(Pfaff,et al,2020)构建全球天气预报模型,提供关键等压面上位势高度、温度、风等6个变量未来6 d的预报,空间分辨率为1°,其预报准确率与ECMWF IFS和GFS(Global Forecast System)的水平相当。

2.6 极端天气预报

数值预报模式通常难以准确理解和模拟极端天气的物理过程,因此极端天气预报一直是天气预报领域的难题。Liu等(2016)基于气候数据集,首次利用CNN模型检测到数据集中的极端天气,但该项工作并没有扩展到极端天气预报上。

基于深度学习的纯数据驱动模型,在预报临近极端天气方面展现出新的前景和挑战。Guastavino等(2021)结合CNN和LSTM算法构建模型,利用雷达数据实现临近雷暴天气的预报、预警。在2.5节中已提到,深度学习在临近降水预报中面临的主要挑战是预报结果过于平滑,这种缺陷会导致极端天气被严重低估(Frei,et al,2019;Foresti,et al,2019);即使改进损失函数的设计仍难以避免这一问题(Brehmer,et al,2019)。为提高极端降水预报技能,Franch等(2020)提出以模型堆叠(stacking)的方式构建深度模型集合,并在模型训练中加入地形数据,模型输出不同降水等级阈值的概率分布来判断极端降水发生的概率,依此提高极端降水临近预报的能力。

针对中、短期极端天气预报,纯数据驱动预报模型的价值主要体现在能够快速输出大量集合预报 样 本(Weyn,et al,2021;Chattopadhyay,et al,2022;Pathak,et al,2022),从而有利于改善概率预报,在一定程度上提高极端天气事件早预警的可靠性。数值预报模式生成集合预报的计算成本较高,而通过数据驱动深度学习模型生成大规模集合预报的速度比传统模式快几个量级,计算成本要低很多。Pathak等(2022)构建的FourCastNet模型一旦训练完成,仅用几秒便可以生成有上千个集合成员的集合预报,但在极端天气预报技能上,该模型的极端降水预报仍不及ECMWF IFS模式。Chattopadhyay等(2020)利用500 hPa高度场和平均温度场的集合预报数据进行模型训练,以相似预报的思路实现了北美地区未来1—5 d极端气温的预报,对北美地区未来5 d内寒潮或热浪事件的发生和区域的准确率达到80%。这项工作利用的深度学习算法 是 胶囊神经网络(CapsNets,Capsule Neural Networks)(Sabour,et al,2017),该算法是在图像识别领域中提出的,解决了CNN算法无法分辨提取的特征属性之间关系的缺陷。在中、长期预报方面,Jacques-Dumas等(2021)利用气候模式输出的长达1000 a的气象数据集,基于CNN模型提前15 d预报出持续热浪事件。

3 面临的挑战与应对

目前,大部分面向气象学科的深度学习算法还处于研发阶段,实际应用效果还有待评估(Irrgang,et al,2021)。与理论研究不同,深度学习技术要在智能网格预报业务体系中应用还将面临诸多挑战,根本挑战体现在以下三个方面:一是气象领域的学者或业务人员对深度学习算法的认识不足,包括如何从众多深度学习算法中选择适用于智能网格预报业务应用的算法等。二是数据基础,这是深度学习在智能网格预报应用的最根本挑战。深度学习只是一个工具,其应用完全依赖于高质量、可靠的数据集,然而目前中国可用于AI算法训练的数据集还较为缺乏。三是深度学习对预报机理的解释不足,从而导致气象领域学者或业务人员对深度学习的可信度和可用性的理解不充分,对深度学习技术的接受度不高。

基于上述挑战,提出七点具体的应对措施进行讨论,包括算法的选择、数据基础、多源数据融合及模型的可解释性、可信度、可用性和工程化。

3.1 算法的选择

深度学习技术是以处理计算机视觉等问题为核心发展起来的,气象领域的研究人员首先要面临的挑战是如何从众多算法中选择适合的算法来解决实际预报问题,如何连接深度学习技术与智能网格预报业务需求,如何评估深度学习在智能网格预报业务中的适用性等问题。这就要求气象研究人员对深度学习的主要算法、模型架构有深入理解,通过开展深度学习算法在智能网格预报各个环节上的研究和试验,了解各类算法的优缺点和适用性,根据气象领域知识建立一套算法评估体系,针对不同预报任务、不同预报要素、不同预报时效等的深度学习算法应用进行比较和优化,以实现深度学习技术在智能网格预报业务中的应用。表2是深度学习技术在智能网格预报各环节的算法、应用效果和主要参考文献,供研究人员参考。

表2 深度学习技术在智能网格预报应用的主要算法和模型列表Table 2 List of main algorithms and models of deep learning in intelligent grid weather forecasting

3.2 算法的数据基础

深度学习技术在智能网格预报中应用的最大挑战是缺乏可用于训练的高质量数据集(Chantry,et al,2021)。深度学习是构建数据间非线性映射关系的技术,数据集的数量和质量决定了模型效果的上限。深度学习技术之所以能够在近些年获得飞速发展,除了得益于算法和硬件的提升,更重要的因素是在图像识别领域,由全球上万名工作人员共同创建了一系列标准数据集,最著名的如ImageNet数据集(Deng,et al,2009;Krizhevsky,et al,2017)。通过标准数据集和标准化的模型性能指标,全球科研人员迅速开展了深度学习算法的研发,通过结果的直接对比与验证,使研发的算法具有可信度和说服力。因此,标准数据集是淬炼深度学习算法不断升级的炼金石。

在气象领域,国外已有团队研发了气象标准数据集,如WeatherBench数据集(Rasp,et al,2020)、RainBench数据集(Witt,et al,2020),这给气象领域研发人员对比不同算法在网格预报中的效果提供了重要基础。然而,中国在这方面还非常缺乏,这将成为AI在中国天气预报领域发展的根本障碍,因此,迫切需要气象领域的研究人员共同建立长历史、统计特性一致的模式数据,整理和开发用于训练和检验的长序列、高分辨率、高质量的观测和再分析数据。同时,亟待构建极端天气或高影响天气数据集,这类数据集由于观测样本少、分类标准不明确等问题在构建上具有挑战。中国国家气象信息中心在AI数据集方面做了大量工作,已发布强对流天气人工智能应用训练基础数据集(刘娜等,2021),该数据集包括2012—2019年中国大陆区域的雷暴、短时强降水等5种强对流天气的大量个例和样本,为中国强对流天气智能识别和预报应用提供了坚实的数据基础。

另外,随着数值预报模式的发展,其版本在不断更新,不同版本数值模式预报的偏差会发生改变。有研究采用时间自适应(Lang,et al,2020)、响应理论(Demaeyer,et al,2020)等统计后处理方案应对该问题。然而,模式改变将影响统计模型的整体性能(Lang,et al,2020;Vannitsem,et al,2021),为获得具有一致性的训练数据集,理想的应对措施是采用与实时模式相同的模式版本对过去几十年的预报进行回算(Hamill,et al,2013),利用回算预报数据集训练模型,以达到更好的预报效果。

3.3 多源数据融合

在多源数据及多种客观预报技术发展的背景下,提高智能网格预报的精细化水平,更有效地解决预报时效和预报方法上的协调一致达到无缝隙连接是智能网格预报亟待解决的关键问题(曹勇等,2021)。有效融合海量气象观测、多源模式预报数据及下垫面等局地特征数据是解决上述两个关键问题的方案之一。多源数据融合的关键技术难点在于如何实现不同时空尺度、不同频次数据的特征提取与融合。

深度学习对处理海量数据有显著优势,这必然会给多源数据融合技术提供新的契机。基于深度学习的多源数据融合,以目前的研究来看,主要有三个研究方向:一是多源观测数据的融合,这类融合技术已广泛应用于基于深度学习的纯数据驱动的临近预报模型中。二是多源模式预报的融合,de Ruiter(2021)利用CNN算法的图像处理能力,对全球低分辨率模式和区域高分辨率模式数据进行融合,实现的中期降水概率预报比单一模式预报效果要好。三是融合多源观测数据和数值预报数据,能够在一定程度上解决预报时效一致性等问题。周康辉等(2021b)利用多源数据融合的深度学习技术实现了临近到短时预报的无缝隙过渡,该工作基于CNN构建了一个双输入单输出的语义分割模型,双输入为分别输入卫星、雷达、闪电等多源观测数据和CMA_GFS模式预报数据,利用模型将两类数据进行融合并输出0—6 h的闪电落区预报,其预报结果比单纯使用多源观测数据或高分辨率模式预报要好。Schaumann等(2021)利用神经网络融合了雷达数据和高分辨率数值预报产品,实现了1—6 h降水预报。

3.4 模型的可解释性

深度学习利用统计方法建立数据间的非线性关系,难以解释其中的物理机制,常常因缺乏可解释性被认为是“黑箱模型”,即使其生成的输出结果看起来合理,但往往很难在物理一致性上得到解释和验证(Irrgang,et al,2021)。这在一定程度上限制了该技术在行业内的应用和认可。同时,深度学习模型最终目标需要对所学内容进行解释,而不局限于预测结果本身(Toms,et al,2020)。

已有许多学者开展了在科学领域的深度学习可解释性研究(Raghu,et al,2020;Roscher,et al,2020),并做了全面回顾(Zhang,et al,2021)。可解释性的实质是对深度学习模型的决策过程进行理解,根据研究的不同角度可解释性研究主要分为两类:一类为特征归属,即基于模型的输入特征对模型贡献的重要程度来解释模型的内在机制,所用的方法主要有通过执行特征消融、特征扰动、特征置换等方式分析特征因子的重要性。另一类为模型检查,这类方法着眼于检查和分析模型不同的神经网络单元学到了什么特征(Bau,et al,2017),并用可视化的方式显示神经网络的内在工作机制,因此也称为模型可视化方法,这类方法是深度学习可解释性研究的热点(Roscher,et al,2020)。模型检查的传统方法有Shapely值(Shapley,1953),但该方法计算成本高,Lundberg等(2017)针对AI领域提出了更高效的方法—SHAP值,其代码已在github上开源(https://github.com/slundberg/shap)。

在气象预报应用领域,已有学者对深度学习方法的可解释性展开了深入讨论(Lagerquist,et al,2019;McGovern,et al,2019;Ebert-Uphoff,et al,2020;Toms,et al,2020)。典 型 的 工 作 是Mc Govern等(2019)全面梳理了深度学习在天气预报应用中常见的可视化解释方法,包括显著图(Saliency maps)(Simonyan,et al,2014)、基于梯度权重的激活图(Grad-CAM,Gradient-weighted Class-Activation Maps)(Selvaraju,et al,2020)等方法。分层相关传 播(LRP,Layer-wise Relevance Propagation)(Montavon,et al,2017)作为深度学习可解释方法,目前尚未在预报领域得到广泛应用,却有着很大的潜力(Ebert-Uphoff,et al,2020),Toms等(2020)介绍了该方法在地球科学领域中的成功应用。该方法基于泰勒分解算法利用反向传播计算得到深度学习模型标签间的相关,通过生成热图(heat map)的方式显示神经网络每一层的工作机制。

上述方法在理解深度学习模型的决策过程上取得了一定进展,然而,目前深度学习技术无法考虑大气运动的基本物理规律,在短期内难以完全替代数值预报模式进行独立预报。因此,将数值预报模式与深度学习相结合是提高该技术在预报领域应用的有效措施之一。利用深度学习技术实现大量的、高频的、小尺度观测数据与多源的、低频的、相对大尺度的模式预报数据融合,弥补观测数据和模式预报数据之间不同时、空尺度的信息提取和转换问题,是深度学习在智能网格预报应用的重要发展方向。

3.5 模型的可信度

深度学习模型存在潜在的不确定性。由于深度学习算法不依赖物理框架的计算,会出现模型结果并不符合基本物理原理的问题(Reichstein,et al,2019),这就导致其不能很好地泛化到新的数据集中。有研究讨论了深度学习在自然科学领域应用时常面临的不确定性特征,包括偶然不确定性和认知不确定性(Kendall,et al,2017;Lakshminarayanan,et al,2017)。偶然不确定性是由数据引起的,是在训练数据集中存在一些噪音,从而影响模型泛化;认知不确定性是由模型本身引起的,是模型在测试集中遇到训练集和验证集中没出现的样本特征产生的认知不确定。

因此,对模型的准确率、泛化能力、可复用性进行多维度评估是深度学习在预报业务中应用的重要前提,也是提高深度学习技术可信度的应对措施之一。深度学习模型在智能网格预报的理论研究越来越成熟,然而算法的比较方式、模型可信度的度量标准、模型适应性的评估指标等问题需要在预报业务应用之前进行全面制定和评估。模型结果首先需要与预报要素的基准客观算法进行对比,依此来度量深度学习模型的准确性和可信度。在训练模型时,要求遵循标准训练流程,明确区分数据的训练集、验证集和测试集,以确保它们之间没有因时间相关而导致模型的不确定性。针对不同预报要素,选择合适的、公认的标准评估指标检验模型性能是建立模型可信度的重要方式。

3.6 模型的可用性

一个能够在智能网格预报业务应用的深度学习模型,除了需要严格度量其准确性和可信度外,还必须评估其运算效率、稳定性、可行性等可用性指标,同时,还应具有一定的物理意义。模型的可用性包括对模型不确定性和适用性的评估,需要根据模型的不确定性特征指定适应性场景。例如,数据驱动临近降水预报模型的预报结果存在过于平滑的不确定性(Shi,et al,2017;Ayzel,et al,2020),这就导致在目前的研究阶段这类模型更适用于弱量级降水预报,对于强降水预报,尤其是极端降水的预报还不适用。

为了得到具有物理意义的深度学习模型,一个有效的策略是将物理机制和天气预报相关知识融入到模型中,根据不同预报要素的特征选择或优化具有物理意义的损失函数,这不仅使模型在物理机制上具有可解释性,还能够提高模型的预报效果和泛化能力,这种方法也被称为基于物理机制的正则化方法(Schultz,et al,2021)。例如,Larraondo等(2020)提出了一种降水预报损失函数优化方案,利用数学方法将降水预报常用的检验指标可微分化,建立针对降水预报的损失函数,有效提高了模型的降水预报技能。

3.7 模型的工程化

深度学习技术在智能网格预报业务中应用的实现就是其工程化过程。不同于理论研究,基于业务应用的深度学习模型不仅要确保其可信度和可用性,还要完成具有及时性、可操作性、可部署、可管理的全链路工程化生产。在实际业务中,数值预报模式版本更新、模型的及时调优是深度学习技术在预报业务中应用的关键(Vannitsem,et al,2021)。数值模式版本更新会导致预报偏差发生改变,需要构建新版本模式数据训练集对深度学习模型进行再次训练。然而,深度学习模型不需要从头开始训练,利用迁移学习技术可以在之前模型的基础上,以共享参数等方式对新训练数据集进行训练,从而快速实现参数更新以适应新的数据,避免浪费过多的计算资源和模型更新时间。另外,基于深度学习模型运行的高效性,模型一旦训练完成,可以快速滚动融入最新数据生成整个网格的预报结果,为业务应用提供较好的及时性。

4 展望

深度学习技术在近几年取得了突破性进展,为智能网格预报技术的提升提供了新的机遇和挑战。如何通过理论创新发挥深度学习的作用,如何将深度学习技术与智能网格预报相结合,构建面向气象的可复用、可验证、可解释的深度学习模型等问题已成为深度学习在智能网格预报应用上的关键挑战。

AI技术在智能网格预报应用离不开高质量数据集,数据集是AI技术应用最核心的因素。目前,中国还尚缺乏长历史序列、高分辨率、高质量的回算预报数据集,这制约了AI技术在网格预报应用的发展。因此,在未来迫切需要建立中国的长历史、统计特性一致的高质量人工智能训练数据集,以促进AI技术在气象领域的深入应用。同时,AI技术应用还离不开气象领域从业人员对它的认识,应加强人才培养,提高业务人员对AI产品的接受度。

在可预见的未来,智能网格预报技术将以数值模式为核心,以高质量实况客观分析资料为基础,研发基于AI技术的智能网格预报体系。包括研发面向气象数据特点的AI算法适应性研究,开展AI技术与数值预报模式融合研究,探索各类算法在天气预报中的可解释性,揭开应用的“黑匣子”。未来的智能网格预报就是应用AI技术将海量的、高频的、小尺度观测数据与大量的、低频的、大中尺度数值模式预报相融合,同时纳入地理信息等数据,基于深度学习等技术学习大量数据的内在规律和局地特征,提高智能网格预报的精细化水平。同时,通过正则化等方法将预报员的经验内化在模型中,实现真正的客观化预报。通过发展算法先进、稳定可靠、自主可控的智能预报系统,全面支撑天气监测评估、灾害天气预报、影响预报及风险预警等核心业务,重点实现水文、生态、海洋、环境等专业领域的预报智能化。

猜你喜欢

智能网降水深度
成都市夏季早高峰时段降水天气短信指引
黑龙江省玉米生长季自然降水与有效降水对比分析
深度理解一元一次方程
5G赋能智能网联汽车
深度观察
深度观察
智能网联硬实力趋强
迎战智能网联大爆发
深度观察
为什么南极降水很少却有很厚的冰层?