APP下载

基于深度学习改进数值天气预报模式 和预报的研究及挑战

2021-11-06李扬刘玉宝许小峰

关键词:天气预报数值卷积

李扬 刘玉宝 许小峰

(1 南京信息工程大学,精细化区域地球模拟和信息中心,南京 210044;2 南京信息工程大学,中国气象局气溶胶-云-降水重点开放实验室,气候与环境变化国际合作联合实验室,南京 210044;3 中国气象局,北京 100081)

0 引言

过去的一个世纪里,天气预报已经从基于经验和类比预报的阶段发展到高度自动化和高准确率的预报阶段,这主要得益于大气观测能力的飞速发展、对大气流体力学和其他大气物理过程更精确的描述,以及数字计算能力的出现和飞跃。高时空分辨率数值天气预报模式的开发和新一代地球观测系统的布局,包括气象卫星、气象雷达等先进的业务遥感观测,导致每天所产生的数据量已经远远超出了传统的数据处理方法提取、加工、应用信息的能力。近年来机器学习,尤其是深度学习,展示了处理大数据的强大能力。该方法能从海量数据中提取有效信息和处理非线性问题,已在图像处理、语音识别等领域得到广泛研究,并已被广泛应用于气象领域的极端事件的检测和预测和对流天气短时临近预报。

数值天气预报模式是天气过程预测和气象短时临近预报的重要手段,该方法通过求解一系列数学物理方程模拟大气过程。数值模拟的过程中存在很多不确定性因素,比如不准确的初始条件、物理过程参数化等。由于大气的混沌特性,不准确的初始场以及物理过程的参数化会导致模式结果出现很大的不确定性。近20年里,观测技术提升、资料同化技术改善、模式分辨率提高、模式物理参数化改进和模式输出统计后处理技术的应用有效改善了数值天气模式的预报结果,但是,模式系统的各个分量仍存在许多不确定因素有待解决。近年来,深度学习技术的突破,为解决数值天气预报模式的不确定性问题提供了一个新思路,并已取得了积极的成果。比如利用深度学习代替传统的统计后处理,改善数值天气预报模式的预报结果、利用深度学习模型代替物理过程参数化模块,改善数值天气预报模式的计算效率等。

近些年,国外一些研究者详细探讨了深度学习在地球科学及大气科学方面的应用研究进展。比如,Reichstein等探讨了深度学习在地球科学领域的应用,包括深度学习对物理模型的参数化优化、模型子模块替换等;Boukabara等从短时临近预报、模式后处理和资料同化方面总结了深度学习在数值天气预报模式方面的研究进展;McGovern等从可解释性方面探讨了如何增强深度学习模型的物理理解能力。上述回顾从不同角度讨论了深度学习在数值天气预报模式方面的研究进展,本文针对深度学习在数值天气预报系统应用研究方面的最新成果进行系统性介绍,深入探讨深度学习在数值天气预报模式参数化的不确定性参数改进和子模块替换、模拟完整数值天气预报模式积分、数值天气预报模式输出误差订正、改善资料同化技术的研究进展、面临的问题和未来的发展潜力,并讨论深度学习技术在数值天气预报模式应用中的可解释性和不确定性量化问题。

1 深度学习方法和模型

近10年里,深度学习在图像处理、语音识别等领域取得了巨大成功,发展了诸多功能强大的神经网络模型,比如卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)等。当前气象应用中的神经网络模型大多是在上述领域得到成熟应用后迁移而来。这些模型的网络结构多是针对特定应用领域的特定问题进行了大量测试所设计而来。因此,这些模型可能对特定问题而言具有最优性能。而在气象领域应用这些模型时,研究者应该充分考虑所处理气象问题的特点和分析相应模型的优缺点(表1),选择和构造适当的深度学习模型。以下概括介绍用于改进数值天气模式和预报的主要深度学习模型。

表1 不同神经网络模型的优缺点 Table 1 Advantages and disadvantages of different neural network models

1)卷积神经网络

卷积神经网络已经在气象领域的分类和状态预测任务中得到较多的应用,包括极端天气的检测和预测、雷达回波外推预报、基于地基或卫星观测的云分类等。这主要得益于CNN中的卷积层和池化层。卷积层可以从图像和结构化数据中提取关键特征,池化层进一步对特征进行降维。

池化层在降低特征维度时保持了平移和尺度不变性,导致CNN模型很难处理对相对位置敏感的问题。气象场具有非常复杂和演变的时空分布特征,气象特征的相对位置是比较敏感的,比如高低压系统的不同相对位置可能会导致不同的天气形势。因此,在利用CNN处理时空分布的气象场时,针对要处理的问题应分析特征变量的相对位置演变特点及对结果是否具有重要影响。如果特征的相对位置对最终结果具有较为明显的影响,那么在构建深度学习模型时,应该考虑和解决CNN无法处理位置敏感特征提取的问题。

2)循环神经网络

循环神经网络是一类专门为处理序列数据设计的神经网络,在时间序列预报中发挥重要作用。气象过程的演变和预报是时间序列过程,因此,循环神经网络更适合处理气象领域的时间序列的预测问题。但是传统的RNN模型在处理长时间序列时可能会导致梯度爆炸和梯度消失的问题。为解决此问题,学界进行了很多研究, 第一类解决方案是设计多时间尺度模型,让高和低时间分辨率尺度负责处理不同时间尺度的信息,在不同时间尺度使用称为渗透单元的隐藏单元帮助学习长期依赖;第二类方案引入门控循环神经网络,包括最具有代表性的基于信息筛选记忆的长短期记忆神经网络(Long Short-Term Memory,LSTM)和基于门控循环单元神经网络(Gated Recurrent Unit,GRU)。渗透单元是基于手动选择常量或参数化的连接权重学习长期依赖关系,而门控循环神经网络是自动学习,并决定何时清除状态。因此,目前在处理具有明显的长期依赖的时间序列问题时,多是以LSTM等门控循环神经网络为主。要注意的是,尽管循环神经网络对单站点的时间序列预测具有较好的使用效果,但是对于更复杂的时空序列问题,需要结合能够处理空间特征的卷积神经网络和能够处理长期依赖的循环神经网络,解决基于时间和空间特征的时序预测问题。

3)卷积和循环混合神经网络

混合卷积和循环神经网络是为了更好的处理具有时空分布特性的任务。卷积长短期记忆神经网络(ConvLSTM)在基于雷达回波的强对流短时临近预报中得以有效应用。该方法仍然无法避免CNN针对时空分布的气象场中某些特征对相对位置敏感的问题。此外,CNN模型更适合处理矩形网络结构的数据,而气象场通常是地球曲面时空分布数据,且气象观测具有高度时空不均匀性,进行投影转换时就会出现信息丢失,从而导致在训练和预测的过程中可能会歪曲或丢失相关信息。因此,选择混合神经网络模型时,应考虑到CNN和RNN网络各自的优缺点,尽量避免混合模型沿袭部分或所有组成模型的缺点。

4)胶囊神经网络

为了解决CNN无法处理相对位置敏感的问题,Sabour等引入了胶囊神经网络(Capsule Neural Networks,CapsNet),利用胶囊替换CNN网络中的池化层。不同于仅输出标量值的神经元,胶囊单元输出是由一系列信息构成的向量,比如包含了位置、相对距离、形状、方向、尺寸等信息。相比于池化层的不变性,胶囊神经网络更关注等变性,可以将相对位置等特征编码到特征图中。Chattopadhyay等利用CapsNet、类比预报和自动标注策略,预测导致极端事件的天气形势,结果表明CapsNet的效果要优于CNN,而且随着训练数据的减少,CNN的准确率比CapsNet下降更明显。他们认为这很可能是因为CapsNet具有从有限的训练数据中提取更多的信息和特征的能力。CapsNet可以保留特征要素的相对位置和移动方向的信息,对于处理时空分布多变的气象问题有明显优势。

同时需要指出的是,由于该网络中胶囊单元是由一系列神经元堆叠而成,可能会导致计算效率有所降低。此外,胶囊神经网络和CNN一样,也无法处理地球曲面数据。当前,胶囊神经网络在气象领域的应用相对较少。未来这一方法可能在对流短时临近预报、极端事件预测等方面发挥较大作用。

5)球面卷积神经网络

无论是CNN还是CapsNet,在处理时空分布的气象场时,通常都需要将分布在球面的气象场投影到平面上,但是这样会出现空间形状失真,从而导致平移权重共享失效。在常规经纬度网格上,往两极方向的网格会被拉伸,因此,动力过程会随着纬度变化。而且除了科氏力的作用外,地球的旋转导致的风向偏离也随纬度变化。有研究者提出可以使用球面卷积神经网络解决此问题,或者可以通过代价函数在训练神经网络模型时考虑随纬度变化的情况。

球面卷积神经网络的提出或许能够进一步改善基于曲面数据的分类和回归任务。对于天气和全球尺度的数值天气预报模式相关的问题,球面卷积神经网络能够更好的适应球面投影数据,而无需进行投影转换。因此,球面卷积神经网络在天气尺度和全球尺度气象过程的应用中,将发挥重要作用。但是球面卷积神经网络中仍存在池化层,仍然无法有效处理对细节信息敏感的任务,比如相对位置、形状、方向等特征具有明显影响的任务。

6)其他

除了上述在气象应用中使用较多的神经网络结构外,还有一些神经网络结构对气象应用具有很大潜力,包括基于编码解码结构像素级预测的U-Net模型、基于时空循环神经网络的PredRNN模型、基于生成器和判别器的生成对抗网络(Generative Adversarial Networks,GAN)等。U-Net、PredRNN和GAN已经在短临预报、数值天气预报模式次网格物理过程参数化、基于MODIS(Moderate-Resolution Imaging Spectrometer)观测重建云结构、基于卫星图像的台风预测等方面的应用获得较好的效果。

2 深度学习和数值天气预报模式的切合点

数值天气预报模式属于一类理论驱动模型,其基本数理基础是热力学定律和牛顿运动定律。此类模型具有严谨的理论基础,较强的数学和物理解释和数值推演能力。但由于此类模型的一些数学和物理过程过于复杂,需要对其物理和动力过程进行参数化处理,以及不准确的初始条件,从而导致数值天气预报模式产生误差,影响模拟和预报精度。而深度学习属于一类数据驱动模型,旨在从大量的数据中发现新规律。此类模型具有很好的灵活性,但是没有严谨的数学物理理论指导,可解释能力较差。表2对比了深度学习和数值天气预报模式的重要优缺点。将深度学习与数值天气预报模式结合起来,有利于发挥两者的优势,实现对数值天气预报模式技术和应用价值地提升。图1概括了当前深度学习在数值天气预报模式相关方面的应用研究情况。

表2 深度学习和数值天气预报模式方法对比 Table 2 Comparison of deep learning technologies and numerical weather prediction models

图1 数值预报模式和深度学习整合(蓝色矩形部分表示深度学习已有应用、且已经得到概念证明的模式分量,灰色矩形部分表示当前的深度学习应用尚处于探索阶段的模式分量) Fig. 1 Linkages between deep learning and numerical weather prediction models (NWP) (The blue rectangular indicates the model components that deep learning can be applied; the gray rectangular indicates the those where the deep learning application is still in the exploration stage)

2.1 资料同化

资料同化是将高质量的大气观测有效融合到数值天气预报模式产生的预报场(初猜场)中,改善数值天气预报模式的初始条件精度。当前的气象观测的数据量已远超出同化系统的处理能力,亟需寻找新的方法用以改善资料同化的过程。而近10年来深度学习技术的快速发展,为改善资料同化的过程带来了新的机遇。

深度学习在资料同化方面的应用研究刚刚起步。Abarbanel等在机器学习和统计资料同化间建立起了等价关系,深入探讨了神经网络和资料同化间的关系,为神经网络在资料同化方面应用奠定了理论基础。Cintra等利用人工神经网络模型代替区域集合卡尔曼滤波方法(Local Ensemble Transform Kalman Filter,LETKF),结果表明,基于神经网络的大气资料同化具有和LETKF方法类似的同化质量,但具有更好的计算效率。Brajard等发展了EnKF资料同化方法与卷积神经网络进行双向互反馈耦合方案,获得了较好的短时临近预报效果。但是此方法对于观测的噪音干扰以及观测数据量非常敏感,当噪音干扰严重或观测数量过少时,预测技能显著降低。此外,该研究仅是基于低维理想模式对混合资料同化和神经网络方案的概念证明,尚未应用到高维气象数值天气预报模式。而且由于此方法混合了资料同化方法和神经网络模型,其计算量有所增加。

除了上述完整的资料同化替代方案和混合方案外,Jing采用神经网络模型构建观测算子模型,结果表明:当训练数据足够的情况下,神经网络模型学习到的观测算子的结果优于使用不准确的转置值的预测算子的结果。Geer等指出对于机器学习方案和资料同化技术很多方面非常一致,比如,用观测误差来表示不同级别的不确定性,用观测算子从规则的模型网格映射到不规则的稀疏观测,以及用物理模型组件或深度学习层对深度学习网络施加物理约束。在地球系统科学中,机器学习和资料同化高度相似。当前,深度学习在气象领域资料同化方面的应用多是基于简单的数值天气预报模式进行概念证明。如何在观测质控和误差订正、模式误差估计和订正、模式参数优化等方面最大化发挥深度学习和资料同化技术的优势,仍面临诸多挑战。为深化深度学习技术在高维数值天气预报模式资料同化方面应用,仍需要大量地深入研究和尝试。

2.2 替换参数化子模块

自20世纪50年代以来,数值天气预报模式发展迅猛,模式分辨率不断提升。然而,大气物理过程的发生尺度比当前最先进的数值天气预报模式的网格尺度要小,而这些次网格过程对于大气演变是非常重要的。目前的求解办法是用动力模式能解析的网格点状态量的函数来近似表示次网格尺度的动力和物理过程,即次网格物理过程参数化。次网格参数化方案包含近似函数和大量可调参数,是造成数值天气预报模式预报误差的重要因素之一。

为了改善气候预测和天气预报,更高效且准确的次网格物理过程估算是非常重要的。目前,深度学习已经被用于尝试代替数值天气预报模式中半经验性质的次网格物理过程参数化子模块,包括数值天气预报模式中的对流参数化、长波和短波或完整的辐射参数化方案、行星边界层参数化等。这些研究表明,深度学习对于改善数值天气预报模式物理过程的计算效率或精度具有非常好的潜力,但同时需要解决稳定性、质量和能量守恒性问题。

Gentine等发现,基于人工神经网络训练的对流参数化方案与原始的物理对流参数化具有相似的结果,且计算效率明显提高。但在没有明确的能量守恒限制情况下,人工神经网络训练的结果可能无法保证能量守恒和湿守恒;虽然深层神经网络模型的结果基本能够保持能量守恒,但是深层神经网络模型很难训练,而且泛化能力较弱,可能存在固有误差。Pal等利用深度神经网络(Deep Neural Networks,DNN)代替地球系统模式中的辐射参数化方案,尽管在保证准确率的情况下模型效率得到了改善,但只利用DNN模拟了晴空气体的长波和短波辐射,没有包括云和气溶胶的辐射效应。Wang等利用DNN模拟WRF模式中的PBL参数化,成功地模拟了边界层内速度、温度和水汽的垂直廓线,但尚未完全耦合到WRF模式中。此外,为了进一步提高计算效率还需要解决模型分布式训练的问题。

除了研究利用深度学习来替换单独的参数化方案,Brenowitz等通过训练神经网络模型替换次网格的多个参数化方案,比如包括积云对流、辐射、边界层输送及其他随机过程参数化,即统一物理参数化替代模型。考虑到气象预测的时空变化特征,仅对每个时步的均方根误差进行性能评估是不够的,应采用多时步预测和观测误差构建损失函数,确保长时间运行期间的稳定性和准确性。然而,由于多时步评价的损失函数的神经网络模型对时间离散化和时间步长具有隐式依赖,会导致训练模型产生误差,因此需要对多时步损失函数的方法进行适当地优化。此外,必须指出的是,以上两种损失函数均无法解决神经网络模型和动力模型耦合时的“模式爆炸”(model blow-up)问题,即因混合模型无法考虑两个模型间的反馈,导致损失函数不能惩罚这种反馈所导致的不确定性,最终发生模式态严重偏离,即“模式爆炸”。多时步损失函数的提出为解决长时间预测的稳定性和准确性问题打开了新的视野。

2.3 替换完整的数值天气预报模式

除研究利用深度学习替换数值预报模式的次网格物理参数化子模块外,Scher和Weber等还尝试了直接利用端到端的深层神经网络模型替换完整的数值天气预报模式。基于简化模型的研究表明,如果有足够的数据,深层神经网络模型可以在不牺牲预报准确率的情况下显著改善计算效率。Scher等发现,训练数据集的大小以及不同气候过程的复杂度会影响神经网络模型的预报技能。他们认为卷积神经网络虽然能够通过卷积层和池化层处理空间特征,但是只适合处理矩形网格数据。对于具有时空变化特征的地球弯曲表面的气象场,采用球面卷积神经网络或许能得到更好的结果。

此外,卷积神经网络很难处理关键特征的空间变化问题,比如一张面部图,眼睛和嘴巴的位置挪动之后,仍然具有正确的特征,但是相对位置却错了。这是由于卷积神经网络中的池化层通过计算相邻网格点的最大或平均值引入平移或尺度不变性来识别不同大小或位置的相同对象。解决这一问题对利用深度学习处理时空复杂多变的气象问题非常重要。为此,Sabour等提出胶囊神经网络,利用包含更多特征信息的胶囊单元替换卷积神经网络中的池化层,以提取包含位置、相对距离、方向等信息,将相对位置编码在特征图中,并引入了位置等变性,从而更好地处理对相对位置特征敏感的问题。

上述提到的替换模式物理参数化子模块和替换完整的数值天气预报模式方法都是基于模式物理参数化和完整的数值天气预报模式的模拟数据集训练深度学习模型。Vlachas等尝试利用神经网络模型构建纯数据驱动的动力系统模型的方法,相比于高斯过程回归,基于LSTM的模型在短期预测方面取得了更好的结果,但是随着迭代的增加误差不断累积,且更容易发散。此外,一些研究者开始利用大量的观测数据训练神经网络模型学习,近似表示偏微分方程,试图从高维数据中发现物理定律。这些研究未来无疑会对深度学习在数值天气预报模式方面的应用带来新的启发。

2.4 数值天气预报模式后处理

大气是一个混沌系统,数值天气预报模式预报对模式初始条件非常敏感,加上模式动力近似、次网格物理参数化和下垫面地形、植被、土壤等特性参数的不确定性等因素,模式预报误差不可避免,有时会在小尺度过程上迅速发展,随后传播到大尺度过程,导致数值天气预报模式预报出现极大的不确定性。目前,集合数值模式预报方法是考虑数值预报的不确定性的主要手段。但是数值天气预报模式的自由度非常大,通常超过10,由于计算资源的限制,当前大部分业务集合数值模式预报的成员数在20~50个,而且集合数值模式预报的初始条件一般是从不完美的初始场误差分布中进行采样。因此,数值天气预报模式的不确定性和集合数值模式预报取样数(成员)的限制导致集合数值模式预报的结果仍可能存在较大误差。

考虑到上述问题,数值天气预报模式输出的统计后处理尤为重要。除传统的统计后处理方法外,机器学习方法也已逐渐被应用于数值预报的后处理,比如基于保序回归的冰雹预报校正,基于随机森林的温度和雷暴尺度降水预报校正。此外,一些研究者利用神经网络对集合数值模式预报的降水和温度进行预报校正。这些研究结果表明,深度学习模型的结果总体优于传统的统计后处理方法,但是深度学习容易发生过拟合。总体而言,当前深度学习在数值天气预报模式后处理方面(特别是集合数值模式预报的后处理)的应用仍处于初步阶段,大部分仅用于针对站点的观测和预报匹配数据集,利用具有极少参数的模型来校正数值天气预报模式的预报。未来利用卷积神经网络模型对二维、三维网格的数值预报进行后处理,通过捕捉相应的大、中、小尺度的天气环流信息,有利于生成空间一致和更准确的预测。通过增加数据量、改善神经网络结构、数据增强技术等,将会进一步改善深度学习方法的过拟合问题。

2.5 可解释性和不确定性量化

深度学习模型是基于大量的数据通过多层神经网络学习规律,没有直接的物理规律的限制。因此,深度学习的预测结果经常存在变量时空分布和多变量之间物理不一致的问题。这一问题会导致深度学习模型得到基于某种评分方式较好的预测结果,但其预测变量间可能不满足真实大气的物理规律。因此,使用深度学习模型时,有必要在改善模型预测能力的同时,加强模型的学习过程和对物理规律的可解释能力。深度学习模型的可解释性和不确定性量化不仅在气象领域非常重要,也是所有其他具有动力演变机制的应用领域都需要解决的问题。

2.5.1 模型的可解释性

深度学习在对流短时临近预报、极端天气预测、数值天气预报模式次网格过程参数化以及数值天气预报模式后处理方面的应用,多数是处理复杂的非线性问题。虽然从结构上说,神经网络是由非线性变化及可调整权重和偏差的一系列层构成,但在实际应用中,由于深度学习网络结构的高度复杂性以及多层网络层抽象程度的增加,理解神经网络模型如何以及为什么能得到(或不能得到)我们想要的结果是非常困难的。比如,在估计降水的降尺度产品时,Pan等利用激活层和扰动敏感性技术来分析CNN模型的学习过程,表明不同的降水事件在不同的网络通道表现出了不同的特征,CNN模型通过核学习过滤数据增强特征提取过程,但该方法仍很难区分这些特征是如何与特定降水事件联系起来的。

为了解决这些问题,有研究提出了“可解释人工智能(Explainable Artificial Intelligence, EXI)”的概念,试图赋予模型可靠性、可解释性、负责性以及透明性的能力。而且已有研究者开始探索利用可解释人工智能来研究解决机器学习和深度学习在气象领域的可解释性问题。比如,Gagne等利用特征重要性和特征优化解释卷积神经网络的结果,揭示出卷积神经网络得到的环境和雷暴形态学信息与我们对冰雹增长的理论理解是一致的;Brenowitz等通过评估神经网络对低层对流层稳定性和中层对流层湿度的敏感性以及耦合神经网络的线性响应函数简化重力波动力过程,更好地解释了在利用神经网络改善次网格尺度参数化并耦合大气流体动力过程时产生的极度不稳定性问题;Toms等发展了特征可视化和层间相关传播(Layer-Wise Relevance Propagation,LRP)方法,探讨了神经网络在ENSO和季节性预报方面的可解释性问题。

除了上述研究外,McGovern等较为系统地介绍了机器学习和深度学习方面的可解释性方法在气象领域的应用,包括杂质重要性、组合重要性、序列选择、部分依赖图、显著图、梯度加权类别激活图、反向优化和新奇探测法,并对每种方法的使用场景以及优缺点进行了总结,以确保机器学习和深度学习模型应用到气象领域时能够发挥最佳性能。

2.5.2 不确定性量化

模型检验和评估的主要任务之一是量化数据的不确定性。数据不确定性包含了可以帮助更加合理的进行资料同化、假设检验和决策的重要信息。对数值天气预报模式,由于模式初始状态和模式方程都存在误差,数值预报本身存在很大的不确定性。因此,无论是评估气候变化还是检验数值天气预报,量化不确定性都是非常重要的。

当前,气象预报领域通常是通过集合数值模式预报方法量化预报的不确定性。深度学习在气象领域仍处于初步应用阶段,对于深度学习模型预测不确定性的研究较少,在量化模型的不确定性方面存在明显不足。比如,仅通过常规评价方法量化具有线性误差假设、相互依赖和不充分等问题;或通过引入新的损失函数优化模型,仅对单站点的预测进行不确定性量化。目前,基于深度学习的标量值的不确定性量化结果的技能评分表现比集合数值天气预报的结果差。由于这些相对简单的不确定性量化方法存在严重不足,有些学者尝试发展更复杂的量化方法,比如贝叶斯深度学习方法。然而,这些更先进的方法面临很多困难,需要进行大量地交互式模型修改和调整,且计算效率低。Gal提出了无需修改模型或进行优化的贝叶斯深度学习不确定性评估工具,但距应用于气象领域的深度学习模型预测尚有一定的差距。气象领域应用深度学习模型需要处理不同的噪音源、高维空间、多尺度、遥相关等问题,有必要整合贝叶斯或概率推断处理不确定性问题。

深度学习的不确定性分析是基于大量历史数据推演出由于数据、模型构造和模型参数的不确定性导致的资料同化分析场、模型预报、数值天气预报误差订正等产品的不确定性和概率特征。实际上这些不确定性与所处理的天气过程的稳定性和可预报性有一定的关系。理论上,对不稳定、可预报性较低的气象过程,机器学习数据和模型参数的不确定性较大,学习结果的可靠性偏小。而对稳定、可预报性较高的气象过程,机器学习数据和模型参数的不确定性较小,学习结果的可靠性会更强。这与数值天气预报中数理方程驱动的集合预报的基础概念和要解决的问题非常一致。如何结合深度学习和数值集合预报技术,提升预报精度和更精确地定量表达预报误差的概率分布,可能是提升当前集合预报产品精度的重要手段。最近,Hewson等利用深度学习技术对欧洲中期天气预报中心(ECMWF)的集合数值预报的降水预报进行后处理,明显地改进了模式降水预报精度和使用价值。

上述分析表明,为进一步改善深度学习在气象领域的应用,深度学习模型的不确定性量化和学习过程的可解释性是目前亟待解决的问题。随着深度学习模型不确定性量化方法的不断改进,这些技术将为量化气象领域深度学习模型预测的不确定性带来新的机遇。

3 结论和探讨

综合回顾了深度学习在改善数值天气模式次网格物理过程参数化、资料同化、模式输出后处理及模型可解释性和不确定性量化方面的研究进展,探讨了当前深度学习在气象领域所面临的问题及未来应加强的研究方向。

本研究认为,完全忽视数值天气模式严谨的数学和大气物理的理论和目前已取得的业务预报上的成功,试图应用深度学习替代数值天气模式可能是不明智的,对相对较长时间、包含复杂非线性过程的天气过程的预报尤其如此。目前多数学者已达成共识,构建耦合数值天气预报模式和深度学习的混合模型,利用深度学习的优势改善理论驱动的物理模型存在的问题,发挥两者的协同作用是发挥深度学习技术在气象预报中价值的可行路径。整体而言,深度学习和数值天气预报模式的协同作用研究尚处于探索阶段,对耦合深度学习和数值天气预报模式时导致的不稳定性和偏差尚缺乏充分认识和较好的解决方案。

当前深度学习在替换数值天气预报模式中的参数化子模块、模拟数值天气预报模式积分和资料同化等方面的研究,主要是针对选取有限特征的低维系统。因此,未来需要对深度学习在数值天气预报模式方面的应用进行更加全面的研究,以进一步改善高维气象业务数值天气预报模式的计算效率和精度。Ott等开发了用于科学计算的Fortran语言和现代深度学习模型语言间的桥梁接口,在一定程度上从技术层面解决了耦合数值天气预报模式和现代语言体系下的深度学习模型所面临的困难。这一工作开创了数值天气预报模式和深度学习高度混合模型计算的先例。考虑到数据驱动的深度学习模型和基于数理方程的数值天气预报模式的数据流、计算方法和并行计算的逻辑均有所差异。ECMWF计划于2024年构建具备支持该中心未来深度学习和数值天气预报模式混合计算的高性能计算(HPC)设施。未来几年,不仅要深入探索和改进深度学习在数值天气预报的观测资料处理和质量控制、资料同化、物理过程参数化、数值方案和模式输出处理及释用方面的能力,还需要开发新型模式软件设计和计算机硬件架构,以期提升深度学习和数值天气预报模式混合计算效率。

通过为深度学习模型添加基于理论的物理限制,即物理限制的深度学习模型,一方面可以解决深度学习的物理一致性问题,另一方面可以在一定程度上增强深度学习模型的可解释性。同时,在模型中引入贝叶斯/概率推断,也是处理模型不确定性问题的可行方案。因此,未来应进一步发展数值天气动力和物理理论驱动的深度学习模型,加强数值天气预报模式和深度学习模型的协同作用,进一步改善数值天气预报模式的结果和运行效率。

必须指出的是,不同于其他领域的深度学习技术发展,深度学习在数值天气预报中的应用必须充分考虑气象过程的高度非线性、下垫面非均匀强迫和观测的多样性和不确定性,同时发挥大气动力数学和物理理论优势,以数值天气预报模式的热动力方程和大气物理过程机制为基础,针对数值天气模式的不同分量的特殊功能和问题,构建物理限制的深度学习技术,提升气象模拟精度。因此,除在人工智能广域研究中鉴别和加强适用于气象特有问题的深度学习新技术外,探索耦合深度学习和数值天气预报模式的资料同化、模式物理和动力以及预报后处理等多环节的混合模型、利用迁移学习技术解决数据量不足所带来的问题,以及发展深度学习模型训练中气象特征和信息筛选的可解释能力,将是未来进一步提升深度学习在数值天气模式研究和应用中的能力和价值的重要研究方向。

猜你喜欢

天气预报数值卷积
基于全卷积神经网络的猪背膘厚快速准确测定
体积占比不同的组合式石蜡相变传热数值模拟
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
数值大小比较“招招鲜”
舰船测风传感器安装位置数值仿真
铝合金加筋板焊接温度场和残余应力数值模拟
蚁先生的天气预报
测不准的天气预报