人工智能在气候预测领域应用初探
2023-11-06中国气象局气象发展与规划院刘冠州唐伟
文 |中国气象局气象发展与规划院 刘冠州,唐伟
一、引言
根据国家标准化管理委员会发布的《人工智能标准化白皮书(2018年)》,人工智能(Artificial Intelligence,AI)是指利用数字计算机或者由数字计算机控制的机器,模拟、延伸和扩展人类的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。现阶段,随着计算机硬件设施性能的显著提升、研究数据的大量增长且存储成本的大幅降低以及算法的明显改进,人工智能技术飞速发展,呈现出深度学习、跨界融合、人机协同、自主操控等发展趋势。
在人工智能领域,一般包括机器学习、知识图谱、自然语言处理、人机交互、计算机视觉、生物识别、增强现实(Augmented Reality,AR)/虚拟现实(Virtual Reality,VR)七大关键技术。机器学习(Machine Learning,ML)是一门交叉学科,涉及统计学、系统辨识、逼近论、神经网络、优化论、计算机科学、脑科学等诸多领域。它研究计算机如何模拟或实现人类的学习行为。获取新知识或技能,重组现有知识结构,不断提高自身性能,是人工智能技术的核心。常使用并且表现突出的主流机器学习方法包括两大类:(1)传统机器学习,如决策树、随机森林、支持向量机、朴素贝叶斯、梯度提升树、极端梯度提升树等;(2)深度学习,如卷积神经网络、循环神经网络、递归神经网络、深度玻尔兹曼机、深度置信网络等。
随着气候变化及其负面影响的日益加剧,干旱、洪涝等气象灾害频发且破坏加剧对人类的生活造成很大影响,提高气候预测的能力也变得愈加重要和急迫,对气候预测的需求越来越大。将人工智能应用于月—季尺度上的气候预测以及更长时间尺度的气候预估,是一项巨大的挑战。人工智气候预测需要海量的优质数据,数据是机器学习的核心,是AI发展的瓶颈,数据决定模型质量的上限。随着对气候系统变化机制的日益深入理解,地球系统的观测数据、再分析资料以及数值模拟数据在过去40年里飞速增长,气候变化科学数据存量越来越大,存储类型越来越丰富。尤其是第五阶段国际耦合模式比较计划(Coupled Model Intercomparison Project-Phase 5,CMIP5)和第六阶段国际耦合模式比较计划(Coupled Model Intercomparison Project-Phase 6,CMIP6),为气候变化、气候预测和气候预估研究提供了数千万亿字节量级的数据资源。同时在高性能计算机、“大数据”和先进算法的支持下,机器学习技术蓬勃发展,为提高气候预测的技巧提供了新的思路和契机,气候预测领域的人工智能应用也在逐渐展开。在模式改进等特定领域,人们已经认识到人工智能技术的巨大潜在利益。传统模式中的不同要素显示出被人工智能技术取代或增强的潜力。许多气候研究人员已经采用人工智能方法来加深对特定地球系统组成部分的理解,相关领域涌现了一大批创新性的研究成果,下文将分类详述。
首先,将着陆试验实测的应变和缓冲器行程数据代入标定试验获得的载荷方程中,计算出起落架轮轴处承受的结构载荷,包括垂向、航向和侧向结构载荷,绘制出实测起落架载荷的时间历程曲线见图3,图中:Pz、Px和Py分别为右主起的垂向、航向和侧向载荷。
二、气候模式参数化改进
Krasnopolsky等人2005年提出了一种基于统计/机器学习和大气模型中确定性建模的协同组合的方法。该方法使用神经网络作为统计或机器学习技术,用于模型物理参数化的精确和快速仿真或统计近似。它被用于为美国国家大气研究中心(National Center for Atmospheric Research,NCAR)社区大气模型开发一个大气长波辐射参数化的精确和快速近似,这是模型物理中最耗时的部分。开发的神经网络仿真比原始参数化快两个数量级到50~80倍。用原始参数化及其神经网络模拟进行的并行10年气候模拟的比较证实,这些模拟产生几乎相同的结果。Gentine等人2018年提出了一种基于机器学习的对流参数化的新方法,使用一个具有指定海面温度的水行星作为概念证明。用气候模型的超参数化版本来训练深度神经网络,其中对流由数千个嵌入的二维云解析模型来解析,对流的机器学习表示可以巧妙地预测对气候模拟最重要的超参数化的对流加热、润湿和辐射特征。
Luo等人2007年使用机器学习的贝叶斯方法来融合由多个气候模型生成的集合季节性气候预报,以获得更好的概率性和确定性预报。研究给出了两个实例:赤道太平洋海表温度的季节预报和俄亥俄河流域的降水预报。这些预报的交叉验证显示,与来自气候模型和气候预报的原始预报相比,合并预报的均方根误差和排序概率得分更小,表明确定性和概率性预报技能都有所提高。因此,这种方法在季节性水文预报中有很大的应用潜力。
三、集合预报
气溶胶—云的相互作用效应是气候模式中不确定性的主要来源,因此量化不确定性的来源从而指导研究工作是很重要的。然而,全球气溶胶模型的计算费用阻碍了对其输出进行全面的统计分析。Lee等人2013年对一个全球三维气溶胶微物理学模型进行了基于方差的分析,以量化模型估计的云凝结核当前浓度中参数不确定性的大小和主要原因。根据专家的启发,确定了28个模型参数,基本上涵盖了所有重要的气溶胶过程、排放和气溶胶大小分布的表示。然后,基于为每个模型网格单元构建的仿真器的蒙特卡罗型采样,进行不确定性分析,在全球范围内改进云活性气溶胶的建模。
在事业单位的财务管理方面,应该从事业单位财务管理中存在的问题出发,完善财务管理规章制度,强化预算管理和资金控制,改进财务监督体系,以确保事业单位财务管理的规范化标准化高效化开展,为事业单位整体管理的改进完善提供良好的基础条件。
旱地环境中的土地退化和沉积物再活化被认为是一个重大的全球环境问题。鉴于目前稳定的沙丘系统在气候变化和人类活动压力增加的情况下有可能重新激活,确定外部扰动在驱动地貌响应中的作用至关重要。Buckland等人2019年开发了一种新的方法,使用人工神经网络(ANN)应用于内布拉斯加州沙丘历史再活化—沉积事件的时间序列,以确定半干旱草原上历史时期的沙沉积与外部气候条件、土地利用和野火发生之间的关系。结果表明,植被生长和沉积物再沉积事件都可以准确估计。单个因素的敏感性测试表明,当气候保持在目前的条件下时,局部强迫(过度放牧和野火)具有统计上的显著影响。然而,主要的影响是气候引起的干旱。此方法有很大的潜力,可以估计未来景观对各种潜在脆弱旱地环境的气候和土地利用情景的敏感性。
三维模拟属于前期阶段的工程项目,相关工程设计人员需要在模拟系统内录入相关的工程设计参数,并结合现有条件将工程建设的三维模拟图进行呈现,在三维环境下的工程模拟真实度更高,对细节的把控更为全面,能够在施工前期阶段对可能发生的工程设计问题进行解决,避免施工工程方案与工程设计方案不符,确保各个施工环节的一致性,帮助工程施工建设人员更为有效的了解基础工程建设项目。
四、气候变化影响评估
准确估计珍稀濒危物种的地上生物量(Aboveground Biomass,AGB)对于保护森林生态系统和濒危物种以及为分析过去和未来气候变化对森林生物量的影响提供有用信息尤为重要。Wu等人2019年使用三个已开发和两个广泛使用的模型,包括广义回归神经网络(Generalized Regression Neural Network,GRNN)、成组数据处理方法(Group Method of Data Handling,GMDH)、自适应神经模糊推理系统(Adaptive Neuro-Fuzzy Inference System,ANFIS)、人工神经网络(Artificial Neural Network,ANN)和支持向量机(Support Vector Machine,SVM),来估计中国天然林中刺桐AGB的可行性。结果表明,这些模型可以利用有限的气象数据解释AGB的变化,建议使用这些先进的模型来估计森林的AGB。
在大型数据集中检测极端事件是气候科学研究中的一个主要挑战。当前极端事件检测算法建立在人类根据相关物理变量的主观阈值定义事件的专业知识之上。通常,多种相互竞争的方法会在同一数据集上产生非常不同的结果。气候模拟和观测数据中极端事件的准确描述对于理解气候变化内容中此类事件的趋势和潜在影响至关重要。Liu等人2016年首次将深度学习技术应用于气候极端事件检测。深度神经网络能够从标记的数据中学习一大类模式的高级表示。在这项工作中,我们开发了深度卷积神经网络(CNN)分类系统,并证明了深度学习技术在处理气候模式检测问题中的有效性。结合基于贝叶斯的超参数优化方案,深度CNN系统在检测极端事件方面达到了89%~99%的准确度。
大气环流模型(General Circulation Models,GCMs)是经常用于评估气候变化影响的气候模型,它的分辨率较粗,因此从GCMs获得的模拟结果在相对较小的流域尺度水文过程中可用性不高。Ghosh和Mujumdar2008年提出了一种基于稀疏贝叶斯学习和相关向量机(Relevance Vector Machine,RVM)的统计降尺度方法,以使用GCM模拟的气候变量模拟季风期(6月、7月、8月、9月)流域尺度的径流。由美国气象环境预报中心(National Centers For Environmental Prediction,NCEP)和美国国家大气研究中心(NCAR)联合制作的再分析数据被用于训练模型,以建立径流和气候变量之间的统计关系。由此获得的关系用于预测GCM模拟的未来径流。统计方法包括主成分分析、模糊聚类和RVM。不同的核函数用于比较目的。该模型被应用于印度的马哈纳迪河流域。将使用RVM获得的结果与最先进的支持向量机(SVM)的结果进行比较,以展示RVMs相对于SVMs的优势。
发展中国家农业生产率的提高被认为在减贫中发挥了关键作用。但在世界大部分地区,这种生产率仍然没有得到很好的衡量,这阻碍了评估和瞄准提高生产率干预措施的努力。Burke和Lobell在2017年使用高分辨率卫星图像,结合从肯尼亚数千块小农土地上收集的田间数据,运用随机森林等方法估计了非洲小农的田间产量变化。结果表明该方法对衡量具体干预措施的影响、描述收益差距的来源和规模以及开发针对非洲小农户的金融产品都有潜在能力。
Goyal等人2014年研究了人工神经网络(ANN)、最小二乘支持向量回归(Least Squares - Support Vector Regression,LS-SVR)、模糊逻辑和自适应神经模糊推理系统(ANFIS)技术在提高亚热带气候下日蒸发量估计准确性方面的能力。通过比较发现,模糊逻辑和最小二乘支持向量回归方法可以成功地应用于从现有气候资料模拟日蒸发过程,机器学习模型优于传统的经验方法。
干旱是水循环的间歇性干扰,深刻影响着陆地碳循环。然而,耦合的水循环和碳循环对干旱的响应和潜在的机制仍然不清楚。Yang等人2016年提供了第一个全球综合的干旱对生态系统水分利用效率影响的数据WUE(Water Use Efficiency)。使用数据自适应机器学习方法构建两个观测WUE数据集,发现WUE对干旱的反应在干旱(WUE随着干旱而增加)和半干旱/半湿润生态系统(WUE随着干旱而减少)之间形成对比,这归因于生态系统过程对水文气候条件变化的不同敏感性。干旱生态系统的WUE变率主要受物理过程(即蒸发)控制,而半干旱/半湿润地区的WUE变率主要受生物过程(即同化)调节。同时多年来水文气候条件的变化会加剧干旱对WUE的影响。结果表明,未来的干旱事件,加上气候变率的增加,将进一步威胁半干旱/半湿润生态系统,并可能导致生物群落重组,首先是低生产力和高水分敏感性的草地。
左岸高程600m以下为陡壁,地下水位略高于金沙江水位,埋深30m。岩体透水率总体上随埋深增加,透水率逐渐减小,且具有一定的分带性。岩体以弱透水为主,弱卸荷或弱风化岩体透水率一般大于5Lu,相对隔水层顶板埋深在67~100m。
在历史全球平均温度数据上,在线学习算法的平均预测损失几乎与事后表现最好的气候模型相匹配。此外,它的性能超过了平均模型预测,这是气候科学的默认做法,中值预测和最小二乘线性回归。通过对2098年的气候模型预测进行实验。使用任何一个气候模型的预测来模拟标签,发现在线学习算法相对于其他气候模型和技术显著提高了性能。同时针对非洲、欧洲和北美的特定地理区域进行了IPCC全球气候模型温度预测实验。在年度和月度时间尺度的历史数据上,以及在未来的模拟中,学习算法通常优于每个地区的最佳气候模型和线性回归。值得注意的是,学习算法始终优于当前基准模型的平均预测。
五、气候数据集改进
淡水资源具有很高的社会相关性,在当前气候变化的背景下,了解其过去的可变性对于水资源管理至关重要。Ghiggi等人2019年进行了了1902年至2014年期间全球网格月径流的重建。径流观测用于训练机器学习算法,该算法基于来自大气再分析的前期降水和温度来预测月径流率。这种重建的准确性通过交叉验证进行评估,并与大型河流流域的独立流量观测值进行比较。与13个最先进的全球水文模型径流模拟的集合相比,所提供的数据集与径流观测值的一致性更好,使其成为大规模水文气候过程研究、水资源评估以及评估和完善现有水文模型的理想候选。
在过去的20年里,大量的研究采用了基于人工神经网络的遥感信息降水量估算的产品(Precipitation Estimation from Remotely Sensed Information using Artificial Neural Networks ,PERSIANN)。目前,PERSIANN提供了几种基于不同空间和时间尺度的不同算法的降水产品。Nguyen等人2018年概述了可用的PERSIANN降水反演算法及其差异,使用气候预测中心基于统一规范的分析作为基准,在不同的空间和时间尺度上对美国可用的业务产品进行了评估,挖掘PERSIANN产品的优势和局限性,并提出了未来将通过进一步整合深度学习算法改进该数据集。
全球历史气候网络每日数据库包含全球各地气象站的每日最高和最低温度等变量。如果不考虑由于收集观测值的时间造成的偏差,基于每日最低和最高温度的气候汇总统计数据将是不准确的。Rischard等人2018年提出了一种新的方法来解决这个问题:通过从附近记录每小时温度的站点信息来估算测量位置的每小时温度,然后可以使用这些信息来创建温度极值的准确汇总。关键的困难是温度曲线的这些插补必须满足落在观察到的每日最小值和最大值之间的限制,并且在24小时内至少达到一次这些值,通过开发一个时空高斯过程模型,用于输入来自附近站点的每小时测量值,然后开发一种新颖且易于实现的马尔可夫链蒙特卡罗算法,用于从满足上述约束的后验分布中进行采样。结果显示,插补的温度很好地恢复了隐藏的温度而且该模型可以利用数据中包含的信息来推断每天测量的时间。
过去一个世纪,特别是最近二十年,降水特征发生了前所未有的变化,这给社会带来了严重的社会经济问题,如水文气象极端事件,特别是洪水和干旱。这些变化的根源在于不断变化的气候条件,然而,它的威胁性影响只能通过十年降水预测(Decadal Precipitation Predictions ,DPPs)的规划来处理。由于降水预测的复杂性,DPP代表了一个非常具有挑战性的前景。由于有限的技术和粗糙的空间分辨率,由大气环流模式(GCMs)提供的DPPs不能直接用于影响评估。Salvi等人2017年基于九个GCM量化美国大陆DPPs的季节性和区域性平均技能,通过应用基于线性和核回归的统计降尺度方法来解决与有限技能和分辨率相关的问题。这两种统计方法都显示出相对于原始GCM数据的改进,特别是在长期统计特性和不确定性方面。
针对训练科目制定合理岗位标准作业大练兵流程,同时理论结合实际,在训练课目中加强对岗位标准作业流程的培训与考核,通过规范岗位大练兵培养队员处理应急事件的正确行为,保证队员自身安全的同时也提高了队员的应急反应与处置能力。
六、气候预测
(一)遥相关预测
Chattopadhyay等人2013年提出了一种基于自组织映射(Self-Organizing Map,SOM)算法的非线性聚类技术,用于识别马登-朱利安振荡(Madden Julian Oscillation, MJO)在其生命周期中的水平和垂直结构。MJO的SOM描述不需要季节内带通滤波或主导模式的选择。SOM基于所选变量的状态相似性来定义MJO阶段。由SOM定义的给定MJO阶段的降雨相关变量的空间模式不同于其他阶段的模式。与其他MJO诊断方法相比,SOM具有其独特的特征,是提取MJO信号的可靠且有用的工具。
整个热带地区的地表温度变化表现出不同程度的空间一致性,然而这种一致性还没有得到很好的描述。大面积地理区域同时出现的多年高温异常有可能对粮食生产和社会发展产生不利影响。Yang等人2019年通过对过去六十年广泛温度测量之间的相关性进行聚类分析,发现70年代后期发生了重大变化。两个空间集群合并为一个主导的空间集群,因此,大多数热带陆地区域同时经历较暖的年份,确定了与太平洋年代际涛动(Pacific Decadal Oscillation ,PDO)的陆地热带联系。
Liess等人2017年提出沃克环流与北半球极地地区的温带波有关,在北半球冬季,这些波从中亚向东南传播到西太平洋暖池。波动模式类似于东大西洋—西俄罗斯模式,并影响厄尔尼诺—南方涛动(El Niño-Southern Oscillation ,ENSO)区域。西西伯利亚平原和ENSO两个活动中心之间的三极模式表明,ENSO相对于全球海平面气压(Sea Level Pressure ,SLP)的背景状态与西西伯利亚平原有显著的负相关。由ENSO的两个作用中心的总和定义的与背景状态的相关性高于单独与任一ENSO中心的每一个成对相关性。这些中心由检测具有相似特征区域的聚类算法来定义。
厄尔尼诺/南方涛动(ENSO)的变化与一系列区域极端气候和生态系统影响有关。因此,稳健的长期预测对于管理政策反应将是有价值的。但是,尽管经过几十年的努力,提前一年以上预测ENSO事件仍然是个问题。Ham等人2019年研究表明,采用深度学习方法的统计预测模型可以在长达一年半的时间内产生熟练的ENSO预测。为了避开有限数量的观察数据,该研究首先在历史模拟上使用迁移学习来训练卷积神经网络(Convolutional Neural Network ,CNN),随后重新分析1871~1973年。在1984年至2017年的验证期间,CNN模型的Nino3.4指数的全季节相关技能远远高于当前最先进的动力预报系统。CNN模式在预测海面温度的详细带状分布方面也更好,克服了动力预测模式的弱点。热图分析表明,CNN模型使用物理上合理的前兆来预测ENSO事件。因此,CNN模型是预测ENSO事件和分析其相关复杂机制的有力工具。
(二)极端气候预测
目前,地表吸收的太阳能有一半以上用于蒸发水分。气候变化预计会加剧水文循环并改变蒸散量,对生态系统、区域和全球气候的反馈产生影响。蒸散量的变化在全球范围内缺乏直接的观测约束,陆地水循环的变化、气候变化和可变性影响的关键诊断标准仍然不确定。Jung等人2010年提供了一个从1982年到2008年全球陆地蒸散的数据驱动的估计,整合使用了全球监测网络、气象和遥感观测以及机器学习算法。此外,使用基于过程的陆面模式集合评估了同一时期的蒸散变化。
双语教育对于我们来说是个机会又是个挑战,任务很艰巨,对于未来电子信息工程专业的双语教学有几点建议:(1)学校加大支持力度。(2)找到双语课程所在总体专业课程中的比例。(3)针对不同的学生设置不同的教学任务。因此我们双语教学道路还很漫长。
一个完善、运行良好的财务管理系统不仅能够帮助企业规避相关的财务风险,提高投资、筹资的效率,更是企业内部审计体系中重要的一个环节。企业财务管理系统和内部审计系统两者相辅相成,具有紧密的协同效应。
对未来干旱的预测是评估干旱事件对重要水资源、农业、生态系统和水文的不利后果的有效缓解工具。使用机器学习算法的数据驱动模型预测是实现这些目的的有希望的原则,因为它们需要较少的开发时间、最少的输入,并且比动态或物理模型相对简单。Deo和 Sahin2015年使用1957~2008年训练的输入数据和2009~2011年期间预测的月度干旱指数,验证了一种计算简单、快速和有效的非线性深度学习算法,称为极限学习机(Extreme Learning Machine ,ELM),用于预测澳大利亚东部的有效干旱指数。预测指标证明了ELM在所有测试点优于ANN模型的性能。此外,ELM模型的学习速度比ANN模型快32倍,训练速度比ANN模型快6.1倍。ELM模型对干旱持续时间和严重程度的预测能力得到了提高,所以ELM是预测干旱及其相关特性的更快捷的工具。
降水不足引发的干旱受温度和蒸发蒸腾等各种环境因素的影响,导致缺水和作物歉收问题。在Park等人2016年的研究中,来自中分辨率成像光谱仪和热带降雨测量卫星传感器的16个基于遥感的干旱因素被用于监测美国不同气候区域 2000~2012 年生长季节的气象和农业干旱,时间尺度为1~12个月的标准化降水指数和作物产量数据分别用作气象和农业干旱的参考数据。通过随机森林、增强回归树等机器学习方法对16个基于遥感的干旱因素与现场参考数据之间的关系进行建模,这些方法在许多回归任务中被证明是稳健和灵活的。结果表明,随机森林产生了最好的性能用于标准化降水指数预测。
这些年来,我一直在外面漂泊,经过许多风风雨雨,依然孤身一人。两年前我有一个女朋友,但她为了自己的理想远渡重洋到他乡。离别时,她曾对我说,过些时日会回到我身边与我长相厮守。我很爱她,为了珍惜这份得来不易的感情,一个人在老地方苦苦地等了两年还不见她回来,也没有半点她的消息。我相信她一定会遵守诺言回到我身边。从见到你的第一眼起,我发现你跟我女朋友长得很像。备受相思煎熬的我常把你当作我的女朋友,跟你在一起的时候感觉就像跟女朋友在一起,消除了内心世界里的一切痛苦相思!我知道这样对你很不公平,可是我无法拒绝你的美。
气候模型是复杂的数学模型,由气象学家、地球物理学家和气候科学家设计,并作为计算机模拟运行,以预测气候。来自世界各地不同实验室的20个全球气候模型的预测差异很大,这些模型为政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)提供信息。给定来自20个IPCC全球气候模型的温度预测,以及超过100年的历史温度数据,Monteleoni等人2011年用深度学习算法对观测序列进行建模,其中当前最佳气候模型作为隐变量。
就这样,他们和我见了面。见面之后,他们觉得我不仅有知识有学问,还具备良好的修养,更难能可贵的是我才刚刚24岁,而且家境贫寒急需用钱。他们认为我会是一个称职的“代孕妈妈”。而我得知了陈清夫妇的坎坷遭遇,看着这对经历了太多磨难的夫妻饱含希冀的眼神,不禁欣然同意为他们孕育孩子。
Belayneh等人2016年探讨了耦合机器学习模型和集成技术预测埃塞俄比亚阿瓦什河流域干旱状况的能力,探索了小波变换与自举和增强集成技术开发可靠的人工神经网络和支持向量回归模型用于干旱预测的潜力。小波分析被证明可以改善干旱预测并改善所有模型的预测结果。
(三)中国区域气候预测应用
夏季降水的季节预报对减少区域性灾害至关重要,但目前预报水平较低。Wang等人2021年基于中国科学院灵活全球海洋—大气—陆地系统有限体积2代版本模式(Flexible Global Ocean-Atmosphere-Land System Model finite volume version 2,FGOALS-f2)动力预报模式的环流场,开发了一种动力和机器学习混合(Dynamical and Machine Learning hybrid,MLD)的中国夏季降水季节预报方法。通过为三种机器学习方法选择最佳超参数以获得最佳拟合和最小过拟合,随机森林和梯度增强回归树方法的集合均值显示出以异常相关系数衡量的最高预测能力。该技能在历史交叉验证期(1981~2010年)的平均值为0.34,在独立预测的10年期(2011~2020年)的平均值为0.20,显著提高了400%的动态预测能力。减少过拟合和使用最佳动态预测在MLD方法的应用中都很重要,对这些方法的深入分析值得进一步研究。
与我国旱涝灾害密切相关的降水变化,每年影响着数十亿人。然而,比天气预报难度更大的次季节预报在很长一段时间内仍是气象服务的一个空白领域。为了提高中国降水的次季节预测精度,Wang等人2021年引入了机器学习方法,提前2~6周对中国降水进行预测,使用一种称为局部线性回归的非线性回归模型和多任务特征选择(Local Linear Regression together with Multitask Feature Selection ,MultiLLR)模型,选择21个气象要素作为候选预报因子来整合不同的气象观测数据。该方法通过多任务特征选择过程,自动剔除无关预测因子,建立预测方程。该方法可为中国降水的次季节预测提供有效的指导。通过在MultiLLR模型中加入另外三个因子,即北极涛动指数、西北太平洋季风指数和西北太平洋副热带高压指数,发现北极涛动能指数最大程度地提高对中国降水的预报能力,其次是西北太平洋副热带高压指数。此外,该模式和美国国家环境预报中心CFSv2模式的集合可以将CFSv2对中国降水的次季节预报技术提高近40%。这一工作表明,MultiLLR模式将有助于我国次季节降水的预测。
长江流域的中下游是中国人口最稠密的地区之一,洪水频繁。He等人2021年采用预测因子重要性分析模型对预测因子进行分类和筛选,并采用五种方法(多元线性回归(Multiple Linear Regression,MLR)、决策树(Decision Tree,DT)、随机森林(Random Forest,RF)、反向传播神经网络(Back Propagation Neural Network,BPNN)和卷积神经网络(CNN))对长江流域中下游夏季降水的年际变化进行预测。八个气候模型的预测被用于比较。在五种测试方法中,RF显示出最好的预测能力。当从冬季开始预测时,RF、DT和气候模型都显示出比早春更高的预测技能,并且RF、DT和MLR方法都显示出比数值气候模型更好的预测技能。缺乏训练数据是限制机器学习方法性能的一个因素。未来的研究应该使用深度学习方法,充分利用海洋、陆地、海冰和其他因素的潜力,进行更准确的气候预测。
Fan等人2023年使用基于深度学习的堆叠式自动编码器进行非线性降尺度,以在早期压缩气候变量的自由度。研究从中国东部四个地区的夏季降水中提取气候因子特征,从中识别出影响各地区夏季降水的关键气候因子。在此基础上,采用包括机器学习方法中的随机森林在内的多种回归方法,构建各区域关键气候预测因子的预测模型。通过模型参数对预测结果的敏感性试验,确定了最佳模型参数。几年的预报表明,该方法对中国东部降水的预报有很高的技巧,特别是在中国南方。结果表明,该模型在区域预测中的异常一致性优于主流模式。与主流模式相比,华南地区的预测结果可提高10%以上。该方法在中国东部夏季降水预测中具有良好的应用前景。
尽管近年来取得了重大进展,但中国季节性降水的预报技术仍然有限。Jin等人2022年开发了一个基于深度学习的中国季节性降水统计预测模型。使用同期大气环流数据对模型进行训练,以学习季节性降水的分布。首先,用几个大气环流模型(GCM)的回报结果对其进行了预训练,对测试集的评估表明,预训练的模型基本上可以再现GCM预测的降水,其异常模式相关系数(Pattern Correlation Coefficients,PCCs)大于0.80。然后,利用ECMWF再分析资料(ECMWF Reanalysis v5,ERA5)资料和中国区域网格降水观测资料进行迁移学习,进一步修正模型中的系统误差。结果表明,以再分析得到的大气环流场作为输入,该混合模式对中国的季节降水模拟效果较好,PCC达到0.71。此外,还评估了使用GCMs预测的环流场作为输入的结果。总的来说,与原始的GCM输出相比,建议的模型在1~4个月的时间内将中国的PCC提高了0.10~0.13。这种深度学习模型在过去两年中已被中国气象局国家气候中心用于为中国夏季降水预测提供指导,并且表现非常好。
七、结语
随着人工智能的蓬勃发展,机器学习等关键技术领域都取得了长足的进步。通过人工智能强大的学习和计算能力,对不同的气候数据类型使用最为匹配的算法,捕捉气候大数据的潜在特征,通过人工智能模型训练可以获得最佳的预测结果,通过上文的梳理可以发现国内外的大量专家学者都已取得显著的研究进展。
但目前人工智能气候预测的准确率、稳定性、预测产品多样化与精细化需求等方面还需进一步的提高。第一,需要与更多的气候模式产品相结合,比如区域气候模式产品和大气环流模式产品等,进一步提高人工智能气候预测产品的时空分辨率,进而提升气候遥相关、极端气候、集合预报等气候预测产品的质量。第二,需要在气候预测中引入随着人工智能技术发展而更为成熟、先进的深度学习方法,进一步拓宽升级人工智能气候预测的技术数字工具箱,提高气候预测的准确性。
总的来说,人工智能在气候预测领域大有可为,应将人工智能充分融入气候预测,进一步提升气候预测技术和能力,以帮助人类更好地应对日益复杂的区域、全球的气候变化和极端气候事件。