人工智能在极端天气的应用综述
2020-11-29何贞铭徐佳琪王晶晶
李 婧,何贞铭,徐佳琪,王晶晶,陈 昊
(长江大学 地球科学学院,湖北 武汉 430100)
1 引言
在过去的一个世纪里,全球范围内的气候均呈不断上升趋势,过去四年也是有纪录以来最热的四年,全球气候的极端特征明显,随之而来的是全球各地频发的严重极端天气事件。因极端天气事件频繁且突然,许多地区准备不足或来不及准备,使得生产生活遭受到巨大损失,甚至会危及生命。这些多发的极端天气不断威胁着基础设施建设、人类健康以及生态系统。
基于科学技术的飞速发展,人工智能(Artificial Intelligence)在各个领域大展身手,利用机器学习、深度学习等工具来解决行业内的棘手问题、开拓新的业务领域。在气象领域中也逐渐发挥着巨大的作用,人工智能应用到极端天气上可以准确预测时间地点同时做好应对措施,减少生命财产损失。
在1956 年美国达特茅斯学院的一个研讨会上[1],AI(Artificial Intelligence)正式被提出,如今人工智能呈现出了深度学习、跨界集成、人机协作等新特征[2-3]。
2 天气预测的传统技术
中国是世界上最早开始进行短期气候预测研究的国家之一[4]。早在1930 年中国对三大涛动与旱涝之间的关系进行了研究,但是由于影响气候变化的因素众多及相互关系复杂多变,因此预测过程十分困难。在过去的60 年中,随着时代发展气象数据类型逐渐丰富,样本长度不断扩大,同时计算机的应用也变得广泛,计算速度的加快,中国的短期气候预测技术经历了逐步完善、改进和持续发展的过程。总的来说传统天气预测技术经历了三个主要的发展阶段[5-6]:经验统计,物理统计和动态统计。
2.1 经验统计技术
在20 世纪70 年代之前,中国天气预测刚刚起步,由于当时气象资料稀少、计算条件十分落后,因此主要采用经验统计技术,借以历史资料如历史曲线演变、天气变化周期、天气谚语中的经验等进行分析。随着资料的积累和技术的发展,数理统计方法和更多其他方法也得到了应用,但这一时期天气预报制作仍然全部由人工完成。
2.2 物理分析技术
而后伴随时代的进步,物理统计发展迅速,建立了基于多种数理统计方法的统计预测模型,到目前为止统计预报方法的研究和应用一直在不断进行,并已成为短期气候预报的主要方法之一[7-11]。通过对短期气候预测理论的不断研究发展,物理因素的分析得到了极大的重视,到了20 世纪80 年代后期,中国气候业务部门基于物理统计方法建立了第一代短期气候预测自动化业务系统,此时基本告别经验统计阶段。
2.3 动力学分析技术
动力气候模式预测系统是继物理统计分析之后的另一个新阶段,在“九五”科技攻关相关项目的支持下国家气候中心建立了第1 代全球海洋资料同化系统(BCC_GODAS1.0),并于2002-10 投入短期气候预测业务系统的业务试运行,在气候预测业务系统中发挥了重要作用[12]。在之后的“十五”“十一五”期间物理统计预测模型的应用和外扩随着其他各种项目研发结果的支持也逐渐增加。
3 人工智能在天气预测中的应用
近年来有很多关于人工智能、机器学习和深度学习的新闻,各个领域都在尝试与其相结合,试图通过机器学习和深度学习等技术解决行业中的问题并扩展新业务。当美国硅谷、国内BAT 等互联网公司在金融、医疗、安全、无人驾驶等领域与人工智能完美结合时[13],人工智能在气象学领域的应用也开始走进人们的视野。
3.1 延伸期概率预报
在数值天气预报中[13],对15~30 d 的延伸期预测一直没有好的方法,因此延伸期预报一直是气象预报行业信息研究报中的难点。
国家气象中心在2012-12 完成了基于贝叶斯和支持向量机(SVM)的高温、暴雨集合预报概率预报技术研究以及相应的预警指数构建,利用支持向量机(SVM)方法,通过对径向基核的核函数选取,建立暴雨中期预警SVM 数学模型。2013-10,Earth Risk 发布了一个40 d 的气温概率预报模式TempRisk Apollo[14]。用深度学习的方法先把近一百年的历史气象数据和数千亿次的计算建立气候模型,再与目前的气候条件进行比较,最后运用预测分析的方法计算冷热天气的概率,是一种区别于传统天气预报的独立的预报方法。然而单凭人工智能并不可取,比如在更复杂的天气进行降雨预报时仍需考虑物理原理,因此该公司也开始重视物理机制和人工智能技术的结合。2015 年,Earth Risk 在最新的TempRisk Apollo II 的算法中引入了美国国家环境预报中心(NCEP)和欧洲中期天气预报中心(ECMWF)的数值预报结果,提供了更加综合和可靠的预报。
3.2 短临预报
与短期、中期和长期预报相比,短临预报是天气预报领域中最年轻的成员。短临预报比短期预报时间更短,主要集中在0~12 h,重点面向中小尺度的天气系统,特别是强对流天气系统的预报,具有较高的时效性,准确的短临预报可以为防灾减害提供有力保证。
北京彩彻区明科技公司在2014 年发布了一款基于位置的短临预报APP——“彩云天气预报”[15],通过地面天气实时观测,结合卫星遥感云图和数值天气预报等数据的图像识别、系统外推和深度学习,并与用户的位置相结合,把用户周围小时内的降水短临预报的准确性提升到了90%及以上,落区甚至精确到用户周围的每一条街道。但由于该APP 的预测方法并未基于天气过程的物理基础,因此遇到强对流天气则会漏报。
中国在2015-06,由中国科学院自动化研究所与中国气象局公共服务气象服务中心联合实验室针对气象大数据中的机器学习方法进行了气象多源数据融合建模、关系挖掘、服务行业大数据挖掘等多项研究,研发并启动了一系列成果,包括分钟降水预报、快速循环地面气象要素融合、强对流天气识、能见度监测与预报等。其中多源数据融合建模已实现分钟降水预报全国0~2 h、1 km×1 km 和每6 min 一次的降水预报,实现了雨、雪、雨夹雪的混合形态识别,识别精度超过85%。
而后随着深度神经网络的发展,短临预报中的人工智能算法应用越来越多。2017 年深圳市气象局和阿里巴巴共同举办了以“智慧城市,智慧国家”为主题的竞赛,目的是使用雷达回波数据进行短期降水预报。2018 年,深圳市气象局、香港天文台与阿里云一起举办了全球天气AI 挑战赛。从两次竞赛的结果可知卷积神经网络(CNN)结合循环神经网络(RNN)可以更好地解决时空预测的问题。使用CNN与RNN 方法进行短临预测源于香港科技大学施行健博士的文章,主要思想是使用卷积神经网络(CNN)层从输入的雷达数据中提取特征,并与LSTM 结合以进行序列预测。2017年施行健博士升级了模型框架[16],并在NIPS 上发布了Trajectory GRU(TrajGRU)。TrajGRU 模型可以解决传统CNN-LSTM 的短板问题,它能够主动学习时空递归连接结构,动态刻画时空特征,更贴合短临的场景。
3.3 数值天气预报
中国数值预报的发展起步较晚,1954 年中国刚开始相关的理论研究,在1965 年推出了北半球数据预报产品,虽然每年都会提出新模式,但基本均为覆盖全球的大范围预报,直到1997 年中国才正式推出中尺度数值天气预报系统[17]。
MM5 是美国宾夕法尼亚州立大学/国家大气研究中心从20 世纪80 年代以来共同开发的第5 代区域中尺度数值模式[18]。中尺度数值模式在全球最广泛的应用是美国大气研究中心NCAR、国家环境预报中心NCEP 等多单位联合建立发展的WRF(Weather Research and Forecasting Model),作为新一代中尺度预报模式和同化系统,它可以提高对中尺度天气系统的认识和预报水平,同时促进了成果向业务应用的转化[19]。
2018-06-15,由北京气象部门研发的“睿图”短期数值预报子系统(RMAPS-ST)1 h 循环系统正式投入实时业务试运行。系统使用图像识别和深度学习等新技术,基于雷达资料快速更新四维变分同化技术和三维数值云模式,能够提供10 min 快速更新循环的区域高分辨率大气三维热动力场的实时快速分析。
4 人工智能在极端天气预测中的应用
AI 在日常天气预测中的成绩斐然,面对危害更大的极端天气,人们希望借助AI 强大技术手段继续其在极端天气中的应用。
4.1 强降雨雪预测
中国沿海城市是人口稠密和高度城市化的地区,随着城市建成区面积不断扩大,地表持水量、积水和入渗能力减弱,抵御短期强降雨的能力大大降低,极易发生内涝。如果能够准确预测强降雨雪的时间,对人们的生命财产安全具有重要的意义。
在气温预测中SINGH 等[20]研究了气象温度属性及针对于特定数据序列的依赖关系,进而提出神经网络结合基于时间序列的遗传算法(genetic algorithm,GA)的综合反向传播温度预测模型。在考虑了包括降雨量[21]、相对温度等多各气象因素后又提出一种基于遗传算法和BP 神经网络的实时温度预测模型。AZNARTE 等[22]综合使用四种机器学习算法——广义线性模型、多变量自适应回归样条、随机森林和分位数随机森林与数值天气预报进行建模、预测,提出了一种动态线性评估实验方法。
虽然中国的强降雨雪预报研究相对落后,但也有许多值得借鉴的成就。兰州大学的陈晓云等[23]利用多维时间序列数据挖掘模型,对多维序列进行符号化后按规则提取降雨天气模型;黄明明等[24]通过对北京市日降水量数据这种不均衡样本提出一种伪最近邻算法,与传统k 最近邻算法相比,伪最邻近算法中的降水量预报的准确性和晴雨预报的各项准确率指标显著提升。在2019 年张远汀等[25]将决策树模型与深度学习模型串接,预测强雨雪天气过程中的积雪以及积雪的深度。重庆市作为曾饱受天灾之苦的地区,重庆市气象局利用百度飞桨深度学习平台,与百度智能云在2019 年共同构建了智能气象系统,但该系统仍处于测试阶段,不会作为最终预报数据发布。
4.2 冰雹预测
2019 年张文海等[26]基于广东多普勒天气雷达的三维拼图资料,利用机器学习开发了一种冰雹识别和临近预报的人工智能算法,该算法对冰雹这类非线性强天气过程具有较强的识别能力。中国气象AI 公司KuWeather 发布了最新的基于深度学习的冰雹监测和预报的产品,该产品颗粒度直接达到经纬度级别,同时其人工智能团队成功研发了未来2 h 分钟级降水短临预报。平台能够实时判断全国任何地理范围内是否有冰雹,并预测未来特定时间段内的冰雹。
2014 年DAVID 及其团队[27]将机器学习应用于冰雹规模集合进行冰雹尺寸预测,它能够让预报员提前数小时和数天预测严重雷暴的可能性和特征,输出的模型可以推断其强度。2019 年DAVID 等[28]利用分析视觉图像的机器学习模式和人工智能技术可以改进雷暴及冰雹预报。该研究还利用不同的机器学习模式进行随机预测,用来改进冰雹预报。随机预报模式并没有分析图像,而是提出一系列问题,像一个流程图一样,用来确定冰雹概率。这些问题可能包括露点、气温和风是否超过或低于阈值等。2020 年俄克拉荷马大学的BURKE 等[29]使用机器学习,把来自新的高分辨率整体预报系统版本2(HREFv2)的数值天气预报(NWP)数据进行处理来改善冰雹预报。
4.3 厄尔尼诺预测
厄尔尼诺/拉尼娜现象指的是热带太平洋海表温度异常上升/下降的气候现象,2014—2016 年发生的超强厄尔尼诺事件具有“生命周期长、累计强度大、峰值强度高”三个重要特点,是20 世纪以来最强的厄尔尼诺事件之一。此次厄尔尼诺事件是全球气候异常变化的重要因素之一,包括中国在内的多个国家都经历了严重的洪涝灾害或旱灾,导致多国粮食严重减产,人民生命财产受损。但由于传统天气预报很难对一年后的情况做出准确预测,所以厄尔尼诺的长期预测一直是个难题。
2017 年,许柏宁等[30]通过实验从设计的深度学习网络模型中挑出一种可以选择预测区域海平面温度异常的模型-序列到序列模型,该模型在中长期(提前7 个月以上)预测上的均方根误差表现较好。在实际区域海平面温度异常预测实验中,该模型能较好地预测出海平面温度异常变化趋势,但峰值处表现较差。2018 年自然资源部国家海洋环境预测中心与清华大学合作研发了具有高预测能力的机器深度学习厄尔尼诺预测模型,并在2019 年厄尔尼诺春季预测会议上实现了试验预测。南京信息工程大学与韩国研究人员YOO-GEUN等[31]三位研究人员在2019年开发出一种深度学习模型来预测厄尔尼诺事件。与目前已知的预测方法相比,他们的算法模型更为准确且最早可提前一年半预测厄尔尼诺事件。
5 结束语
随着科技的进步人们已经解决了一部分的气候问题,但气候预测仍是全世界气象学家所面临的难题,极端气候事件的预测更加困难,气候时间变化的规律和形成机理也一直没有研究彻底,因此今后不仅要发展预测监测能力,也要研究气候事件的统计特征的变化规律,而这些问题借助着人工智能都可以更好地实现。尽管人工智能在天气预报中有着举足轻重的作用,但招揽人才的时候却不顺利,专家曾说在人工智能领域中人才严重失衡,目前行业热度和高薪都集中在自动驾驶、计算机视觉等领域,因此大批顶尖人才的首选不是矿产勘探、天气预报等关乎国计民生的行业。气象领域人工智能的应用虽然已有一定的时日,在某些方面也取得了一定的进展,但总的来说这些应用仍较为基础,大有开发前景。