人工智能在台风监测和预报中的探索与展望

2022-07-05周冠博钱奇峰吕心艳聂高臻

气象研究与应用 2022年2期

周冠博，钱奇峰，吕心艳，聂高臻

（1.国家气象中心，北京 100081；2.中国气象科学研究院灾害天气国家重点实验室，北京 100081）

引言

台风灾害是全球发生频率最高、影响最严重的自然灾害之一。我国位于太平洋西岸，受台风活动影响的广大沿海省份人口稠密、经济发达，对台风灾害的承受力也最为脆弱，台风灾害对我国的社会经济发展构成了严重的威胁［1－2］。特别是随着全球气候变暖，西北太平洋地区台风增强概率和比例均在上升，台风强度增大，强台风偏多，而其移速变慢，造成登陆台风强度以及影响时间都在增加，台风带来的危害正在逐渐加大，导致更多人员伤亡和财产损失，台风的防御难度也进一步加大。

过去的20a，台风的路径预报有了显著的提高，24h 路径误差减少约60%，但台风强度预报误差却逐年波动［3－4］，强度预报技巧改进非常有限［5－6］，特别是近海台风强度预报不准确，往往会导致预报预警不及时，出现台风防御不足、预报服务工作非常被动的局面。经评估，24h 强度预报误差每减小1m·s-1，可减少3.8 亿元直接经济损失［7］。可见，台风强度预报的准确性是防台减灾的重要一环。数值预报模式是现代天气预报的重要技术支撑，但数值预报对台风强度预报能力却十分有限［8］，特别是快速增强台风基本没有预报能力。另外，影响台风强度变化的因素错综复杂，主要因素有海洋热状况条件、大尺度环境因子以及台风内核结构，并且目前海上台风观测资料的缺乏，一定程度上阻碍了台风强度变化机理的研究。台风强度变化的物理过程的科学认识不足，严重制约了台风强度预报水平的提高。

近年来随着人工智能技术的兴起，利用地面自动气象站、雷达、卫星等获取的观测数据越来越多，在气象大数据背景下，结合具有强大的数据学习能力和复杂结构特征刻画能力的深度学习进行研究有着十分广阔的应用场景。目前已有很多人工智能应用于气象领域的案例，例如短时临近预报、气候预测、空气质量指数（AQI）预测、数据同化、台风和极端天气预测、数值预报优化等。因此，本文针对当前人工智能技术在台风监测和预报中的应用与发展进行回顾，最后给出目前人工智能方法在台风监测和预报应用中存在的问题以及未来的工作展望。

1 人工智能在台风监测中的应用

台风往往在开阔的洋面上生成，由于海洋上观测资料稀少，台风的监测主要依靠气象卫星探测来完成。在台风业务预报中，也主要是依靠卫星云图来确定台风的强度。虽然卫星遥感不能直接测量地表附近的风，但是云、水汽和降水的卫星图像可以作为估计热带气旋强度的替代物［9－12］。

四十多年来，Dvorak［13－14］技术一直是全球热带气旋（TC）强度估计的主要来源，尤其是在飞机侦察数据不可用的情况下［10］。Dvorak 技术包括主观识别彩色增强红外图像中的中心和带状云特征，基于云图的台风云型特征与台风强度的统计关系发展的一套基于卫星图像台风云型特征的台风强度估计技术。在过去的二十年中，已经开发了几种修正的Dvorak 技术［15］。例如，Olander 和Velden［16］先进的Dvorak 技术（ADT，Advanced Dvorak Technique）目前用于业务热带气旋强度估计。自动气象站通过使用客观的风暴中心确定方案和基于计算机识别云特征的算法来减少主观性，对这些算法应用线性回归来估计热带气旋强度。经过多年业务实践，Dvorak方法也已成为各国官方机构最常使用的台风主观定强方法［17］。Dvorak 方法的缺点是在云特征指数的确定方面存在较大主观性，不同的预报员往往定出的指数有较大的差别，因此，需要提高台风定强的客观化和自动化程度。

近年来，随着人工智能学科的广泛应用，由于其在图像识别方面的优势，如何将深度学习技术应用于气象领域的台风监测，受到越来越多的关注。自从2012 年AlexNet［18-19］的提出，深度学习算法蓬勃发展。这些算法包括卷积神经网络（CNN）、递归神经网络（RNN）和生成对抗网络（GAN）。CNN 由从输入图像中提取空间特征的卷积层和具有简单计算单元的完全连接层组成，简单计算单元学习辨别特征以改善对目标现象的预测，而不依赖人类智能来识别哪个特征是重要的［20］。因此，正如气象学家确定云的形态在一定强度范围内与热带气旋有关，CNN 将使用这些特征作为预测因子来估计TC 强度。崔林丽等［21］基于FY－4 卫星的东南沿海台风强度深度学习算法，利用FY－4 卫星多通道数据，采用CNN 深度学习模型，根据提取的特征，分别对白天和夜间构建分类模型，给出台风强度；Zhang 等［22］利用TCIC（TC intensity grade classification）模块结合红外卫星图像将TC 强度分为三类，给出了三个基于CNN 回归网络的TCIE（TC intensity estimation）模型，它们将不同强度类型的红外卫星图像与TC 最佳跟踪数据相结合。三种TCIE 模型都考虑了分类误差，以提高TCIE 精度。Zhuo 和Tan［23］基于物理增强的深度学习估计热带气旋强度和尺度，通过引入反映TC 强度与尺度关联的新概念——TC 丰满度，能够显著改进TC 强度估计。另外，引入的其他物理信息（下垫面信息、TC 移动速度和风暴年龄等）可以进一步提升TC强度估计性能。

2019 年国家气象中心联合北京邮电大学，提出了一种端到端的可视化智能台风定强模型（核心模型见图1），该模型就是通过计算机视觉领域成熟的预训练CNN 深度学习模型为基础，比如：RESNET（Residual Network）、VGG（Visual Geometry Group）等，对卫星云图数据进行台风强度相关的特征提取；然后，根据提取的特征分别构建分类模型和基于相似度的检索模型获取决策结果；最后，融合两个模型的识别结果，给出最终台风的强度、置信度和参考云图。深度学习通过机器对大量样本的分析和学习，能够隐式提取图像中深层抽象的复杂特征，越来越多地被应用到台风强度估测中。

该模型已于2019 年在中央气象台进行了业务测试，2020 年正式投入到实际的台风强度估测业务，基本上实现了基于气象卫星图像对台风强度的智能识别。以2021 年登陆我国的超强台风“烟花”为例，介绍人工智能在台风强度估测中的表现。总体而言，模型对台风各个阶段强度的估计与实际变化均比较一致。在台风增强阶段，对台风在8 月6 日12时之前的强度估计略偏弱。在台风整个生命史中，能较好识别出台风在7 月21 日增强过程，以及7 月25 日登陆之后的减弱过程（图2），对台风“烟花”的强度估计较为准确，虽然某些时刻表现出不同程度的波动，但整体而言模型对台风强度的估计与实况基本吻合，检验结果MAE 为3.35m·s-1，RMSE 为4.6m·s-1，基本上可以满足业务需求。

图3 是ResNet 模型对台风“烟花”三个不同时刻云图的强度估计结果，其中图3（a）为“烟花”达到巅峰强度42m·s-1时的云图，模型认为该时刻台风强度为42m·s-1的概率为60%、38m·s-1的概率为34%以及48m·s-1的概率为4%，最终模型加权平均后给出40.9m·s-1的强度估计，与业务定强较为接近。图3（b）为“烟花”强度的维持阶段，此时模型给出的强度估计41.7m·s-1与业务定强42m·s-1更为接近。图3（c）是“烟花”深入内陆后的云图，此时台风云型松散，中心空心明显，但模型估计结果为25.1m·s-1，与业务定强25m·s-1基本一致。

2 人工智能在台风路径预报中的应用

台风的移动路径主要受到大尺度环境背景场、海气相互作用以及台风自身结构等多种因素的影响，因此传统的预报方法并不能很好的同时反映这些复杂的热力和动力系统，很难用于提高台风路径的预报水平。近年来，随着人工智能新技术的发展，人工神经网络方法在很多学科领域取得了一些很好的研究成果［24－28］，而遗传算法是近年来人工智能技术领域十分广泛采用的一种基于自然选择和自然遗传的全局优化算法［29－33］；Jin 等［34］以进化的遗传算法，生成期望输出相同的多个神经网络个体，建立了新的非线性人工智能集合预报模型；黄小燕和金龙［35］综合考虑了台风移动路径的气候持续因子和数值预报动力因子，采用主成分分析特征提取与逐步回归相结合的预报因子数据挖掘技术，以BP（Back Propagation）神经网络作为基本模型，结合遗传算法构建了一种非线性智能台风路径集合预报方法；王瀚［36］总结了基于深度学习的台风路径预测多模型算法研究；BP 神经网络方法主要是通过选取经纬度、中心气压、最大风速、移速等预报因子（参考CLIPER 法的预报因子）来进行台风的路径预报［37］；吕庆平等［38］利用气候持续性因子，采用支持向量机法、神经网络法及最小二乘回归法建立了3 种不同的热带气旋路径预报模型；朱雷［39］提出了基于贝叶斯神经网络结合Bagging 委员会机器集成的台风路径预报模型；周笑天等［40］则基于神经网络结合集合预报对台风路径预报进行了优化；Mario Ruttgers等［41］研究了在生成对抗网络中利用卫星图像来进行台风路径预测。由此可见，人工智能在台风的路径预报中的应用还是比较多样的，主要的技术包括多神经网络集成（以气候持续因子、数值模式物理量、EC 台风预报产品等资料为基础，采用深度学习特征提取技术，结合多种神经网络的集成预报模型）、基于路径图形的预报、基于集合预报（BP 神经网络筛选集合预报成因）的方法、基于云图的外推预报（基于对抗神经网络GAN，结合一段时间云图，做6h 外推云图预报，识别台风位置）等。

近年来，国家气象中心也在不断尝试传统的路径预报方法与人工智能新技术相结合，目前业务上主要应用的方法有两种：（1）优化台风路径集合预报订正（TYTEC）方法，对TYTEC 前期预报进行实时误差评估，通过AI 算法自动调整各集合预报模式的参数及权重系数，从而取得最佳台风路径预报效果。（2）基于多种智能计算模型的台风路径集成预报方案。具体的技术路线如图4 所示，首先对EC 台风集合预报成员，采用最优定位排序法，将T 个最好成员组成一个因子矩阵X；然后利用广义回归神经网络、回归随机森林算法以及偏最小二乘算法，分别对因子矩阵X，以相同年份作为独立样本交叉建模，获得三个具有与因子矩阵X 相同样本的序列Y＝｛y1，y2，y3｝；最后采用多元回归模型对由Y、X 和日本预报组成的模型输入矩阵二次建模，实现路径客观预报。

3 人工智能在台风强度预报中的应用

目前气象业务上的台风强度预报，除了综合预报方法外，其它的客观预报方法主要是以统计预报和统计－动力模式为主，并且大多采用回归等统计方法，对台风强度的快速变化刻画能力较弱。近年来，随着人工智能技术的发展，具有较强非线性能力的神经网络等方法在气象预报应用中获得了一定的进展，Pradhan 等［42］使用基于多层深度CNN（Convolutional Neural Network）网络对台风等级进行估计，Zahera等［43］使用LSTM（Long Short－Term Memory）和DNN（Deep Neural Network）网络对台风强度进行估计，Chen 等［44］发布了一个开放数据集，提出了基于CNN强度回归的多模型融合方法，Wei 等［45］使用神经网络方法对台风强度进行更加精细的划分，张淼等［46］利用FY－3C 微波温度计通道特征与台风强度建立统计关系估计热带气旋强度。很多的研究表明了人工智能技术在台风强度预报方面有很好的发展前景［47-48］。因此，通过人工智能技术对台风预报中的非线性问题进行研究，是未来的发展趋势之一。

基于深度学习预测台风强度快速增强的基础特征提取，传统的计算强度的特征提取方法是Dvorak技术。它设计人类构造的特征模式，来进行具有主观性推测的强度估计和预测。近年来，基于深度学习的台风强度估计和预测的方法也得到了越来越多的关注。基于深度学习的分类模型的强度预测方法将每个强度作为一个独立的固定类来预测台风强度，并利用交叉熵损失来优化模型。基于深度回归的方法使用均方误差作为损失函数估计和预测台风的准确强度值。然而，这些方法忽略了强度预测的一个关键点，即台风特征提取的准确性对于台风强度预测的重要性。具有相似特征模式的台风往往具有更接近的强度，因此，从历史信息和多视角信息结合起来进行强度预测是可行的研究方向。Chen 等［49］使用了五点加权平均法来组合历史信息，虽然在结果上显示了改进，但没有考虑到时空台风图像之间的复杂关系。Chen 等［44］提出的另一个方法是将图像旋转不同角度后的估计值与实际图像进行融合以降低估计的偏差，但它忽略了图像本身的多视角特征。台风强度预测离不开强度估计的准确性，已有研究使用CNN 来估计台风强度。Pradhan 等［42］在研究中首先介绍了CNN 在台风强度估计中的应用，并将台风图像分为八类。然而，他们只得到强度范围而不是准确的强度，他们的训练数据和测试数据是相关的。Chen 等［50］在研究中使用多通道卫星图像和外部信息，如纬度、经度和日期，通过回归网络来估计准确的强度。Xu 等［51］在研究中提出一个上下文感知的cycleGAN 来解决台风数据的高度不平衡的问题。Chen 等［52］还提出使用GAN 从IR1 和WV 通道生成PMW 和VIS 通道图像，用于实时强度估计。然而，现有的方法缺乏可解释性，不能充分利用TC 强度（label），而TC 强度是连续的，对优化嵌入空间非常重要。不同的是，我们提出的DR－transformer 框架将台风强度估计看作是一个最近邻分类问题，并利用标签的连续性构造了一个距离一致性嵌入空间，在这个空间中我们可以很容易地通过K－最近邻分类器找到查询图像的领域。

因此，国家气象中心采用人工智能领域的基于时空关联深度学习模型为技术基础，通过标注、学习、预测已有数据中的关键信息来解决台风强度快速增强趋势预测和判别问题。基于时空关联深度学习模型的技术路线如图5 所示，实现步骤分别是：①台风强度变化特征提取；②台风强度趋势预测；③台风强度突变检测；最后，根据②和③的结果进行策略融合，输出台风强度趋势判别结果。基于时空关联深度学习模型的关键步骤说明如下：

（1）台风强度变化特征提取

特征提取是强度趋势预测和突变检测的基础。该技术基于历史台风时间序列数据进行学习，包括时序云图序列数据、位置序列、其他相关数值数据比如气压、降水等序列的学习，属于有监督的多模态序列学习问题，这也是对传统序列学习的一个挑战。本部分研究拟采用PIPELINE 架构的3D 卷积神经网络（CNN）结合长短期记忆（LSTM）网络构成的3D＿LSTM 模型，同时对初始时刻到任意t 时刻的时序云图序列的时间和空间特征进行序列学习，并结合其他时序位置数据、数值数据进行关联和特征融合，预测台风强度在下一时刻即t＋1 时刻的变化特征向量。

（2）台风强度趋势预测

台风强度趋势预测是基于台风强度变化的通用特征，即大样本特征进行预测的技术。因此，在3D＿LSTM 模型得到的时序多模态下一时刻时空特征的基础上，进一步构造回归损失函数为基础的预测模型，训练并计算台风强度变化的通用特征权重，从而预测台风在下一时刻的强度。

（3）台风强度突变检测

台风强度突变检测是基于台风强度变化特征中突变特征，即需要在所有强度变化特征中，学习与强度突变影响相关的特征。因此，在3D＿LSTM 模型得到的时序多模态下时刻时空特征的基础上，进一步构造基于注意力机制的分类模型，计算不同时刻、不同特征的权重，从而预测台风在t＋1 时刻的强度突变的级别和概率。最后，将（2）和（3）的结果分别作为进行交叉融合学习，得到最终的台风强度趋势判别结果。

4 人工智能的优势及不足

人工智能是基于多层神经网络建立模拟人类分析、学习的模型，模仿人脑机制识别目标，感知信息，模型通过训练能够自动提取原始数据中隐含的信息形成抽象的高层特征表示，将特征表示通过拟合函数进行计算得到决策结果。近年来随着人工智能技术的兴起，利用地面自动气象站、雷达、卫星等获取的观测数据越来越多，在气象大数据背景下，结合具有强大的数据学习能力和复杂结构特征刻画能力的深度学习进行研究有着十分广阔的应用场景。人工智能技术在数值天气预报中也表现出明显的优势，不仅可以对资料预处理、资料同化、模式积分以及预报信息的处理和交流起到优化作用，而且还可以改善集合预报、数值模式的后处理、数值预报模型研发，甚至可以代替传统数值模式，有望在天气预报中起到积极的推动作用。

然而，由于人工智能技术多以统计为基础，因此在应用时也存在明显的不足：（1）弱解释性问题。人工智能对规律的表示比较难理解，解释性不足，在一定程度上限制了其在行业内的广泛应用和认可。（2）如何进行模型设计。数值天气预报背后有大量的数学和物理理论的支撑，而如何使用这些有明确物理意义的理论来指导人工智能技术还值得进一步研究。（3）不确定性问题。我们目前的天气预报比较重视预报的不确定性问题，那么如何利用人工智能技术将天气预报的不确定性有效地表达出来也是一个值得思考的问题。（4）如何与数值天气预报相耦合的问题。目前人工智能技术的应用主要表现为局部优化和替代，如何实现与数值天气预报和集合预报长期稳定耦合，也是需要妥善解决的问题。（5）在高时空分辨率天气预报问题中的可行性。人工智能预报模型主要是依靠纯数据驱动的，这种定量化的预报模型如何在高时空分辨率和强非线性的天气预报问题中使用，还有待进一步研究。综上所述，人工智能技术在天气预报应用中还存着许多挑战。

5 面临的主要困难及展望

从现有研究看，人工智能已开始在台风监测和预报中发挥越来越重要的作用，体现在台风的涡旋识别、定位定强、路径预报、强度预报等多个方面。纯数据驱动的人工智能预报模型已经在台风监测和预报的应用中表现出巨大的潜力。然而人工智能技术在台风监测和预报的应用中还存在许多的困难和挑战，未来的发展方向可能主要分为以下几个方面：

（1）在全球热带气旋的监测中的应用。包括全球热带气旋的自动识别和定位定强。随着我国多系列气象卫星的发射成功，我们每天可以得到海量的卫星云图数据，如何从大量的卫星数据图像中更加精准地识别出全球范围内同时存在的多个热带气旋，并且自动进行定位和定强是未来台风监测的重点发展方向。同时，人工智能预报模型在计算量和数据访问量方面的需求也大幅提升，也对高性能计算平台提出了更高的要求。

（2）台风路径预报的优化。近年来随着集合预报和数值模式的发展，台风路径预报水平有了大幅提高，但是对于复杂路径和奇异路径的台风，模式往往显得无能为力，因此台风路径预报也遇到了发展的瓶颈。未来借助于人工智能技术深度挖掘影响和制约台风移动路径的多种大尺度影响因子、台风本身内力，并结合数值模式和集合预报，可能会找到提高台风路径预报水平的新突破口。

（3）台风强度突变的预报。当热带气旋在短时间内急剧增强时，就会发生快速增强。台风快速增强仍然是热带天气预报的主要挑战之一。如何利用海量的气象卫星图像，通过人工智能技术对卫星图像特征信息进行深度学习和挖掘，结合数值模式对台风强度预报的一些模式算法，进而识别其强度迅速变化的征兆，从而提高对台风强度及其突变的预报能力也就成为了尤为重要的课题。

6 结论

随着人工智能技术的不断发展，研究探索适合气象领域的深度学习模型，更好地利用来自地面自动气象站、雷达、卫星等获取的大规模观测数据，自动、智能、快速地得到更加精准、可解释、可控可调、可视化的预测结果，必将对气象领域带来深远的影响。

通过对卫星云图所拍摄的台风进行涡旋识别、定强、路径跟踪可以有效地对实时台风的位置定位、风险评估及预警发布，围绕如何有效利用气象卫星图像进行自动涡旋定位和定强，进行全天候自动追踪展开研究，利用人工智能技术对卫星云图进行特征分析、抽取、识别和定位，具有重要的研究意义。未来结合人工智能等方法，也必将对台风实时监测乃至预报预测等技术起到巨大的推动作用。