基于神经网络集合预报的台风路径预报优化
2020-04-21周笑天张丰杜震洪刘仁义
周笑天,张丰,杜震洪*,刘仁义
(1.浙江大学浙江省资源与环境信息系统重点实验室,浙江杭州310028; 2.浙江大学 地理信息科学研究所,浙江 杭州310027)
台风是一种气象灾害,每年约有20 个台风直接或间接地影响、威胁我国人民的生命财产安全。台风破坏力大,为有效控制台风产生的危害,台风路径预报成为当下迫在眉睫的研究热点之一。近年来,随着气象学和计算机软硬件条件的发展,台风路径预报研究渐趋成熟,同时对预报精度的要求也大幅度提高。
台风路径预测研究的模型和方法大致可以分为以下4 类:(1)气象学模型。XU 等[1]提出,使用超低仰角雷达数据有助于预测台风发展,完善预警系统和临近预报;俞兆文等[2]采用WRF-ARW 和WRFDA 的3.8 版本进行了云雨条件下AMSR 2 卫星微波成像资料的同化试验。(2)统计学模型。袁杰颖等[3]在现有集合预报方法的基础上,基于预估偏差的思想设计了一种新的优化方案,以进一步提高台风路径预报的精度和稳定性;WANG[4]利用热带气旋路径数值模式GRAPES-TCM 对台风路径进行了综合预测实验,并设计了3 种集成方案;HUO 等[5]采用正交的CNOPs 方法,具有更大的水平分布,能更好地描述预测的不确定性。(3)动力学模型。陈子通等[6]探讨耦合方案对预报精度的影响,实现动力过程与物理过程耦合;黄文锋等[7]根据热带气旋运动的最新轨迹,提出了一种动态预测模型的初始风场调整方法;CHUN 等[8]进行了AMSR2同化,提供了更好的台风结构,显著提高了中心海平面气压、最大风速和台风路径预报。(4)神经网络模型。王向阳等[9]选取了目前国内外最具代表性的3种西北太平洋热带气旋路径预报方法对热带气旋路径预报进行集成,从而提高了热带气旋路径预报的准确率;黄小燕等[10]以南海海域的台风样本为基础,采用主成分分析的特征提取与逐步回归计算相结合的预报因子信息数据挖掘技术,以提高预报模型泛化能力;邵利民等[11]利用前馈型BP 神经网络模型,对发生于中国沿海的热带气旋的移动路径进行了预报应用研究。
综上所述,在这几类台风路径预测模型中,气象学模型最为传统也最为精确,能将天气图、卫星资料等数据转换为台风内部分布的各层数据,预报员利用软件处理分析,提取所需台风的实时特征,但其本身缺乏长时间序列下对于台风运行规律和动向的预报能力;统计学模型的出现很好地解决了这一问题,顾及大气物理量参数的相关性,根据台风初始扰动的可能性,纳入大量样本进行统计,给出了台风运行路径的合理推荐集;动力学模型,综合考虑环境气流、地貌分布、下垫面因素,利用台风移动规律的函数,应用数值模式的分析结果,推算台风的移动路径;神经网络预报模型是当下的研究热点,该模型以大量历史台风数据作为实验基础,在反复训练下自动调整网络节点间的权重因子,从而达到预报给定台风路径信息的目的,具有自适应性强、容错性高等优点。
本文在前人研究基础上,将集合预报思想与神经网络模型相结合,设计并实现了基于集合预报思想的统计学模型和基于BP 算法的神经网络预报模型,改进了单集合预报的固定性,降低了单神经网络预报模型的随机性,构建了一个高可用、细粒度并且符合台风预报时效性需求的基于混合模式集合的台风路径神经网络预测模型,充分发挥了时序层次优势和偏差调节能动性,突破了传统集合预报的线性相关局限,为台风路径预报研究开拓了崭新思路,为气象灾害预警工作提供了决策支持。
1 混合模式集合预报下的台风路径神经网络预测模型
1.1 台风混合模式集合预报思想
作为动力随机预测技术的新一代产物,集合预报曾被用于纬度天气预报系统,现今其体量发生了巨大变化,并被扩展到季节和气候预测。目前应用的热点之一是短期集合预报,包括对热带气旋预报的研究。因其预测时间短,短期集合预报比中期预测更复杂,由于预测方法中初始性扰动场受的影响比中期预测的大,因此,选择好的方法尤为重要,其关键在于方法的离散速度和初始数组的离散次数[12]。关于预测的空间规模,除了使用全球大气模型来预测大规模气象环境之外,在中尺度预报领域也引入了集合预报法。结果表明,该方法具有明显的优势,尤其在极端气象现象预测上优势更显著。
EPSTEIN[13]提出的动力随机预报和LEITH[14]提出的“蒙特卡罗”预报是经典集合预报思想的基础。“蒙特卡罗”预报在业务应用上,需要大量高性能计算机集群共同计算,一度陷入瓶颈。近年来,随着计算机软硬件水平的突飞猛进,欧美等发达国家气象界高度重视集合预报,随后,我国国家气象中心也开始集合预报尝试。从科学角度看,集合预报不仅是一种观点,更是一种革新。
集合预报是一种为了体现初值不确定性并将扰动的随机性系列化的方法。原先其定义主要在于初值集合,体现在1992 年左右ECMWF[15]和NCEP[16]的预报工作中;而后考虑了模式的不确定性[17],将不同模式的多样化以集合的方式表达,形成了后来的集合预报发展产物,也就是混合模式集合预报。
KRISHNAMURTI 等[18]基 于AMIP 提 出 了 混合模式集合的预报创意,改善了气象和季节规模的预测,并将其扩展到飓风预报领域。因超级集合均方根误差与典型的模型分析较接近,在预测期效果中显示了其优势。结果表明,通过混合模式集合预报获得的信息,在概率和决定性上均比单模型集合预报的误差小。通过比较选择的集合预报优化方法,一般称为PoorMan 法[19]。本质上,PoorMan 集合预报技术属于多分析多模型集合预报,从一些大型集合预报中心采集,并进行决定性预测,较普通集合预报的开发与维护更简单。基于PoorMan 法,文献[20]提出了超级集合预报思想,通过多个模型的预报结果,根据模型的先前性能修正预报结果,获得最佳的决定性预报。与其他的集合预报方法不同,超级集合预报只提供决定性预报,根据此方法获得的决定性预报效果,比一般集合预报方法的效果更明显。集合预报思想的更新推进和广泛使用,将使数值预报在概念、技术、实践方面发生巨大转折。
1.2 基于BP 算法的神经网络模型
神经网络是一种依赖神经单元逐级互联,并具有自我调节、自我适应能力的网络,能够模拟动物对外界情况变化的真实反应传递。随着神经网络研究的进一步发展和更新,其已成为一门多元化、交叉性的前沿学科。神经网络模型是基于神经网络和机器学习的,在大数据环境下具有一定的预测能力[21]。
多层网络的训练效果虽然显著优于单层感知机,但需要的训练学习算法更为复杂。误差反向传播(Back-Propagation,简称BP)算法是当前最具代表性的神经网络学习算法[22]。
BP 神经网络的网络结构如图1 所示。
图1 BP 神经网络结构Fig.1 Structure of BP neural network
激活函数是神经网络中重要的一环,将非线性特征引入网络,并将输入信号转换为输出信号。良好的激活函数能加快训练速度,提升训练效果。为解决梯度消失问题,有效提升效率,本文采用ReLU函数,该函数的非线性能力较强,稀疏性良好,与生物神经元中的少量信号选择性响应特征相符[23]。其数学表达式和一阶导数如下:
可见,对于小于零的输入,神经元在负方向上均为0,有利于减少参数间的相互依存关系,降低过拟合的发生概率;对于大于等于0 的输入,可大幅减少计算量,提高网络的训练速度。
在常规的神经网络训练中,只是归一化处理了输入层数据,没有在隐含层中进行归一化处理。输入数据在经过σ(WX+b)矩阵计算以及激活函数处理后,随着神经网络的多重计算,数据分布的差异性会越来越大,模型训练得到的参数泛化性能会被削弱,同时会降低实验效率,因此,需要在网络中进行归一化处理。
批 归 一 化(batch normalization(BN))算 法 由IOFFE 等[24]提出,可改善神经网络的训练效果,具体表现为:加快收敛速率,提高训练效率;省去了一些正则化处理过程,避免了因学习率设置过小发生训练欠拟合情况;保持网络的稳定性,提高模型训练精度。
针对神经网络训练中的过拟合问题,Dropout技术是一种简单高效的训练策略,有助于提高网络的泛化能力[25]。其原理为:以p 的概率随机Dropout神经元,将其值置为0,其他神经元以1-p 的概率被保留,降低了神经元之间的相互依赖性,使网络中各神经元相互促进又相互制衡。示意图如图2 所示。
图2 Dropout 示意图Fig.2 Schematic of Dropout
本文以“台风路径集合预报优化”核心问题为导向,深入研究了台风混合模式集合预报思想和基于BP 算法的神经网络模型;在此基础上,提出了神经网络优化训练算法;更进一步,以台风路径预报的实际业务需求为背景,构建了台风路径集合预报倾向优化模型,如图3 所示。
图3 集合预报神经网络方法Fig.3 Ensemble prediction neural network method
1.3 台风路径集合预报倾向优化模型
基于台风全球集合预报系统预报数据以及从中央气象台网站采集的台风实况数据,运用批归一化方法和Dropout 技术,训练台风路径集合预报倾向优化模型(typhoon ensemble-prediction tendency(TEPT))。
基于不同站点集合预报结果数据集中的历史预报,本模型侧重考虑各站点的预报好坏情况,设置了倾向度θ(0 <θ <1)。网络训练的输出并不是直接推算台风路径的经纬度,而是推算各个站点的倾向度,表征各站点的预报精度。对于n 个站点,有由于过少的网络层数会导致非线性能力偏弱,过多的网络层数需要更加庞大的数据量,因此,最终选定的台风路径集合预报倾向神经网络为4 层,包括1 个输入层、2 个隐含层和1 个输出层。输入层包括前3 时次预报数据和预报时次的集合预报数据,输出层为各站点预报倾向,使用倾向集合预报误差来表征loss。神经网络之间用全连接网络相连,激活函数选用提高线性分割度的ReLU,将原始数据集划分为训练数据集、验证数据集和测试数据集,使用批归一化方法和Dropout 技术增强模型的计算能力和表达能力。该网络的核心训练参数如表1 所示,实验思路如图4 所示。
图4 集合预报倾向优化模型实验思路Fig.4 Experimental tack of ensemble prediction tendency optimization model
表1 TEPT 网络核心训练参数Table 1 Network training parameters of TEPT
1.4 评价指标
路径误差为两点之间的距离,即在已知两个点的经纬度情况下,求它们之间的距离。不妨将地球视作一个标准的球体,令其半径等于地球的平均半径R,以0 度经线为基准,忽略地形带来的误差,就可以计算出两点之间的地表距离。假设两点的经度分别为lng1 和lng2,两点的纬度分别为lat1 和lat2,东经为正,北纬为负,由三角函数,可以得两点间的距离D:
集合预报产品需要一套定量的误差检验体系[26],对于决定性的均值预报,可用平均误差和平均绝对误差来衡量,其表达式分别为:
2 实例验证与结果分析
2.1 研究区概况
选择西北太平洋和南海作为主要研究区域,经纬度分别为80°E~180°E,0°N~60°N,基本覆盖了西北太平洋和南海活动台风的大部分区域,具有良好的代表性。
受西太平洋副热带高压、东风气流和季风槽的影响,在该区域的台风生成后大部分会向中国、日本、韩国、越南等国家行进,造成巨大的经济损失和人员伤亡。在我国登陆的台风会给我国带来严重的雨情灾害,灾情主要表现为大范围的降水和高强度的暴雨,影响范围覆盖20 多个省份[27]。另外台风造成的洪水使得众多中小河流水位超过警戒线,给当地人民生活、生产带来极大困难。
因此,研究西太平洋和南海区域的台风不仅为该区域气象学研究打开了通道,而且能为受台风影响国家的防台、抗台工作提供知识服务和决策支持。
2.2 数据预处理
文中用到的台风数据来源于全球两大集合预报系统ECMWF 和NCEP 的台风模式预报数据和中央气象台网站提供的2016—2018 年3 a 的台风数据,总数据达185 万行。ECMWF 模式数据一天2报,每报50 个站点;NCEP 的GEFS 模式数据一天4报,每报20 个站点;中央气象台实况和预报数据(CMA)更新频率不定,采集频率最短为每小时1 次。
台风数据中存在部分无用记录或空缺记录,实验前需进行处理:
(1)经度或纬度数据为0 的记录,数据本身有误,需删除。
(2)风圈半径可能存在3 种大小不同的数值,本文只取最小风圈半径所对应的数据记录。
(3)预报数据中存在跨180°经线的台风,计算前可将这些经度lng 转化为(360-lng),输出时返回正常值。
(4)在神经网络训练前,需预先进行数据插值(空缺时间点上的经纬度需补全)和归一化处理,以提高训练效率,提升优化效果。
另外,在神经网络优化训练前,将Oracle 中的数据按照“年份-台风标号-起报时间”整理成csv 文件集,以方便数据匹配,提高训练效率。
台风数据总记录达185 万行,去除无效数据后有141 万行。本研究中使用的台风数据涉及5 个表,分别为TYPH_INFO 表、TYPH_MONITOR_WEB表、TYPH_FORCAST_WEB 表、TYPH_MODEL表和TEPO 表。TYPH_INFO 表记录了台风的基本信息,包括台风模型与实况的对应关系以及台风的中英文名称;TYPH_MONITOR_WEB 表记录了台风实况数据的具体信息,包括台风实况编号、点时间、纬度、经度等;TYPH_FORCAST_WEB 表记录了中央气象台预报的台风数据信息,包括台风实况编号、预报台、起报时间、预报时次等;TYPH_MODEL 表记录了两大全球集合预报系统ECMWF 和NCEP 的台风集合预报数据,包括台风模型编号、起报时间、预报时次等;TEPO 表记录了集合预报多模协同优化预报数据结果,包括位置、台风模型编号、起报时间、预报时次等。
2.3 结果分析
图5 列出了训练集(橙线)和验证集(蓝线)的收敛过程。用2018 年台风数据做检验,表2 列出了台风路径集合预报倾向法TEPT(typhoon ensembleprediction tendency)与全球集合预报系统ECMWF和NCEP(NCEP 提供的GEFS 数据)以及中央气象台CMA 的误差对比情况(路径误差单位为km)。
图5 训练集和验证集的收敛过程Fig.5 Convergence process of training set and verification set
取TEPT 的平均预报结果,绘制2018 年台风数据检验图,分别用浅绿、黄、绿、红标记ECMWF、GEFS、CMA 和TEPT 预 报 结 果,如 图6 所 示。可见,在 预 报 时 次60 h 内,TEPT 比GEFS 和CMA 的精度稍好;而在预报时次36 h 内,TEPT 的预报精度有明显提高,较其他预报精度高。在60 h 以外的预报时次范围,总体表现略差。
表2 TEPT 全体误差对比情况Table 2 All comparisons of TEPT errors
模型的预报误差均随预报时次的增加而增加。在大多数时次上,TEPT 的预报效果波动较大,因此对于TEPT 的预报,可采用集合预报的延伸思想,将其预报结果以集合的形式呈现,包络面会更加贴近实况台风的走向,从而大致估计台风路径波动范围。
图6 2018 年TEPT 对比检验结果图Fig.6 Contrast test result diagram
3 结 语
集合预报充分体现了其优越性,摆脱了传统混合模式预报解算中的固有限制,充分发挥了时序层次优势和偏差调节能动性,创新了台风路径预报的优化思路,促进了海洋气象研究和台风预报业务的发展。另外,本文融合混合模式集合预报思想和神经网络模型方法,探索了多元可扩融合模型,建立了集合预报神经网络优化模型,同时解决了单集合预报的固化性和单神经网络预报模型的随机性问题,突破了传统预报的线性相关局限。
受训练数据量和网络选型的限制,预测的准确度和稳定性有待增强。后续研究可考虑数据分片集成方法和其他不同结构的学习器,以提高模型的迭代预测能力,增强预测方法的健壮性。