基于观测和再分析数据的LSTM 深度神经网络沿海风速预报应用研究

2020-01-18王国松王喜冬侯敏齐义泉宋军刘克修吴新荣白志鹏

海洋学报 2020年1期

王国松，王喜冬，侯敏，齐义泉，宋军，刘克修，吴新荣，白志鹏

( 1. 河海大学海洋学院，江苏南京 210098；2. 国家海洋信息中心，天津 300171；3. 天津市滨海新区气象局，天津 300457；4. 大连海洋大学海洋科技与环境学院应用海洋研究所，辽宁大连 116023；5. 61741 部队，北京 100094)

1 引言

我国沿海地区集中了全国70%以上的大中城市和50%的人口，创造了全国60%以上的国民生产总值（GDP），但沿海地区几乎每年都会发生灾害性大风事件，造成较大的经济损失和人员伤亡[1-4]，同时海上大风对航海安全也构成了极大的威胁[5]。中国是受台风和寒潮灾害影响较严重的国家之一，台风、寒潮等引起的海上大风现象易形成灾害性海洋环境，并导致沿海渔船事故频繁发生。中国是海运大国，对外贸易中94%的货运量依靠海运来完成，随着海运经济的发展和海上活动的日益增多，海上险情逐年增加。频繁的海难事故造成了巨大的人员伤亡和财产损失。因此人类活动比较频繁的沿岸地区是加大精细化预报服务的关键区域，做好沿岸海洋气象防灾减灾和海上突发事件应急的快速预测预警对国计民生意义重大。

近几年，特别是2013 年发明了Resnet 神经网络之后，深度学习技术得到了迅猛发展[6-13]，Lecun 等[14]在1998 年发明了卷积神经网络（Convolutional Neural Network，CNN），Hinton 和Salakhutdinov[15]在2006 年首次提出了“深度神经网络”的概念，谷歌Deepmind 结合神经网络和蒙特卡洛树搜索开发的AlphaGo 机器学习程序取得了99.8%的胜率[16]。同时递归神经网络(Recurrent Neural Network，RNN)在语音识别和自动翻译等时间序列方面也得到了广泛应用。长短期记忆网络(Long Short-Term Memory，LSTM)是由Hochreiter 和Schmidhuber 提出[17]，它是在RNN 基础上，加入了遗忘和强化学习的一种RNN 算法，并进行了不断的改良和推广[18-21]。前人的研究为我们海洋气象预报工作提供了新思路，国际上许多学者也开始在海洋气象领域进行了大量的深度神经网络预报预警方面的相关研究，结果较传统的预报方法都有很大的改进[22-28]，主要体现在预报精度的提高和建立预报模型所需的时间减少两个方面[29-30]，具有良好的应用前景。王辉等[31]指出在未来海洋大数据时代下，应深入理解全球海洋预报中科学大数据的机理和特点，对观测的海量数据进行快速处理，构建实时的预报数据。Shi 等[29]采用多层ConvLSTM 网络，对多普勒雷达回波数据进行了训练，以此对香港地区的降水做临近预测，预报精度相比于传统的光流法有显著地提高。Klein 等[26]发明了一个动态卷积层来对短时天气过程进行了预测。目前国内利用深度神经网络来进行海洋气象快速预报研究还处于起步阶段，相对于欧美等国家在深度神经网络预报研究方面取得的众多成果[32-34]，国内在该领域的研究仍很薄弱[24]。

另一方面，数值预报技术最新研究进展指出，全球的数值海洋气象业务预报可以提供从天气尺度的千米分辨率预报到几十千米分辨率的全球季节预报[35-36]。对于目前的数值预报模型普遍存在模式初始调整过程中，在预报初期（0～12 h）模式解无法正确表述潜在重要的大气过程的问题，因此模式在调整过程中的解通常不能使用，这也是一般建议不要使用模式前12 h 预报结果的原因[37]。同时资料同化算法可以将预报模式和千万量级的观测资料相结合，生成四维空间中物理一致的初始条件[38]。但是在各种数值模式模拟海洋气象过程中，往往由于模式分辨率不足等原因，对次网格尺度的物理过程不能给予很好的描述，需要诸如辐射、边界层、微物理、积云对流等物理过程参数化来完善模拟的效果[39]。而不同的参数化方案配合使用对于不同的海洋气象过程又有着明显不同的模拟效果。在海上风场预报过程的数值模拟研究中，由于其特定的生成维持条件及特殊的微物理过程，采用不同的边界层方案和微物理参数化方案，必定会得到饶有差别的模拟效果[40]。在WRF 模式中，行星边界层包括Yonsei 大学方案(YSU)、Mellor-Yamada-Janjic 方案、GFS 方案、MRF 方案、ACM2 PBL 方案、Quasi-Normal Scale Elimination PBL 方案等[41]。不同参数方案代表着大气边界层中湿度、热量和动量的湍流交换，影响低空的动力和热力结构[42]。很多学者发现，模式性能严重依赖大气稳定度[43]，PBL 方案在近海和沿海台站的作用差异较大[44]。目前随着高性能计算和观测系统的发展，对模式物理过程、不确定性和不同数值算法和观测数据同化算法的研究为数值预报提出了更多的科学挑战。

随着观测技术水平的发展，大量的海洋气象历史和现场观测资料为利用深度神经网络技术进行海洋气象环境短时预报研究提供了良好的数据和理论基础[45]。随着人工智能的快速兴起并渗透到各个领域，将海洋气象高分辨率实时和历史观测数据与人工智能相结合是海洋气象预测预警和应急反应系统的一个发展方向和研究切入点[23,26-27,46-48]。未来的海上安全保障服务系统，应该能够快速地应对解决各类海洋工程、航海保障、海上重大活动和突发事件应急等海洋气象短时环境保障工作的关键问题，以提高安全保障服务工作效率和成功率，最大限度地挽救人身及财产安全，为海洋防灾减灾提供业务支撑。

2 资料和方法

2.1 资料

完整且高质量的代表台站参考序列对于构建预报效果良好和鲁棒性强的深度学习模型至关重要，本文选取的5 个代表台站经过了站网密度、水文气象背景、地形条件、海拔高度、离岸距离、资料质量、时间序列长度、观测要素种类、仪器变更、台站迁移和观测方式等多方面的选取标准进行了综合考虑和筛选。

本文所用的资料包括：（1）中国近海5 个台站气象资料来自于世界气象组织（World Meteorological Organization, WMO）[49]，台站位置和基本信息见图1 和表1。观测要素包括时间(time)，总云量（cn），风向（dir），风速（spd），海平面气压（oslp），3 小时变压（p3），过去天气1（wea1），过去天气2（wea2），6 小时降水（pre），低云状（ccl），低云量(cnl)，低云高(clh)，露点(dew)，能见度(vis)，现在天气(wea)，温度(tem)，中云状(ccm)，高云状(cch)。同时利用对数风廓线公式把台站资料订正到海上10 m 高度[50]。（2）欧洲中期天气预报中心（European Centre for Medium-Range Weather Forecasts, ECMWF）提供的6 h 再分析数据ERA-Interim，空间分辨率0.125°×0.125°，包括10 m 径向风(10V)，纬向风(10U)，风速(10W)，海平面气压(SLP)，海温(SST)，2 m 气温(T2M)和气压(P)7 个要素[51-52]。利用双线性插值获取了对应台站的时间序列。以上资料时间范围为2004 年3 月11 日至2017年12 年31 日，6 h 间隔。（3）2017 年热带气旋最佳路径资料取自中国气象局热带气旋资料中心“CMA 最佳路径数据集”[53]。

气象台站资料经过了国家海洋信息中心严格质量控制[54-55]，包括范围检验、非法码检验、一致性检验以及人机交互检验等，经过质控形成可靠数据集。同时针对台站不同观测场海拔高度，本文利用指数风廓线公式将风速资料统一换算成海面10 m 风速[50]。根据深度学习模型配置特点，把质控后的数据集根据时间分成了训练集（2004 年3 月11 日08 时至2015 年12 月31 日20 时）、测试集（2016 年1 月1 日08 时至2016 年12 月31 日20 时）和验证集（2017 年1 月1 日08 时至2017 年12 月31 日20 时）3 部分。

图 1 气象观测台站分布（蓝点）与WRF 模式嵌套区域Fig. 1 Locations of meteorological observation stations (blue points) and nested domain of WRF model

表 1 中国近海5 个气象台站基本信息Table 1 Basic information of the five meteorological stations in China offshore

2.2 数据预处理

数据是深度神经网络预报的核心基础，传统的机器学习技术在处理未加工过的数据时，体现出来的能力是有限的。本文对质控后的海洋气象数据集进行了重新审查和校验，检查了数据一致性，删除了重复信息和缺省值。对本文所用数据集中所有变量缺省值统计发现，高云状、低云高、总云量和低云状这4 个变量缺省值大于15%且数据质量一般，故在数据集中删除。本文最终数据集变量包括14 个台站历史观测变量（时间，风向，风速，海平面气压，3 h 变压，过去天气1，过去天气2，6 h 降水，低云量，露点，能见度，现在天气，温度，中云状）和7 个再分析资料变量（径向风，纬向风，风速，海平面气压，海温，2 m 气温和气压）。

本文根据海洋环境预报特点构造训练集，并在训练集数据上进行资料预处理操作。预处理方法是对数据的每个特征都进行零中心化，然后将其数值范围都归一化到[0,1]范围之内。本文资料预处理操作都只能在训练集数据上进行计算，算法训练完毕后再应用到验证集和测试集上（图2）。本文利用2004-2015年近12 年的数据样本来训练网络，然后分别用2016年和2017 年数据样本进行测试和验证，测试深度学习模型是否能抓住风速预报的特征，应用于风速预报。

以西沙站为例，经过质量控制和预处理后的训练集相关性热力图统计发现，与目标变量观测风速相关最高的9 个变量，ERA-interim 再分析风速和台站观测风速相关最高，达0.67，其余要素相关均低于0.3，且5 个台站之间相关变量差异较大（图3）。说明风速变化的影响因子多为弱相关关系，因此数值动力模式和深度学习模型在风速预报时需要考虑多种要素综合作用。

3 模式设置

3.1 LSTM 模式

LSTM 是由Hochreiter 和Schmiduber 提出的一种时间递归神经网络，能学习长期依赖性，适合用于处理和预测时间序列中间隔和延迟非常长的事件，LSTM 网络或者相关的门控单元同样用于编码和解码网络，目前广泛应用在语言识别、机器翻译和文本预测中[18,21]。LSTM 的记忆单元包含3 个门收集控制信息，分别是输入门输出门和遗忘门门控循环单元可以通过保护单元不受其他单元的信息影响，从而缓解冲突性更新问题。标准LSTM 公式如下式所示，

图 2 预处理后测试集主要变量序列分布Fig. 2 Time series of main variable of the test set after preprocessing

图 3 西沙站与观测风速相关性最高的9 个变量热力图Fig. 3 The heat map of highest correlation between 9 variables and observed wind speed at Xisha Station

本文构建的深度学习预报模型包含4 个LSTM层，4 个丢弃层（dropout）和3 个全连接层（dense），其中输入层是00 时（t-3），06 时（t-2），12 时（t-1）和18 时（t）4 个时刻的结果，输出层是未来6 h（t+1）风速结果（图4）。为了更好的体现模型预报特点和对比分析，本文根据输入变量不同，分别构建了以台站观测14 个变量为模型输入的OBS-LSTM 模型（公式（6））和台站观测、ERA-Interim 再分析数据共21 个变量为输入的ALL_LSTM 模型（公式（7）），运算平台为大连海洋大学GPU 图形工作站。

图 4 ALL_LSTM 预报模型结构图Fig. 4 ALL_LSTM prediction model structure diagram

表 2 WRF 模式设置Table 2 Specification of the WRF model

式中，（hOBS_LSTM）t和（hALL_LSTM）t分别代表OBS-LSTM 模型和ALL-LSTM 模型t时刻的预报结果；f代表模型函数；（xobs）t和（xera）t分别代表台站观测和ECMWF 再分析资料t时刻的变量值。

本文针对每个台站的LSTM 风速预报模型特点，分别进行调参来得到最好的性能，模型损失函数采用均方根误差进行梯度下降迭代训练，优化器选择Nadam。采用Dropout 正则技术，在训练中每次更新参数按照一定概率随机断开输入神经元，防止过拟合，增强鲁棒性。采用小批次梯度下降方法按批来更新参数，即减少随机性又节省计算量。采用了L2 正则化使网络更倾向于使用所有输入特征，而不是严重依赖输入特征中某些小部分特征，控制神经网络过拟合现象。由测试结果发现，网络高低层参数数量的分布情况很大程度上影响网络的整体性能，低Dropout 值和高batch_size 值有助于降低本文构建的LSTM 模型风速误差；同时相比于OBS_LSTM 模型，增加了再分析数据的ALL_LSTM 模型在试验过程中显示较强的鲁棒性，而OBS_LSTM 模型易出现过拟合现象。

3.2 WRF 模式风场业务化预报系统验证数据

本文以中国近海为研究海域（图1），构建了WRF模式三重嵌套3 个加密区的风场业务化预报系统[56]，其中模式范围和参数化方案选取如表2 所示[57]。同时本文采用高山红等[58]提出的循环3DVAR 数据同化方案，它能充分有效地将各种资料信息同化到模式初始场中，为模式提供更高质量的初值，达到明显改进数值预报质量的目的。利用2017 年11 月1 日赤湾和深圳两个海洋站的观测资料验证对比发现（图略），本文的WRF 模式风场业务化预报系统48 h 预报结果与海洋站观测风速变化趋势和强度都十分接近，其中24 h 预报结果显示，赤湾站的平均风速均方根误差为1.94 m/s，风向偏差为34°，深圳站的平均风速均方根误差为1.46 m/s，风向偏差为28°[59]，说明现有的业务化风场预报数值模拟系统具有比较高的准确率，但仍有提升空间。

4 模型性能分析

本文采用均方根误差（Root Mean Square Error，RMSE），绝对误差（Mean Absolute Error，MAE）和相关系数（Correlation Coefficients，CC）3 种误差统计方法来对模型性能进行评估，

式中，N表示统计对象总体数目表示模式第i个输出变量表示第i个观测输出变量X。衡量风速预报性能时，RMSE 和MAE 值越低，表示模型预测的风速精度越高；CC 数值范围在[0,1]，CC 值越接近于1，表示模型预测的风速精度越高。

4.1 误差分析

中国近海风场受季风和台风影响较大，本文的测试数据集（2016 年）和验证数据集（2017 年）包含了中国近海全年风场特征，可以很好地体现季风期及其转换期和台风期间（2016 年和2017 年分别有6 个和8 个台风影响本文研究区域）风场特点。根据验证集风速误差统计分析结果发现（表3），ALL_LSTM 模型、OBS_LSTM 模型和WRF 模式中国近海5 个台站6 h 风速预报平均RMSE 分别为1.19 m/s、1.24 m/s 和2.03 m/s，MAE 分别为0.91 m/s、0.96 m/s 和1.60 m/s，CC 分别为0.61、0.56 和0.55。相比于WRF 模式预报结果，ALL_LSTM 模型和OBS_LSTM 模型RMSE 分别平均降低了41.3%和38.8%，MAE 降低了43.0%和40.0%，相关性提高了11.6%和1.8%。进一步对ALL_LSTM 和OBS_LSTM 模型风速预报结果对比发现，ALL_LSTM 模型在RMSE、MAE 和CC 误差统计均优于OBS_LSTM 模型，说明再分析数据和WRF 模式同化数据的增加对于风速预报精度有一定的提高。根据5 个台站的预报误差统计发现，WRF 模式在大连和吕泗站的风速预报结果较好，相关系数在0.7 以上，但风速绝对误差偏高。两种LSTM 模型在西沙站的风速预报结果与实测最为接近，而在青岛站的风速预报有待提高。

表 3 验证集风速误差统计Table 3 Compare the performance of 6 h wind speed on validation sets

4.2 大风分析

灾害性大风过程是海洋气象预报关注的重点，下面从高影响天气产生的大风过程来分析模式预报效果。图7 为3 个模型在验证数据集上日平均风速预报结果与台站观测数据时间序列对比，总体结果显示LSTM 深度神经网络在风速预报上有很好的性能，能够模拟出风速的日变化趋势。下面根据5 个台站的地形和气候不同特点，分别描述在大风情景下的模拟效果。

大连和青岛地形复杂，主要为大陆性季风气候和温带季风气候，又有显著的海洋气候特点，冬季主要为寒潮大风过程。数值预报受地形和局地小尺度天气过程影响，风速预报难度较大[60]。根据大连和青岛站1 月、2 月和3 月的风速时间序列发现（图5a，图5b），这两个站分别在不同时刻存在风速突然增大的过程，如大连站第27 和45 时刻（图5a），青岛站第17、24、26、和45 时刻等（图5b）。WRF 模式在这两个站的预报风速整体偏大，其中大连站预报风速变化趋势和观测基本一致，而在青岛站风速预报结果存在一定的时间上滞后现象，即模式初始调整过程[61]。相比于WRF数值模式，本文构建的两种LSTM 模型除在部分大风过程中风速预报结果偏小外（如青岛站第37 时刻），和实际观测结果更为接近，且不存在初始调整现象。在大风预报上ALL_LSTM 模型结果优于OBS_LSTM模型结果。

图 5 ALL_LSTM，OBS_LSTM 和WRF 模式日平均风速预报结果与台站观测资料对比Fig. 5 Comparison of daily mean wind speed forecast results of ALL_LSTM, OBS_LSTM and WRF models with observational data

吕泗、汕头和西沙站以冲积平原或礁坪沙堤为主，受地形影响较小，属海洋性季风气候，在夏季和秋季受热带气旋影响频繁。2017 年共有22 个台风影响中国近海，影响范围主要集中在南海和东海东部。2017 年吕泗站没有受台风直接影响，根据吕泗站7 月、8 月和9 月预报风速时间序列显示（图5c），3 种模型的预报结果和观测都比较接近，ALL_LSTM 模型结果误差最小。WRF 模式在第31 和75 时刻的大风预报过程存在风速偏大的情况，而本文构建的两种LSTM 模型风速和观测更为接近。汕头和西沙站受台风影响较大，其中2017 年先后有1702 号强热带风暴“苗柏”（MERBOK）、1707 号热带风暴“洛克”（ROKE）、1709 号台风“纳沙”（NESAT）、1713 号超强台风“天鸽”（HATO）、1716 号强热带风暴“玛娃”（MAWAR）和1717 号热带风暴“古超”（GUCHOL）6 个台风对汕头附近海域产生影响（图1）。根据汕头站6 月、7 月和8 月观测资料结果显示（图5d），本站整体风速偏小，热带气旋影响不明显。西沙站2017年先后受1704 号强热带风暴“塔拉斯”（TALAS）、1719 号强台风“杜苏芮”（DOKSURI）和1724 号强热带风暴“海葵”（HAIKUI）3 个台风直接影响（图1），7 月、8 月和9 月风速时间序列显示（图5e），两种LSTM 模型在本站的预报结果和观测基本一致，在“塔拉斯”（第18 时刻）和“杜苏芮”（第75 时刻）这两次台风过程中，本文构建的LSTM 风速模型明显优于WRF 模式风速预报结果。

5 结论和讨论

本文基于中国近海气象台站历史观测资料和ERAInterim 再分析数据等，构建了两个LSTM 深度学习模型来进行短时风速预测。与WRF 模式6 h 风速预报结果误差统计和时序序列对比分析，得到如下结论。

（1）本文构建的LSTM 深度学习风速预报模型，相比于WRF 模式预报结果，RMSE 误差分别降低了41.3%和38.8%，MAE 平均降低了43.0%和40.0%。

（2）通过对风速和大风过程的分析发现，本文构建的LSTM 模型成功学习了不同方向风速预报特点，对于不同方向风速预报误差结果相近，具有一定的抗干扰能力，可以忽略掉部分相关性和质量差的变量，同时能够抓住地形、短时大风和台风等敏感信息，对于台风过程和大风预报结果明显优于WRF 模式，降低了地形等因素对数值预报结果的误差[62]。

（3）两种LSTM 模型对比发现，ALL_LSTM 模型风速预报误差最小，并且对调参要求低，相比OBS_LSTM模型具有更强的鲁棒性；OBS_LSTM 风速模型基于历史观测资料，未来可用于小区域快速预报，由于预报范围不同，此方法可以作为数值动力模式预报的补充。

物理参数化方案内在的不确定性制约着数值天气预报技术的发展[38]，目前海洋气象动力数值模型参数化方案一般针对特定过程和要素预报效果良好，但在实际预报中通用方案在某些情况可能会存在较大的预报误差，比如针对台风的模拟参数不适用于寒潮大风的预报过程。同时随着新的卫星和观测仪器发展，生物、化学、生态等资料的增多，更多更先进的观测数据对海洋气象数值预报和同化算法提出了更高的计算处理需求[36,38]。另一方面，深度学习是一种特征学习方法，擅长发现高维数据中的复杂结构，通过把原始数据通过一些简单的但是非线性的模型转变成为更高层次的，更加抽象的表达[14]。通过足够多的转换的组合，非常复杂的函数也可以被学习[14,62]。深度学习正在取得重大进展，解决了人工智能界多年仍没有进展的问题[10-11]。因此本文下一步将深度学习与海洋气象动力学相结合，将概率统计方法正确地运用到海洋预报这个具体领域中去，使深度学习具有丰富的海洋气象意义、物理内容和坚实的理论基础，提高海洋气象预报的准确度，还有待更广泛的研究。