基于长短期记忆神经网络的西太平洋暖池变化预测
2021-11-08林琪凡耿旭朴胡利平
林琪凡,耿旭朴,谢 婷,胡利平
(1.北京大学物理学院,北京 100871;2.厦门大学海洋与地球学院,近海海洋环境科学国家重点实验室,福建 厦门 361102;3.北京环境特性研究所电磁散射重点实验室,北京 100854)
暖池在印度洋、太平洋和大西洋均有分布,在西太平洋的部分称为西太平洋暖池,用以区分东印度洋暖池和西半球暖池[1].由于研究问题的差异以及所用海表温度(sea surface temperature,SST)数据的全球分布情况,西太平洋暖池的划定有所不同.基于1981—2018年各年的全球年平均SST分布,本研究选取28 ℃等温线作为暖池边界,如图1所示,黑线内的西太平洋海域即为本研究区域.
黑色实线表示28 ℃等温线.
西太平洋暖池广阔的海域面积、突出的SST、丰富的热含量[2],使这里的海气相互作用在气候系统中具备更显著的影响力.一直以来,科学界都将西太平洋暖池与厄尔尼诺-南方涛动(El Nio-Southern Oscillation,ENSO)事件紧密联系在一起[3-6].西太平洋暖池作为ENSO事件的重要组成部分[3],两者之间的关系一直是科学研究的热点问题.厄尔尼诺是每隔3~7年发生在赤道中、东太平洋的大规模表层海水持续(6个月以上)异常偏暖现象;反之,持续异常偏冷的现象称为拉尼娜(La Nia)[7].厄尔尼诺作为ENSO事件的暖现象,是全球气候波动的突出贡献者,对世界生态系统的稳定和人类社会的发展有着重要影响.根据Philander[8]的统计与分析,20世纪80年代以来,平均每隔4年发生一次厄尔尼诺,每隔10年发生一次强厄尔尼诺.厄尔尼诺增加了极端天气事件发生频率,可能给各地带来干旱和洪涝等灾害,影响东太平洋沿岸渔业,造成重大的人员和财产损失.因此,对ENSO事件、厄尔尼诺现象的预警尤为重要.然而,由于缺失对气候扰动源头的了解,准确预测ENSO事件的发生存在一定困难[4].
从20世纪80年代至今,研究者对暖池的定义、特征、多尺度变异进行了深入探索.Philander[8]首次提出西太平洋暖池质心的概念,用于研究西太平洋暖池中的海气相互作用,发现了暖池质心东向移动与厄尔尼诺现象的关系.Yan等[2]和Ho等[9]使用卫星观测到的SST数据追踪1982—1991年各年西太平洋暖池温度和大小的变化情况,建立暖池面积、体积、质心、东边界等参数,得出西太平洋暖池水平尺度远大于垂直尺度的结论.Kidwell等[5]使用集成经验模式分解法(EEMD)和Hilbert-Huang谱分析方法,发现西太平洋暖池的面积和形心具备从季节到年代际等多个时间尺度的变异特征,探究了不同类型厄尔尼诺现象与暖池长期变化趋势的关系.Ho等[9]和Yan等[4]计算并分析了暖池形心的运动,探究海洋、大气与厄尔尼诺现象之间的关系.方立新等[10]在此基础上进行改进,引入暖池质心的概念.Kidwell等[6]进一步发现了西太平洋暖池的三维形心、热含量和体积在年代际尺度上与ENSO事件的相关关系.但目前关于暖池数值模拟的研究进展缓慢.胡石建[11]认为目前的海气耦合数值模式不能很好地模拟西太平洋暖池,原因在于对西太平洋暖池形成和维持机制的认识不充分.对西太平洋暖池基本动力学方面知识的缺失,使得利用数值模拟对西太平洋暖池未来的变化情况进行预测存在一定困难.
常用的海洋数据预测方法主要分为两类:一类是基于物理学原理的数值模型,另一类是基于数据的数据驱动模型[12].数值模型使用一系列微分方程描述海洋中的各类水文现象,需要具备对特定海域、特定水文现象产生和维持机制的深刻理解,一般计算复杂且难度较高;而以深度神经网络为代表的数据驱动模型可以从大批量原始数据中学习特征,对未来进行预测,摆脱了物理机制的限制,弥补了部分海洋领域数据缺失和理论薄弱的不足[13].在传统海洋数据数量多、变化复杂、特征不突出的背景下,深度学习在海洋数据重构、海洋图像分类识别、海洋时间序列数据预测等方面表现良好[14].在深度学习领域,循环神经网络(recurrent neural network,RNN)和长短期记忆(long short-term memory,LSTM)神经网络可以满足时间序列数据的预测需求.RNN通过建立层内信息循环和无效数据遗忘的功能,实现了神经网络对数据的记忆,但RNN在实际使用中存在长期依赖问题,在长序列训练中存在梯度消失或梯度爆炸的问题,因此只具有短期记忆.LSTM神经网络是特殊的RNN,通过改进算法一定程度解决了这种长期依赖问题,因此对于长时间序列事件的处理和预测达到更好的效果.
本文基于LSTM神经网络,利用日平均SST数据对西太平洋暖池面积、暖池强度、暖池质心经度和暖池质心纬度4个暖池指数的时间序列进行训练、测试和预测,并在此基础上探究暖池指数多尺度变异特征与ENSO事件之间的关系,进而对未来10年(2019—2028年)ENSO事件的发生进行判断.
1 数据与方法
1.1 数据来源
美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)、海洋与大气研究室(Oceanic and Atmospheric Research,OAR)、地球系统研究所(Earth System Research Laboratory,ESRL)、物理科学部(Physical Sciences Division,PSD)提供的高分辨率每日平均最优插值SST(high-resolution daily optimum interpolation SST)数据和多变量ENSO指数(multivariate ENSO index,MEI).
SST数据的时间跨度从1981年9月1日—2018年12月31日,共38 a(13 627 d).数据覆盖全球海洋(89.875° S~89.875° N,0.125° E~359.875° E),经纬度网格大小为0.25°×0.25°,总计1 440×720个格点.
ENSO事件产生于大气、海洋及多种气候系统的相互作用,成因多样且复杂.MEI充分考虑大气和海洋的双重影响,结合多种参数进行分析,被视为监测和反映ENSO事件最全面的指数[15].
1.2 研究方法
LSTM多用于处理和预测时间序列中间隔和延迟相对较长的重要事件.当数据输入LSTM神经网络中,根据一定规则判断信息是否有用,有用信息留下,无用信息则通过遗忘门丢弃.通过这种方法,LSTM神经网络一定程度上解决了RNN存在的长期依赖问题.
1.2.1 数据预处理
本文对SST数据首先进行月平均.在实际问题中,需要对模型输入具备多个特征的样本数据,但这些特征的量级和量纲可能不一致.通过Z-score标准化处理,可以使不同特征具有相同的尺度,保证不同特征对参数的影响程度一致.数据标准化的表达式为:
(1)
其中,μ为序列的平均值,σ为序列的标准差.除此之外,LSTM对输入数据的规模(范围)很敏感,特别是在使用激活函数sigmoid和tanh时.对未进行标准化的原始数据进行试验后发现程序运行速度非常缓慢,在某些数值较大、变化范围较大的变量训练时(例如暖池面积),甚至出现无法成功运行的情况.因此,对数据进行标准化处理也能够加快神经网络的训练和权重参数的收敛,否则可能阻止神经网络有效学习.
此外,还需要将数据变为Pytorch框架中LSTM模型可接受的形式.输入数据的格式必须为3维的张量:第一维是序列(sequence)长度,代表用于预测的时间长度,本研究设置为50,即使用第1~50个月的数据预测第51个月;第二维是批次(batch)大小,代表每次进入模型的数据大小,本研究采用的是批量梯度下降法,每一次迭代时使用所有样本来进行梯度的更新,因此批次大小为样本集的大小;第三维是输入数据的特征数量,本研究设置为1,即一次只进行一种指数的训练和预测.
1.2.2 训练、测试与预测
整个数据集需要划分为训练集(training set)和测试集(test set),在数据量有限并保证测试数据足够的基础上,为了最大化训练数据的数量,划分比例为8∶2,即时间长度上前80%的数据用于训练,后20%用于测试.训练集和测试集中都包含用于预测的输入数据和预期得到的实际数据.在训练时,这两部分数据都放入模型;而在测试时,只将用于预测的输入数据放入模型.
训练集用于训练模型、确定模型参数[16].将训练集输入一个初始化模型,按照前向传输的方式进行前馈运算,然后计算模型输出的预测值和实际值之间的均方根误差(RMSE),将误差在模型中通过反向传输的方式进行反馈运算,对每个节点之间的权重进行修改,使下一次训练得到更好的结果.训练以权重为任意值开始,训练的目的在于不断调整权重,在学习完训练样本后使误差尽可能小,即神经网络模型通过训练而“学习”到的内容蕴含在“权重”这一参数中.通过训练得出最优模型后,需要使用测试集对模型进行检验,衡量模型的泛化能力[16].在测试时,向模型输入的数据仅包含用于预测的输入数据,人为比较模型的预测值和测试集中的实际数据,以判断模型对新鲜样本的预测能力.
为了判断模型是否存在超前预测的能力,对该模型输入测试集进行预测.与测试不同的是,这一步得到的每一个预测值的输入序列都是真实值和先前预测值的组合.例如,使用第1~50个数据预测第51个数据后,使用2~51个数据预测第52个数据时,加入预测得到的第51个数据.一般情况下,预测的准确度会随着预测的进行不断下降.最后,使用已知的时间序列对未来数据进行预测.最优模型构建流程见图2.
图2 LSTM神经网络训练和预测流程图
在LSTM神经网络模型训练前,需要定义3个超参数:序列长度、学习率(learning rate)和迭代次数(epochs).序列长度代表用于预测的时间长度,本研究中4个指数预测的序列长度均设置为50.学习率表示每次梯度下降的步长,本研究既设置学习率随迭代次数的增加而减缓,也设置固定学习率进行训练.迭代次数表示整个训练过程的工作次数,一次迭代将会使用所有数据、所有批次进行前向和反向传播计算来更新模型参数,本研究设置的迭代次数均在104以上.
1.2.3 暖池指数的建立
本研究建立暖池面积、暖池强度、暖池质心经度和暖池质心纬度4个指数来表征暖池的时空变化.
在西太平洋(经度范围为120° E~120° W),暖池面积通过暖池内(28 ℃等温线内)0.25°×0.25°网格数量乘以网格对应面积得到.参考国家气候中心监测业务关于暖池强度的定义[17],暖池强度表达式为:
SST_Sum=∑i(SSTi-28 ℃)(SSTi≥
28 ℃),
(2)
其中,SSTi为暖池内各格点的SST.将累加得到的时间序列经过Z-Score标准化,得到暖池强度.
暖池质心反映暖池的位置及其变化情况.参考非均质物体的质心公式[10],在计算暖池质心时考虑SST差异的影响,引入温度权重w,表达式为:
(3)
其中,SSTmin=28 ℃,SSTmax为每日暖池内SST的最大值.暖池质心经、纬度的计算公式分别为:
(4)
其中,xi、yi分别为暖池各格点的经、纬度.
2 结果与分析
2.1 训练和测试结果
通过对暖池面积、暖池强度、暖池质心经度和暖池质心纬度4个模型进行训练和测试,找到最适的超参数,使模型在训练损失、测试损失和预测结果中均表现良好,成功构建LSTM神经网络最优模型.各暖池模型的超参数设定如表1所示,预测序列长度均为50,除暖池强度学习率固定外,其他3个模型均采用学习率随迭代次数增加不断下降的方法,迭代次数均设定在104以上.下面以暖池质心纬度、经度模型的训练和测试结果为例,展示LSTM神经网络模型的合理性和适用性.
表1 各暖池模型的超参数设定
图3(a)和(b)分别表示暖池质心纬度和经度模型在特定超参数下训练的结果,图中实线表示实际值,虚线表示预测值,实际值与预测值基本吻合,说明通过训练模型能够很好地学习输入数据.
图3(c)和(d)为训练过程中使用标准化数据计算得到的RMSE.可以看出随着迭代次数的增加,RMSE不断减小,达到0.2以下;在迭代次数达到8 000次后能够很好地收敛,得到稳定的训练结果.最终暖池质心纬度和经度模型训练的RMSE分别为0.15和0.11.
图3(e)和(f)是对模型进行测试的结果.暖池质心纬度和经度模型测试的RMSE分别为0.55和0.89,反标准化后计算得到的RMSE分别为3.25和6.50.与训练的RMSE相比,测试的RMSE更大,说明模型的预测结果不能完全和实际值相吻合;但在测试时,预测值在趋势上与实际值基本吻合,说明模型的预测结果有一定的准确度.
图3(g)和(h)是对模型输入测试集进行预测的结果.暖池质心纬度和经度模型测试的RMSE分别为0.84和0.98,反标准化后计算得到的RMSE分别为5.00和7.19,稍大于测试结果,但预测结果与实际值变化趋势基本吻合,说明模型在一定程度上存在80个月超前预测的能力.基于模型在测试集的预测结果(80个月)中表现良好,进而利用LSTM神经网络模型对暖池进行10年(120个月)的预测,认为其具有一定的合理性.
(a)、(c)、(e)和(g)为暖池质心纬度模型,(b)、(d)、(f)和(h)为暖池质心经度模型.
2.2 暖池面积预测
基于最优暖池面积模型,对未来10年暖池面积的变化进行预测.图4中蓝线是1981—2018年暖池面积的变化情况,红线是未来10年(2019—2028年)暖池面积的预测结果.由图4(a)和(b)可以看出预测结果震荡频率过快,许多年份出现4个峰值,不符合暖池面积的实际变化情况[10].对其进行6个月低通滤波除去这一信号后,预测结果如图4(c)和(d),未来10年暖池面积将在2.3×107~3.6×107km2范围内变化,但模型没有学习到暖池面积不断增长的长期趋势.
图4 1981—2028年暖池面积变化(a)、未来10年(2019—2028年)暖池面积预测(b),及6个月低通滤波后1981—2028年暖池面积变化(c)和未来10年暖池面积预测(d)
为了探究暖池与ENSO事件之间的关系,将各暖池指数的原始数据减去多年平均季节变化(即年循环),得到暖池指数的距平值,再将距平值通过巴特沃斯滤波器进行365 d低通滤波,得到各暖池指数的低频变化,由此排除季节内变化和季节变化的影响.通过计算暖池面积的低频变化与MEI之间的相关系数,得到暖池面积与ENSO事件的相关性.暖池面积的低频变化和MEI之间的相关系数为0.38,p<0.05,在95%置信度下认为暖池面积和ENSO事件存在相关性.相关系数为正值但并不接近1,表明具备较弱的正相关关系.Kidwell等[5]曾经发现,在1982—2011年的30年间,暖池面积增加了18%,具备不断增长的长期趋势.因此,将暖池面积通过1 700 d高通滤波除去长期变化趋势的影响后,计算得到的相关系数为0.74,p<0.05,表明暖池面积在除去长期趋势的影响后与ENSO事件存在更显著的正相关关系.图5(a)中灰柱表示MEI,正值对应于厄尔尼诺现象,负值对应于拉尼娜现象,蓝线为1981—2018年除去长期趋势的暖池面积低频变化,红线为其预测结果.2019年初,暖池面积达到极小值,之后不断增长,在2019年冬季达到极大值,此次增长持续时间长.根据暖池面积与ENSO事件之间的正相关关系,模型预测结果表明2019年冬季会出现厄尔尼诺现象并持续到2020年底.如图5(b)所示:在2023年冬季和2027年冬季,暖池面积出现较明显的极大值,可能出现一次较弱的厄尔尼诺现象;在2021年初、2024年和2028年,暖池面积出现极小值,可能出现拉尼娜现象.根据暖池面积的低频变化对未来10年ENSO事件的发生进行预测的结果符合过去“厄尔尼诺平均每隔4年发生一次,每隔10年发生一次强厄尔尼诺”的结论[8].
图5 1981—2028年暖池面积的MEI与低频变化(无长期趋势)(a),以及未来10年暖池面积的低频变化预测(无长期趋势)(b)
2.3 暖池强度预测
暖池强度模型对未来10年暖池强度的预测结果表明,未来10年暖池强度将在-1.5~1.0范围内变化,与暖池面积模型类似,暖池强度模型没有学习到不断增长的长期趋势(图6).
图6 1981—2028年暖池强度变化(a)和未来10年暖池强度预测(b)
与暖池面积变化相同,暖池强度具备不断增长的长期变化趋势.将原始数据减去年循环、通过12个月低通滤波得到暖池强度的低频变化(图7(a)),并通过1 300 d高通滤波除去长期变化趋势的影响后,暖池强度和MEI之间的相关系数为0.59,p<0.05,表明暖池强度与ENSO事件存在正相关关系.在图7(b)中,2019年初的暖池强度达到极小值,从2019年中旬开始不断增长,在2020年达到极大值,增长持续时间长.根据暖池强度低频变化与ENSO事件之间的正相关关系,模型预测结果表明,2020年将出现厄尔尼诺现象,可能持续到2022年甚至2023年.在2024年,暖池强度出现极小值,可能出现拉尼娜现象.
图7 1981—2028年暖池强度的MEI与低频变化(无长期趋势)(a)和未来10年暖池强度的低频变化预测(无长期趋势)(b)
2.4 暖池质心纬度预测
暖池质心纬度模型对未来10年暖池质心纬度的预测结果表明(图8):未来10年暖池质心将在10° S~10° N范围内南北移动;在2024年前,预测结果具备明显的周期性变化规律,但2024年后,预测结果不再符合暖池质心纬度的变化规律,准确度较低.
图8 1981—2028年暖池质心纬度变化(a)和未来10年暖池质心纬度预测(b)
暖池质心的纬度变化不具备明显的长期变化趋势,无需进行高通滤波;同时暖池质心纬度的季节变化规律非常明显,但模型预测的季节变化规律与实际变化不完全一致,减去实际值年循环后不能有效除去季节变化信号.因此,将预测值进行40个月低通滤波得到低频变化,保留与ENSO事件相同周期的信号.计算得到暖池质心纬度和MEI之间的相关系数为-0.46,p<0.05,在95%置信度下认为暖池质心南北方向的移动和ENSO事件存在相关性.相关系数为负值但并不接近-1,表明负相关关系较弱.模型预测结果表明,2019年和2020年上半年将出现厄尔尼诺事件,2021年出现拉尼娜现象,2022年和2023年将出现较弱的厄尔尼诺现象,2024—2025年将出现一场持续时间较久的拉尼娜事件,随后,2026年开始厄尔尼诺现象持续发力,在2027年达到最强(图9).
图9 1981—2028年暖池质心纬度的MEI与低频变化(a)和未来10年暖池质心纬度的低频变化预测(b)
2.5 暖池质心经度预测
暖池质心经度模型对未来10年的暖池质心经度进行预测的结果表明(图10):未来10年暖池质心将在145° E~175° W范围内东西移动;2019年初,暖池质心不断向西移动,在2020年向东移动且向东偏移的态势一直持续到2022年中旬,之后暖池质心向西移动至最西端约145° E,并在之后的几年呈现缓慢东移的趋势,于2028年达到最东端.
图10 1981—2028年暖池质心经度变化(a)和未来10年暖池质心经度预测(b)
将预测值减去1981—2018年暖池质心经度的年循环、通过365 d低通滤波,得到暖池质心经度的低频变化.计算得到暖池质心经度和MEI之间的相关系数为0.88,p<0.05,相关系数为正值且接近1,表明暖池质心东西方向的移动和ENSO事件具备显著的正相关关系.图11中可以看到,暖池质心经度数据的负峰值非常突出,可能会错误判断拉尼娜事件的发生和强度.模型预测结果表明,2020—2022年将出现一场持续时间久、强度大的厄尔尼诺事件,2024年可能出现一次较弱的拉尼娜现象,从2025年底开始厄尔尼诺现象持续发力,在2027年达到最强.
图11 1981—2028年暖池质心经度的MEI与低频变化(a)和未来10年暖池质心经度的低频变化预测(b)
3 讨论与结论
本研究将深度学习技术应用于海洋科学,利用LSTM神经网络成功构建4个用于预测暖池指数时间序列的模型,通过设定序列长度、学习率和迭代次数3个超参数,达到模型在训练、测试和预测中均表现良好的目的.预测结果展现了未来10年(2019—2028年)暖池大小、强度和质心的变化情况,并通过暖池指数对ENSO事件进行预测.
从暖池面积、暖池强度、暖池质心经度和暖池质心纬度4个LSTM神经网络模型的预测结果可以看出,4个暖池模型都很好地预测到暖池指数的多尺度变异特征,包括季节内变化、季节变化和低频变化,但暖池面积模型多学习了实际数据并不存在的半年尺度变异特征,暖池面积模型和暖池强度模型没有学习到不断增长的长期变化趋势,这说明即使是具备长期记忆能力的LSTM神经网络模型,在学习和训练较长的时间序列数据时仍然存在问题.同时,根据暖池质心纬度模型的预测结果,5年以上的预测结果准确度会大大下降.
本研究还结合4个暖池指数与MEI的相关关系对未来10年ENSO事件的发生进行了预测.4个模型都认为在2019年底到2020年会出现厄尔尼诺现象,暖池强度模型和暖池质心经度模型结果表明这场厄尔尼诺现象将持续到2023年,而暖池面积模型和暖池质心纬度模型结果表明在2021年中会出现拉尼娜现象,之后将再出现较弱的厄尔尼诺现象.4个模型都认为在2024年将出现明显的拉尼娜现象,而2027年冬季将再次出现厄尔尼诺现象.4个模型在对ENSO事件是否发生的判断上具有高度一致性,预测结果与2019年底发生的厄尔尼诺现象相符,证明了预测的有效性.
然而,本研究仅使用LSTM神经网络实现了暖池4个指数在时间尺度上的预测,无法了解它们在空间尺度上的变化情况.Yang等[18]在LSTM提取时间尺度信息的基础上增加一个卷积层提取空间信息,实现了SST的时空预测.除此之外,许柏宁等[19]提出使用序列到序列(sequence to sequence,Seq2Seq)模型结合卷积长短期记忆(convolutional long short-term memory,ConvLSTM)神经网络预测区域SST,之后的研究证实这一方法在长期预报中优于LSTM神经网络模型[20-21].
此外,目前大部分研究仅根据SST等温线或者固定区域划定暖池.实际上,暖池并不是二维平面的,而是一个具有三维结构的水体[22-23].厄尔尼诺事件的发生和暖池下层水体的运动情况息息相关.如果能够得到海表以下的海水温度分布情况,使用等温面划定暖池,增加考虑暖池深度这一参数,可能更有利于了解暖池的变化情况,提高ENSO事件预测的准确度.