基于卷积门循环单元和气象雷达图像的临近降水预报*

2021-09-15张佳洛刘传才

计算机与数字工程 2021年8期

关键词：卷积神经网络雷达

张佳洛黄勇刘传才，3

（1.南京理工大学计算机科学与工程学院南京 210094）

（2.安徽省气象科学研究所合肥 230061）

（3.闽江学院物联网产业化与智能生产协同创新中心福州 350108）

1 引言

准确的降水预报服务可以帮助计划户外活动，甚至可以提供洪水或交通的预警。目前，我国预报业务通常把0～2h的天气预报称为临近预报［1］。临近预报的主要手段是基于天气雷达资料的雷达回波外推技术，即根据当前时刻雷达观测结果，推测雷达回波未来的位置和强度，以实现对未来时间段的降水预报［2］。目前常用的基于雷达回波进行预报的方法主要包括交叉相关法（Tracking Radar Echoes by Correlation，TREC）、单体质心法、光流法。1978年Rinehart提出了TREC算法，将雷达回波视为单体进行识别、分析、追踪，对单体进行拟合外推来做临近预报［3］。对较大的回波，交叉相关法有较好的识别和追踪效果。对较小的单体，尤其是相互距离较近的多个单体，其识别和追踪效果较差［4］。单体质心法是紧随交叉相关法之后出现的。与交叉相关法相比，单体质心法能较好地识别和追踪较小的孤立单体，并且能够提供单体的更详细的特征数据，因而得到了更快的发展。乔春贵等使用质心法对雷达回波图进行线性外推，结果显示该方法对稳定的层状云表现较好，而对其他类型的云表现相对较差［5］。1950年由Gibson首先提出光流法，最初主要应用于图像分割、目标追踪、运动估计等领域［6］。Hoffman等在数值模式检验领域第一次引入了光流的概念，结果表明光流法与传统的单体质心法和交叉相关法相比，对于变化较快的强对流降水天气过程，具有明显的预报优势［7］。

相较于传统的雷达回波预报方法，神经网络模型通过逐层的特征变换，将样本在原空间的特征表示变换到一个新的特征空间，从而提升分类或预测的准确性［8］。在最新的研究中，SHI Xingjian等提出一种时空序列预报模型ConvLSTM（Convolution Long Short-term Memory），将CNN和LSTM相结合，即在传统LSTM的基础上在每个LSTM单元中增加卷积结构。实验结果表明，ConvLSTM相对于光流法能够更好地捕捉雷达回波的时空特征，达到较优的结果［9］。

尽管ConvLSTM深度学习算法在对流临近预报中表现良好，但是模型只能学习单一高度下雷达回波图像序列的特征预测未来时间段回波序列。鉴于此，提出了一种基于卷积门循环单元的神经网络的临近降水预报模型，模型先对目标站点不同高度的雷达反射图像做卷积，同一高度的卷积图像通过GRU学习云团运动过程中的时序特征，最后将不同高度时序图像的学习特征聚合到全连接层中进行训练，输出目标站点未来1h～2h的降水量。

2 研究方法

本文的预测模型结构如图1所示，先对不同高度的时序图像做卷积和池化处理，学习空间特征。对于每个高度上的时序图像将卷积和池化后的特征作为输入，使用GRU作为循环神经网络的神经元来训练数据，最后对四个高度的图像特征进行全连接，以未来1h～2h的降水数据作为输出。

图1 预测模型流程图

2.1 卷积层模型

雷达反射图像有其固定的特性，在临近预报模型中先对雷达图像进行卷积操作，学习图像中的云团特征。对整个图像作卷积运算，可以得到图像中任意位置上的不同特征的激活值［10］。在本文的临近预报模型中，对目标站点观测到的雷达图像（100×100）做卷积操作，卷积核尺寸大小为（5×5），步长为5，卷积之后进行（2×2）的最大池化，最后单张雷达图像的特征维度大小为（10×10）。

卷积过程可以由下式表示：

式（1）中，l表示当前位于的神经网络层数，i，j分别表示特征映射图上的点和编号，x表示计算数值（雷达回波图像的灰度值），k为卷积核参数，b表示加性偏置，Mj表示特征映射图集合，⊗表示卷积操作，σ(·)为激活函数。

最大池化（max-pooling）过程可表示为

2.2 循环层模型

简单的卷积池化操作只能学习到当前时刻云团的空间特征，并不能学习到云团在运动过程中的聚合或消散特征，以及运动的轨迹。本文的模型中加入了循环层，学习不同时序上的雷达图像的时序特征。如图2所示，在循环神经网络中，输入t=［t1，t2，…，t14，t15］表示经过卷积和池化处理之后雷达图像特征，在每个时间步（1≤t≤15）中，参数都要经过每层中的循环单元处理，最后将循环层输出的结果聚合到全连接层，以未来1h～2h的降水量最为输出训练模型。

图2 循环神经网络模型

在传统的RNN模型中，随着当前和过去数据之间的差距越来越大，一般的RNN模型无法学习较长连接的输入。Bengio等已经证明，传统的RNN模型很难学习到输入序列超过10的特征［11］。在临近降水预报中，雷达时序图像为15张，因此需要使用改进之后的RNN模型，提高循环神经网络中的学习能力。在循环层中使用GRU模型，可以增加时序记忆同时减少训练参数，节省模型训练时间。

在GRU模型中，引入了重置门（reset gate）和更新门（update gate）的概念，从而修改了循环神经网络中隐藏状态的计算方式。GRU中的重置门和更新门的输入均为当前时间步输入Xt与上一时间步隐藏状态Ht-1，输出由激活函数为sigmoid函数的全连接层计算得到。

如图3所示，神经元的输入Xt∈Rn×d（n为样本数，d为输入个数）和上一时间步隐藏状态Ht-1∈Rn×h（h为隐藏单元个数）。其中重置门Rt∈Rn×h和更新门Zt∈Rn×h的计算公式如下：

图3 门循环单元（GRU）

式（5）中Xt∈Rn×d表示输入，Wxh∈Rd×h，Whh∈Rh×h是权重参数，Rt∈Rn×h计算所得的重制门，Ht-1∈Rn×h表示t-1步的状态，⊙表示变量做点乘，bn∈Rl×h是偏置参数，tanh函数作为激活函数来计算候选状态的值。对于隐藏状态计算公式如下：

式（6）中可以看出，时间步t的隐藏状态值Ht∈Rn×h的计算依赖于重制门，时间步t-1的隐藏状态值和时间步t的候选隐藏状态值。

3 结果与分析

3.1 实验数据

本文采用的实验数据集包含雷达回波图和目标站点地面降水量。每张雷达图像覆盖一个目标地点及其周边地区，标记为100×100网格，其中每个网格点记录的是经过线性转换后的dBZ。实验数据共有一万个样本，分为训练集（80%）、测试集（10%）、验证集（10%）。其中每个样本包含90帧图像，如图4所示，共分为四组，分别表示目标站点在0.5km、1.5km、2.5km、3.5km监测到的图像，每组15帧，每两帧的时间间隔为6min，最后是目标站点未来1h～2h的降水量。

图4 数据示例

3.2 实验结果及分析

临近降水预报属于回归问题，为了定量地描述其预报的准确性，在实际评估中，常采用了均方误差（MSE）和平均绝对误差（MAE）三个指标来对算法进行比较［12］，计算公式如下：

在实验中，共有一万个样本数据，每个样本包含60张雷达反射图和对应1h～2h内的降水量。其中，8000个样本作为训练集，1000个样本作为验证集，1000个样本作为测试集。表1表示的是模型在测试集中的评分结果。其中，Mul-Input ConvGRU采用图1的输入输出模型，将四层高度的雷达图片分别做卷积，并使用GRU模型学习，对不同高度学习的特征做全连接进行训练。在卷积中使用的卷积核大小为（5×5），对卷积后的图像（20×20），最后做最大池化（2×2）。最终用来输入GRU模型中特征向量为（15×100），模型使用了两层循环层，两层全连接层，输出预测的降水量。Sin-Input ConvGRU表示抽取样本中的一层数据参与训练，采用的卷积层、循环层、全连接层跟Mul-Input ConvGRU模型相同。

从表1中可以看出不同模型下的MSE和MAE，结果越小预报准确性越高。根据表1的实验结果可以看到，多输入模型的MSE和MAE都要小于单输入模型。此外，在循环层中使用GRU可以将MSE降低3.2，MAE降低0.2。出现上述现象的原因是由于多输入模型能够学习到目标站点不同高度的特征信息，可以减少雷达误差对预测结果的影响。且在循环层中使用GRU模型，引入重制门和更新门单元，保持长时记忆，从而提高了预报的准确性。

表1 模型评分结果

为直观展示模型的预报性能，实验采用Mul-Input ConvGRU模型对随机抽取的100个样本进行预报，结果如图5所示，曲线重合程度越高，表明预报精度越高。从图中可以看出当真实降水量较大的时候，预测值会出现偏差。这是由于降水量大情况下，较难学习到云团的剧烈运动特征，但相较于单输入模型，已经具有较好的预测精度。

图5 降水预报曲线

在Mul-Input ConvGRU模型中，不同的迭代次数会对预报性能产生较大的影响。实验分析模型随迭代次数增加时，MAE和MSE的表现。如图6，7所示，图中的曲线mul-input ConvGRU，0.5-sin-input ConvGRU，1.5-sin-input ConvGRU，2.5-sin-input ConvGRU，3.5-sin-input ConvGRU分别表示多输入模型和不同高度下单输入模型的MAE和MSE。从图中曲线可以看出，对于单输入模型，输入训练高度为1.5km的雷达图像时，预测效果最好。这是由于高度低的时候会受到地物干扰，而高度偏高时看到的云雨信息由于距离地面较远，下落过程中会出现蒸发、增长等物理过程，从而引起降水量变化。在1.5km处，不受地物影响，又贴近地面，下落到地面时，降水量的变化小。从图中可以看出，多输入模型的预测性能要优于单输入模型。这主要是因为多数入模型在对不同高度的雷达特征聚合之前进行了Dropout操作，可以在保证学习不同高度特征的同时减少训练参数，使得模型具有较强的泛化能力。

图6 迭代次数与平均绝对误差

图7 迭代次数与均方误差

4 结语

本文提出了一种基于ConvGRU神经网络的临近降水预报模型，通过训练不同高度的雷达序列图像来预测目标站点未来1h～2h的降水量。实验结果分析表明，改进之后的模型能够对不同高度的雷达序列图像同时进行学习，有效解决单一高度下雷达图像反射率失真的问题。但对于此模型的训练来说，由于样本数据较少使得模型参数较难训练到最优，未来会收集更多样本数据并加入一些数据预处理的方法扩大样本数数据。