利用深度学习填补双偏振雷达回波遮挡

2022-09-20尹晓燕胡志群郑佳锋左园园皇甫江朱永杰

应用气象学报 2022年5期

尹晓燕胡志群郑佳锋左园园皇甫江朱永杰

1)(中国气象科学研究院灾害天气国家重点实验室，北京 100081) 2)(成都信息工程大学大气科学学院，成都 610225) 3)(中国气象局大气探测重点开放实验室，成都 610225)

引言

雷达周边地形和高大建筑物、树木等的遮挡导致雷达探测的回波数据出现偏差[1]，进而影响雷达定量估测降水及其他定量产品准确性。目前，我国正在进行天气雷达网的双偏振升级改造，双偏振雷达不仅可以使用基本反射率因子ZH计算降水强度，还增加差分反射率ZDR、差传播相移率KDP等偏振参量，可获得比常规天气雷达更多有关降水粒子形状和相态等微观物理信息，对进一步提高灾害性天气的监测和预报能力具有显著意义[2]。因此，开展双偏振雷达波束遮挡订正研究对提高其数据应用能力很有帮助。

目前对于雷达波束遮挡订正的研究大多基于高分辨率的数字高程模型(digital elevation model，DEM)[3]和雷达反射率因子垂直廓线(vertical profiles of reflectivity，VPR)[4-6]技术开展。利用DEM的雷达波束遮挡填补方法是基于Batten[7]提出的波束在标准大气中的传播方程。一些学者将标准大气中因雷达波束遮挡而造成的功率损耗加入波束遮挡模拟，对ZH进行订正[8-9]。杨洪平等[10]利用DEM数据确定CAPPI(constant altitude plan position indicator)有效数据区域并探讨波束部分阻挡时的回波强度订正方法。Andrieu等[11]和Creutin等[12]利用DEM将雷达体扫数据分为遮挡和无遮挡部分，并利用无遮挡区域回波数据生成的VPR订正受遮挡区域的反射率因子。杨泷等[13]利用DEM计算的波束遮挡信息，以统计生成的VPR为依据，用上层无遮挡仰角的回波填补低层遮挡区的回波，通过对比填补前后的反射率因子及雷达定量降水估测结果检验填补效果。但基于DEM和VPR技术的订正方法均存在一定局限性，如新建筑物和树木等不断出现，DEM数据难以及时更新。VPR技术的研究大多针对以层状云性质为主的大范围降水过程，对于孤立的强对流系统则不适用。

另外，针对偏振量的遮挡订正主要基于KDP对波束部分遮挡的不敏感性以及ZH，ZDR与KDP的约束关系进行遮挡填补[14]。如Lang等[15]分别利用DEM模拟雷达波束与地形的相互作用，KDP对波束遮挡不敏感性和降雨中双偏振雷达测量值的自一致性研究波束遮挡存在时水平反射率因子的校正，并确定每种方法的优缺点，表明当微弱回波被强的障碍物减弱为噪声时，这3种方法均无法校正雷达数据，从而导致校正后ZH出现偏差。Zhang等[16]提出利用雷达波束的自一致性关系进行积分，动态估计波束遮挡率，并对被遮挡区域的反射率因子进行校正。

深度学习作为一种人工智能算法，有别于传统预测方法，特别是应用在处理非线性问题上有良好效果[17-18]。深度学习在雷达数据分析方面也取得一系列成果，如雷达定量降水估测、雷达回波外推等[19-20]。Chen等[21]将地面雷达和TRMM(tropical rainfall measuring mission)雷达观测数据相结合作为深度神经网络的输入，证明该降雨估测算法的广阔前景和通用性。对于雷达回波外推，可以使用递归神经网络(recurrent neural network，RNN)等深度学习算法从雷达回波时空序列中捕获时空相关性，以获得外推向量，用于预测雷达回波的发展和移动[22-23]。韩丰[24]使用预测循环神经网络(predictive RNN)架构，利用雷达历史组合反射率因子建模，预报未来1 h的雷达组合反射率因子。Yin等[25]利用深度学习算法，以高层多个仰角、距离库的回波强度作为输入，低层0.5°仰角无遮挡区域回波强度作为标签数据，构建训练集进行回波订正。米前川等[26]建立干旱预测模型，分析评价传统的整合移动平均自回归时间序列模型(Autoregressive Integrated Moving Average Model, ARIMA)以及不同深度神经网络(deep neural networks，DNN)模型的预测效果，表明DNN模型的总体预测能力优于ARIMA模型。

本研究以广州S波段双偏振天气雷达为例，基于深度学习算法构建垂直填补(vertical echo-filling,VEF)和水平填补(horizontal echo-filling,HEF)两种网络架构，根据两种架构训练得到利用上层无遮挡区仰角回波填补0.5°仰角遮挡区的回波，利用左右无遮挡回波填补高仰角遮挡回波的两类模型，并基于多个评估指标和回波填补实例对模型进行评估。

1 数据来源和预处理

1.1 双偏振雷达数据

本研究使用的雷达数据来自广东省广州S波段双偏振天气雷达(CINRAD/SAD)。该雷达采用的扫描模式为VCP21降水模式，每6 min完成1次体扫，共观测9个仰角层(0.50°，1.45°，2.40°，3.35°，4.30°，6.0°，9.90°，14.6°，19.5°)，距离分辨率为250 m，方位分辨率为1°，探测参量包括反射率因子ZH、差分反射率ZDR、差传播相移率KDP等，且ZH，ZDR，KDP的最大探测距离均为460 km。图1为受地形遮挡影响的雷达遮挡系数，广州雷达在0.5°仰角层的多个方位均存在不同程度遮挡，抬高仰角后，地形遮挡消失。但受高大建筑或者是避雷针影响，在224°～227°，280°～282°，288°～292°，297°～299° 4个方位存在较为严重遮挡，最高遮挡至4.3°仰角，严重影响偏振量精度。

1.2 数据预处理

深度学习建模过程中，数据清洗是关键环节。在生成训练集之前，对雷达基数据进行质量控制处理，采用中国气象科学院灾害天气国家重点实验室天气雷达团队研发的质量控制算法，滤除地物杂波、孤立回波和平滑回波等[27-29]。训练集的标签值为0.5°仰角的回波值，输入特征值为0.5°仰角对应的上层仰角回波值和左右径向回波值。

此外，为了去除无回波和极弱回波对模型训练的影响，本研究将ZH<-5 dBZ和无回波的点均赋予较低的反射率因子(-20 dBZ)，将ZDR<0 dB和无回波的点设为-5 dB，将KDP<0°·km-1和无回波的点设为-5°·km-1。对雷达数据进行质量控制和预处理之后，本研究采用min-max标准化方法[30]对数据进行标准化(式1)，将数据映射到[0,1]区间。

(1)

式(1)中，若y为ZH，则ymin=-20 dBZ，ymax=70 dBZ；若y为ZDR，则ymin=-5 dB，ymax=5 dB；若y为KDP，则ymin=-5°·km-1，ymax=5°·km-1。

1.3 构建训练集

共统计2017—2020年4—9月回波面积较大的280个体扫数据。考虑到KDP对部分遮挡不敏感，因此本研究主要训练ZH，ZDR的遮挡填补模型。

1.3.1 构建垂直填补模型训练集

针对仅0.5°仰角存在遮挡的区域，利用上层多个仰角、径向、距离库的三维数据构建训练集。由图1可知，广州双偏振天气雷达在270°～300°和210°～240°方位基本不存在遮挡，因此选择这两个区域作为无遮挡区域，选取该区域数据构建训练集。将0.5°仰角的回波作为训练集的标签值，以及与标签位置对应的9个方位、9个距离库和N个仰角层内的N×9×9的回波作为特征值。

在构建训练集时，本研究将考虑以下3个方面：①由图1可知，0.5°仰角20 km内基本不存在遮挡，且近距离容易受雷达旁瓣的影响，因此在构建垂直填补模型时，仅选择20 km以外的数据。②回波经过融化层的演变过程较为复杂，为了尽量避免融化层的影响，本研究取华南地区5—9月融化层最低高度[31]，即5 km以下高度的回波作为训练集。4.3°，3.3°，2.4°，1.5° 4个仰角层的起始融化层高度对应的斜距分别约为54，68，88，120 km，因此，兼顾多数雷达产品的有效应用距离，本研究将雷达0.5°仰角斜距划分为[20 km,54 km)，[54 km,68 km)，[68 km,88 km)，[88 km,120 km] 4个距离段，分别训练回波填补模型。③雷达波束随距离展宽，同时缺少高仰角回波，因此每个距离段输入特征值的仰角数N分别为4，3，2，1。将0.5°仰角的ZH和ZDR分别作为标签值，对应上层的ZH，ZDR，KDP值作为输入特征值。

ZH垂直填补模型4个分段的数据量分别为464570组、502734组、686063组、703405组，ZDR垂直填补模型4个分段的总数据量分别为747610组、400506组、402506组、787623组，其中80%用于训练，20%用于测试。

1.3.2 构建水平填补模型训练集

针对遮挡仰角较高的区域，利用同一仰角左右相邻的多个径向、距离库的数据构建训练集。广州S波段双偏振天气雷达有4个方位到高层均存在明显遮挡，其中224°～227°，280°～282°，297°～299° 3个方位在0.5°仰角有3个径向存在遮挡，288°～292°在0.5°仰角有5个径向存在遮挡。因此本研究提出采用同一仰角的左右径向波束来进行填补，并分别构建3根径向和5根径向填补模型。同样选择1.3.1节中的无遮挡区，将0.5°仰角其中3根连续径向或5根连续径向的ZH和ZDR分别作为标签值，将左右相邻径向的ZH，ZDR，KDP作为输入特征值。对于3根径向填补模型，当最中心径向作为标签值时，则取非遮挡方位的左右3根径向及前后取3个距离库的值作为特征值，当标签值在偏左或偏右的径向时，特征值则相应地向左或向右增加1根径向，并且向右或向左减少1根径向。5根径向填补模型与3根径向填补模型取值类似。ZH3根径向填补模型和5根径向填补模型的数据量分别为191638组、296993组，ZDR3根径向填补模型和5根径向填补模型的数据量分别为161665组、269591组，其中80%用于训练，20%用于测试。

2 设计填补网络架构

深度学习一般由输入层以及多个不同神经网络的隐藏层、输出层构成。卷积神经网络作为深度学习算法之一，可以提取数据的空间特征[32]。

以ZH为例，图2a为ZH垂直填补(VEF)网络架构，经多次试验，对于ZH通道，该架构设计包含2个卷积层和1个全连接层的多层神经网络，全连接层均设置为线性层，对于ZDR和KDP通道，设计只包含2个线性层的多层神经网络，通过1个线性层将3个通道进行输出。对于ZDR垂直填补，图2a中交换ZH，ZDR位置，即ZDR包含卷积层，ZH和KDP全部为线性层(图略)。图2b为水平填补(HEF)网络架构，ZH，ZDR，KDP通道均采用2个线性层，对ZH填补时，ZH通道采用与ZDR，KDP通道不同的参数，即增加ZH各层的节点数以增强对ZH的训练效果，通过1个线性层将3个通道进行输出。同理，对ZDR填补时，ZDR通道的每1层相应地增加节点数量。

此外，为了避免过拟合，增强模型的泛化能力，每1层之间增加随机丢弃层，即在每次训练过程中丢弃掉20%神经元的输出。对于3个通道每层的激活函数，经过试验后均设置为ReLU函数。

3 模型训练

在深度学习训练过程中，通过误差的反向传播，将每次模型估算值与训练集的真实值进行比较，并通过损失函数计算估算值和真实值之间的损失值，将损失值再通过优化器调整每个隐藏层每个节点的权重值。实质上，通过建立深度学习模型最小化损失函数，该损失函数衡量在给定数据集上与完美的差距。在回归问题中，常用均方根误差作为损失函数。采用的估算精度评价指标分别为解释方差、平均绝对偏差和相关系数。

3.1 垂直填补模型

首先用训练集数据训练得到ZH和ZDR4个距离段垂直填补模型，再将测试集数据输入模型，得到0.5°仰角ZH和ZDR模型估算值与真实值的散点图如图3所示，其中色标代表散点高斯核密度估计值[33]，值越大，代表该处散点越密集。

由图3可知，除了个别点误差较大，4个距离段模型在测试集上总体表现良好。表1为ZH垂直模型不同距离训练模型的估算值和真实值定量评估结果。[20 km,54 km)，[54 km,68 km)，[68 km,88 km) 3个距离段估算值和真实值的解释方差均约为0.90，平均绝对偏差均在2 dB以下，相关系数也均在0.95以上(达到0.001显著性水平)。由于距离雷达越远，波束展宽越大，[88 km,120 km]距离段表现稍差，但其测试集的解释方差也在0.80以上，平均绝对偏差在2.5 dB以下，相关系数均在0.90 以上(达到0.001显著性水平)。可见，ZH垂直填补模型表现较好，准确率较高。从ZDR的评估结果看，虽然解释方差较低，但平均绝对偏差均约为0.15 dB，相关系数均在0.85以上(达到0.001显著性水平)，ZDR垂直填补模型表现也较好，基本满足对雷达数据的精度要求。

表1 ZH和ZDR垂直填补模型不同距离段评估结果Table 1 Evaluation of each section in ZH and ZDR vertical echo-filling models

3.2 水平填补模型

图4为ZH和ZDR水平填补模型不同填补径向数的模型估算值和真实值散点图，表2为ZH和ZDR水平填补模型不同填补径向数的模型估算值和真实值的定量评估结果。ZH和ZDR水平填补模型的解释方差均能达到0.80，平均绝对偏差分别约为2.0 dB 和0.1 dB，相关系数均大于0.90(达到0.001显著性水平)。总体上，4个水平填补模型均表现较好，准确率高。特别地，由于5根径向填补模型的遮挡更严重，遮挡波束更宽，因此不论从散点图还是定量评估结果看，5根径向填补模型比3根径向填补模型表现略差。

表2 ZH和ZDR水平填补模型不同填补径向数的评估结果Table 2 Evaluation of different fill radial numbers in ZH and ZDR horizontal echo-filling models

4 模型应用

选取广州SAD天气雷达2019年8月25日11：36(世界时，下同)、2019年5月8日03：54和2020年6月6日08：54测得的3个体扫数据进行验证。对于1.1节中提到的仅0.5°仰角存在遮挡的方位，划分4个距离段，分段输出0.5°仰角对应上层4，3，2，1个仰角的各81(9×9)个距离库的ZH，ZDR，KDP作为输入因子，分别利用4种垂直回波填补模型，分别得到0.5° 仰角层ZH和ZDR估算值。对于1.1节中提到的遮挡仰角较高的方位，将遮挡径向左右相应42个距离库的ZH，ZDR，KDP输出作为输入因子，分别利用2种水平填补模型，得到0.5°仰角层的ZH和ZDR估算值。利用无遮挡方位的真实值，对模型进行评估。

4.1 个例1

图5为2019年8月25日11：36模型填补的0.5° 仰角ZH和ZDR的PPI(plan position indicator)对比图，图5a和图5c分别为ZH和ZDR真实值，图5b和图5d分别为ZH和ZDR估算值。表3为无遮挡区(方位120°～210°，斜距20～120 km)评估结果。

由图5可见，该个例既有回波较强的积云，也有回波较弱的层云，ZH主要分布在10～60 dBZ，ZDR主要分布在0.2～3.0 dB。虽然模型对10 dBZ左右特别弱的ZH估算值偏强，对于较小的ZDR(小于1.0 dB)估算准确率相对较低，估算值较真实值偏弱；对于较大的ZDR(大于1.0 dB)估算则准确率较高，回波区域和回波强度估算均较准确。总体上，模型对回波的填补与真实值基本一致。对于有明显遮挡的区域(红色椭圆区域)，填补前该区域回波强度整体偏弱，且云系结构破碎不明显，填补后对流系统和层状云系统的结构均更加清晰。由表3可知，[20 km,54 km)和[54 km,68 km)两个距离段ZH和ZDR评估结果的解释方差和相关系数均在0.90以上(达到0.001显著性水平)，平均绝对偏差也均约为1 dB 和0.03 dB；[68 km,88 km)和[88 km,120 km]两个距离段由于距离雷达较远，受波束展宽的影响评估结果较差，但解释方差也约为0.80，平均绝对偏差约为2 dB和0.03 dB，相关系数在0.85以上(达到0.001显著性水平)。总体上，垂直填补模型实现了对ZH和ZDR的有效填补。

表3 2019年8月25日11：36无遮挡区回波填补不同距离段评估结果Table 3 Evaluation of echo-filling of each section in the unblocked area at 1136 UTC 25 Aug 2019

4.2 个例2

图6为2020年6月6日08：54模型填补的0.5° 仰角ZH和ZDR第二象限的PPI对比图，图6a和图6c分别为ZH和ZDR真实值，图6b和图6d分别为ZH和ZDR模型估算值。表4为无遮挡区(方位300°～330°)观测值和估算值的评估结果。由图6可见，该个例以大面积强回波为主，回波强度ZH主要分布在30～60 dBZ，ZDR主要分布在1.0～5.0 dB。对比填补前后，模型对回波的填补与真实值基本一致，对于有明显遮挡的区域回波也有一定的订正效果。另外，从表4的评估指标看，ZH和ZDR评估结果的解释方差和相关系数均在0.90左右(达到0.001显著性水平)，平均绝对偏差分别约为2.0 dB和0.03 dB。总体上，模型对强回波云系有较好的填补效果。

表4 2020年6月6日08：54无遮挡区回波填补不同距离段的评估结果Table 4 Evaluation of echo-filling of each section in the unblocked area at 0854 UTC 6 Jun 2020

4.3 个例3

图7为2019年5月8日03：54模型填补的0.5°仰角ZH和ZDR第二象限的PPI对比图，图7a和图7c分别为ZH和ZDR真实值，图7b和图7d分别为ZH和ZDR模型的估算值。表5为无遮挡区(方位300°～330°)真实值和估算值的评估结果。由图7可见，该个例以大面积弱回波为主，回波强度ZH主要分布在20～35 dBZ，ZDR主要分布在0.2～1.5 dB。对比填补前后，模型对回波的填补与真实值基本一致，对于有明显遮挡的区域回波也有一定的订正效果。另外，从表5的评估指标看，ZH和ZDR评估结果的解释方差和相关系数均在0.90左右(达到0.001显著性水平)，平均绝对偏差分别小于2.4 dB和0.04 dB。总体上，模型对弱回波云系也有一定的填补效果。

表5 2019年5月8日03：54无遮挡区回波填补不同距离段的评估结果Table 5 Evaluation of echo-filling of each section in the unblocked area at 0354 UTC 8 May 2019

5 小结

本研究以广州S波段双偏振天气雷达为例，利用卷积神经网络等深度学习方法，构建VEF和HEF两种网络架构。利用无遮挡区ZH，ZDR,KDP构建训练集，建模填补遮挡区的ZH和ZDR。针对只有0.5°仰角存在遮挡的区域，基于VEF架构利用上层多个仰角、径向、距离库的三维数据多模态建模；针对遮挡仰角较高的区域，基于HEF架构，利用左右相邻多个径向、距离库多模态建模，使得遮挡填补更准确。

1) 相较于之前单偏振雷达仅用强度作为输入因子对回波强度进行填补，双偏振雷达的遮挡回波填补增加了偏振参量ZDR，KDP作为输入用多模态建模，实现了对ZH，ZDR的填补，且ZH的填补效果也较单因子输入填补效果更好。

2) 划分4个距离段，不同距离段选择不同的仰角输入，分段建模可避免融化层影响，提高训练效果。

3) 多个评估指标定量评估及填补图像对比表明：利用深度学习算法对天气雷达低层仰角遮挡回波的填补效果较好，填补结果能够有效提高天气雷达数据质量，改进雷达定量降水估测、相态识别等二次产品的准确性。