APP下载

卷积神经网络和传统算法的雷达面雨量计算效果对比研究

2022-01-19李宗飞陈凯华赵玉娟

气象研究与应用 2021年4期
关键词:雨量插值反演

李宗飞,陈凯华,赵玉娟

(天津市气象信息中心,天津 300000)

多普勒天气雷达在短时临近预报中起到极其重要的地位,目前较为普遍的应用包括降水强度反演,雷达回波外推,冰雹识别等[1]。采用雷达反射率(ZH)进行降水强度(I)反演是多普勒雷达的一项重要应用,较为常用的方法是使用Z-I 公式进行计算,可通过理论推算或观测数据统计获得,实验表明反射率和降水强度成指数关系[2-5],如式1 所示。研究表明,Z-I 公式的系数a 和指数b 与降水类型存在较为密切的关系,其中系数a 波动范围较大,在100~400 之间,如对流性降水和层状云降水的系数a 表现差别较大[6],指数b 一般在1.0~2.0 之间,所以该方法在不同类型的降水中存在一定的误差,针对我国中西部地区观测资料缺乏的现象[7],使用雷达数据进行面雨量计算可以弥补不足。

近年来,人工智能算法得到较好的发展。人工智能算法中的卷积神经网络在雷达回波外推、模式识别等领域取得较好发展[8-10]。本文在以上经验的基础上,尝试采用卷积神经网络进行雷达定量估测降水,完成小时面雨量的计算,并选用2D 卷积神经网络(Conv2D)和U-Net 卷积神经网络模型分别进行计算。本文通过对小时面雨量的计算来检验传统算法、Conv2D 和U-Net 网络模型的优缺点。

1 算法设计

小时面雨量估计需要考虑两个因素,即时间和尺度。时间因素是指降水随时间的发展和变化,雷达每6min 完成一次全体扫观测,每小时11 次数据(加首尾观测),所以在时间维度上需要将当前小时的11 次观测数据都作为原始数据进行计算;尺度因素是指不同降水的尺度存在较大差异,如对流性降水和层状云降水。对于传统算法来说,对流性降水和层状云降水的雨强计算参数有较大的差异,而对于神经网络算法来说,目前并不确定其影响。

传统算法主要采用Z-I 公式进行降水估算,公式中I(mm·h-1)表示小时雨强,Zh(mm6·m-3)为反射率,a、b 分别为系数和指数。为了更准确计算小时面雨量,解决以上提出的第一个问题,本文采用逐时积分法,如下式(2)所示,Is 为小时面雨量,Ist 为第t 次观测数据反演面雨量。

针对时间因素,Conv2D 网络的输入通道定义为11 路,作为11 个观测时次的雷达扫描数据的输入通道。考虑卷积网络的计算时间和计算效果,经过多次实验后确定Conv2D 网络的层数为5。针对尺度因素,本文采用U-Net 卷积神经网络与Conv2D 进行对比研究,U-Net 卷积神经网络通过上下采样的方法,改变数据的空间分辨率,不同分辨率的数据对不同尺度降水有不同的影响,从而实现不同尺度降水估计的区别对待。

基于以上考虑,设计U-net 网络模型的输入通道为11 路,输出为1 路。为了增加网络容量,提高其拟合能力,第一层网络首先将11 路通道的输入升为33 路,然后再进入U 型结构,网络中包含了两次下采样(池化),两次上采样,各卷积层输入输出及衔接情况如下图1 所示:

图1 conv2D 卷积神经网络(a)、U-net 卷积神经网络结构(b)

2 数据处理

2.1 数据描述

本次实验使用了两年的降水数据,其中包括了雷达基数据和地面自动站降水数据。雷达数据使用基本反射率ZH(dBz),自动站数据使用过去一小时降雨量,其中自动站小时降雨量的插值面雨量产品将作为数据真值(标签)用于机器学习。

为了避免海上和偏远地区站点稀疏影响插值效果,本次实验选用北京Z9010 雷达基数据,该雷达站附近自动站较为密集,便于降水数据插值。由于雷达观测范围及高度对降水估计影响较大,所以将计算范围选择在雷达附近150km 范围内,地面自动站数据使用了东经114°51′~118°,北纬38°12′~41°21′范围内的数据,与雷达数据范围相匹配。

雷达数据使用0.5 度仰角的基本反射率,该仰角更接近地面降水,但是该仰角可能存在地物杂波、晴空回波、微量降水(小于15dBZ)等,基于以上考虑,本文在神经网络计算前剔除了小于15dBZ 的雷达回波。

2.2 数据预处理

2.2.1 雷达数据坐标转换

因为地球是球形,所以地面自动站是分布在球面上的点,以经度和纬度表示其位置,而雷达扫描数据是锥形面,采用仰角、方位和距离表示其观测位置。为了便于机器学习,需要将雷达数据转换到经纬度坐标,与地面数据相匹配。

构建三维坐标系,通过计算地面观测数据与雷达站点的经度差Δlon 和纬度差Δlat,利用下面公式,计算观测位置相对于雷达的方位角∠A、距离d,式中∠φ 是雷达仰角,∠θ 为观测位置与雷达站点的地心夹角,利用(3)(4)(5)式实现雷达数据的坐标转换,完成雷达数据到地面数据的投影。

雷达数据投影成以经纬度为坐标的格点数据,格点精度为0.05°,格点范围是114°51′E 至118°E经度,38°12′N 至41°21′N 纬度,范围和精度与地面插值数据一致。

2.2.2 数据插值及归一化

使用IDW(反距离权重)插值算法完成地面降水插值,将接近2000 个站点插值成64×64 格点,格点分辨率为0.05°×0.05°,约为5000m。插值使用meteva 函数库中interp_sg_idw 函数实现,临近点最多使用4 个,函数当中幂次参数为2。

数据归一化是神经网络算法计算的一个重要环节,首先归一化解决了卷积过程中因数据过大导致的溢出;第二,数据归一化使不同量级的输入数据具备了相同的影响能力;第三,数据归一化使激活函数处于最大梯度区间,加快了学习速率;最后,数据归一化使网络系统更加稳定[11]。文章将15~65dBZ 的反射率进行归一化(小于15dBZ 舍去),将0~80mm的小时降雨量进行归一化,因为超过80mm 的降水极为稀少,如果以最大值进行归一化将使算法对频次更高的中小雨的学习变得困难。

3 结果与分析

使用2018 年汛期降水数据进行模型训练,然后使用2019 年汛期的11 个降水日,共264(11×24)个小时降水数据进行分析。图2 是2019 年5 月26 日03 时小时面雨量,图2 中分别是Conv2D 神经网络产品、U-Net 卷积神经网络产品、实况插值产品和Z-I 关系反演产品。宏观上看,两种卷积神经网络算法在降水强度、位置、面积与实况插值产品基本一致,但是由于Conv2D 神经网络未考虑尺度问题,对较小尺度降水分布细节保留不够,如图2 中Conv2D反演面雨量有明显的均化现象,U-Net 对细节的保留比Conv2D 好,且降水中心强度与实况更为接近。雷达反演降水的分布细节及纹理较为合理,但强度比实况产品弱,并且因地物原因,雷达站附近出现强地物回波(图2(Z-I)中心位置亮点),影响显示效果。

图2 Conv2D 网络(a)、U-net 网络(b)、实况面雨量(c)和Z-I 公式计算的面雨量(d)

图3 为2019 年7 月22 日16 时的面雨量产品,通过比较实况产品与Z-I 关系反演面雨量发现,在雷达观测方位90°左右存在明显遮挡,并且在雷达北部受观测高度和地形的影响,雷达观测数据与实况数据存在一定差异。Conv2D 和U-Net 两种卷积网络计算面雨量,其位置和降水覆盖面积比雷达反演降水有较大改善,U-net 卷积网络计算效果更好,尤其是在降水强度上与实况更为接近,但仍存在不足。首先,卷积神经网络为减小整体误差,对于尺度较大的降水,中心区域存在聚拢现象,损失了降水分布细节,两种卷积网络计算面雨量降水中心聚拢;其次,同样为减小整体误差,部分不连续降水区域会被连接。

图3 Conv2D 网络(a)、U-net 网络(b)、实况插值面雨量(c)和Z-I 公式计算的面雨量(d)

U-Net 卷积网络算法与Conv2D 卷积网络算法相比,由于增加了不同分辨率的数据处理,在较小尺度降水中会保留更多的降水分布细节,如图2 所示;而在略大尺度的降水中,U-Net 卷积网络在反演降水的强度上比Conv2D 卷积网络算法更好,如图3 所示。

同样以地面降水插值面雨量为参考,对计算产品进行统计评估,参考梁维亮等[12]分量级统计思想,现给出4 个统计水平,分别是level=(0.1mm,10mm,20mm,30mm),借鉴TS 评分法给出如下表1 所示分类。因为卷积神经网络算法输出产品增加了接近0.5的背景噪声,需要额外去除,针对卷积神经网络算法,只统计大于0.5mm 的雨量。

表1 评分统计分类

根据TS 评分标准,定义准确率等于(A+D)/(A+B+C+D),击中率等于A/(A+C),漏报率等于C/(A+C),空报率等于B/(A+B),虚警率等于B/(B+D)。以此标准对四种反演效果进行评估,得到表2所示结果。该结果表明,普通Conv2D 网络反演效果在各个参数上都表现最差,U-Net 卷积网络与Z-I关系法相近,其中Z-I 关系法在参数调整后各参数表现存在差异。所以,Z-I 关系法参数的选取,需要根据降水情况调整,而卷积神经网络因平均和聚拢作用使其对降水分布的细节以及降水边界处理不够好,但通过调整网络结构,具备改进的可能,如UNet 效果强于Conv2D 的效果。

表2 四种计算方法的评分统计结果(单位:%)

通过对不同降水强度进行分级统计,得到表3所示结果,在大于10mm 强度等级的统计结果中U-Net 表现最好,Conv2D 表现次之,Z-I 关系法表现最差。

表3 四种计算方法不同降水强度的评分统计结果(单位:%)

为了更好的比较反演效果,本文给出了宏观层面的参数统计,分别是等效中心P、覆盖面积S、平均强度E 三个参数,分别由下式(6)(7)(8)表示,M和N 表示水平格点数和垂直格点数,x,y 表示坐标位置,Ixy 表示(x,y)位置的小时降水量,式(6)中Px表示水平方向的等效中心,Py 表示垂直方向的等效中心。式(7)(8)中i 是卷积神经网络算法输出产品的背景噪声,在本次实验中i 为0.5。

通过对宏观参数的统计得到表4 所示数据。首先从等效中心误差进行分析,四种方法与实况插值数据差别不大。然后从覆盖面积误差来看,Conv2D和Z-I(a=200,b=1.5)的误差最大,Conv2D 卷积神经网络由于存在平均和背景噪声现象,使其面积增大,Z-I(a=200,b=1.5)方法是因为大量未形成降水的弱回波被计算在内,导致面积增大。最后从平均强度来看,Z-I(a=300,b=1.4)存在严重低估现象,另三种方法表现较好。从整体效果来看,U-net 卷积网络算法表现最好。

表4 四种计算方法的宏观统计误差(%)

4 结论

对比人工智能方法和传统算法在雷达反演面雨量上的效果,可以看出卷积神经网络算法可以实现雷达面雨量估计,并且通过优化网络结构,调整网络参数,使算法的反演效果可以得到提升,例如U-Net卷积神经网络比普通Conv2D 网络效果略好,但是卷积神经网络为了减小平均误差,出现了平均和聚拢的现象,所以降水分布细节不如传统算法效果好。

通过对各类算法评分参数对比,传统算法在准确率、击中率等统计评分中表现较好,U-Net 卷积网络居中,Conv2D 卷积算法最差,但在分量级参数统计中U-Net 表现效果最好,表明U-Net 卷积网络在面雨量估计中存在一定优势。

宏观统计参数对比表明U-Net 卷积神经网络算法整体效果最好,传统算法通过对其参数调整,发现平均强度和覆盖面积存在一定矛盾,表明该算法为同时满足面积和强度上的要求需要进一步改进。

综上所述,人工智能的方法与传统算法各有优劣,人工智能算法通过调整网络结构存在优化空间,后期可通过增加格点密度或者改善网络结构进一步实验,本次实验受计算资源限制,未完成此内容。而传统算法同样存在一定的局限性,需要根据其降水强度的不同调整相应参数。

猜你喜欢

雨量插值反演
反演对称变换在解决平面几何问题中的应用
宁夏红柳沟流域水沙变化及产沙分析
基于小波去噪的称重雨量数据分析
基于Sinc插值与相关谱的纵横波速度比扫描方法
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
SL—1 型雨量传感器故障分析排除和维护
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
Blackman-Harris窗的插值FFT谐波分析与应用