采用ERA5 数据构建基于人工神经网络的天津ZWD 模型

2024-03-04刘杰，刘亮*

地理空间信息 2024年2期

刘杰，刘亮*

（1.交通运输部天津水运工程科学研究所，天津 300456；2.天津水运工程勘察设计院有限公司天津市水运工程测绘技术企业重点实验室，天津 300456）

对流层延迟[1-2]是当前GNSS[3]（Global Navigation Satellite System，全球卫星导航系统）等基于电磁波定位技术的主要误差源之一[4-5]。根据成因，对流层延迟通常可分为两部分[6]，即静力学（干）延迟和非静力学（湿）延迟[7-9]。其中，干延迟由非水汽成分造成，当前可根据地表气象资料准确估计[10]。然而，由于水汽的垂向变异性复杂，水汽引起的湿延迟无法在地表气象元素的支持下准确获取。故湿延迟在高精度GNSS 数据后处理时，常被视为未知参数之一，通过多历元滤波与其他参数一并解算[11]。但是，实时/近实时GNSS应用多不具备该条件，随着对实时/近实时PPP（Precise Point Positioning，精密单点定位）需求的不断增长，更加迫切需要精度可靠的ZWD（Zenith Wet Delay，对流层天顶湿延迟）模型来提供湿延迟估值。

GPT3（Global Pressure and Temperature 3，第三代全球气压与温度模型）[1,12]是当前性能最优的ZWD 模型之一，因其精度可靠、使用方便，在世界范围内应用广泛。但是，该模型根据ERA-Interim（European Centre for Medium-Range Weather Forecasts Re-Analysis Interim，欧洲中尺度气象预报中心过渡再分析产品）产品[13]构建，且内核为传统函数模型，故存在时空分辨率粗糙的问题。为解决上述问题，本研究基于最新一代ERA5 数据[14]提取的ZWD，采用BP（Backpropagation，误差反向传播）神经网络[14]，在天津范围内建立了Tianjin_ZWD（以下简称TZ 模型）。而后，本研究测试了TZ模型的性能，并与GPT3模型进行了对比。

1 建模数据

当前，ERA5 产品可提供全球范围内水平分辨率0.25°，垂向37 气压层，时间分辨率为1 h 的气象数据，是天津范围内采样率最高的公开气象数据源之一。因此，本研究采集了23个ERA5节点自2016年至2018 年的气压（P），温度（T），比湿（q）等数据，用于解算ZWD。

数值积分法是获取ZWD 最可靠的方法[14]，因此，本研究采用该方法，通过下式计算ZWD：

式中，Nwi和ΔHi分别为第i 层大气的湿折射率和厚度，前者可由下式计算：

式中，k'2和k3为大气物理常数，其值请参见文献[15]；ei和Ti为第i层大气的水汽压和温度。ERA5产品不直接提供e，该参量可经由q和P通过下式获得：

根据式（1）、（3），即可获取所有ERA5 节点处的ZWD 序列。至此，ZWD 序列连同其所属的空间位置信息（经度（E），纬度（N）和高程（U））以及时间参数共同组成TZ模型的建模数据。

2 建模方法

BP神经网络是高效的非线性拟合工具，当前已广泛应用于GNSS 气象学领域[2,8]。因此，本研究采用该神经网络训练并生成TZ模型。如图1所示，上节提取完成的建模数据采用如下方法导入BP神经网络：3个时间参数，即年，年积日（d）和时（h），联合节点空间位置NEU 组成6 个输入参数，对应的ZWD 为输出。相应地，输入层神经元数量确定为6 个，而输出层神经元则为1 个。此外，考虑到训练速度和参数数量，本研究定义12个隐藏层节点。

图1 天津范围内ERA5点位的分布

关于BP 神经网络，隐藏层的激活函数g(·)为双曲正切函数：

输出层的传递函数f(·)则为线性函数：

另外，参数u 和w 分别为输入层和隐藏层之间的权系数以及隐藏层和输出层间的权系数。上述的2 个系数会在误差的反向传播过程中不断校准，直至输出误差小于设定的阈值。另需说明的是，本文仅对BP神经网络提供如上所示的简单介绍，关于该神经网络的详细信息请参见文献[7]。

训练数据导入确定结构的BP 神经网络后，经迭代并确定各参数，最终即可完成TZ模型的构建。

3 模型验证

为了全面测试TZ模型的性能，本研究将2019年的ERA5-ZWD作为真值与TZ和GPT3模型的ZWD估值进行了对比。由于天津市地势平坦，各ERA5点位间的高差较小，并且2种模型的精度在各ERA5点位处较为接近，为避免图幅冗杂，故本文仅选择117.25°E，40°N处作为示例点，用以详细分析上述模型的性能差异。

如图2 所示，GPT3 模型和TZ 模型都仅需测站位置和时间就可以输出可靠的ZWD 序列。然而，二者的估值在DOY 219，2019（对应2019 年8 月7 日，夏季）附近差距最大，但TZ-ZWD （红线）相比GPT3-ZWD（蓝线）更贴近真值（灰线），表明TZ 模型在夏季，即对流层活跃期，性能更优。总体上看，相比GPT3-ZWD（蓝线），TZ-ZWD（红线）与真值（灰线）更为接近，表明TZ模型可提供更优的ZWD估值。值得注意的是，从局部放大图来看，TZ-ZWD存在日周期变化，符合ZWD 的时间变化特征。然而，该日周期并不显著，后续实验可尝试增加BP 神经网络的隐藏层节点数或隐藏层数量来增强ZWD 估值的日周期变化幅度，使其更贴合真实情况。

图2 ZWD估值与真值（ERA5-ZWD）的对比

图2 BPNN结构

图3 展示了GPT3 模型和TZ 模型的bias 分布情况，可见二者的Bias 均集中于0 mm 附近，且平均值都接近于0，说明2 种模型均可提供近似无偏差的ZWD 估计。结合表1，GPT3 的平均Bias 为-0.1 cm，而TZ模型为0.1 cm，说明GPT3总体上存在小幅高估的问题，而TZ模型则表现为略微低估。另外，表1还列出了2 种模型的平均RMSE：GPT3 为5.0 cm，TZ 为4.5 cm。即TZ模型的RMSE比GPT3模型低0.5 cm，证明TZ模型的性能比GPT3模型高10%。综上所述，GPT3模型和本研究提出的TZ模型均能在天津地区提供可靠的ZWD估值，然而，得益于精度更佳的建模数据和BP神经网络内核，TZ实现了比GPT3更优的预测性能。

表1 GPT3和TZ模型的平均Bias和RMSE统计／cm

图3 GPT3（左）和TZ（右）的Bias分布

4 结语

本文基于2016 年至2018 年的ERA5-ZWD，采用BP神经网络，训练并生成了适用于天津地区的ZWD模型TZ。经2019 年的ERA-ZWD 测试，并通过与GPT3模型对比，结果表明：TZ模型能够提供与真值更接近的ZWD 估值，且其RMSE 由5.0 cm 降至4.5 cm，性能提升10%。未来随着GNSS技术的进一步推广，TZ模型有望广泛应用。此外，TZ模型的构建策略也可为全国其他地区的ZWD建模提供借鉴。