APP下载

顾及气象数据的中国区域对流层延迟RBF神经网络优化模型

2022-09-01徐天河王帅民

测绘学报 2022年8期
关键词:掩星对流层估计值

徐天河,李 耸,王帅民,江 楠

1. 山东大学空间科学研究院,山东 威海 264209; 2. 河北工程大学矿业与测绘工程学院,河北 邯郸 056038

GNSS数据处理中,对流层延迟改正最常用的方法包括模型改正法和参数估计法[1]。模型改正法通过分析特定参数的时空特性来探索不同影响因子与对流层延迟之间的函数关系,利用物理公式构建适用于全球或局部地区的对流层延迟改正模型。目前应用比较广泛的对流层延迟改正模型包括以下4类:①早期基于实测气象参数构建的经典模型,如Hopfield、Saastamoinen、Black、Askne&Nordius模型[2-5]。该类模型根据不同的近似方法利用目标位置的实测气象参数反映测站上空的气象变化,将气压、温度、水汽压等气象元素代入特定模型计算天顶方向的对流层延迟改正(zenith tropospheric delay,ZTD),改正精度可达分米级,甚至厘米级。②无须实测气象参数的经验模型,如UNB系列、EGNOS系列、GPT系列模型[6-12]。这些模型依据全球或局部地区已有的气象观测资料拟合相关参数,应用时只需根据年积日和测站位置通过外推或内插方法获取所需气象参数,结合物理模型计算对流层延迟。其中,文献[10]指出精度较高的GPT2w模型在全球341个GNSS站点的ZTD估计值标准差约为3.6 cm。③通过分析大量已知对流层延迟改正参数构建的经验模型,如GZTD系列、IGGtrop系列等[13-15]。文献[13]表明GZTD模型在385个IGS跟踪站的ZTD估计值的平均偏差为-0.2 cm,均方根误差为4.24 cm。文献[14]指出IGGtrop模型整体平均偏差和均方根误差分别为-0.8和4.0 cm。④借助机器学习算法描述对流层延迟非线性特征的改正模型。这类模型包括多层感知机、自适应神经元模糊推理系统(adaptive-network-based fuzzy inference systems,ANFIS)、人工神经网络(artificial neural network,ANN)、最小二乘支持向量机(least squares support vector machine,LSSVM)等[16-24]。其中应用最广泛的是基于ANN构建区域对流层模型,该类模型通过输入不同类型的参数在全球或局部地区实现对流层延迟改正参数的插值、预报、融合或改进;如基于测站空间位置参数,利用反向传播(back propagation,BP)神经网络或径向基(radial-basis function,RBF)神经网络在一些国家和地区构建区域对流层延迟模型[16-20];综合时空信息,利用BP神经网络和长短期记忆(long short-term memory,LSTM)算法在南极西部地区实现ZTD预报[21];基于测站位置信息和Hopfield模型,利用BP神经网络构建BP-Hopfield融合模型[22];结合时空信息和温度估计误差,利用BP神经网络或LSSVM对模型法估计的对流层延迟进行改进[23-24]。

上述机器学习模型大都围绕BP神经网络展开研究,而RBF神经网络相比于BP神经网络建模稳定性更高,收敛速度更快。另外,之前学者利用BP神经网络改进对流层延迟模型的研究主要针对Hopfield模型和GPT系列模型,而在当前实际数据处理中Saastamoinen模型更为常见且通过积分法计算ZTD值的精度更高,故采用RBF神经网络对基于Saastamoinen模型和积分模型估计的ZTD值进行改进更具有应用价值。同时已有研究缺乏采用不同气象数据产品计算ZTD值的对比分析和结果改进,如欧洲中尺度天气预报中心(European Centre for Medium-range Weather Forecasts,ECMWF)发布的第五代全球气象再分析资料(ERA5),气象、电离层与气候星座观测系统(constellation observing system for meteorology,ionosphere and climate,COSMIC)提供的大气参数剖面等。

基于以上分析,本文首先基于中国地区ERA5再分析资料、COSMIC掩星数据产品和实测气象数据估计236个中国地壳运动观测网络(crustal movement observation network of China,CMONOC,简称陆态网)测站的ZTD值,其中对于单层气象数据和多层气象数据分别采取模型法和积分法进行计算;然后,顾及ZTD估计值的非线性特性,基于RBF神经网络在空间域构建估计值改进模型,获取改进后的ZTD值并进行精度评估。

1 数据与方法

1.1 数据来源

根据不同获取途径将试验涉及的气象数据分为3类:ERA5气象再分析资料、陆态网测站实测气象参数及COSMIC掩星数据。其中,ERA5数据是ECMWF中心通过同化多源大气参数生成的第5代全球气象再分析资料,以格网数据形式进行发布。该类产品根据不同垂直分辨率可分为单层地表数据和气压层数据(37层),均可从https:∥cds.climate.copernicus.eu/获取。陆态网是基于GNSS测站的观测网络,用于中国地区板块运动及重力场的实时监测。部分陆态网基准站配备外部气象设备,可实际测量测站处的气压、温度和相对湿度[25]。COSMIC观测系统由6颗低轨卫星组成,其数据产品基于该观测系统和GNSS卫星之间发生的掩星事件获取,主要包括原始GNSS观测值和大气参数剖面(https:∥data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc)。除上述3类气象数据之外,试验中采用的GNSS_ZTD值由BERNESE5.2软件解算所得。

试验选取了236个陆态网测站2015年的GNSS_ZTD值和实测气象参数及同时段覆盖中国区域的ERA5气象再分析资料和COSMIC掩星数据。其中,GNSS_ZTD时间分辨率为1 h,实测气象数据采样率为30 s;ERA5格网数据的时空分辨率分别为1 h和0.25°×0.25°;基于COSMIC掩星事件反演的掩星数据没有固定的时空分辨率,全球范围内单天发生的掩星事件约2000次[26]。以2015年6月11日为例,展示研究区域内可用数据覆盖情况如图1所示,其中红色点代表已估计GNSS_ZTD值的陆态网测站,边缘为黑色表示该测站可获取实测气象参数,发生在研究区域上空的掩星事件用蓝色星点表示。

图1 2015年6月11日可用数据分布Fig.1 Distribution of available data on June 11,2015

1.2 基于气象参数估计测站处ZTD值

由于不同气象数据产品的垂直分辨率不同,故分别采用模型法和积分法估计ZTD值。对于ERA5单层地表数据和实测气象数据而言,根据Saastamoinen模型估计ZTD值;而基于ERA5气压层数据和COSMIC掩星数据估计ZTD时,采用积分法计算。

1.2.1 ERA5气象再分析资料

由于ERA5数据以重力势能ρ表示格网数据的高度信息,且重力势能经过转换后得到的高程参数为位势高,故计算时需统一格网数据与目标测站的高度参数,具体如式(1)所示[27]

(1)

式中,Hρ和H分别代表位势高和正高,其转换公式是关于测站纬度φ的函数;R(φ)和Y(φ)分别表示在纬度φ处计算的地球有效半径和旋转椭球表面正常重力值;Y45表示纬度为45°时正常重力,取值9.806 65 g/m2;正高与大地高之间的转换基于EGM2008模型[28-29]实现。

1.2.1.1 模型法

基于单层地表数据,根据目标测站位置选取4个邻近格网点。依据气象参数随高程的变化关系分别将4个格网点在格网高度hg处的气象参数(气压Pg,温度Tg)改正到测站高度hs处,得到目标测站高度位置的气压Ps和温度Ts[30-31],具体改正如式(2)和式(3)所示

Ts=Tg-6.5×(hs-hg)

(2)

(3)

由于单层地表数据中不包含水汽压参数,故利用格网点温度Tg和露点温度TDg计算比湿参数RHg,经过高程改正后用于估计测站高度位置的水汽压Pvs,具体计算如式(4)—式(7)所示

(4)

(5)

RHs=RHg×e-0.000 639 6(hs-hg)

(6)

(7)

式中,R2、R3和R4根据温度的数值范围分3种情况取值[32]。之后基于4个格网点在测站高hs处的气压Ps,温度Ts和水汽压Pvs,通过双线性内插分别获取目标测站的气压P,温度T和水汽压Pv,其中插值时采用反距离加权法确定不同位置参数参与计算的权重。最后,基于测站处气压P,温度T和水汽压Pv,采用Saastamoinen模型[3]估计GNSS测站处的ERA5S_ZTD值。

1.2.1.2 积分法

依据目标测站位置选择信号路径穿过的气压层数据参与计算,并确定4个邻近格网点位置。以最接近目标测站高度hs的气压层数据为基准,将4个邻近格网点处的气压Pi,温度Ti和比湿RHi改正至目标测站高程位置,并计算水汽压Pvi,其中i表示参与计算的气压层层数。利用不同气压层格网点数据(Pi,Ti,Pvi)和测站高度处的改正数据(Ps,Ts,Pvs)计算不同高度位置的大气折射率N,并对折射率N进行积分获取测站高度位置4个邻近格网在测站高hs处的ZTD值。经过双线性内插获取测站位置的ERA5P_ZTD值。具体计算如式(8)和式(9)所示[5](各气象参数的高程改正和双线性内插的计算过程与模型法中类似)

(8)

(hj-hj+1)

(9)

式中,K1、K2和K3表示折射率常数,分别取值77.604、64.79 K/hPa和377 600 K2/hPa;htop代表最高气压层格网数据高度;j代表信号路径穿过的层数,不同层之间采用梯形公式计算。

1.2.2 陆态网实测气象参数

基于外部气象观测装置可直接测量测站处的气压P,温度T和比湿RH,其中比湿RH与水汽压Pv之间依据式(4)—式(7)进行转换;利用获取的P、T和Pv基于Saastamoinen模型估计测站处的ZTD值,记为MET_ZTD。需要注意的是,模型计算前已剔除实测气象参数中的异常值。

1.2.3 COSMIC掩星数据产品

COSMIC数据产品基于掩星事件在全球范围内提供大气参数垂直剖面,包括气压Pk,温度Tk和水汽压Pvk,其中k代表从上至下第k个数据;由于其没有固定的时空分辨率且单天内在研究区域上空发生掩星事件较少,无法采用内插法获取目标测站的各项气象参数,故以200 km为限值在水平方向上按天匹配掩星事件位置和测站位置[26],以限值范围内距离测站最近的大气参数剖面为准在垂直方向上进行高程改正;基于改正后的气象参数利用积分法估计测站处的ZTD值,记为RO_ZTD,具体计算公式与ERA5气压层数据类似。对于在水平方向上没有匹配到掩星事件的测站不予估计ZTD值。

1.3 基于RBF神经网络构建对流层延迟改进模型

为充分验证BERNESE5.2解算GNSS_ZTD值的精度,分别在不同季节选取10 d作为观测时段,联合IGS分析中心提供的观测文件解算IGS测站的GNSS_ZTD值,并统计GNSS_ZTD与IGS分析中心提供的ZTD值(IGS_ZTD)之间的平均偏差和均方根误差(表1)。由表1中BJFS、CHAN、URUM、LHAZ、WUHN、SHAO测站的统计结果可知:受IGS_ZTD数据覆盖率的限制,不同测站可匹配的数据个数不同,其中SHAO和WUHN测站统计的数据个数较少;6个测站的平均偏差数值分布于1.0~2.4 mm,均方根误差取值范围为3.6~5.7 mm,平均均方根误差为4.6 mm。由此可知,利用BERNESE5.2解算的GNSS_ZTD与IGS_ZTD值符合较好。顾及改进模型中ZTD参考值的精度,以GNSS_ZTD值为基准构建4种ZTD改进模型。为保持ZTD估计值和ZTD参考值的时间分辨率一致,MET_ZTD取整时刻的气象数据进行估计,并在建模时按测站以1 h为阈值匹配RO_ZTD和GNSS_ZTD。

表1 GNSS_ZTD与IGS_ZTD间的平均偏差和均方根误差Tab.1 Average bias and root mean square error between GNSS_ZTD and IGS_ZTD mm

图2以ERA5S_ZTD为例展示了改进模型的结构。该模型基于RBF神经网络[33]构建,其输入层向量由训练测站的纬度、经度、高程和ERA5S_ZTD估计值组成,输出层参数为ERA5S_ZTD与GNSS_ZTD之间的偏差,隐含层节点个数为16。其他ZTD估计值的改进模型与ERA5S_ZTD类似,其中RO_ZTD改进模型的输入向量中扩充了掩星数据的时间信息。经过模型改进后的ZTD改进值为基于RBF模型获取的偏差值与ZTD估计值之和,分别以RBF_ERA5S_ZTD、RBF_ERA5P_ZTD、RBF_MET_ZTD、RBF_RO_ZTD表示。另外,为充分验证改进模型的精度和适用性,令所有可用测站依次作为测试站,剩余测站作为训练站进行建模,获取研究区域内所有测站的ZTD改进值进行精度评估。

图2 ERA5S_ZTD估计值改进模型结构Fig.2 Improved model structure of ERA5S_ZTD estimation

1.4 精度评定方法

顾及ZTD值的季节特性,将整个观测时段按月划分,以GNSS_ZTD为参考,统计各月所有ZTD估计值和ZTD改进值的均方根误差(RMSE);同时,为区分不同测站的ZTD值精度,按站统计月RMSE进行分析。除此之外,基于RMSE统计ZTD改进值相较ZTD估计值的精度提升率,以分析各改进模型的改进能力。其中,以ERA5S_ZTD为例展示RMSE和改进值精度提升率计算公式如式(10)和式(11)所示,基于其他气象数据估计ZTD值与之类似

(10)

(11)

式中,n代表观测时段采样个数。并且由于当ZTD改进值RMSE减小时视为精度提升,故补充负号确保精度提升时,Improvement为正值。

2 算例分析

2.1 ZTD估计值结果分析

表2中4种ZTD估计值平均每天可估计的测站个数和RMSE统计结果显示:基于固定测站和不同的气象数据产品,ERA5S_ZTD、ERA5P_ZTD和MET_ZTD可估计的测站个数远大于RO_ZTD估计值,2015年平均每天可估计测站个数分别为226、226、214和52。这是由于ERA5再分析资料是具有固定分辨率的全球格网数据,可通过插值获取任意位置的气象参数;MET_ZTD估计值的获取主要依赖于测站是否配备气象设备;而RO_ZTD估计值的测站个数受研究区域内掩星事件数量的限制。另外,4种ZTD估计值12个月的RMSE平均值分别为42.8、16.1、53.6和62.3 mm。其中,ERA5S_ZTD和ERA5P_ZTD的RMSE取值范围分别为25.5~62.8 mm和13.8~20.7 mm,最大RMSE均分布于7月;MET_ZTD估计值在6月份达到最大RMSE值80.7 mm,最小RMSE值为1月份的26.8 mm;RO_ZTD估计值的RMSE分布于31.0~88.2 mm,8月份数值最大。

表2 4种ZTD估计值可用测站个数与RMSE统计结果Tab.2 The number of available stations and RMSE statistical results for the four ZTD estimations mm

同时,按站统计了4种ZTD估计值的月RMSE,并以月为单位展示各组统计结果如图3所示。其中,红线为反映该组月RMSE平均水平的中位数;蓝色上箱线和下箱线分别表示该组数据的上四分位数Q1和下四分位数Q3,位于两值中间的数据个数占总数据量的50%,可反映主体数据的分布情况。箱子上方和下方延伸出的黑线分别表示非异常范围内的最大值和最小值;其中非异常数值范围取Q1+1.5×(Q1-Q3)至Q3-1.5×(Q1-Q3),当数值超过该范围时,认定为异常值,用红色十字表示。由图3可知,部分测站的月RMSE出现异常值,但大多数月RMSE集中在60 mm以下,测站个数占50%以上。忽略异常值进行分析,ERA5S_ZTD估计值的各组月RMSE分布相对集中,中位数取值范围为30~50 mm,整体月RMSE数值呈现中间高两边低的变化趋势,其中12月、1月和2月的月RMSE值相对较小,均集中于60 mm以下;6月、7月、8月和9月份的月RMSE值相对较大,最大值约90 mm左右。这是由于夏季高温和高水汽含量导致对流层中大气分子变化复杂,采用固定模型估计ZTD值难度较大。相较而言,ERA5P_ZTD估计值的非异常月RMSE均分布于30 mm以下且各组数值离散程度较小。MET_ZTD估计值和RO_ZTD估计值的月RMSE变化趋势和数值范围与ERA5S_ZTD类似,但各组月RMSE值相对离散且非异常最大值较大,尤其在6月、8月、9月,最大值均超过120 mm。其中,基于模型法计算ZTD值精度较低与Saastamoinen模型本身存在误差有关,另外气压层数据相比于单层地表数据在信号传播路径上提供的气象数据更多,故通过对多层数据积分获取的ZTD值精度更高。

图3 基于不同测站的4种ZTD估计值RMSE统计结果Fig.3 RMSE statistical results of four ZTD estimates based on different stations

以3月、6月、9月和12月为例,分别展示4种ZTD估计值在不同季节的月RMSE分布情况。对比图4至图7可以看出:ZTD估计值的月RMSE不仅具有冬季低夏季高的季节特性,还与测站的空间位置密切相关。其中,基于模型法计算的ERA5S_ZTD和MET_ZTD受测站位置影响明显,代表高RMSE值的黄色点和橙色点集中分布于高湿高热且海拔较低的南方地区;并且对比ERA5S_ZTD和MET_ZTD的月RMSE可以发现:当测站位于北方地区时,MET_ZTD的月RMSE与ERA5S_ZTD相差不大;而南方地区的结果显示,MET_ZTD高RMSE的测站个数更多,且沿海地区测站的月RMSE高于ERA5S_ZTD。考虑到实测气象参数中的异常值已被剔除,故推测可能是由于ERA5数据与实测数据间的偏差抵消了基于Saastamoinen模型估计的ZTD值与GNSS_ZTD之间的偏差,导致部分测站的MET_ZTD精度低于ERA5S_ZTD。而采用积分法估计的ERA5P_ZTD的月RMSE整体较小且受测站位置影响较小,仅有个别测站的RMSE值大于20 mm;这可能是由于高度较高时大气参数的地域特性不明显[34],故基于多层气象数据直接积分获取ZTD值的RMSE在南北地区差异不大。另外,RO_ZTD估计值的月RMSE分布特性不明显,这是因为RO_ZTD估计值除受测站位置影响外还受掩星事件与测站间距离的制约。

图4 不同测站3月份ZTD估计值的月RMSE分布情况Fig.4 Distribution of monthly RMSE of ZTD estimations at different stations in March

图5 不同测站6月份ZTD估计值的月RMSE分布情况Fig.5 Distribution of monthly RMSE of ZTD estimations at different stations in June

图6 不同测站9月份ZTD估计值的月RMSE分布情况Fig.6 Distribution of monthly RMSE of ZTD estimations at different stations in September

综上所述,以GNSS_ZTD值为参考,基于积分法采用ERA5气压层数据得到的ZTD估计值精度最高,月RMSE集中于10~20 mm。采用模型法估计的ERA5S_ZTD和MET_ZTD的整体精度相当,月RMSE高于ERA5P_ZTD且受气象参数影响明显,当温度或湿度较高时,估计值的月RMSE较大;另外,由于个别测站的RMSE偏高导致表2中MET_ZTD各月RMSE值均大于ERA5S_ZTD。RO_ZTD估计值受掩星事件的限制,时间分辨率较低且在研究区域可获取数据个数较少,RMSE平均值最高。

2.2 改进模型ZTD结果分析

基于RBF算法,针对4种气象数据ZTD估计值分别构建对流层改进模型,并按月统计改进模型ZTD的RMSE,见表3。表3中统计结果显示:4种改进模型ZTD估值12个月的RMSE平均值分别为23.5、14.2、32.1和40.8 mm。 其中,前3种改进模型平均每天可参与建模的测站个数超过200个,而RO_ZTD估计值的改进模型可训练的测站数量较少,12个月平均每天可用测站个数为52个;另外,RBF_ERA5S_ZTD、RBF_ERA5P_ZTD和RBF_MET_ZTD改进值均在7月份达到最大RMSE值,分别为33.0、19.8和44.3 mm,最小RMSE值分布在2月、12月和1月,分别为15.5、10.5和18.7 mm。RBF_RO_ZTD改进值的最大RMSE为6月份的58.9 mm,最小RMSE在1月份取值24.7 mm。

表3 4种ZTD改进值可用测站个数和RMSE统计结果Tab.3 The number of available stations and RMSE statistical results for four improved ZTD mm

图8—图12展示了各月份不同测站4种ZTD改进值的月RMSE统计结果及其分布情况。若不考虑图8中异常值(红色十字),蓝色箱体宽度较小表示4种ZTD改进值的月RMSE分布相对集中,红线集中于30 mm以下且峰值均位于6月—8月,说明月RMSE小于30 mm的测站占50%以上。其中,RBF_ERA5P_ZTD各月RMSE均小于30 mm;RBF_ERA5S_ZTD和RBF_MET_ZTD的结果显示:RMSE小于30 mm的测站占比在1月—4月和10月—12月可达75%,5月—9月约为50%;RBF_RO_ZTD月RMSE值整体偏大,最大月RMSE(黑色线)分布在30~90 mm。

图8 基于不同测站的4种ZTD改进值RMSE统计结果Fig.8 The RMSE statistical results of four improved ZTD values based on different stations

由图9—图12中,3月、6月、9月和12月不同测站的月RMSE分布情况可知:与ZTD估计值类似,4种ZTD改进值同样具有高温高湿环境下月RMSE偏高的季节特性和地域特性,这是由于ZTD估计值对改进模型进行外部约束所致;需要注意的是,图9—图12与图4—图7不同,RMSE最大值范围已降低至一半;RBF_ERA5P_ZTD 4个季节的所有测站月RMSE的平均值分别为10.6、15.9、14.6和9.7 mm。其中夏秋两季(6月、9月)的RMSE值多为10~20 mm的浅蓝色点,而代表0~10 mm的深蓝色点集中分布在冬春两季(3月、12月)的北方地区和高原地区。RBF_ERA5S_ZTD和RBF_MET_ZTD的月RMSE分布特性与RBF_ERA5P_ZTD类似,但数值量级高10~20 mm;其中,RBF_MET_ZTD月RMSE超过40 mm的测站个数多于RBF_ERA5S_ZTD。RBF_RO_ZTD月RMSE的地域特性不明显,月RMSE多分布于20~50 mm,部分高RMSE值的橙色点散落于高原地区和北方地区。

图9 不同测站3月份ZTD改进值的月RMSE分布情况Fig.9 Monthly RMSE distribution of improved ZTD in March at different stations

图10 不同测站6月份ZTD改进值的月RMSE分布情况Fig.10 Monthly RMSE distribution of improved ZTD in June at different measuring stations

图11 不同测站9月份ZTD改进值的月RMSE分布情况Fig.11 Monthly RMSE distribution of improved ZTD in September at different stations

图12 不同测站12月份ZTD改进值的月RMSE分布情况Fig.12 Monthly RMSE distribution of improved ZTD in December at different stations

初步对比2.1节和2.2节的两组结果可以发现,改进模型ZTD值的月RMSE数值整体较小且分布更加集中,RMSE值偏大的测站数量明显降低。

2.3 改进模型适用性分析

对比分析图13和图14中2015年气象数据ZTD估计值和改进模型ZTD估计值与GNSS_ZTD之间的数值关系,结果显示,相较于ERA5S_ZTD估计值,RBF_ERA5S_ZTD改进值均匀分布在直线两侧且相对集中,RMSE值从45.0 mm减小至24.4 mm;RBF_ERA5P_ZTD相比ERA5P_ZTD没有明显变化,RMSE值略微减小,分别为14.5和15.9 mm;MET_ZTD和RBF_MET_ZTD对比结果表明,改进模型对于数值在2500 mm附近的估计值改进效果明显,RMSE值从54.8 mm降至33.4 mm;对于偏离GNSS_ZTD较大的RO_ZTD估计值,RBF_RO_ZTD明显收敛,RMSE值减小约20 mm。

图13 4种ZTD估计值与GNSS_ZTD值Fig.13 Four ZTD estimates and GNSS_ZTD values

图14 4种ZTD改进值与GNSS_ZTD值Fig.14 ZTD of four improved models and GNSS_ZTD values

表4按月统计了4种ZTD改进值相对于ZTD估计值的精度提升率。由表4可知,4种ZTD改进值12个月的提升率均为正值,平均值分别为43.4%,10.0%,36.3%和34.4%。其中RBF_ERA5S_ZTD提升率平均值最高,除1月份提升率为24.3%以外,其他月份的提升率均大于40%,9月份达到最大值49.6%;RBF_MET_ZTD次之,各月提升率取值范围为27.7%~45.3%,最小提升率和最大提升率分别分布于1月和6月。RBF_RO_ZTD的提升率平均值与RBF_MET_ZTD相差不大,并在1月和2月取最小值和最大值,分别为20.2%和52.5%。受ERA5P_ZTD估计值精度的制约,RBF_ERA5P_ZTD改进值的提升率最低,各月数值均低于20%,1月份的提升率仅有0.2%。

表4 4种改进模型ZTD估计值的精度提升率Tab.4 Improvements of ZTD based on four improved models (%)

为进一步分析ZTD提升率与测站位置的关系,在图15中按站统计ZTD改进值的精度提升率。结果显示:不同测站结果不同,提升率数值有正有负。分析红线和上下箱线的位置可以发现:RBF_ERA5S_ZTD各月提升率大于0的测站超过总数量的3/4,提升率大于40%的测站约占一半,8月份最大提升率达到80%;相较而言,RBF_ERA5P_ZTD改进值的提升率数值偏小,大约一半测站的提升率为正值,最小提升率在12月份达到-80%;RBF_MET_ZTD精度有所提升的测站在4~10月约占3/4,其他月份约为一半;RBF_RO_ZTD各月提升率数值范围较大,大部分的测站的改进值精度高于估计值,其中提升率大于40%的测站约占1/4。

图15 基于不同测站的4种改进模型精度提升率统计结果Fig.15 Statistical results of accuracy improvement rate of four improved models based on different stations

图16—图19分别以3月、6月、9月和12月为例展示了不同测站提升率的分布情况。RBF_ERA5S_ZTD改进值的结果显示:绝大部分测站为提升率大于0的黄色点和红色点,且数值更高的红色点集中分布于南方地区和华北地区,这些地区的测站分布相对密集,尤其是云南地区;而提升率为负值的测站多散落于测站分布较少的边缘地区。同样地,RBF_MET_ZTD改进值的高提升率具有相同的分布特性,且提升率为负值的蓝色点多分布于测站较为稀疏的高原地区和东北地区。这是因为改进模型是针对ZTD估计值与GNSS_ZTD之间的偏差进行补偿,当基于RBF模型估计的偏差值准确时,ZTD改进值精度有所提升,反之则精度下降。而RBF模型的准确度依赖于输入的训练样本数据,当训练样本与测试样本的相关性较强时,模型对参数特性进行充分学习,针对测试样本的输出参数估计准确。因此,当测试站位于研究区域边缘地带或测站分布稀疏地区时,周围测站较少,参与建模的训练站与测试站所处环境差异较大,其ZTD估计值相关性较差,模型对测试站的偏差值估计不准确,最终导致测试站改进后的ZTD值精度降低。另外,由于每天可估计RO_ZTD的测站不固定,影响提升率的因素较多,故RBF_RO_ZTD提升率分布相对复杂,个别提升率为负值的测站也出现在测站密集地区。相较上述3种改进值的提升率而言,RBF_ERA5P_ZTD提升率数值整体偏低且分布规律不明显,大于0的提升率多为黄色点,小于0的提升率多为浅蓝色点,高提升率的红色点出现在3月和12月的北方地区。

图16 不同测站3月份改进模型的精度提升率分布情况Fig.16 Distribution of monthly improvement of four improved models at different stations in March

图17 不同测站6月份改进模型的精度提升率分布情况Fig.17 Distribution of monthly improvement of four improved models at different stations in June

图18 不同测站9月份改进模型的精度提升率分布情况Fig.18 Distribution of monthly improvement of four improved models at different stations in September

图19 不同测站12月份改进模型的精度提升率分布情况Fig.19 Distribution of monthly improvement of four improved models at different stations in December

综合本节图表进行分析,得出结论:基于RBF神经网络构建的改进模型对于ERA5S_ZTD、MET_ZTD和RO_ZTD估计值的改进效果显著,大部分测站改进值的精度有所提升且提升率与测站分布有关,提升率平均值分别为43.4%、36.3%和34.4%;其中RBF_ERA5S_ZTD提升率最高,仅有个别边缘测站的改进值提升率为负值;RBF_MET_ZTD在南方地区提升效果明显,部分位于高原地区和东北地区的测站提升率为负值;RBF_RO_ZTD提升率受训练测站个数影响,分布相对复杂。而针对基于积分法获取的ERA5P_ZTD估计值,其与GNSS_ZTD值一致性较高,偏差量级较小且相对随机,经过模型改进后,约一半测站的RBF_ERA5P_ZTD精度有所提升,但提升率数值较低,提升率平均值为10.0%。

3 结 论

本文基于单层气象数据(ERA5单层数据、实测气象参数)和多层气象数据(ERA5气压层数据、COSMIC掩星数据),分别采用模型法和积分法估计236个陆态网测站2015年的ZTD值,并以GNSS_ZTD值为参考进行精度评估。结果表明:基于ERA5气压层数据采用积分法估计的ERA5P_ZTD与GNSS_ZTD一致性最高,月RMSE平均值为14.2 mm。相较而言,基于ERA5单层数据和Saastamonien模型计算的ERA5S_ZTD精度较低,月RMSE平均值为42.8 mm。同样采用该模型和实测气象数据计算的MET_ZTD月RMSE平均值为53.6 mm,其中北方地区测站的精度与ERA5S_ZTD相当,南方地区个别测站月RMSE较大导致所有MET_ZTD的月RMSE高于ERAS_ZTD。对于基于积分法的RO_ZTD估计值而言,由于受研究区域内掩星数据数量的限制,可获取估计值个数较少,其月RMSE平均值为62.3 mm。另外,采用模型法估计的ZTD值受季节和地域影响更加明显,当温度和湿度较高时,ZTD估计值的精度较低。

针对不同气象数据获取的4种ZTD估计值,基于RBF神经网络以GNSS_ZTD值为基准构建改进模型,并利用未参与建模的测站进行模型验证。结果显示,RBF_ERA5S_ZTD、RBF_MET_ZTD、RBF_ERA5P_ZTD和RBF_RO_ZTD月RMSE平均值分别为23.5、32.1、14.2和40.8 mm,相较气象数据获取的ZTD估计值精度,提升率分别为43.4%、36.3%、10.0%和34.4%。进一步分析显示,不同测站ZTD估计值改进程度不同,ZTD精度提升率与测站分布有关;测站密集地区的ZTD精度提升明显,提升率多为正值且较高,较低提升率或提升率为负值的情况大都出现于测站稀疏地区和边缘地区。

致谢:感谢中国地震局提供的陆态网GNSS观测数据和实测气象数据;感谢欧洲中尺度天气预报中心提供的ERA5数据和COSMIC中心提供的掩星大气参数产品。

猜你喜欢

掩星对流层估计值
FY-3D 卫星的北斗掩星分布特征与误差特性*
基于COSMIC掩星精密定轨数据的等离子体层电子含量研究
郴州地区对流层顶气候概况
利用掩星温度数据推算大气月平均纬向风场
一道样本的数字特征与频率分布直方图的交汇问题
统计信息
2018年4月世界粗钢产量表(续)万吨
实时干涉测量中对流层延迟与钟差精修正建模
成都地区2005~2015年对流层NO2柱浓度趋势与时空分布
月掩星——天上的魔幻