贵州地区CMORPH卫星降水产品的误差订正
2021-07-05王福增何山谷晓平于飞杨玲
王福增,何山,谷晓平,于飞,杨玲
(1.成都信息工程大学电子工程学院,四川 成都610225;2.贵州省生态气象和卫星遥感中心,贵州 贵阳550002;3.贵州省山地环境气候研究所,贵州 贵阳550002)
1 引 言
高时空分辨率的卫星反演降水资料具有全天候、全球覆盖的特点,其时空分布相对均匀、独立,但是由于其本质是通过间接手段观测得到的,降水资料的精度无法与地面观测降水相比。地面自动站降水资料能够精准地反映地面降水情况,在气象、水文等领域通常被认为是降水“真值”,但是地面降水资料也存在一定的局限性[1]:首先由于局部气候变化,一个站点测量的降水量可能不能充分代表其附近的降水特征;其次受地形地貌的影响,地面站点数量与分布情况决定了是否能够完整地描述一个地区的降水空间结构。因此,结合两者各自的优势发展融合降水是国际上主流的研究方向[2-5]。
融合降水的前提是不同来源的资料之间相互独立,且不存在系统误差。有研究表明在中国区域内,TRMM、CMORPH等主流的卫星反演降水产品与地面资料相比均存在明显的系统误差[6],其中CMORPH存在高估低值降水、低估高值降水的特征[7-8],因此有效的系统误差订正方法能够影响融合降水产品的质量。
卫星反演降水资料中的系统误差可细分为独立误差和非独立误差[9]。独立的系统误差是指误差大小不随区域、时间或者观测值的大小而变化,是降水资料中存在的固有误差,可通过对整个降水场增减相同的常数来消除;非独立的系统误差在实际反演的卫星降水资料中更常见,这种误差值会随着降水量级的不同、时间和空间的变化而发生改变,难以通过线性方法消除。因此如何有效消除卫星反演降水产品中的系统误差是发展融合降水道路上的难点。由于CMORPH降水产品在不同地区具有不同的特点,与地面自动站观测数据相比,在雨强及降水区域都存在不同程度的偏差。因此本文采用统计的方法对格点数据进行降水概率统计,并用概率密度匹配法对贵州地区CMORPH降水产品进行订正。从分析的三次降水得出CMORPH降水产品偏差订正值在0.114~0.468 mm/h,均方根误差订正在0.24~1.49 mm/h之间。
2 系统误差订正方法
在现有的文献资料中,最常见的订正系统误差方法有两种,其中一种较传统,主要思路是定义卫星反演降水资料作为背景场,将卫星降水与地面观测降水之间的偏差作为订正值,按照某种权重将订正值插值到背景场中,来达到订正系统误差的目的,这也是融合降水的基本思路[10-11];另外一种方法采用的是统计学中的概率配对的方法,主要思路源于卫星降水在一定时空范围内概率密度分布相对稳定[12-13],通过调整卫星反演降水值,使其概率密度分布与地面观测降水一致,从而达到订正系统误差的目的。本文从统计学中降水概率密度匹配角度分析卫星反演降水资料与地面降水资料。具体方法如下:概率密度匹配法广泛应用于校正卫星观测误差[14-15],其主要思路为:对每一个格点,根据历史资料的时空分辨率及误差特征选取适当的时空窗口,在窗口内收集匹配的地面观测和卫星反演降水格点资料,分别得到二者的累积概率密度分布,然后用地面降水的概率密度去标定卫星降水资料的概率密度,两者概率密度函数值的差值即为卫星降水资料的偏差,用偏差值修正卫星降水资料达到去除卫星降水系统误差的目的[8]。
其中误差订正效果受降水累积概率分布拟合函数的影响,而降水累积概率分布是非正态分布,有研究表明Gamma分布适合用于拟合降水累积概率分布曲线[16-17],Gamma分布如式(1)所示,式(2)所示为Gamma函数:
其中x表示降水量;α表示形状参数,影响概率密度高值区的分布位置,对于给定的β,当α越小(α<1),x趋于0的概率密度越大,表明小降水事件出现的概率越大,分布函数近似于指数分布,当α越大(α>1),概率密度高值区越靠近x趋于∞的区域,表明中量级或高量级降水出现的概率越大,分布函数近似于正态分布;β表示尺度参数,用来衡量分布函数曲线的拉伸和收缩的程度,即对于给定的α,当β越小,表明不同量级的降水分布越分散,反之表明不同量级的降水分布越集中。参数α、β由极大似然估计法得到,与样本均值xˉ、方差s2的关系如式(3)所示:
3 资料来源及预处理
3.1 资料来源
CMORPH是由美国气候预测中心(Climate Prediction Center,CPC)提出的一种新技术,该技术主要思路是利用地球同步卫星的红外数据与极地卫星的微波数据联合估计降水[18]。气候预测中心首先计算从地球同步卫星传来的半小时间隔的红外云图,获得云的运动矢量,然后通过时间加权插值外推相对高质量的微波反演降水,估计无微波观测的时间间隔内的降水,生成更高时空分辨率的降水资料。本次研究采用的是CMORPH时空分辨率为30 min、8 km的降水产品。
地面降水资料来自贵州省2 136个自动气象站每分钟的降水资料,图1为贵州省自动气象站的分布情况。
图1 贵州省自动气象站分布
3.2 资料预处理
CMORPH资料的时间分辨率为30 min,通过累加得到1小时的降水资料;空间分辨率为0.072 7°×0.072 7°,按贵州省的经纬度划分(103~110°E,24~30°N)共85×98个网格点;对每个格点按面积加权平均,将分辨率调整至0.07°×0.07°,共86×100个网格点。
将地面自动气象站的分钟降水数据,对照卫星资料的时间累加至1小时,然后通过克里金插值法[19-20]将降水数据插值到0.07°×0.07°的经纬度网格中,同时对至少拥有1个站点的网格做标记,称作“有效格点”。
4 逐时卫星降水资料系统误差订正方法
4.1 CMORPH卫星降水产品逐时降水误差特征分析
2018年5月贵州省区域内的CMORPH卫星降水数据和站点插值数据(1小时、0.07°×0.07°)的平均偏差随时间序列的变化如图2所示。从图2中可发现逐时CMORPH降水资料与地面站点降水之间存在明显误差,误差随时间变化起伏较大且无明显特征和规律,数值范围集中分布在-3.5~0.1 mm/h之间,可明显看出绝大部分平均误差值小于0,表明存在负偏差(即卫星降水值大于地面降水值),说明CMORPH卫星降水产品高估了地面降水,其中负偏差值较大的时间段集中分布在5月中旬、下旬。
图2 2018年5月贵州省CMORPH逐时降水资料平均偏差变化
由于贵州省自动站数量较多,难以逐个分析其小时降水的特征,因此本文在贵州省区域内选取了六个国家级自动气象站为代表,分别是安顺站、贵阳站、遵义站、兴义站、铜仁站、都匀站,选取以上六个站点所在的“有效格点”内的地面插值数据和CMORPH卫星降水数据为样本,分别统计每个站点的降水概率密度分布。由于Gamma分布函数要求自变量大于0,且地面自动气象站监测到有降水发生时的最小值为0.1 mm,因此本文只统计有降水事件发生的样本,并将0.1 mm作为判定是否有降水事件发生的最小阈值,同时依据中国气象局颁布的降水强度等级划分表,将小时降水量(P)分为小雨(0.1 mm≤P<1.5 mm)、中雨(1.5 mm≤P<7 mm)、大雨(7 mm≤P<15 mm)、暴雨(15 mm≤P<40 mm)以及大暴雨(P≥40 mm)五种不同的强度等级。
图3所示为六个站点的降水概率密度分布情况,这里以图3a(安顺站)为例做具体分析:地面降水的概率密度分布满足指数分布特征,不同降水量级下的概率密度随量级的增大而减小,在小雨、中雨区间内地面降水的概率分别为53%、29%,反映了小时降水集中分布在中、低量级的特点,仅有18%左右的概率出现大雨及以上的降水事件。CMORPH的降水概率密度分布较复杂,其分布特点为在中雨、大雨区间内占有更高比重,其中在小雨区间内CMORPH的降水概率仅为24%,而在中雨区间内的降水概率高达63%,远超其他降水区间,此外大雨及以上区间内的降水概率达到了13%左右。对比两种降水数据源的概率密度分布,不难看出CMORPH与地面降水的概率密度分布差距较大,其中在小雨区间内,即当降水量低于1.5 mm/h时CMORPH发生降水的概率远低于地面降水,存在偏差的部分占样本总数的30%左右;在中雨区间内,即当降水量高于1.5 mm/h时CMORPH的降水概率高于地面降水,而两种降水数据源在大雨及以上的区间差距较小,偏差较高的部分主要来源于中雨区间,其降水概率占比高出地面降水约34%。整体来看地面降水在小雨区间内占有更高比重,而CMORPH在中雨区间内占比更高,说明CMORPH高估了地面降水,导致不同区间内样本数量的增加。
其余站点的概率分布情况与图3a(安顺站)相比大致相似,均能体现CMORPH高估了地面降水的特点,其中CMORPH卫星降水在3~5 mm/h的区间内占有极大的比重。结合前文可印证CMORPH高估了地面降水,造成这一现象的原因可归结为卫星降水产品作为一种间接估测降水的手段,其降水精度受仪器、气候、反演算法等多方面因素的影响,同时卫星降水产品代表的是某一区域内的平均值,与站点的单点测量存在一定空间差异性,导致CMORPH存在低值高估的特点,验证了CMORPH卫星降水存在明显的非独立系统误差。
图3 站点数据和卫星数据的降水概率密度分布
4.2 误差订正方案设计
本次研究选取了2018年5月22日10:00—13:00的一次降水过程进行误差订正分析。对于每一个卫星降水格点,为了保证能够收集到足够多的有效样本数据,需要在一定范围的时间窗口和空间窗口中按时间权重和距离权重选取样本。时间窗口和空间窗口的定义如下。
(1)时间窗口:传统误差订正法和概率密度匹配法均需要引入历史资料作为参考。通过对2018年5月的降水资料分析发现,在1小时的时间尺度下,每日的小时降水变化复杂、起伏波动较大,同时有研究指出贵州省夏季的短时强降水事件多发生在深夜或凌晨[21]。考虑到降水的日变化特征[22-23],为了保证选取样本的概率分布更加稳定,因此将本次降水过程发生前6小时作为时间窗口。
(2)空间窗口:为了避免单一网格点不能代表局部气候的情况,在收集样本时需要设置一定的空间窗口。在对站点数据进行克里金插值处理时,发现当两个站点之间的距离在25 km范围以内时,相关系数高于50%,而当范围超过25 km时两点之间的空间相关性显著减小,因此本文以目标网格点为中心,6.3°×6.3°的范围作为空间窗口。
对每一个网格点按时间窗口和空间窗口收集样本时只选取“有效格点”内的降水资料。考虑到Gamma分布的特点,只选取两种降水资料同时有降水事件发生的数据作为样本,其中以0.1 mm作为判定是否发生降水的最小阈值。为了得到每个格点内稳定的降水概率密度分布曲线,选取的非0降水样本数至少需要1 000个,且收集的样本越多越能得到稳定的累积降水概率密度分布。当样本数量达不到要求时,则需要适当扩大时间窗口,即选取目标日期前一天相同时空窗口收集样本,直到达到要求为止。
4.3 检验方法
通过分析贵州省2 136个站点的降水资料,对融合前、后的卫星反演降水采用平均绝对误差(ARE)和均方根误差(RMSE)对CMORPH降水进行检验分析。
其中,N代表样本总数;i代表样本的序列号;S和G分别代表CMORPH卫星降水值和对应的地面降水值。
5 系统误差订正结果
5.1 Gamma分布参数分布
图4所示为地面观测降水和卫星降水对应的Gamma分布中的形状参数α和尺度参数β的分布情况。从图中可发现两种降水数据源的参数α、β均服从指数函数分布特征,尺度参数β的值随形状参数α的增大呈指数减小;地面观测降水中α的数值分布在0.10~1.25之间,CMORPH中α的数值分布在0.20~1.75之间,说明在小时尺度下发生小降水事件的概率非常大,而在β值相同的情况下,CMORPH中α的数值明显高于地面观测降水;与α相比β的变化范围较大,在地面观测降水中β的取值范围在0.1~26.0之间,而在CMORPH中β的取值范围为1.25~29.00,对于给定的α,CMORPH对应的β高于地面观测降水。结合形状参数α和尺度参数β的特征变化,不难看出站点降水资料发生小降水事件的可能性显著大于CMORPH降水资料,CMORPH对应的降水值分布在更高的量级,即CMORPH高估了地面观测降水,印证了前文的结论。
图4 Gamma分布参数α、β
5.2 系统误差订正结果分析
本文选取的降水过程为2018年5月22日10:00、11:00、12:00和13:00四个时刻,具体的降水空间分布情况如图5所示,这里以10:00这一时刻(图5a、5b、5c)为例作具体分析。
从图5a地面降水空间分布可看出,此次降水过程影响范围较广,主要分布在贵州省南部、东北部等地区,其中有两个较大的强降水中心分别位于黔西南州望谟县至兴仁县一带、黔南州烛山县至黔东南州朗洞县一带,强降水中心的值普遍高于7 mm/h,最高时能达到50 mm/h,除强降水中心外绝大多数地区降水值位于中雨到小雨的区间内,平均降水值为3~4 mm/h;此外在遵义市道真县、铜仁市范围内均存在较大面积的降水,但降水强度普遍较低属于小雨的范畴;以地面观测降水为参照,观察图5b卫星降水空间分布发现,CMORPH的降水空间结构与地面降水极为相似,其准确地描述出了贵州省黔西南州、黔东南州以及黔南州内较大范围的降水,但是CMORPH并未表现出贵州省东北方的大面积弱降水区域,说明CMORPH在该地区低估了弱降水值;此外CMORPH将黔西南州境内的降水全部标记为强降水区域,平均降水强度高达8 mm/h,与实际降水情况相比有较大的偏差,同时CMORPH还将黔南州境内的大面积弱降水区域标记为强降水,说明CMORPH在以上地区高估了地面降水,而在贵州省东南方向CMORPH错误地估计了强降水中心的位置。从发展趋势来看,在研究时段内地面降水(图5a、5d、5g、5j)的强降水中心向东南方向发展,降水强度和覆盖范围随时间增长而减小,但是相比之下贵州东北部的大面积弱降水变化较小,而CMORPH(图5b、5e、5h、5k)同样是向东南方向发展,其影响范围和降水强度随时间推移不断减小。
图5 2018年5月22日10:00—13:00降水订正结果
从地面观测降水和CMORPH卫星降水的空间分布可看出CMORPH存在非常明显的系统误差,采用Gamma分布函数拟合降水累积概率密度并对其进行系统误差订正,从订正结果中(图5c、5f、5i、5l)可发现CMORPH订正前后整体降水空间结构并无明显变化,但是其强降水中心的强度和范围都有了明显的减小,其中位于黔西南州方向的降水空间结构更接近地面降水,尤其是在图5i中概率密度匹配法准确地将卫星降水中大面积的强降水区域分割为相对独立的两块区域,并保留了其强降水中心的特征,在结构上贴近地面降水(图5g);同时在黔南州境内的大面积降水与订正前相比强度明显降低4 mm/h左右,说明了采用概率密度匹配法在一定程度上能有效减小系统误差;然而在黔东南州方向上的订正效果并不理想,这是因为CMORPH错误地估计了强降水中心的位置,采用概率密度匹配法只能尽量减小该处的降水强度与范围,并不能在卫星降水中订正得到真实的强降水中心,这也是概率密度匹配法的局限性,造成这一现象的原因是地面降水中出现大雨及以上区间内降水的概率较低,导致样本数据过少,Gamma拟合曲线难以准确描述高值区间内的真实概率分布,因此当地面出现强降水事件对应的卫星数据为弱降水值时概率密度匹配难以起到有效的订正效果,此时就需要结合其他方法对卫星降水数据进行订正。
表1所示为4个时刻的CMORPH降水和地面降水在订正前后的平均绝对偏差和均方根误差,可看出订正前4个时刻的CMORPH降水的偏差范围位于0.73~1.27 mm/h之间,均方根误差的范围位于2.360~3.814 mm/h之间,说明CMORPH卫星反演降水资料的精度与地面资料相比较低。经过概率密度匹配法订正后的CMORPH降水的偏差范围降低至0.61~0.80 mm/h,均方根误差降低至2.19~2.32 mm/h,表明订正后的CMORPH降水的精度相比订正前有了明显的提升。其中10:00这一时刻的偏差值由1.272 mm/h减至0.804 mm/h,减幅达到0.468 mm/h,均方根误差值由3.814 mm/h减至2.324 mm/h,减幅达到1.490 mm/h,订正后的精度提升较明显,而12:00这一时刻的偏差值由0.708 mm/h减至0.594 mm/h,减幅达到0.114 mm/h,均方根误差值由3.814 mm/h减至2.324 mm/h,减幅达到0.240 mm/h,订正后的精度有提升,但幅度较小。
表1 订正效果评估
考虑避免单次降水过程可能出现的随机性,本文还选取了2018年5月13日06:00—09:00和2018年5月29日16:00—19:00两次降水过程进行误差订正分析;其中5月13日的降水过程持续时间短、影响范围和降水强度均低于5月22日的降水过程,5月29日降水范围及降水强度都较大。对两次降水过程分别采用概率密度匹配法进行系统误差订正,并对结果进行了误差分析,订正前、后卫星降水和地面降水之间的平均绝对误差和均方根误差如表2所示,两者误差均有所减小,其中5月13日的误差订正偏差在0.03~0.09 mm/h之间,均方根误差减幅为0.40~1.05 mm/h;5月29日误差订正偏差相对较大,约在0.3 mm/h左右,均方根误差减幅为0.85~1.03 mm/h。
表2 2018年5月13日、5月29日两次降水过程订正效果评估
从三次降水过程分析可得,概率密度匹配法能够有效地减小系统误差,但是对不同的降水过程来说其订正效果会产生差异性,其中5月22日和5月29日两次降水过程有相同特点,即CMORPH降水产品与地面降水相比具有更大降水范围,而5月13日这次降水过程范围较小,且误差偏差远小于其余两次降水过程,说明降水空间结构也会成为影响误差订正效果的因素。
6 结 论
本研究针对贵州省2018年5月的三次降水过程,结合地面自动气象站降水资料,采用概率密度匹配法对CMORPH降水产品进行系统误差订正,得到以下结论。
(1)逐时的CMROPH卫星降水资料存在明显的非独立系统误差,误差范围随降水量级的变化而变化,总体存在低值高估的特点,因此难以通过线性方法进行订正。
(2)在小时尺度下地面降水的累积概率密度呈指数分布,即降水的概率大小会随降水量级的增加逐渐下降;CMORPH卫星降水的累积概率密度分布更加复杂,在中雨、大雨区间内的降水概率较高,而在小雨、暴雨等区间内降水概率较低。通过Gamma分布函数能够有效地拟合出地面降水和卫星降水的概率密度曲线。
(3)通过概率密度匹配法订正后的CMORPH降水产品与订正前相比空间结构没有发生太大变化,但是强降水中心的降水量明显减小,其降水空间结构更加贴近地面降水。通过评估计算发现,CMORPH与地面降水之间的平均绝对误差和均方根误差均有所减小,说明采用概率密度匹配法能够有效减小CMORPH降水产品的系统误差,订正偏差在0.114~0.468 mm/h的范围内,均方根误差订正值在0.24~1.49 mm/h的范围内,订正结果的降水范围及降水强度都接近于实际降水。