考虑有雨无雨辨识的多源降水融合方法

2022-11-16李伶杰王银堂唐国强王磊之胡庆芳

水科学进展 2022年5期

李伶杰,王银堂,唐国强,高轩,王磊之,胡庆芳

(1. 南京水利科学研究院水文水资源与水利工程科学国家重点实验室,江苏南京 210029；2. 长江保护与绿色发展研究院,江苏南京 210098；3. University of Saskatchewan Coldwater Lab,Canmore,Alberta T1W 3G1,Canada；4. 西北农林科技大学旱区农业水土工程教育部重点实验室,陕西杨凌 712100)

获取高精度降水时空分布信息对于提升水旱灾害防御能力、促进水土资源高效配置与利用等具有重要意义。然而,受天气形势、地理位置、地形地貌及人类活动等因素的复合影响,降水呈现复杂变异性[1],精准估计降水时空分布一直是气象水文研究的难点之一。

目前,观测和估计降水的方式日趋多元,主要有地面观测、气象卫星与天气雷达遥感反演、大气再分析等[2]。地面观测可获得点尺度高精度信息,但站网密度和空间分布模式影响了降水空间格局的刻画。遥感反演和大气再分析的栅格降水信息具有覆盖范围广、空间连续性强等优势,但受传感器及反演算法的影响,分类和定量误差相对突出,并且在不同气候、地形及降水强度等条件下呈现复杂分异特征[3- 4]。集成地面观测、遥感反演和大气再分析及其他相关辅助信息(如位置、地形、植被、微波链路信号等)的多源信息融合方法,已成为获取精细化降水时空分布的重要途径[5- 6]。目前,降水融合方法已取得一系列进展,根据不同信息源的地位,可分为3类：一是以遥感反演或大气再分析数据为主,采用若干种栅格降水数据构建初估场,然后利用地面站点观测降水在一定优化准则下修正初估场,得到降水融合场,如最优插值[7]、地理加权回归[8]等；二是以地面站点观测信息为主,以遥感、再分析和其他相关信息作为辅助变量,采用协克里金插值[9]、广义可加模型[10]等融合多源信息,也有贝叶斯滤波[11]和条件融合[12]等方法在对站点观测降水插值的基础上,利用其他栅格降水修正插值场；三是信息地位平等的多源配准集成,核心是率定各源数据权重,典型方法有贝叶斯加权平均[13]、概率密度函数叠置[14]、TC(triple collocation)[15]和深度神经网络[16]等。然而,这些方法重点关注了累积降水量或降水强度的误差订正,提高年、月降水估计精度的效果显著,但对于空间非连续性特征显著的短历时降水(如日、小时尺度等),融合过程中各种降水数据的有雨无雨状态信息相互干扰,难以有效改善雨区空间位置和范围的辨识效果,从而影响降水频率分析,并增大枯水流量模拟预报的不确定性。近年来,学界针对该问题开展了有益的探索。如Cornes等[17]以0和1分别表示有雨和无雨,采用薄板样条插值方法将站点观测降水的状态变量插值到各栅格,以降水概率阈值0.5判断每个栅格的有雨无雨状态,该方法虽有一定效果,但未考虑降水概率阈值在不同地理气候区、不同日期的动态变化；Zhang等[18]构建了具有有雨无雨状态辨识和降水量回归功能的双层机器学习模型,将多种卫星反演降水和站网插值降水进行融合,有效订正了卫星反演降水的分类误差；Xiao等[19]以ERA5数据集中植被、土壤水、气温、蒸散发等为解释变量,采用人工神经网络构建了有雨无雨辨识模型,并将其与分位数映射法耦合构建了融合模型,也显著提高了分类辨识精度。显然,考虑有雨无雨辨识有助于提高降水融合精度,但集分类辨识与定量估计于一体的融合方法仍存在较大探索空间,新方法研究对于推动降水融合进步具有积极意义。

本文提出考虑有雨无雨辨识的多源降水融合框架,采用地理加权逻辑回归与地理加权回归方法分别构建降水概率估计模型和降水融合模型,提出一种新型多源降水融合方法；应用该方法开展汉江流域遥感反演和地面观测日降水融合研究,综合总体精度、不同季节、不同子流域及不同强度的降水估计效果,验证所提方法的有效性。

1 研究方法

1.1 考虑有雨无雨辨识的多源降水融合框架

多源降水融合框架包括有雨无雨状态辨识、多源降水融合及降水融合结果修正3个环节：

(1) 有雨无雨状态辨识。提取地面站点观测数据中隐含的有雨无雨状态,构建降水概率估计模型,以地面站点状态的正确辨识率最高为目标优选降水概率阈值,由此辨识各栅格降水状态。

(2) 多源降水融合。构建集成地面观测、遥感反演和再分析等数据及辅助信息的多源降水融合模型,估计各栅格降水量。

(3) 降水融合结果修正。各栅格有雨无雨状态与降水量估计值对应相乘,将无雨区降水量修正为0,得到各栅格的最终降水融合结果。

该框架内降水概率估计与降水融合模型的构建是核心,可选用克里金插值、地理加权回归、广义可加、贝叶斯最大熵、机器学习等模型,演化出不同融合方法,具有较强灵活性。

1.2 基于地理加权逻辑回归与地理加权回归的多源降水融合方法

地理加权回归(Geographically weighted regression,GWR)是一种典型的局部多元回归分析方法,通过计算邻近点空间权重和局部回归系数,综合考虑了因变量空间自相关和因变量与解释变量互相关性,可有效刻画因变量空间异质性[20]。Chao等[21]和Chen等[22]基于GWR构建了地面观测和遥感反演降水融合模型,取得了不错的降水估计效果。本文也应用该方法构建多源降水融合模型,采用集局部回归与逻辑回归于一体的地理加权逻辑回归(Geographically weighted logistic regression,GWLR)模型[23]实现有雨无雨辨识,估计降水概率。由此,提出联合GWLR和GWR的降水融合方法,记为M- GWLR- GWR(Precipitation merging method based on GWLR and GWR)。M- GWLR- GWR属于第1类降水融合方法,具体融合思路如下：首先在站点位置上,构建集成地理信息、遥感反演降水、再分析降水的多源融合模型,即GWLR和GWR；在此基础上,将模型超参数(即最优空间邻域带宽)移用至各栅格,建立各栅格降水概率估计与多源融合模型；最后结合有雨无雨状态修正降水融合结果。

(1) 数据预处理。确定降水估计的目标分辨率,协调站点与栅格降水的时间分辨率、不同栅格降水产品的空间分辨率。准备地面站点与待估计栅格的经纬度、高程及其他辅助信息。

(2) 栅格降水概率估计。选取判断有雨无雨状态的降水量阈值(T),若观测降水量大于等于T,则表示有雨,记降水状态变量Io=1,反之表示无雨,记Io=0。以地面站点有雨无雨状态为因变量,在优选站点地理信息解释变量组合的基础上,在站点尺度构建基于GWLR的降水概率估计模型(式(1))[23],优化确定最佳邻域带宽(q1- best)。迁移应用该带宽,推求各栅格降水概率估计模型参数,计算各站点和栅格的降水概率估计值。

(1)

式中：p(i)为i点(站点或栅格,坐标为xi,yi)处降水概率,当i点为站点时,结果记为pm- gauge,当i点为栅格时,结果记为pm- grid；βi0为常数项参数；Gk(i)为i点处第k个地理因子(坐标、高程、坡度、坡向等,k=1,2,…,K1);βik(xi,yi)为相应回归参数。

(3) 栅格降水状态辨识。初始化降水概率阈值为Cpop0,据式(2)判断地面站点降水状态(Im- gauge),以所有站点有雨无雨状态的正确辨识率(R)最高为目标函数,采用SCE- UA求解最优降水概率阈值(Cpop- best),由此辨识各栅格有雨无雨状态。

(2)

(3)

式中：Im- gauge为基于降水概率估计模型与降水概率阈值判断的站点有雨无雨状态；n0为无雨站点的正确辨识数量；n1为有雨站点的正确辨识数量；n为研究区地面观测站点总数；R为正确辨识率评分。

(4) 多源降水信息融合。利用地面观测、遥感反演和再分析产品在站点位置的观测或估计降水量及相关辅助信息,在站点位置构建基于GWR的多源信息融合模型(式(4)),优化最佳邻域带宽(q2- best),迁移应用该带宽推求各栅格融合模型参数,计算各栅格降水融合结果。

(4)

式中：Pm(i)为i点(坐标为xi,yi)处降水融合结果,mm,当i点为站点时,融合结果记为Pm- gauge,当i点为栅格时,融合结果记为Pm- grid；γi0为常数项参数；Wk(i)为i点处第k个地理因子(k=1,2,…,K2);γik(xi,yi)为相应回归参数；Sl(i)为第l种栅格降水产品(卫星反演、再分析等,l=1,2,…,L)在i点处的降水量估计值,mm;γil(xi,yi)为相应回归参数。

(5) 降水融合结果修正。针对各栅格,采用Pm- cor=Im- gridPm- grid修正降水融合结果,检测是否存在Pm- cor与Im- grid不一致的栅格。若存在,针对不一致栅格,搜索满足“Im- grid=1且Pm- cor≥T”或“Im- grid=0且Pm- cor

针对研究时期内每一个时段,重复上述步骤(2)—(5),实现降水概率阈值及最佳邻域带宽的动态估计,得到研究区各时段栅格降水量空间分布估计结果。M- GWLR- GWR方法适用于集成遥感反演、再分析与地面观测降水及相关辅助地理信息的降水空间分布精准估计。需要说明的是,该方法并不局限于液态降水。由于近年来遥感反演算法、再分析数值模式的进步,相关数据产品已经包含降水相态分类(液态和固态)[24- 25],提供了降雪定量估计结果,本文方法也是多源降雪信息融合的一种新途径。

2 研究区试验方案

2.1 研究区与数据

汉江是长江中游左岸的最大支流,干流流经陕西、湖北两省,全长1 577 km,流域范围介于106°15′E—114°20′E、30°10′N—34°20′N之间,总面积约15.9万km2(图1)。地势复杂,呈西高东低态势。流域地处东亚副热带季风气候区,多年平均降水量约900 mm,时空分布不均,年降水量呈南岸大于北岸,上游、下游大,中游小的分布特征,且全年70%～80%的雨量集中于汛期(5—10月)。结合地理气候特点,全流域分为丹江口以上(Ⅰ)、唐白河(Ⅱ)和丹江口以下(Ⅲ)3个子流域。

图1 汉江流域地形、水系及降水地面观测站Fig.1 Topography,river,and precipitation gauges locations over the Han River basin

所用栅格降水为MSWEP(Multi- Source Weighted- Ensemble Precipitation Version),是美国普林斯顿大学采用加权算法集成4种未经校正的卫星反演降水(TMPA 3B42RT、CMORPH、GSMaP、GridSat)、2种再分析降水(EAR- interim、JRA- 55)和全球约77 000个雨量计观测降水形成的首个覆盖全球、横跨1979—2021年的高分辨率(0.1°×0.1°,3 h)降水数据集,详细研制算法见文献[26]。降水数据为MSWEP V2.1的3 h数据(http:∥www.gloh2o.org/),时间范围为2010—2016年。地面站网观测降水数据为从国家气象科学数据中心和长江流域水文年鉴收集的56个气象站与16个雨量站2010—2016年逐日降水量。经分析,MSWEP V2.1已集成了气象站网中安康、汉中、老哈河、房县和枣阳5站观测降水,为确保MSWEP V2.1与地面观测信息相互独立,地面观测数据中该5站数据予以去除。因此,全流域共67个地面站点,其中,丹江口以上流域(Ⅰ)43个、唐白河流域(Ⅱ)7个、丹江口以下流域(Ⅲ)17个。

2.2 降水融合试验方案

降水融合试验的空间分辨率取0.1°×0.1°,时间分辨率为日,时间范围为2010—2016年。融合源数据为MSWEP V2.1和地面站点观测降水,前者采用UTC时间,沿时程累加得到日降水,其对应北京时间为08:00至翌日08:00,将气象站北京时间08:00—20:00、20:00—08:00两时段降水求和得到日降水,从而与雨量站观测日降水统计时段保持一致。采用K- Means聚类方法将地面站点划分为空间均匀分布的4组试验站网,采用4折交叉验证的方式开展降水融合试验(图2)。

图2 降水融合试验的地面观测站网分布Fig.2 Distribution of gauges networks for precipitation fusion experiment over the Han River basin

以传统基于GWR的降水融合方法(记为M- GWR)作为对比,阐明考虑有雨无雨辨识对降水融合精度的影响。另外,还采用GWLR- GWR方法,仅利用地理信息,开展降水空间插值,记作I- GWLR- GWR,与M- GWLR- GWR对比分析引入MSWEP V2.1的作用。所有降水融合与空间插值方法的地理因子均考虑经纬度坐标(XY)、经纬度坐标+高程(XYH)2种情形,阐明高程对降水估计精度的影响；经分析2种解释变量组合的方差膨胀因子较低,共线性问题对模型参数估计的影响较小。本文GWLR与GWR模型采用自适应带宽,权函数取bi- square,以留一交叉验证均方误差最小为目标[20],采用黄金分割法优选空间邻域带宽。降水融合模型构建通过编写Matlab代码实现。

2.3 降水融合精度及增益评价方法

本文在站点位置上以观测降水为真值,采用分类和连续性2类指标评价降水融合精度。分类指标包括探测率(Probability of detection,DPO)、误报率(False Alarm Ratio,RFA)和临界成功指数(Critical Success Index,ICS),有雨无雨阈值取T=0.1mm/d。连续性指标包括绝对平均误差(Mean absolute error,EMA)和相关系数(Correlation Coefficient,CC)。此外,还采用综合反映融合数据与观测数据的偏差、离散程度差异和相关系数的Kling- Gupta 效率评价,其中偏差用均值比(α)表示,离散程度差异用变差系数比(β)表示,确保α与β独立(式(5)—式(7))[27],Kling- Gupta效率系数用EKG表示。此外,为重点分析考虑有雨无雨辨识的影响,根据降水状态分类结果,将总误差(Total Bias,BT)分解为击中误差(Hit Bias,BH)、漏报降水量(Missed Precipitation,PM)和误报降水量(False Precipitation,PF)(式(8)—式(9)),评价不同性质误差的变化。

(5)

α=μm/μo

(6)

β=(σm/μm)/(σo/μo)

(7)

BT=BH+PM+PF

(8)

(9)

式中：Pm- gauge,i、Po,i分别为第i个站点位置处降水融合数据和观测降水；μm、σm分别为降水融合数据的均值和标准差；μo、σo分别为观测降水的均值和标准差；H为击中事件(估计有雨且实测有雨)的数量;BH为击中事件的累积误差；M为漏报事件(估计无雨而实测有雨)的数量；PM为漏报事件的累积降水量；F为误报事件(估计有雨而实测无雨)的数量；PF为误报事件的累积降水量。

评价融合增益是衡量降水融合方法有效性的重要内容。本文以降水融合精度较参考数据精度的相对改善程度作为融合增益,参考数据包括MSWEP V2.1和降水空间插值数据(插值与融合方法对应)。以前者为参考,分析降水融合改善遥感反演降水精度的效果；以后者为参考,研究遥感反演降水捕捉空间分布格局方面的优势以及对于提高降水估计精度的作用。本文将精度评价指标按取值大小与表征精度是否更高的对应关系,划分为正向型(指标值越大,精度越高)、逆向型(指标值越小,精度越高)和中间值最优型(指标值越靠近中间最优值,精度越高)3类指标,提出针对各类指标融合增益评价的通用公式,见表1。对于中间最优值型指标,ɑ和β的最优值为1,BT和BH最优值为0。

表1 多源降水融合增益评价的通用公式

3 结果与讨论

本文涉及地面站点观测、MSWEP V2.1、M- GWR(XY)、M- GWR(XYH)、I- GWLR- GWR(XY)、I- GWLR- GWR(XYH)、M- GWLR- GWR(XY)和M- GWLR- GWR(XYH)共8种方式估计汉江流域降水空间分布。通过降水空间分布估计结果对比、本文方法与传统融合方法对比、本文方法融合结果与参考降水对比,综合阐明所提方法的有效性。

3.1 降水空间分布估计结果

图3和图4分别给出了8种方式估计汉江流域日平均降水量和典型日期(2016年9月25日)降水量的空间分布图。由图3可知,汉江流域日平均降水量呈现东南、南部和西部高,东北部低的总体特征。MSWEP V2.1 (图3(b))低估了东南部和西部降水；传统融合方法(图3(c)和图3(d))较好刻画了降水量高值区空间格局,但略微高估了东北部低值区降水量；M- GWLR- GWR方法(图3(f)和图3(h))则较好呈现了高值区与低值区降水空间分布,与空间插值方法(图3(e)和图3(g))相比,改善了低估东南部和南部降水的不足。由图4可知,该日降水主要发生在流域中部,降水中心位于唐白河流域东部和丹江口以上流域南部。MSWEP V2.1(图4(b))仅捕捉了唐白河流域降水中心；传统融合方法(图4(c)和图4(d))虽能捕捉2个中心,但在西北和东南部存在大量误报现象；空间插值方法(图4(e)和图4(g))较好描述了雨区范围,但明显低估了降水中心雨量；而本文方法(图4(f)和图4(h))则兼顾了有雨无雨格局与降水中心,较好刻画了日降水量空间分布。

图3 汉江流域日平均降水量空间分布Fig.3 Spatial distribution of mean daily precipitation over the Han River basin

图4 汉江流域2016年9月25日降水量空间分布Fig.4 Spatial distribution of precipitation over the Han River basin on September 25,2016

3.2 与传统降水融合方法的比较

从总体精度、不同季节、不同子流域及不同强度日降水估计精度4个方面,对比M- GWLR- GWR与传统M- GWR方法的优劣。受日降水随机性强及空间变异性复杂的影响,常出现部分站点降水估计精度为离群值,为减弱其对平均估计效果分析的影响,以中位数代替算数平均值。表2给出了不同融合方法估计汉江流域各站点日降水精度的中位数。由表可知,在分类精度方面,较传统方法,M- GWLR- GWR的探测率有所减小,误报率降低至0.1附近,ICS提升至近0.7。相应地,误报降水量得到了显著压缩,击中误差也有所减小,但漏报降水量绝对值明显增大,使总误差由高估转为低估,且绝对值也大幅增加。在连续性精度方面,M- GWLR- GWR的CC略小于M- GWR,但前者估计日降水序列的变差系数更接近地面观测,EKG也小幅升高。对于2种融合方法,在解释变量中引入高程因子对各指标的影响总体较小,可能原因是日尺度降水的强随机性影响了降水—高程相关关系的稳健性。

表2 M- GWLR- GWR与M- GWR方法估计汉江流域各站点日降水精度的中位数

图5对比了2种融合方法对不同季节日降水的估计精度。在分类辨识方面(图5(a)—图5(c)),与M- GWR相比,M- GWLR- GWR显著降低RFA的同时,缩小了四季的差异,虽引起DPO中位数下降,但各季节ICS均有所升高。这是由于地面站点分布稀疏不均,依据地面观测降水状态识别的有雨无雨分界线与真实边界仍存在偏差,使漏报区域增大,导致较传统方法减小了探测率。但结合3个分类精度指标的数量关系[28],可知本文方法改善RFA的正面效益超过了对DPO的负面影响。从季节分布看,ICS呈现春秋高于夏冬的特征,M- GWLR- GWR使分类指标的冬季变幅趋于扩大,即增加了空间差异性。在不同误差组分方面(图5(d)—图5(f)),M- GWLR- GWR降低了四季的PF,增大了PM绝对值,BH变化不大；受夏季降水量较大的影响,PF中位数和变幅的改善效果优于其他季节,而PM则相反。从连续性精度来看(图5(g)—图5(i)),M- GWR与M- GWLR- GWR方法的CC相差不大,但后者在四季均倾向于降低EMA,EKG均得到了小幅提升。

图5 M- GWLR- GWR与M- GWR方法估计不同季节日降水的精度指标箱线图Fig.5 Boxplots of metrics of M- GWLR- GWR and M- GWR for estimating daily precipitation in different seasons

图6对比了2种融合方法对不同子流域站点日降水的估计精度。由图可知,相比于M- GWR,M- GWLR- GWR使各子流域的RFA均得到了大幅削减,有效改善了ICS,指标变幅在子流域间无显著差异。与分类指标对应,子流域的PF中位数及变幅也有明显压缩,而PM中则明显增大,BH变化相对较小。对于连续性精度,M- GWLR- GWR小幅削减了EMA,虽然CC略有恶化,但各子流域EKG中位数较M- GWR均有所增大,其中唐白河流域的改善效益相对突出,但站点差异性趋于扩大。

图6 M- GWLR- GWR与M- GWR方法对不同子流域站点日降水的估计精度指标箱线图Fig.6 Boxplots of metrics of M- GWLR- GWR and M- GWR for estimating daily precipitation at gauges over sub- basins

图7进一步对比了2种融合方法对不同日降水强度(Precipitation intensities,IP)的估计精度。由图可知,随雨强增大,M- GWLR- GWR较M- GWR降低DPO、压缩RFA、增大ICS的效果趋于减小；M- GWR的RFA随雨强增大而先减后增,而M- GWLR- GWR显著减少了小雨误报事件,使RFA呈现随雨强增大而增加的趋势。对于不同误差组分,在降水强度和分类精度的综合影响下,M- GWLR- GWR较M- GWR削减PF和增大PM的幅度随雨强增大而减小,而BH绝对值的减小幅度先增后减；PM对雨强变化的响应规律发生了改变,M- GWR的PM绝对值先增后减,而M- GWLR- GWR则随雨强增大而减小,这与小雨情形下DPO有所降低相对应。

图7 M- GWLR- GWR与M- GWR方法对不同强度日降水的估计精度Fig.7 Performance of daily precipitation estimation with different intensities derived from M- GWLR- GWR and M- GWR

3.3 较参考数据的降水融合精度增益

表3给出了M- GWLR- GWR方法估计汉江流域各站点日降水精度增益的中位数。由表可知,所提方法有效改善了MSWEP V2.1精度,各项指标增益全部超过了10%,特别是RFA和PF增益超过了60%,综合精度ICS和EKG改善幅度分别高于40%和100%。由于插值降水精度总体高于MSWEP V2.1,以插值降水为参考的降水融合精度增益总体小于以MSWEP V2.1为参考的分析结果,降水融合对分类精度的影响十分微弱,订正BT、BH和PF的效益均高于15%,CC、α、β和EKG也得到了不同程度的改善,特别是综合精度EKG提高了10%以上,高程因素的影响相对较弱。

表3 M- GWLR- GWR方法估计汉江流域各站点日降水精度增益的中位数

图8给出了M- GWLR- GWR方法估计不同季节日降水的精度增益箱线图。以MSWEP V2.1为参考,所提方法使ΔRFA和ΔPF中位数分别高于40%和70%,冬季略小于其他季节；对于DPO和PM,除夏季有负面影响外,在春、秋、冬三季,2个指标改善效益的中位数分别不低于10%和60%；四季ΔICS中位数均在25%以上,夏季略低于其他季节。连续性精度也得到了有效改善,ΔEMA与ΔCC中位数全部高于40%,而对于EKG,则各季节均有半数以上站点的增幅超过了1倍,总体上连续性精度增益的季节性特征不显著。以插值降水为参考,ΔRFA中位数介于2%～7%,ΔPF中位数不低于10%,且冬季最小；ΔBH中位数均大于0,并在夏季达到20%以上；ΔDPO、ΔPM和ΔICS中位数接近于0。连续性精度方面,春、夏、秋三季的ΔEMA箱体整体高于0,在冬季也有超过50%站点的误差得到订正,ΔCC和ΔEKG中位数分别介于2%～8%与2%～15%,且夏季高于其他季节。引入高程除对指标增益的变幅略有影响外,其中位数与不考虑高程的情形基本一致。

图8 M- GWLR- GWR方法估计不同季节日降水的精度增益箱线图Fig.8 Boxplots of metrics gains of M- GWLR- GWR for estimating daily precipitation in different seasons

图9为M- GWLR- GWR方法估计不同子流域站点日降水的精度增益箱线图。较MSWEP V2.1,各子流域ΔRFA、ΔICS和ΔPF的箱体整体高于0,并且中位数分别超过了60%、30%和80%；ΔBH中位数高于60%,但考虑高程使唐白河流域部分站点ΔBH小于0；DPO和PM增益相对较小,并且3个子流域均存在部分站点的精度有所恶化。就连续性精度而言,ΔEMA、ΔCC和ΔEKG的中位数分别超过了50%、40%和90%,特别是丹江口以下流域约50%站点的综合精度EKG得到了巨幅提升。总体上,唐白河流域DPO、BH、PM精度增益低于另外2个子流域,而RFA、ICS、EMA精度增益恰好相反,这主要与参考数据MSWEP V2.1的相关精度指标在不同子流域的空间分异特征有关。较插值降水,降水融合数据的PF、BH、EMA和EKG改善效益相对较高,中位数分别超过了20%、7%、8%和10%,ΔRFA、ΔDPO、ΔICS、ΔPM和ΔCC相对较小；总体上各指标增益在不同子流域间无明显差别,但受地势平坦、降水与高程相关性较弱等影响,引入高程因子使唐白河流域部分站点BH大幅增加,ΔBH中位数由33%降至7%。

图9 M- GWLR- GWR方法估计不同子流域站点日降水的精度增益箱线图Fig.9 Boxplots of metrics gains of M- GWLR- GWR for estimating daily precipitation at gauges over sub- basins

图10分析了M- GWLR- GWR方法估计不同强度日降水的精度增益。以MSWEP V2.1为参考,除BH外,各指标在不同雨强条件下均有所改善,ΔDPO和ΔICS随雨强增大而升高,ΔRFA和ΔPF则先减后增。值得注意的是,本文方法使强降水事件(IP≥50 mm/d)的综合分类精度ICS提高了3倍,大幅降低了PM和PF,但增大了BH,这与漏报降水事件转为击中降水事件有关。对于插值降水,除PF外,各指标增益总体大于0,ΔDPO、ΔICS和ΔPM随雨强增大而增加,ΔBH、ΔPF则相反；同样地,强降水事件捕捉能力ICS提升幅度超过60%,但PF有所增大。这主要是由于遥感反演产品通常低估强降水,与地面观测融合总体使强降水区域的降水估计值增大,从而减少了漏报事件数量、增加了击中事件数量,但真实强降水区域边界处雨量站分布不均可能使降水融合数据的强降水区略大,从而增加了误报事件数量和误报降水量。

图10 M- GWLR- GWR方法估计不同强度日降水的精度增益Fig.10 Metrics benefits of M- GWLR- GWR for daily precipitation estimates with different intensities

4 结论

本文基于地理加权逻辑回归与地理加权回归模型,构建了考虑有雨无雨辨识的多源降水融合方法,选择汉江流域,开展了MSWEP V2.1与地面观测日降水融合试验,综合对比了本文方法与传统方法的优缺点,量化了较遥感反演降水数据及降水空间插值数据的统计精度增益。主要结论如下：

(1) 与传统方法相比,本文方法有效刻画了有雨无雨空间分布及降水中心的位置,大幅减小了误报率及误报降水量,临界成功指数和Kling- Gupta效率系数均有所提高,并且改善效果在夏季、小雨情形下更显著。引入高程对降水融合精度影响较弱。

(2) 较MSWEP V2.1数据,本文方法改善误报率和误报降水量增益的中位数高于60%,提高综合精度EKG幅度超过100%。在夏季唐白河流域,探测率和漏报降水量等指标增益相对较低。降水融合使强降水(IP≥50 mm/d)事件的捕捉能力提高了3倍,并降低了漏报和误报降水量。

(3) 较降水空间插值数据,本文方法降低误报降水量和提高Kling- Gupta效率系数的幅度超过了10%,夏季Kling- Gupta效率系数的增益高于其他季节。此外,降水分类辨识性能的改善幅度随雨强增大而升高,提高强降水事件辨识精度的幅度高于60%。

本文给出了考虑有雨无雨辨识的多源降水融合框架的一种实现方式,纳入其他空间估计模型而演化出的不同融合方法是否更优值得继续探讨。所提方法与雨量站网的关联性较强,在不同站网密度及分布模式下,对于日及日以下尺度短历时降水的降水融合性能还需更多实例分析加以验证；特别对于小时甚至更短时间分辨率的降水空间估计,还可考虑引入卫星云图、雷达回波图像等信息,进一步提高雨区边界的辨识精度。另外,CTC(Categorical triple collocation)作为不依托地面观测信息的代表性融合方法[29],已在提升有雨无雨辨识技巧方面展示了较好的潜力。今后对比不同方法的优劣,并考虑综合集成是重要的探索方向。