APP下载

新疆天山山区TRMM卫星降水数据的精度检验和校正方法研究

2017-12-18何祺胜任伟伟

水土保持研究 2017年6期
关键词:天山降水量山区

李 慧, 杨 涛, 何祺胜, 任伟伟

(1.荒漠与绿洲生态国家重点实验室, 中国科学院 新疆生态与地理研究所, 乌鲁木齐830011;2.河海大学 水文水资源与水利工程科学国家重点实验室, 南京210098;3.河海大学 地球科学与工程学院, 南京210098; 4.中国科学院大学, 北京 100101)

新疆天山山区TRMM卫星降水数据的精度检验和校正方法研究

李 慧1,4, 杨 涛1,2, 何祺胜3, 任伟伟1,4

(1.荒漠与绿洲生态国家重点实验室, 中国科学院 新疆生态与地理研究所, 乌鲁木齐830011;2.河海大学 水文水资源与水利工程科学国家重点实验室, 南京210098;3.河海大学 地球科学与工程学院, 南京210098; 4.中国科学院大学, 北京 100101)

在降水资料缺乏的天山山区,基于重建时间序列后的NDVI和DEM数据,采用CART算法对TRMM3B43月降水数据进行校正。利用研究区25个站点实测降水量对校正前的TRMM降水数据和校正后的TRMM降水数据分别进行精度检验。结果表明:校正前TRMM月降水与站点实测降水有很好的一致性,存在显著的线性相关关系,但误差较大;TRMM降水与实测降水的决定系数(R2)随时间尺度的增大而减小,相对误差(δ)和均方根误差(RMSE)则随之增大,说明TRMM遥感数据的精度随时间尺度的增加而减小;校正后TRMM降水精度得到了显著地提高,与实测降水在月、季、年尺度上的R2分别为:0.97,0.87,0.83,相比校正前R2提高了10%以上,误差也有明显的减小。这说明在天山山区,使用CART对TRMM降水数据进行校正的方法可行。

天山山区; TRMM; 校正; CART; 精度检验

降水作为地球水循环的主要驱动因子,不仅影响着一个地区或流域的水分和热量状况,也是全球水热循环的推动力之一[1]。准确的降水空间分布数据,理论上可由高密度分布的站点通过雨量计测量的方法采集获得[2],但在气象站分布稀少的西部山区,可利用的观测数据有限,所以有关山区局地降水分布的研究相对较少,若能充分利用遥感数据产品,则在大面积的空间范围上为降水的时空特征研究提供了有利支持[3]。1997年美国NASA(National Aeronautical and Space Administration)和日本NASDA(National Space Development Agency)联合发射了热带降水测量TRMM(Tropical Rainfall Measuring Mission)卫星,它的主要任务是观测热带和亚热带地区降水特征及能量交换。TRMM卫星可向陆地发回多种时间和空间分辨率的探测数据,这为分析降水、闪电、云量等天气现象提供了最详细最直接的信息[4-5],也使确定降水的空间分布成为可能。TRMM卫星降水资料在热带湿润地区有大量应用,但要将其用于我国西北干旱半干旱地区,还需要进一步校正处理[6],提高该降水数据的精度。

针对TRMM 数据的校正,目前主要方法是传统的统计分析方法,如回归分析等。在回归分析中,当自变量间存在共线性时,会影响回归系数的正确估计,致使1个变量的作用会掩盖另1个的变量作用。决策树模型可有效避免此类问题,它作为数据挖掘中的一种分类技术,它在根据各个属性变量将数据集进行分类时,可以提取一系列的分类规则,这些规则中所包含的变量就可能是影响因素。CART是决策树中比较经典的算法,相比其他的决策树,CART算法的优点是它使用二元分支,能够充分用到全部数据;还可以处理孤立点,将孤立点变成单独的节点,这样不会影响下一步分裂;并且CART算法能够处理空缺值,可在一定程度上减小信息的偏差;CART算法应用已经非常广泛[7]。

植被是联结土壤、大气和水分的自然“纽带”,在全球变化研究中起到“指示器”作用[8]。因此有文献指出,在分析研究区域降水时,将植被作为一个因子进行考虑,并建立了TRMM降水数据与植被指数NDVI的模型[9-11]。但是已有研究表明,利用MODIS,AVHRR和SPOT4/VEGETATION等中低分辨率的传感器进行观测时,太阳光照角度、观测视角以及云的条件随时间变化都很大,因此得到的观测值是来自地表的双向反射率信息,包含很多不可预测的噪音,严重影响了土地覆被和陆地生态系统的变化监测结果[12]。因此,为了真实地反映出全球气候变化下植被的动态响应,有必要对NDVI 时间序列进行重建,即通过一系列预处理方法降低遥感NDVI 合成数据中的噪声水平[13]。简单的方法是取一旬之中NDVI 最大值作为这个期间的NDVI值,由此来减少云的干扰,这种方法叫做最大值合成法(MVC),然而,如果一旬时间内所有图像都有云的话,就无法得到该旬无云图像。因此,仅仅使用最大值合成法是不够的,还必须在最大值合成后做进一步的处理,本文运用基于傅立叶变换的HANTS算法来实现NDVI数据时间序列的重建[14]。

1 研究区概况及数据

1.1 研究区概况

天山山区位于39°—45.5°N,73°—96°E,地处欧亚大陆腹地,既有中温带大陆干旱气候特点,又有垂直气候特征,属于典型的大陆型气候。天山山区降水分布不均,时间和空间差异悬殊,夏季降水量大,而冬季降水量较小,山区降水量丰富,自西向东呈逐渐减少的趋势,北坡的降水明显多于南坡。天山北坡多年平均降水量可达500~700 mm,而且在西部个别迎风坡年降水量多达1 000 mm,这种条件形成了西北干旱区的“湿岛”景观[15]。有研究显示,天山山区的中山带海拔3 000 m左右是降水量最大的地区,并且天山山区孕育了全疆65%的河流,其径流量占总流量的54%[16]。天山山区植被结构复杂,生态环境多样性强,主要以草地覆盖为主,森林带上限多处于低处,林相稀疏。因此在分析本研究区域降水时,将植被作为一个因子进行考虑。

1.2 数据来源

本研究选用的数据产品包括TRMM3B43卫星雷达降水数据、植被指数NDVI数据、DEM(数字高程模型)数据和25个气象台站降水数据。

TRMM降水数据由美国航空航天局NASA (http:∥trmm.gsfc.nasa.gov/)提供,其中3B43数据为综合降水数据产品,空间分辨率0.25°×0.25°,时间间隔为1个月;植被指数NDVI数据由美国NASA全球监测与模型研究组发布,空间分辨率为1 km×1 km;DEM数据由NASA 提供,空间分辨率为90 m×90 m;天山山区25个气象台站的月降水资料由中国气象局国家气候中心提供,具体位置及海拔信息见表1。以上所有数据的时间均选取2000年1月—2014年12月。

1.3 数据预处理

TRMM3B43数据为NC格式,利用MATLAB软件批处理为文本格式;NDVI数据为HDF格式,在ENVI中对其进行拼接、投影、裁剪等处理从而得到研究区NDVI数据,为进一步消除云、大气、太阳高度角等影响,保证NDVI反映的是年地表植被覆盖状况[10],本文用HANTS变换对NDVI进行了处理,得到研究区重建时间序列的NDVI数据;利用DEM数据,基于ArcGIS将其分辨率重采样为1 km后提取研究区的坡度和坡向。

表1 天山山区气象站点信息

2 研究方法

2.1 校正方法

本文将采用决策树中CART算法对TRMM降水数据进行校正。基本思想为[17]:从顶结点开始,CART在每一结点选取最优变量的最优分化,形成一颗大树。然后修剪这一颗大树获得一系列子树,并从中挑选出真误差率的估计值为最小的子树。最后根据这颗树对客体进行预测。通常,即使学习集很大,即学习集包含许多客体,并且每一客体有许多变量的测量值,CART树的大小仍会比较适中。因为在很多情况下,一小部分变量即包含了绝大部份的预测信息,CART树利用这些变量即可设法捕获绝大部分的预测信息。

本文基于MATLAB平台,使用CART算法校正时,输入的变量为:TRMM数据、坡度、坡向、经度、纬度、海拔和重建时间序列后的NDVI。期望输出为实测降水量,实际输出即为校正后的TRMM降水量。

2.2 精度检验

通过25个气象站点的实测降水数据对TRMM和校正后的TRMM数据进行检验,采用以下3个指标验证:

决定系数(R2)

相对误差(δ)

均方根误差(RMSE)

3 结果与分析

以25个站点的实测降水数据为准,分别从月、季、年时间尺度分析TRMM降水数据精度,并通过CART算法对TRMM降水数据进行校正,比较校正前后的精度差异。

3.1 校正前精度检验

(1) 月尺度。将天山山区2000—2014年25个站点的实测降水数据作为降水量的“真实值”,以各雨量站15 a月降水量为自变量,以与其对应的TRMM3B43月降水量为因变量做散点图(图1)进行一元线性回归分析,并将两组数据做成多年平均月降水的时间序列图(图2)。

图1给出了TRMM 降水数据和地面雨量站2000—2014年各月降水量的散点分布一元线性回归方程。经过检验,R2=0.87,δ=22.40%,RMSE=3.89 mm,可以看出TRMM月降水数据与实测数据之间存在显著的线性相关性,但误差较大。

图1TRMM降水数据与实测月降水数据散点图

图2中,2000—2014年TRMM月降水数据与站点实测的多年平均月降水数据的总体变化趋势是一致的。经计算,TRMM降水数据普遍高于实测降水数据,尤其是降水量较少的1—3月、11月、12月,TRMM降水数据比实测降水数据分别高:3.47 mm,3.14 mm,1.91 mm,3.73 mm和3.54 mm,而在降水量相对较多的4月,5月,9月,10月,TRMM降水略低于实测降水。

图2TRMM降水数据与实测月降水数据时间序列

(2) 季尺度。将TRMM 降水数据与站点实测降水的数据按季节划分(春季:3—5月,夏季:6—8月,秋季:9—11月,冬季:12—2月),整理为季平均降水数据,并对各季节的降水数据分别做散点图(图3)和时间序列图(图4)。

图3TRMM降水数据与实测季降水数据散点图

在图3中春、夏、秋、冬四季的R2分别为0.71,0.80,0.67,0.61,经计算,δ分别为13.23%,10.57%,13.54%和62.62%,RMSE分别为6.08 mm,9.19 mm,5.77 mm和10.82 mm。说明夏季相关性最好,冬季相关性最差且误差较大。

从图5中可以看出,春夏秋冬四季的TRMM降水与实测降水变化趋势基本保持一致,其中夏季和冬季降水的变化趋势的一致性优于春季和秋季,但夏季和冬季TRMM降水明显高于实测降水,尤其冬季差值较大,平均高10.25 mm。

(3) 年尺度。将TRMM 降水数据与站点实测降水的数据统计为年降水数据,分别做散点图(图5)和时间序列图(图6),在年时间尺度上对TRMM降水的精度进行对比。

图5中,TRMM多年平均降水数据与实测值的R2=0.70,δ=44.23%,RMSE=26.5 mm,可以看出,TRMM年降水数据与雨量站观测数据之间存在线性相关性,但误差较大。从图6中可以看出,2000—2014年,TRMM年均降水数据与实测降水量总体变化趋势还是一致的,但同一年份降水量差异较大,除2001年TRMM年均降水比站点实测降水低9.3 mm外,其余年份均为TRMM降水数据高,且平均高24.73 mm。

图4TRMM降水数据与实测季降水数据时间序列

从研究区的月、季、年尺度上可以看出,TRMM降水与站点实测的降水都有很好的一致性,可以大致反映天山山区降水的分布特征。但大多数情况下,尤其是降水较少的月份,TRMM降水产品高估了实际降水,并且TRMM降水数据与实测降水数据的决定系数(R2)随时间尺度的增大而减小,相对误差(δ)和均方根误差(RMSE)则随之增大,说明TRMM遥感数据的精度随时间尺度的增加而减小。

3.2 校正后精度检验

以25个站点的实测降水数据为准,分别从月、季、年3个时间尺度对校正后的TRMM数据进行精度检验。

(1) 月尺度。提取每个站点对应位置校正后的TRMM月降水数据与实测月降水量分别构建一元线性回归模型(图7),并对两组数据做时间序列图(图8)。

图5TRMM降水数据与实测年降水数据散点图

在校正后的TRMM降水与实测月降水数据的一元线性回归分析(图7)中,R2=0.97,δ=9.47%,RMSE=1.85 mm。可以看出,校正后的TRMM降水数据与实测月降水数据拟合度很高,误差较小。

图6TRMM降水数据与实测年降水数据时间序列

图7校正后的TRMM降水数据与实测月降水数据散点图

图8中,校正后的TRMM月降水数据与站点实测多年平均月降水数据的总体变化趋势是一致的。经计算,校正后的TRMM月降水数据与实测降水数据的多年月平均差值为1.32 mm,在降水量较少、TRMM数据与实测降水数据误差较大的1—3月、11月,12月分别差0.74 mm,0.77 mm,0.99 mm,1.55 mm和0.97 mm。

图8校正后的TRMM降水数据与实测月降水数据时间序列

(2) 季尺度。将两组校正后的TRMM降水数据与站点实测降水数据整理为季降水数据,并对各季节的降水数据做散点图(图9)和时间序列图(图10)。

在图9中,春夏秋冬4个季节,校正后的TRMM降水数据与实测降水数据的R2分别为0.84,0.94,0.79,0.74,δ分别为6.87%,2.47%,11.02%,11.89%,RMSE分别为3.03 mm,2.58 mm,4.4 mm,2.41 mm。

图10显示,校正后的TRMM季降水数据更接近实测值,冬季的一致性更明显。经过计算可知,春夏秋冬4个季节校正后的TRMM降水与实测降水数据的平均差值分别为:2.67 mm,1.91 mm,3.78 mm和1.88 mm。

图9校正后的TRMM降水数据与实测季降水数据散点图

图10校正后的TRMM降水数据与实测季降水数据时间序列

(3) 年尺度。将校正后的TRMM降水数据与站点实测降水数据统计为年降水数据,分别做散点图(图11)和时间序列图(图12)。

图11校正后的TRMM降水数据与实测年降水数据散点图

图12校正后的TRMM降水数据与实测年降水数据时间序列

图11中,校正后的TRMM降水数据与实测年降水数据的R2=0.83,相关性相对于月和季尺度较小。δ=4.16%,RMSE=9.1 mm。从图12可以看出,校正后的TRMM年降水与站点实测降水有较好的一致性,但仍存在一定误差。计算得知,校正后的TRMM年降水数据比实测降水数据平均高6.23 mm,其中2006年,2011—2014年误差较大,分别高13.28 mm,10.25 mm,18.33 mm,13.06 mm和24.94 mm。

4 结 论

(1) 校正前,TRMM降水与站点实测降水有很好的一致性,TRMM月降水数据与实测值的决定系数(R2)为0.87,存在显著的线性相关关系,说明TRMM数据可以反映出研究区大致的降水情况。相对误差(δ)和均方根误差(RMSE)分别为22.40%和3.89 mm,说明TRMM降水与实测降水之间的误差较大。

(2) TRMM 数据与实测降水在月、季、年尺度上的决定系数(R2)分别为:0.87,0.75,0.70,随时间尺度的增大而减小,相对误差(δ)和均方根误差(RMSE)则随之增大,说明TRMM遥感数据的精度随时间尺度的增加而减小。这与王晓杰研究天山山区TRMM降水得到的结论一致。

(3) 校正后,降水量精度得到了显著地提高。校正后的降水量与实测值在月、季、年尺度上的决定系数(R2)分别为:0.97,0.87,0.83,相对误差(δ)分别为:9.47%,8.06%和4.16%,均方根误差(RMSE)分别为:1.85 mm,3.11 mm和9.1 mm。相比校正前R2提高了10%以上,误差也有明显的减小。说明基于重建时间序列的NDVI数据和利用DEM数据提取坡度、坡向对TRMM数据进行校正的方法可行。

[1] 刘奇,傅云飞.基于TRMM/TMI的亚洲夏季降水研究[J].中国科学D辑:地球科学,2007,37(1):111-122.

[2] 朱会义,贾绍凤.降雨信息空间插值的不确定性分析[J].地理科学进展,2004,23(2):34-42.

[3] 吴雪娇,杨梅学,吴洪波,等. TRMM多卫星降水数据在黑河流域的验证与应用[J].冰川冻土,2013,35(2):310-319.

[4] 穆振侠,姜卉芳,刘丰.基于TRMM/TMI与实测站点的降水垂直分布差异性探讨[J].干旱区研究,2010,27(4):515-521.

[5] 白爱娟,方建刚,张科翔. TRMM卫星资料对陕西及周边地区夏季降水的探测[J].灾害学,2008,23(2):41-45.

[6] 季漩,罗毅. TRMM降水数据在中天山区域的精度评估分析[J].干旱区地理,2013,26(2):253-262.

[7] 张松林. CART-分类与回归树方法介绍[J].火山地质与矿产,1997,18(1):67-75.

[8] 刘少华,严登华,史晓亮,等.中国植被NDVI与气候因子的年际变化及相关性研究[J].干旱区地理,2014,37(3):480-489.

[9] Immerzeel W W, Pellicciotti F, Shrestha A B. Glaciers as a proxy to quantify the spatial distribution of precipitation in the Hunza basin[J]. Mountain Research and development, 2012,32(1):30-38.

[10] 张晓.天山中段卫星降水数据的降尺度研究及时空特征分析[D].兰州:西北师范大学,2013.

[11] Jia S, Zhu W, LüA, et al. A statistical spatial downscaling algorithm of TRMM precipitation based on NDVI and DEM in the Qaidam Basin of China[J]. Remote Sensing of Environment, 2011,115(12):3069-3079.

[12] Cihlar J, Ly H, Li Z, et al. Multitemporal, multichannel AVHRR data sets for land biosphere studies: artifacts and corrections[J]. Remote Sensing of Environment, 1997,60(1):35-57.

[13] 顾娟,李新,黄春林. NDVI时间序列数据集重建方法述评[J].遥感技术与应用,2006,21(4):391-395.

[14] 王丹,姜小光,唐伶俐,等.利用时间序列傅里叶分析重构无云NDVI图像[J].国土资源遥感,2005,64(2):29-32.

[15] 蓝永超,吴素芬,钟英君,等.近50年来新疆天山山区水循环要素的变化特征与趋势[J].山地学报,2007,25(2):177-183.

[16] 蓝永超,吴素芬,韩萍,等.全球变暖情境下天山山区水循环要素变化的研究[J].干旱区资源与环境,2008,22(6):99-104.

[17] Rozante J R, Cavalcanti I F A. Regional Eta model experiments:SALLJEX and MCS development[J]. Journal of Geophysical Research:Atmospheres, 2008,113(D17):1-20.

ResearchonAccuracyValidationandCalibrationMethodsofTRMMinTianshanMountainsofXinjiang

LI Hui1,4, YANG Tao1,2, HE Qisheng3, REN Weiwei1,4

(1.StateKeyLaboratoryofOasisEcologyandDesertEnvironment,XinjiangInstituteofEcologyandGeography,CAS,Urumqi830011,China; 2.StateKeyLaboratoryofHydrologyWaterResourcesandHydraulicsEngineering,HohaiUniversity,Nanjing210098,China; 3.EarthScienceandEngineering,HohaiUniversity,Nanjing210098,China; 4.UniversityofChineseAcademyofSciences,Beijing100049,China)

Based on the NDVI data after time series reconstruction, we used DEM data to extract the geographical factors, such as slope and aspect, using the method of CART, and mainly calibrated the TRMM3B43 monthly precipitation data in the Tianshan Mountains lacking of observed precipitation data. We used the 25 stations precipitation data to test the precision of TRMM precipitation data and TRMM precipitation data after calibration, respectively. The results showed that TRMM monthly precipitation had a good consistency with observed data,there was a significant linear correlation relationship, but had a the significant deviation. The coefficient of determination (R2) between TRMM precipitation and observed precipitation decreased with time, the relative error (δ) and root mean square error (RMSE) increased, illustrating that the precision of remote sensing data of TRMM decreased with time; the accuracy of TRMM precipitation after calibration had been significantly improved,R2were 0.97, 0.87 and 0.83, which was between TRMM precipitation and observed precipitation on different temporal scales of month, season and year, and increased by more than 10% compared to the previous correction, deviation had decreased obviously. The results proved that the calibration method of CART to the TRMM precipitation data in Tianshan Mountains was feasible.

Tianshan Mountains; TRMM; calibration; CART; accuracy validation

K903

A

1005-3409(2017)06-0327-07

2016-03-03

2016-04-23

国家自然科学基金面上项目(41371051);中科院重点部署课题(KZZD-EW-12-1);荒漠与绿洲生态国家重点实验室基金(G2014-02-04)

李慧(1991—),女,陕西榆林人,硕士研究生,研究方向为水文与水资源.E-mail:527919855@qq.com

猜你喜欢

天山降水量山区
1958—2019年新兴县汛期降水量的气候特征
天山雪莲
天山儿女
“赤脚”——一个山区医生的行走(上)
《山区修梯田》
天山雪鸡
降水量是怎么算出来的
黄台桥站多年降水量变化特征分析
山区
1988—2017年呼和浩特市降水演变特征分析