华东地区多年平均TRMM月降水数据空间降尺度研究
2022-04-08刘瑞,徐源,叶川炜,姚泽辉,张琦,李谷琳,苟晓娟,罗书斌
刘 瑞,徐 源,叶 川 炜,姚 泽 辉,张 琦,李 谷 琳,苟 晓 娟,罗 书 斌
(1.成都理工大学地球物理学院,四川 成都 610059;2.成都理工大学旅游与城乡规划学院,四川 成都 610059;3.中国海洋大学海洋地球科学学院,山东 青岛 266100;4.南京信息工程大学地理科学学院,江苏 南京 210044;5.华东师范大学地理科学学院,上海 200062;6.成都理工大学地球科学学院,四川 成都 610059)
0 引言
降水数据是气候分析、水资源评价、水分循环等相关研究中不可或缺的关键参数[1],其数据精度和时空分辨率直接影响研究结果的可信度和实用性。传统方法多基于站点实测降水数据进行内插获取区域数据,但受站点代表性影响,数据稳定性和精度难以保证,且忽略了地理要素对降水的作用,限制了插值数据的进一步应用。遥感卫星大范围覆盖的特点弥补了因气象站点稀疏导致的数据缺失问题[2,3]。其中TRMM卫星可提供大量热带海洋降水、云中液态水含量、潜热释放等气象数据[4],但该数据的空间分辨率(0.25°×0.25°)相对较低,且数据精度随区域地理位置的变化而产生差异,不足以准确刻画复杂地形区降水的分布规律,也无法完全满足小尺度区域研究对降水数据的精度要求[5,6]。因此,为推进中小尺度区域降水时空变化特征研究,有必要进行TRMM降水数据空间降尺度研究。
常用降尺度方法有简单降尺度法、统计降尺度法、动力降尺度法及动力和统计相结合降尺度法[7]。其中统计降尺度法基于数学模型建立统计关系,因计算量小、运行速度快、准确性高而备受青睐。例如:Hellström 等[8]将多元回归统计模型应用于瑞典月降水量的降尺度研究;Keupp等[9]以海拔、坡向、距海距离和NDVI为协变量,采用3种统计方法,将伊朗中部地区年降水量空间分辨率由1 km×1 km降到250 m×250 m;范丽军[10]首次利用统计降尺度模型模拟中国各台站1月和7月未来区域平均降水变化;范科科等[11]采用交叉验证、多元逐步回归等方法构建内蒙古地区TRMM降水数据与地形、气候等要素之间的多元回归关系;宁珊等[12]采用偏最小二乘降尺度方法提高TRMM降水数据的空间分辨率,并评估处理后数据在新疆不同地貌区的有效性。
目前关于TRMM降水数据降尺度研究主要将植被指数作为模型的气候因素,而植被对降水的响应存在约一个月的滞后性[13]。降水是由空气中的水汽冷凝而产生,因此,水汽与降水有直接的相关性[14-16],但少有学者将水汽指数作为降水数据的降尺度因子。鉴于此,本文以华东地区为研究区域,选取经纬度、海拔、坡度和坡向作为地形的降尺度因子,并结合水汽指数构建融合多源数据的TRMM降水数据统计降尺度模型(TRMMMOD05),以期获得兼顾精细化与准确性的区域降水数据,扩大卫星数据应用的广度和深度,从而为研究区的水资源研究、农业旱涝监测和生态环境管理等提供可靠的数据源,并与基于滞后性归一化植被指数的降尺度模型(TRMMLNDVI)进行比较,探讨水汽指数作为模型气象协变量的优势。
1 数据与方法
1.1 研究区与数据
华东地区包括山东、安徽、江苏、浙江、江西、福建、台湾和上海(图1,本研究不包括台湾),总面积83.43万km2,约占中国面积的8.7%。华东地区水资源、动植物资源和矿产资源丰富,常住人口约4亿人,占全国人口的30%,是中国经济发展较快的地区之一。该区域属于亚热带湿润性季风气候和温带季风气候,年均气温15~18 ℃,年均降水量超过800 mm,且主要集中于夏季。该区域东部临海、西部延伸至内陆腹地,地形复杂多样,以丘陵、盆地、平原为主,也有泰山、黄山、武夷山等山峰,海拔差异明显,相对高程较大。因此,研究华东地区的降水时空分布对该区域的动植物生长、农业生产和经济发展具有重要意义。
MODIS标准可降水量数据(MODIS05)、MODIS标准归一化植被指数数据(MODIS13A3)和TRMM3B43_V7逐月降水数据来源于美国太空总署(NASA)(https://ladsweb.modaps.eosdis.nasa.gov/search/),MODIS数据空间分辨率为1 km×1 km,TRMM数据空间分辨率为 0.25°×0.25°;国家气象站点观测数据来源于国家气象科学数据中心(http://data.cma.cn/),研究区内共有145个气象站点,将其随机分为72个训练站点和73个验证站点(图1);研究区DEM和行政边界矢量数据分别来源于地理空间数据云和中国科技资源共享网(表1)。研究时段为2005-2015年,选择1月、4月、7月和10月分别代表冬、春、夏、秋季,鉴于NDVI对降水的响应具有滞后性,故选择2月、5月、8月和11月作为NDVI各季节的代表月份。
图1 华东地区(不含台湾)地形地貌和气象站点分布Fig.1 Distribution of topography and meteorological stations in East China (except Taiwan Province)
表1 TRMM降水数据降尺度模型所需数据Table 1 Data used in the downscaling model of TRMM precipitation data
1.2 研究方法
1.2.1 降尺度因子初选 用于降尺度的变量因子应与水平尺度约2 000 km以上的气象数据有显著相关关系,既能刻画区域内降水的空间分布特征,又便于快速、精准获取。华东地区雨水、地表水资源量均居全国之首[17],水汽和降水呈明显的正相关性,因此,本文选取的降尺度因子包括经纬度、海拔、坡度、坡向和水汽指数,当构建TRMMLNDVI模型时,将水汽指数替换为滞后性归一化植被指数(图2中水汽指数以1月多年平均值为代表,NDVI以2月多年平均值为代表)。为消除变量间的量纲影响,对模型因子进行归一化处理,其中坡向因子先按方向进行重分类赋值后再归一化,重分类赋值规则为:平地(-1°)为1,北向(0~22.5°、337.5°~360°)为2,东北向(22.5°~67.5°)为3,东向(67.5°~112.5°)为4,东南向(112.5°~157.5°)为5,南向(157.5°~202.5°)为6,西南向(202.5°~247.5°)为7,西向(247.5°~292.5°)为8,西北向(292.5°~337.5°)为9。
图2 TRMM降水数据降尺度模型因子Fig.2 Factors for the downscaling model of TRMM precipitation data
1.2.2 逻辑回归降尺度方法 逻辑回归是一种广义的线性回归,其通过函数L将因变量对应一个隐状态p,然后根据p与1-p的大小决定最终的值。逻辑回归能进行连续型和离散型自变量分析,不要求自变量符合正态分布,可较好解决因子间相互依赖的问题[18]。因此,本文选用逻辑回归建立TRMM卫星降水数据与各降尺度因子之间的统计关系,具体步骤为(图3):根据地面观测站点分布位置,提取原始数据集的值;以多年平均TRMM月降水值为因变量,降尺度因子为协变量,构建适用于研究区的逻辑回归降尺度模型;回归值叠加预测的高分辨率残差结果,最终得到降尺度后的TRMM降水空间分布数据。计算公式为:
Dresult=Dlogistic+Dresidual
(1)
(2)
(3)
图3 研究方法流程Fig.3 Technical process of the research method
1.2.3 模型评价指标 利用相关系数(R)、偏差绝对值(|Bias|)和标准误差(RMSE)对73个验证站点的降尺度结果进行精度评价。R是研究变量间线性相关程度的统计量,其值在0~1之间,值越接近1,表明相关程度越高;|Bias|是评价结果精密度的统计量,其值越小,表明数据之间的偏离度越小;RMSE能反映估算误差的整体水平,其值越小,表示实测值与估算值越接近。计算公式如下:
(4)
(5)
(6)
2 结果分析
2.1 TRMM降水数据有效性分析
目前TRMM降水数据主要针对大范围、大尺度的研究,数据精度受多年平均降水量的影响[19],因此本文在使用TRMM降水数据之前,需对研究区数据进行有效性分析。以训练站点的多年平均观测月降水量为X轴、多年平均TRMM月降水数据为Y轴绘制散点图(图4),并计算相关系数R,以此验证TRMM降水数据在研究区的有效性。可以看出,1月和4月的TRMM降水值与站点实测降水量的变化趋势高度相似,R均在0.9以上;10月的总体变化趋势一致性稍差,R为0.794;7月的相关性最低,R仅为0.487,可能是由于当地7月多小尺度对流降雨,而TRMM 分辨率较低,不能准确捕捉此类降雨,导致原始数据精度一般[20],但仍通过置信度为99%的显著性检验。综上,TRMM降水数据在华东地区是有效的,可对其进一步研究。
图4 站点多年平均实测月降水量与TRMM值的散点图Fig.4 Scatter plots of observed values and TRMM values of multi-year average monthly precipitation
2.2 TRMM降水数据降尺度结果时空分布
基于ArcGIS平台,利用低分辨率下所得逻辑回归模型系数进行降尺度:利用TRMM原始数据减去0.25°×0.25°分辨率下的预测值,得到多年平均1、4、7、10月的低分辨率降水残差数据,对残差结果进行普通克里金空间插值,得到1 km×1 km高分辨率数据;将高分辨率的降水估算值与高分辨率残差值叠加,得到TRMM卫星降尺度空间分布数据(图5)。从图5可以看出,受冬季季风影响,1月降水呈现由南向北递减趋势,降水高值区位于浙江、江西与安徽交界处,最高降水量达90 mm,降水低值区位于山东,降水量不足5 mm,体现出冬季降水最少的特点;受东南季风影响,4月东南部降水明显增加,虽然降水仍由南向北递减,但降水高值区有所偏移,主要位于江西,降水量达210~240 mm,低值区仍位于山东,最低降水量不足10 mm;因东南季风进一步增强,雨带随之北移,7月北方降水明显增加,降水高值区在江苏、安徽、山东均有出现,降水量达270~310 mm,而浙江、江西和福建降水相对较少(120~150 mm);受沿海地理位置的影响,长江三角洲一带降水最多,10月可达90~120 mm,降水低值区又回到山东北部,最低不足4 mm。
图5 TRMM多年平均月降水数据降尺度结果空间分布Fig.5 Spatial distribution of downscaling results of TRMM multi-year average monthly precipitation data
2.3 降尺度结果误差验证
为检验降尺度结果的可靠性,以验证站点实测降水量为X轴、验证站点原始TRMM值和降尺度结果值分别为Y轴绘制散点图(图6),经降尺度处理后的TRMM数据与站点实测降水的变化趋势更一致,最明显的是7月和10月,其相关性显著提高;1月和4月数据处理前后的变化虽不如其他月份明显,但也能看出数据间的拟合结果有所改善。
图6 多年平均原始TRMM值和降尺度结果与站点实测降水量的散点图对比Fig.6 Comparison of scatter plots of observed values and original TRMM values with observed values and downscaling results for multi-year average monthly precipitation
从相关系数(R)、偏差绝对值(|Bias|)和标准误差(RMSE)的评价结果可知:降尺度后,各月的R均有明显改善,7月的R提高了0.251;数据偏离度减小,但原始TRMM数据本身偏差很小导致|Bias|整体变化不大;RMSE范围缩小到5.18~42.87 mm,各月均有不同程度的降低。结合以上分析可知,TRMMMOD05降尺度模型在提高原始数据空间分辨率的同时,也改善了原始数据的精度,降低了原有误差,不仅能刻画降水在研究区的空间分布格局,还体现了降水高值区随时间和气候变化而迁移的特点。
2.4 降尺度模型对比分析
以NDVI作为气象协变量引入降尺度模型中,构建TRMMLNDVI降尺度模型,并与TRMMMOD05模型进行对比。由表2可知,与原始TRMM数据相比,TRMMMOD05和TRMMLNDVI的估算精度均明显提升。除4月外,其他各月的TRMMMOD05降尺度效果均优于TRMMLNDVI,其中7月的TRMMMOD05优势最明显,R相差0.121,|Bias|相差0.015,RMSE相差4.95 mm,可能是该月降雨量过大,植被对降水的响应不敏感所致;4月TRMMLNDVI的降尺度结果更优,可能是由于该月温度上升较快,蒸发速度也快,导致水汽对降水的指示性不同步,而植物在该月对降水的响应更好。进一步将水汽指数和滞后性植被指数同时作为降尺度模型的气象协变量,降尺度结果与观测值的R指标评价结果(1月:0.904;4月:0.927;7月:0.654;10月:0.855)表明:1)与双气象协变量模型估算结果相比,单一协变量模型的降尺度效果更好;2)1月与4月降尺度后的数据精度低于原始TRMM。总之,两种降尺度模型估算结果的精度均高于原始数据,TRMMMOD05整体的降尺度效果优于TRMMLNDVI,能更好地刻画复杂地形对降水空间异质性的影响程度。
表2 两种模型的精度评价结果Table 2 Accuracy assessment results of the two models
3 结论
本文融合经纬度、海拔、坡度、坡向和水汽指数建立逻辑回归统计降尺度模型,对中国华东地区2005-2015年的TRMM卫星多年平均月降水数据进行1 km×1 km空间分辨率降尺度,并利用R、|Bias|和RMSE3个指标评估降尺度结果,结论如下:1)研究区原始TRMM降水数据与气象站点实测数据强相关,其中4月相关性最高(R为0.951),7月最低(R为0.487),这与王维琛等[21]的研究结果一致,各月数据均通过置信度为99%的显著性检验,证明研究区TRMM降水数据有效;2)引入水汽指数的降尺度模型提高了原始TRMM降水产品的空间分辨率,刻画了降水呈南多北少的空间分布格局,但受东南季风影响,北方7月降水量明显增加,同时降水呈季节性变化,夏季降水量多,最高达310 mm,冬季降水量少,最低不足4 mm;3)TRMMMOD05模型提高了原始TRMM降水数据的精确度,其中7月的改善效果最好,R提升了0.251,|Bias|降低了0.024,RMSE降低了8.67 mm,可见该降尺度模型在华东地区的适用性较好,但因7月的原始数据有效性低,导致该月降尺度后的数据精度不理想,在一定程度上说明降尺度结果的精度依赖于原始数据,这与李豪等[22]的研究结果一致;4)对比TRMMLNDVI与TRMMMOD05模型的降尺度结果,4月的TRMMLNDVI更有优势,而其他月份的TRMMMOD05估算结果更准确,在变化趋势与偏离度上表现更好,总体而言,TRMMMOD05能更准确地刻画复杂地形下的降水空间分布格局。
除自然因素外,人类活动也会影响降雨的发生,未来应考虑将能表达人文作用的因子引入模型,使得天气预报、旱涝灾害预警、生态环境监测等相关研究有更精细的降水资料支撑。