APP下载

基于机器学习融合多源遥感数据模拟SPEI监测山东干旱*

2021-03-26杨晋云黄安齐张佳华

中国农业气象 2021年3期
关键词:旱情降水站点

杨晋云,张 莎,白 雲,黄安齐,张佳华

基于机器学习融合多源遥感数据模拟SPEI监测山东干旱*

杨晋云1,张 莎1,白 雲1,黄安齐1,张佳华2**

(1.青岛大学计算机科学技术学院,青岛 266071;2.中国科学院遥感与数字地球研究所,北京 100094)

以山东省为研究区,选择偏差校正随机森林BRF(Bias-corrected random forest),支持向量回归SVR(Support vector regression)和Cubist模型三种机器学习方法融合多影响因子模拟3个月时间尺度的标准化降水蒸散指数SPEI-3,以期为精确监测山东地区干旱提供一种方法。将2001−2017年23个站点的SPEI-3值作为因变量,多源遥感数据包括降水量、地表温度、蒸散发、潜在蒸散发、归一化植被指数以及土壤湿度六类7个影响因子作为自变量,自变量和因变量构成数据集的80%作为训练集,20%作为测试集。根据BRF模型得到研究区各个站点的模拟值以及各影响因子的相对重要性,绘制SPEI-3的空间分布图,并进行验证。结果表明,综合因子比单一因子模拟效果好,BRF模型测试集中的模拟值和观测值的决定系数R2达到了0.856,均方根误差RMSE为0.359,BRF模型能较好模拟站点SPEI-3值。大部分站点模拟值与观测值反映的干旱趋势一致,反映站点不同程度旱情的月份个数基本相同。此外,BRF模型模拟的SPEI-3的空间分布与站点SPEI-3观测值表现的干旱程度基本一致,且SPEI-3空间分布站点之外栅格数据也可以较准确地反映旱情,说明根据BRF模型可在站点和空间尺度上较精确地监测山东地区干旱情况。

机器学习;多源遥感;干旱;标准化降水蒸散指数;山东省

干旱是一种常见、发生频率较高的灾害,是由水分收支或供求不平衡所形成的水分亏缺现象[1],干旱的精准监测对农业生产具有重要意义[2−3]。由于降水量年内分配不均,山东省旱涝灾害频繁,给农业生产以及社会经济发展带来严重的影响[4],因此,研究干旱对山东省粮食安全、农业生产、生态环境建设和社会经济发展的影响具有重要的现实意义。

目前国内外研究学者提出了很多干旱监测指标,主要分为基于站点气象数据的传统指标和基于卫星数据的遥感监测指标。基于站点气象数据的传统指标有标准化降水指数(Standard Precipitation Index,SPI)[5],帕默尔干旱指数(Palmer Drought Severity Index,PDSI)[6],标准化降水蒸散指数(Standardized Precipitation Evapotranspiration Index,SPEI)[7]等。SPEI同时考虑降水和温度对干旱的影响,又具有多种时间尺度,已被广泛应用于干旱研究中[8−12]。由于站点实测数据准确性高,基于站点气象数据的传统指标在干旱监测与研究中被广泛应用,但其都是基于站点尺度计算的,不具有空间代表性,在应用于区域尺度干旱监测时有一定的局限性。

基于卫星遥感监测干旱是通过建立由卫星获得的植被状况、地表温度、热惯量等参数与地面干旱监测指标的关系来间接监测干旱[13]。近年来,学者们提出用遥感干旱指数研究空间尺度的干旱情况,包括温度状态指数(Temperature Condition Index,TCI)[14],降水状态指数PCI(Precipitation Condition Index)[15],植被状态指数VCI(Vegetation Condition Index)[16],土壤湿度状态指数SMCI(Soil Moisture Condition Index)[17]等。由于干旱的复杂性,单一的遥感指数不能准确反映干旱情况,很多学者提出了融合多源遥感指数来监测干旱[18−20]。但是目前融合多源遥感数据得到的综合干旱指数多通过枚举方式赋予各遥感指数权重系数的方法获得,并使用站点指数来验证综合干旱指数的适用性,且遥感指数存在明显的时空适用性差异[3]。在空间尺度上精确监测干旱仍需进一步深入研究,选择一个合适的遥感干旱指标在站点以及空间尺度上精确监测干旱,对农业生产具有重要的意义。

机器学习方法具有非线性、预测准确率高、泛化能力强的特点,可有效处理大量数据[21−22],随着长时序遥感数据的积累,已成为监测干旱所使用的另一主要方法[23−26]。以往利用机器学习方法监测山东地区干旱的研究报道较少,本研究利用机器学习方法融合多源遥感数据直接模拟站点指数SPEI,得到站点指数SPEI的空间分布,扩大了站点指数监测干旱的空间尺度,以期为精确监测山东地区干旱提供方法借鉴。

1 资料与方法

1.1 研究区概况

山东省(34°25′−38°23′E,114°36′−122°36′N)位于中国东部沿海,土壤类型多样,地形以山地丘陵为主,东部是半岛,西部及北部属华北平原,中南部为山地丘陵,形成平原盆地交错环列其间的地貌;地跨淮河、黄河、海河、小清河和胶东五大水系;主要农作物有小麦、玉米、大豆等(图1)。山东地区属温带大陆季风性气候,降水年内时空分配极为不均,致使春、秋、冬季易干旱[27]。将山东地区划分为半岛、鲁东南、鲁西北、鲁西南和鲁中。

1.2 数据

1.2.1 遥感数据

(1)MODIS植被指数等数据

MODIS搭载在Terra 和 Aqua卫星上,提供了大量的产品并且被广泛应用。使用的2001−2017年的MODIS产品从Land Processes Distributed Active Cent获得,包括土地覆盖类型产品MCD12Q1、植被指数产品 MOD13A1、地表温度产品MOD11A2及蒸散发和潜在蒸散发产品MOD16A2。MCD12Q1为年尺度的土地覆盖类型产品,空间分辨率为500m,提取研究区内的农田覆盖区域。MOD13A1为16d合成的地表植被指数产品,空间分辨率为500m,利用提取的农田覆盖区域掩膜植被指数产品获取农田区的植被指数;MOD11A2为8d合成的地表温度产品,空间分辨率为1000m,将其重采样为500m;MOD16A2为8d合成的蒸散发产品,空间分辨率为500m,由于数据空间上有缺失值,将其进行邻域分析处理。以上产品通过求平均值均合成为月值。

(2)TRMM降水量数据

TRMM(The Tropical Rainfall Measuring Mission)是1997年作为美国国家航空航天局(NASA)和日本宇宙航空研究开发机构(JAXA)的联合太空任务而发射,以提供基于卫星的全球降水监测数据[28]。TRMM3B43是0.25°×0.25°月平均格点数据集,从https://daac.gsfc.nasa.gov/网站获得。数据期限为2001−2017年,计算1个月(TRMM-P1)和3个月(TRMM-P3)尺度的累计降水量,并将结果重采样为500m。

(3)GLDAS土壤湿度数据

GLDAS数据是由美国航空航天局(NASA)戈达德空间飞行中心(GSFC)与美国海洋和大气局(NOAA)国家环境预报中心(NCEP)联合开发的同化产品,结合4个陆面模式(Mosaic、Noah、CLM和VIC)输出的土壤湿度数据[29]。使用2001−2017年的GLDAS土壤湿度数据(https://giovanni.gsfc. nasa. gov/giovanni/),空间分辨率是0.25°,将其重采样为500m。

1.2.2 站点数据

计算站点尺度的SPEI-3,所用数据为山东省23个气象站点2001−2017年月降水量和平均气温数据,气象站点分布如图1所示,月降水量和平均气温数据从中国气象数据共享网(http://data.cma.cn/)获取。

1.3 方法

1.3.1 技术流程

技术分析流程如图2所示,首先,归一化处理各个影响因子并提取站点值,将其作为自变量,计算的标准化降水蒸散指数SPEI-3作为因变量。自变量和因变量构成数据集的80%作为训练集,20%作为测试集;其次采用三种机器学习模型偏差校正随机森林BRF(Bias-corrected Random Forest)、支持向量回归SVR(Support Vector Regression)、Cubist分别进行训练,将训练好的模型用于测试集,分别计算三种模型的决定系数R2、均方根误差RMSE(Root Mean Squared Error)及平均绝对误差MAE(Mean Absolute Error),优先选择出最佳模型;根据最佳模型得出23个站点的SPEI-3模拟值以及各影响因子的相对重要性,将相对重要性作为权重,根据各个因子的遥感影像绘制SPEI-3的空间分布,并进行验证。

1.3.2 栅格遥感数据归一化处理

选择对标准化降水蒸散指数(SPEI-3)影响较大的因子,包括降水、地表温度、植被、蒸散发、潜在蒸散发、土壤湿度作为机器学习算法的自变量。为统一数据的范围,将各影响因子归一化处理,使数据在[0,1]。根据各因子对干旱的影响特点,选择相应的归一化公式(表1)。

表1 针对每个栅格计算六类影响因子的归一化公式

注:i表示月份,min、max分别表示该影响因子2001−2017年i月相应栅格的最小值和最大值。

Note: i represents the month, min and max represent the minimum and maximum value of the corresponding grid in the i month of the impact factor from 2001 to 2017, respectively.

1.3.3 站点标准化降水蒸散指数(SPEI-3)的计算

标准化降水蒸散指数SPEI具有多时间尺度的特征,3个月时间尺度的SPEI即SPEI-3的计算步骤[30]为

(1)采用Thornthwaite[31]方法计算月潜在蒸散量PET。

(2)计算每个月降水和潜在蒸散量的差值。

式中,Pi为月降水量,PETi为月潜在蒸散量,i表示月份。建立不同时间尺度的气候水分平衡累积序列,即

式中,k为时间月尺度,取值为3,n为计算次数。

(3)对Di进行正态化,首先采用Log-logistic概率密度函数,建立数据序列。

式中,α为尺度参数,β为形状参数,为Origin参数,由线性矩方法获得,进而得出Di的累计概率密度函数为

当P≤0.5时,

当P>0.5时,P=1−P,

其中,C0=2.515517,C1=0.802853,C2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。

结合降水和气温数据计算山东地区23个气象站点的SPEI-3的值(简称观测值)。根据国际上通用的SPEI指数的干旱等级划分标准[32],将SPEI划分为5个等级(表2)。

表2 SPEI-3的干旱等级划分标准

1.3.4 机器学习算法模型

(1)Bias-corrected random forest(BRF)

随机森林(Random Forest,RF)是通过集成学习的思想将多棵树集成的机器学习算法,它的基本单元是决策树[33]。在回归问题中,随机森林的输出是所有决策树输出的平均值,可避免产生一些不合理的数值,所以随机森林在准确性方面具有较强优势。但是,随机森林处理过大或过小的数值时,会有偏差。因此,采用偏差校正随机森林的方法,其回归树的个数ntree为500,树节点mtry个数为3。详细方法为:

①用训练数据集Ytrain=RF(Xtrain)构建RF模型,其中Xtrain和Ytrain分别代表自变量和因变量。

③构建以残差为因变量,训练数据集作为自变量的RF模型,rtrain=RFres(Xtrain,Ytrain),这个RF模型用来估计测试集的残差。

⑥将预测出的残差值与预测值相加,得出最终的预测值。

(2)Support Vector Regression(SVR)

支持向量回归(SVR)的目的是使广义误差界降到最小,从而达到泛化性能。这种泛化误差界是训练误差和控制假设空间复杂性的正则项的组合,是由Vapnik[34]提出的一种基于统计学习理论的机器学习方法。使用的该模型是R软件(3.6.1)中的e1071包,核函数kernel选择了径向基核函数Radial Basis Function,gamma为0.001。

(3)Cubist 模型

Cubist模型是一种商业的机器学习方法,可以实现对大数据的挖掘,实现在上百个因子中快速识别预测值的相关因子并建立模型[35]。Cubist规则与模型的匹配完善了单一模型带来的不足,从而提升了模型预测精度[36]。使用的该模型是R软件(3.6.1)中的Cubist包。参数committees设置为1,参数neighbors 设置为9。

1.4 模型评估方法

将23个站点2001−2017年标准化降水蒸散指数各影响因子的站点值和SPEI-3作为数据集,以80%作为训练集(样本数为3590),20%作为测试集(样本数为898)。训练集和测试集均为随机取样获取,为保证机器学习方法的稳定性,每个模型运行50次。每个机器学习模型都计算了测试集的观测值和模拟值的决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)。R2一般用于评估模拟值和观测值的符合程度,RMSE用来衡量模型预测值和实际值的偏差,MAE可以反映模拟值误差的实际情况。R2越接近于1,RMSE和MAE越接近于0,表示模型性能越好。各指标的计算式为

1.5 处理软件

R是统计领域广泛使用的一种统计分析软件,属于GNU系统的一个免费、源代码开放的软件,可用于统计计算。R软件包含大量的库和包,可以快速实现开发设计,完成机器学习的功能。

2 结果与分析

2.1 三种算法模拟精度比较

分别采用自变量是单一因子和综合因子输入方法对三种算法的模拟精度进行比较,结果见表3。由表中可看出,无论是训练集还是测试集,BRF算法单一因子对每个站点逐月标准化降水蒸散指数(SPEI-3)的模拟值和观测值间拟合的决定系数(R2)均最大,均方根误差(RMSE)和平均绝对误差(MAE)均相对较小;将7个因子同时输入模型进行综合模拟的结果也发现,BRF算法的模拟效果最好,其R2最大,RMSE和MAE最小,与董婷等[23]利用随机森林RF得到的模拟值和实测SPEI-3值的决定系数在0.49~0.71之间对比,本研究的精度显著提高。总之,输入自变量是综合因子时,BRF模型模拟值与观测值的差异最小,一致性最强,表现出更强的模拟能力。

注:BRF是偏差校正随机森林模型,SVR是支持向量回归模型,R2是绝对系数,RMSE是均方根误差,MAE是平均绝对误差。

Note:BRF is the bias correction random forest model, SVR is the support vector regression model, R2is the absolute coefficient, RMSE is the root mean square error, MAE is the mean absolute error.

2.2 利用优选BRF模型分析各因子的相对重要性

将23个站点2001−2017年7个影响因子作为自变量的输入,将精度平均减少值作为标准度量,得到各因子的相对重要性。表4结果表明,TRMM-P3的相对重要性最高为52.14%,TRMM-P1的相对重要性为8.37%,表明降水是影响干旱最重要的因子。由于模拟的标准化降水蒸散指数SPEI是3个月时间尺度的,因此与3个月的降水量TRMM-P3相关性最大。其次是土壤因子和温度因子,相对重要性分别为12.06%和11.36%,3个月时间尺度的SPEI与农业干旱有关[10],因此土壤湿度对SPEI-3的模拟发挥了重要作用。其余影响因子的相对重要性均低于10%,表明这些因子对模拟SPEI-3的贡献较少,对干旱的影响较小。另外由于MODIS的ET和PET数据缺失值较多,使用邻域数值分析在一定程度上降低了数据的准确性;植被对干旱响应的滞后性,导致归一化植被指数NDVI的相对重要性也较低。

表4 各因子对干旱评估的相对重要性

2.3 利用优选BRF模型模拟山东省干旱情况

2.3.1 站点历年干旱情况模拟

将多源卫星数据输入优选的BRF模型中,模拟得到每个站点2001−2017年逐月标准化降水蒸散指数SPEI-3值,与利用实测降水、气温等数据计算的站点SPEI-3值进行比较(图3)。由图中可以看出,BRF模型较好地模拟了SPEI-3值,各站点2001−2017年逐月SPEI-3的模拟值与观测值很接近。

根据表2对SPEI的干旱划分标准,统计得到2001−2017年各站点基于观测值SPEI-3与模拟值SPEI-3判断的不同旱情级别(无旱、轻旱、中旱、重旱、特旱)的月份个数,结果如表5所示。从表中可以看出,模拟值和观测值所反映的不同旱情月份个数基本相同。由于遥感栅格数据的缺值,导致模拟值比观测值反映不同旱情的月份个数少,特别是临沂,成头山、青岛则无模拟值。

为验证BRF模型SPEI-3模拟值反映干旱变化趋势的效果,20个站点2001−2017年模拟值与观测值的变化趋势如图4。由图4可以看出,BRF模型可以较好地模拟SPEI-3值,尽管少数站点的SPEI-3模拟值与观测值存在不一致,但大多数站点SPEI-3模拟值与观测值的变化趋势保持一致,可判断干旱变化趋势。因此,BRF模型可较好模拟站点SPEI-3值,反映站点的不同旱情以及干旱变化趋势。

表5 23个站点观测值和模拟值反映的不同旱情的月份个数

(续表)

注:“−”表示无模拟值。 Note: “−” is no simulated data.

2.3.2 典型年空间分布栅格干旱模拟

选取SPEI-3空间分布栅格数据以及站点SPEI-3数据,评价SPEI-3空间分布监测干旱的精确性以及SPEI-3空间分布站点之外栅格数据反映干旱的情况,选取干旱年2002年和2011年[3]数据,其分布如图5和图6所示。由图可见,SPEI-3空间分布和站点观测值所表现的干旱程度基本保持一致。由图5可知,2002年6月以后,全省高温少雨,基本处于干旱状态,尤其在8月,鲁中和鲁东南出现了特旱,鲁西北和鲁西南也有一部分地区发生特旱。9−11月旱情集中发生在济南、泰安、泰山等地,与山东地区的厄尔尼诺现象和无有效降水持续时间[37]有关。由图6可知,2011年1月山东省大部分地区出现了特旱,因为2010年12月−2011年1月降水量很少所导致[38]。3–4月和6–7月均有局部地区出现重旱,与童德明等[3]研究结果一致。SPEI-3空间分布站点之外栅格数据反映的旱情与历史实际旱情一致,总体来说,BRF模型模拟的SPEI-3的空间分布与站点SPEI-3观测值表现的干旱程度基本一致,且SPEI-3空间分布站点之外栅格数据也可以较准确地反映旱情,SPEI-3空间分布可以较准确地监测山东干旱。

3 结论与讨论

3.1 结论

(1)三种机器学习模型中,自变量输入综合因子比单一干旱因子的模拟效果好,BRF模型的模拟效果最好,模拟值与观测值的测试集的R2达到了0.865。输入自变量是综合因子时,BRF模型模拟值与观测值的差异最小,一致性最强,表现出更强的模拟能力。

(2)各个影响因子中,TRMM-P3的相对重要性最高,达到52.14%,TRMM-P1的相对重要性为8.37%,表明降水是影响干旱最重要的影响因子。其次是土壤湿度SM,相对重要性为12.06%,表明土壤湿度对模拟SPEI-3发挥了重要作用。

(3)根据BRF模型,得出站点的SPEI-3模拟值和SPEI-3空间分布。站点模拟值SPEI-3与观测值SPEI-3所反映的不同级别旱情的月份个数基本相同,站点SPEI-3模拟值与观测值反映的干旱趋势基本保持一致,说明BRF模型可较好模拟站点SPEI-3值。根据BRF模型绘制的SPEI-3空间分布与站点观测值反映的干旱情况基本一致,站点之外的SPEI-3空间分布栅格数据所显示的旱情与历史实际遭受的旱情一致。总体来说,根据BRF模型模拟SPEI-3可在站点和空间尺度上较精确地监测山东地区干旱。

3.2 讨论

本研究在选取影响因子时,只考虑了降水、地表温度、植被、蒸散发、潜在蒸散发、土壤湿度六类因子模拟3个月时间尺度的标准化降水蒸散指数SPEI-3监测山东地区的旱情,由于干旱的复杂性,高程、植被覆盖类型等对干旱也有一定程度的影响,未来研究中需要考虑这些因子[39],提高模型精度,才能更精确地监测干旱。

目前根据不同水资源供需关系将干旱划分为气象干旱、农业干旱、水文干旱和社会经济干旱四大类[40],本研究在确定因变量时直接选取3个月时间尺度的标准化降水蒸散指数(SPEI-3)作为农业干旱指数[10],且计算蒸散量项也仅采用Thornthwaite方法,采用Penman-Monotrith方法计算的SPEI监测干旱会更准确。此外,由于山东地区存在人为灌溉的因素,将SPEI-3作为监测干旱的指标受到一定制约。可以考虑根据不同的干旱类型,选取不同干旱监测指标作为因变量,如SPEI-1可监测气象干旱,土壤湿度和作物产量可监测农业干旱等,从而进一步提高不同类型干旱监测的精确性。

[1] 张强,姚玉璧,李耀辉,等.中国西北地区干旱气象灾害监测预警与减灾技术研究进展及其展望[J].地球科学进展,2015,30(2):196 -213.Zhang Q,Yao Y Bi,Li Y H,et al. Research progress and prospect of drought meteorological disaster monitoring, early warning and disaster mitigation techniques in northwest China[J].Advances in Earth Science,2015,30(2):196-213.(in Chinese)

[2] 徐钰,江丽华,张建军,等.气候变化对山东省农业生产的影响与对策[J].中国农业气象,2010,31(S1):23-26.Xu Y,Jiang L H,Zhang J J,et al.Impact of climate change on Shandong agricultural production and the adaption countermeasure[J].Chinese Journal of Agrometeorology,2010,31(S1)23-26.(in Chinese)

[3] 童德明,白雲,张莎,等.干旱严重程度指数(DSI)在山东省干旱遥感监测中的适用性[J].中国农业气象,2020,41(2):102-112. Tong D M,Bai Y,Zhang S, et al. Applicability of drought severity Index(DSI) in remote sensing monitoring of drought in Shandong Province [J].Chinese Journal of Agrometeorology,2020,41(2):102-112.(in Chinese)

[4] 王庆,马倩倩,夏艳玲,等.最近50年来山东地区夏季降水的时空变化及其影响因素研究[J].地理科学,2014,34(2):220-228.Wang Q, Ma Q Q, Xia Y L, et al.Temporal and spatial changes of summer precipitation in Shandong province in recent 50 years and its influencing factors [J]. Geography science,2014,34 (2): 220-228.(in Chinese)

[5] Mckee T B, Doesken N J, Klesist J.The relationship of drought frequency and duration to time scale[J].Paper Presented at 8th Conference on Applied Climatology,1993,17(22):179-183.

[6] Palmer W C.Meteorological drought[R].Research Paper No 45,US Dept of Commerce,1965:1-58.

[7] 王林,陈文.标准化降水蒸散指数在中国干旱监测的适用性分析[J].高原气象,2014,33(2):423-431.Wang L, Chen W.Analysis of applicability of standardized precipitation evapotranspiration index in drought monitoring in China [J]. Plateau Meteorology, 2014,33(2):423-431.(in Chinese)

[8] 容锦盟,周丹,罗静,等.4种干旱指标在华北地区气象干旱监测中的适用性分析[J].干旱地区农业研究,2019,37(1):265-273.Rong J M, Zhou D, Luo J, et al. Applicability of four drought indexes in meteorological drought monitoring in north China [J].Agricultural Research in the Arid Areas, 2009,37(1):265-273.(in Chinese)

[9] 张玉静,王春乙,张继权.基于SPEI指数的华北冬麦区干旱时空分布特征分析[J].生态学报,2015,35(21):7097-7107.Zhang Y J, Wang C Y, Zhang J Q. Analysis of spatial and temporal distribution characteristics of drought in north China winter wheat region based on SPEI index [J]. Acta Ecologica Sinica, 2015, 35(21):7097-7107.(in Chinese)

[10] Wang Q, Wu J, Lei T,et al.Temporal-spatial characteristics of severe drought events and their impact on agriculture on a global scale[J].Quaternary International,2014,349:10-21.

[11] 杨思遥,孟丹,李小娟,等.华北地区2001-2014年植被变化对SPEI气象干旱指数多尺度的响应[J].生态学报,2018,38(3):1028-1039.Yang S Y, Meng D, Li X J, et al. Multi-scale response of vegetation change to SPEI meteorological drought index in North China from 2001 to 2014 [J].Acta Ecologica Sinica,2018, 38(3):1028-1039.(in Chinese)

[12] Xing L, Binbin H, Xingwen Q, et al. Use of the Standardized Precipitation Evapotranspiration Index(SPEI) to characterize the drying trend in southwest China from 1982-2012[J].Remote Sensing,2015,7(8):10917-10937.

[13] 郭铌,王小平.遥感干旱应用技术进展及面临的技术问题与发展机遇[J].干旱气象,2015,33(1):1-18.Guo N, Wang X P. Development of remote sensing drought application technology, technical problems and development opportunities [J]. Drought Meteorology, 2015,33 (1):1-18.(in Chinese)

[14] Kogan F N.Application of vegetation index and brightness temperature for drought detection[J].Advances in Space Research,1995,15(11):91-100.

[15] Oliver J E.Monthly precipitation distribution: a comparative index[J].Professional Geographer,2010,32(3):300-309.

[16] Kogan F N.Remote sensing of weather impacts on vegetation in non-homogeneous areas[J].International Journal of Remote Sensing,1990,11(8):1405-1419.

[17] 胡蝶,沙莎,王丽娟,等.欧空局主被动微波土壤水分融合产品在甘肃省干旱监测中的应用[J].干旱气象,2019,37(4):517-528.Hu D,Sha S,Wang L J,et al.Application of ESA active and passive microwave soil water fusion products in Drought monitoring in Gansu Province [J].Journal of Arid Meteorology,2019,37(4):517-528.

[18] Rhee J,Im J,Carbone G J.Monitoring agricultural drought for arid and humid regions using multi-sensor remote sensing data[J].Remote Sensing of Environment, 2010,114(12):2875-2887.

[19] Zhang L,Jiao W,Zhang H, et al.Studying drought phenomena in the Continental United States in 2011 and 2012 using various drought indices[J]. Remote Sensing of Environment, 2017, 190:96-106.

[20] 杜灵通,田庆久,王磊,等.基于多源遥感数据的综合干旱监测模型构建[J].农业工程学报, 2014, 30(9):126-132.Du L T, Tian Q J, Wang L,et al.Building a comprehensive drought monitoring model based on multi-source remote sensing data [J].Transactions of the CSAE, 2014,30 (9):126-132.(in Chinese)

[21] Rahmat S N,Jayasuriya N,Bhuiyan M A.Short-term droughts forecast using Markov chain model in Victoria, Australia[J]. Theoretical and Applied Climatology, 2017,129(1-2):1-13.

[22] 王飞,杨胜天,丁建丽,等.环境敏感变量优选及机器学习算法预测绿洲土壤盐分[J].农业工程学报, 2018,34(22):110-118.Wang F,Yang S T, Fing J L, et al. Selection of environmental sensitive variables and prediction of oasis soil salinity by machine learning algorithm [J].Transactions of the CSAE, 2018, 34 (22):110-118. (in Chinese)

[23] 董婷,任东,邵攀,等.基于多源遥感数据和随机森林的综合旱情指标构建[J].农业机械学报, 2019(8):1000-1298.Dong T,Ren D,Shao P,et al.Construction of comprehensive drought index based on multi-source remote sensing data and characteristics of severe drought events and their impact on agriculture on a global scale[J].Transactions of the Chinese Society for Agriculture Machinery,2019(8):1000-1298.(in Chinese)

[24] 吴晶,陈元芳,余胜男.基于随机森林模型的干旱预测研究[J].中国农村水利水电,2016(11):17-22.Wu J,Chen Y F,Yu S N.Drought prediction based on random forest [J].China Rural Water Conservancy and Hydropower, 2016 (11):17-22.(in Chinese)

[25] Belayneh A, Adamowski J, Khalil B, et al. Long-term SPI drought forecasting in the Awash River Basin in Ethiopia using wavelet neural network and wavelet support vector regression models[J]. Journal of Hydrology, 2014,508:418-429.

[26] 樊高峰,张勇,柳苗,等.基于支持向量机的干旱预测研究[J].中国农业气象,2011,32(3):475-478.Fan G F,Zhang Y,Liu M, et al.Drought prediction based on support vector machine [J].ChineseJournalofAgrometeorology, 2011,32 (3):475-478.(in Chinese)

[27] Park S,Im J,Jang E,et al.Drought assessment and monitoring through blending of multi-sensor indices using machine learning approaches for different climate regions[J]. Agricultural & Forest Meteorology, 2016, 217:50.

[28] Fang J,Yang W,Luan Y,et al. Evaluation of the TRMM3B42 and GPM IMERG products for extreme precipitation analysis over China[J].Atmospheric Research,2019, 223(JUL):24-38.

[29] Houser P R, et al. The global land data assimilation system[J].Bull Amer Meteor- Soc,2004,85(3):381-394.

[30] Vicente-Serrano S M,BegueríaS,López-Moreno JI. A multiscalar drought index sensitive to global warming:the standardized precipitation evapotranspiration index[J].Journal of Climate,2010,23(7):1696-1718.

[31] Thornthwaite C W. The climates of the earth[J].Geographical Review, 1933, 23(3):433-440.

[32] 黄浩,张勃,马尚谦,等.甘肃河东地区气象干旱时空变化及干旱危险性分析[J].中国农业气象,2020,41(7):459-469.Huang H, Zhang B, Ma S Q,et al.Analysis on temporal and spatial variation of meteorological drought and drought risk in HeDong area, GanSu [J].ChineseJournalofAgrometeorology,2020,41(7):459-469.(in Chinese)

[33] Zhang G,Lu Y. Bias-corrected random forests in regression[J].Journal of Applied Statistics,2012,39(1):151-160.

[34] Cortes C, Vapnik V.Support-vector networks[J].Machine Learning,1995,20(3):273-297.

[35] Kuhn M, Johnson K.Applied Predictive Modeling[M].New York:Springer,2013,383-385.

[36] Frank E, Wang Y, Inglis S, et al.Using Model Trees for Classification[J]. Machine Learning,1998,32(1):63-76.

[37] 张胜平,陈希村,苏传宝,等.2002年山东省严重干旱分析[J].水文,2004,24(3):42-45.Zhang S P, Chen X C, Su C B, et al. Analysis of severe drought in Shandong province in 2002 [J]. Hydrology, 2004,24 (3):42-45.(in Chinese)

[38] 苑文华,王瑜,张慧. 2010-2011年秋冬季山东特大气象干旱特征及成因分析[C].第31届中国气象学会年会,2014.Yuan W H,Wang Y, Zhang H.Analysis on the characteristics and causes of severe meteorological drought in Shandong during the autumn and winter of 2010-2011[C].The 31st Annual Meeting of Chinese Meteorological Society,2014.(in Chinese)

[39] Shen R,Huang A,Li B , et al. Construction of a drought monitoring model using deep learning based on multi-source remote sensing data[J]. International Journal of Applied Earth Observation & Geoinformation, 2019, 79:48-57.

[40] 韩家琪.基于大数据思维的干旱监测方法研究[D].北京:中国农业科学院,2018:2-3.Han J Q.The research of drought monitoring based on big data[D].Beijing:Chinese Academy of Agricultural Sciences, 2018:2-3.(in Chinese)

SPEI Simulation for Monitoring Drought Based Machine Learning Integrating Multi-Source Remote Sensing Data in Shandong

YANG Jin-yun1, ZHANG Sha1, BAI Yun1, HUANG An-qi1, ZHANG Jia-hua2

(1.College of Computer Science and Technology, Qingdao University, Qingdao 266071,China; 2.Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100094)

In this study, Shandong province was taken as the research area, and three machine learning methods, namely Bias corrected Random Forest(BRF), Support Vector Regression(SVR) and Cubist model were selected to integrate multiple impact factors to simulate the standardized precipitation evapotranspiration index on a three-month time scale(SPEI-3), so as to provide a method for accurate monitoring of drought in Shandong province. SPEI-3 values of 23 stations from 2001 to 2017 were taken as dependent variables. Multi-source remote sensing data including precipitation, surface temperature, evapotranspiration, potential evapotranspiration, normalized difference vegetation index and soil moisture were taken as independent variables. Independent variables and dependent variables constituted 80% of the data set as training set and 20% as test set. According to the BRF model, the simulated values of each site in the study area and the relative importance of each impact factor were obtained. The spatial distribution diagram of SPEI-3 was drawn and verify them. The results showed that the multiple factor simulation was more effective than the single factor. The R2of the simulated value and observed value in the BRF model’s test set reached 0.856, and the RMSE of the root mean square error was 0.359. The BRF model can well simulate the SPEI-3’s values of the sites. Simulated and observed values for most sites are consistent with the drought trend, and reflect the number of months of different drought conditions is basically the same. The spatial distribution of SPEI-3 simulated by the BRF model is basically consistent with the drought degree of observed SPEI-3 at the site, and SPEI-3 spatial distribution of raster data outside the sites can also reflect the drought situation more accurately. According to the BRF model, the drought situation in Shandong province can be monitored more accurately at the site and spatial scale.

Machine learning; Multi-source remote sensing; Drought; Standardized precipitation evapotranspiration index; Shandong province

10.3969/j.issn.1000-6362.2021.03.007

杨晋云,张莎,白雲,等.基于机器学习融合多源遥感数据模拟SPEI监测山东干旱[J].中国农业气象,2021,42(3):230-242

2020−09−11

中国科学院战略先导项目(XDA19030402);国家自然科学基金(41871253);山东省基础研究计划(2018GNC110025)

张佳华,研究员,主要研究卫星遥感及其在气象、灾害、环境与生态中的应用、全球变化的区域响应、城市生态遥感等,E-mail:zhangjh@radi.ac.cn

杨晋云,E-mail:yjy5144@163.com

猜你喜欢

旱情降水站点
四川盆地极端降水演变特征及拟合
成都地区云水资源分布特征及其与降水的关系
建筑施工中基坑降水施工工艺分析
北京市轨道交通站点公共空间使用后评价初探
Cloud seeding
积极开展远程教育示范站点评比活动
怕被人认出
先进站点应与落后站点开展结对帮扶
远水