MODIS干旱指数结合RBFNN反演冬小麦返青期土壤湿度
2019-08-19黄友昕胡茂胜沈永林刘修国
黄友昕,胡茂胜,沈永林,刘修国,罗 琼,孙 飞
MODIS干旱指数结合RBFNN反演冬小麦返青期土壤湿度
黄友昕1,胡茂胜1,沈永林1,刘修国1※,罗 琼2,孙 飞1
(1. 中国地质大学(武汉)地理与信息工程学院,武汉 430074;2. 武汉大学测绘遥感信息工程国家重点实验室,武汉 430079)
土壤湿度是农业干旱信息最重要的表征因子,它的反演对区域乃至全球农业干旱监测及预报都具有重要意义。该文基于MODIS遥感干旱监测指数构建了冬小麦返青期土壤湿度的评价指标体系,在此基础上,结合径向基函数神经网络(RBFNN)协同反演农地土壤湿度。首先,针对单一利用遥感干旱指数反演土壤湿度具有一定的局限性问题,选取监测土壤含水量、作物需水形态变化、冠层含水量、冠层温度等参量的遥感干旱监测指数作为综合评价指标;并利用实测土壤湿度作为验证标准,从原始遥感干旱监测指数中选取出适宜的指标集;然后,以选取的评价指标集为输入层,以实测土壤湿度作为输出层的输出,构建RBFNN的农地土壤湿度反演模型。研究结果表明:应用在河南省冬小麦返青期时,基于MODIS遥感干旱监测指数与RBFNN协同反演的土壤湿度模型具有较好的反演效果;模型的评价指标集与10 cm深度的土壤湿度相关性更好,而且能综合多通道遥感信息来反映土壤湿度的变化;模型的平均预测精度达到93.27%,与BP-NN和线性回归反演模型相比,反演精度分别提高了2.92和9.97百分点;模型回归分析相对1:1斜线的偏差最小;相关系数为0.846 49,回归决定系数为0.862 6。研究结果可为区域土壤湿度的遥感反演提供新的案例参考。
遥感;土壤;湿度;干旱指数;径向基函数神经网络;MODIS
0 引 言
土壤湿度(soil moisture,SM)是农作物生长发育的基本条件,是农作物产量预测的重要参数[1],也是气候、水文、生态等领域衡量土壤干旱程度的重要指标,在陆面过程模式和全球气候模型预测方面也扮演着重要的角色[2]。尤其在农业干旱监测中,土壤湿度不足会直接影响农作物的正常发育,致使作物生长受胁迫,使作物生物量和产量减少,进而导致农业干旱现象发生[3]。因而,SM是农业干旱信息最重要的表征因子,它的反演对区域乃至全球农业干旱监测及预报都具有重要意义[4]。
土壤湿度的获取方法一般有3种:田间实测法、土壤水分模型法和遥感法[1,5]。田间实测法可准确测量土壤含水量,但测量范围有限,实时性欠佳;土壤水分模型法可提供实时的土壤水分信息,但需大量的气象数据支持,较耗费人力财力。而遥感法具有实效性强、经济、覆盖范围广等优势,已成为区域动态监测SM的有效手段[5-13]。多年来,国内外学者基于遥感干旱指数对SM的遥感反演方法进行了大量研究。Waston等[6]最早利用热惯量模型与热红外波段估测SM;Price[7]提出了用表观热惯量(apparent thermal inertia,ATI)来近似代替真实热惯量,指出在裸露土壤或植被覆盖度低的区域ATI反演SM效果较好。Kogan[8]研究论证了冠层温度可以有效评价作物土壤表面水分亏缺,并提出了温度条件指数(temperature condition index,TCI);冯强等[9]建立了植被条件指数(vegetation condition index,VCI)与SM在农作物生长季节的统计模型,并应用于全国耕地的SM监测中;Carlson等[10]研究了地表温度与归一化植被指数(normalized different vegetation index,NDVI)的斜率与SM的关系,并发展了植被供水指数(vegetation supply water index,VSWI);鲍艳松等[11]基于合成孔径雷达微波数据,建立了冬小麦不同生育期的SM反演模型;李华朋等[12]研究指出归一化红外差异指数(normalized difference infrared index band6 or band7,NDIIB6/7)比同类型的植被水分指数对冠层含水量更敏感;Wang等[13]研究指出结合近红外与短波红外构建的归一化多波段干旱指数(normalized multi-band drought index,NMDI)更适合于评估土壤与植被的水分。然而,现有研究中存在的主要问题是:单一地利用可见光、近红外、短波红外,热红外等构建的遥感干旱指数,在反演SM时均具有一定的局限性[1],如微波易受地表粗糙度与植被覆盖的影响;ATI仅适用于裸露土壤或植被覆盖低的区域;而植被指数在植被相对稀少的干旱地区监测SM并不合适[12];因此,在实际应用中若能综合运用这些遥感干旱指数进行SM的协同反演,将是一种提高SM反演精度的有效途径。
土壤湿度是一个复杂的非线性耦合系统[13],受土壤复杂结构和环境多因子影响显著,而人工神经网络(artificial neural networks,ANN)模型能自动分析多源输入与输出间的非线性映射关系。由于ANN的独特优势,国内外不少学者利用ANN模型开展对SM反演的研究[13-16]。大部分学者采用反向传播神经网络(back-propagation neural networks,BP-NN)建模反演SM;但BP-NN存在学习算法收敛速度较慢、需参数调节多、训练过程中总体误差易陷入局部极小等不足[16-17]。然而径向基函数神经网络(radial basis function neural networks,RBFNN)的算法原理在一定程度上克服了BP-NN的缺点,能以任意精度逼近任意连续函数,可广泛应用于自适应非线性建模中[17-20]。
针对上述现状,本文提出一种基于MODIS的遥感干旱指数与RBFNN协同反演农地SM的方法,即以2001—2012年河南省冬小麦返青期为研究对象,选取监测土壤含水量、作物需水形态变化、冠层含水量及冠层温度等参量的6种遥感干旱指数作为综合评价指标集,尝试结合MODIS的遥感干旱指数与RBFNN对农地的SM进行协同反演,并与BP-NN和线性回归(linear regression,LR)模型进行比较,以期为区域SM反演提供一种新的案例参考。
1 材料与方法
1.1 研究区概况
河南省位于中国中东部、黄河中下游,地理坐标介于110°21′-116°39′E,31°23′-36°22′N之间(图1)。该地区地貌与气候具有明显的过渡特征,气候自南向北由亚热带向暖温带过渡,自东向西由平原向丘陵山地气候过渡;地貌由西向东阶梯变化,北、西、南三面为山地环绕,中东部为华北平原,西南部为南阳盆地;该研究区土壤类型也随地形与气候的变化而演替:豫东、豫北平原多为潮土;豫南平原多砂姜黑土;豫西北山地丘陵多为褐土、红黏土;豫南多为水稻土等[21]。由于受季风气候的影响,降水量时空分布极其不均,干旱缺雨天气较多,因而造成该地区农业干旱事件频发。
1.2 数据源及其处理
遥感数据源采用美国国家航空航天局的Terra卫星搭载的中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,MODIS)的3个数据产品:MOD09A1、MOD11A2和MCD12Q1(表1)。MOD09A1是地表反射率产品,包括7个波段(band)信息,分别是红光band1(620~670 nm)、近红外band2(841~876 nm)、蓝光band3(459~479 nm)、绿光band4(545~565 nm)及3个短波红外band5(1230~1250 nm)、band6(1628~1652 nm))和band7(2105~2155 nm);MOD11A2是地表温度(land surface temperature,LST)产品,包含2个热红外波段band31(10780~11280 nm)和band32(11770~12270 nm),以及白天与晚上的LST;以上2个产品用于计算遥感干旱监测指数的值。MCD12Q1是MODIS全球土地覆盖产品,选用包括17类国际地圈生物圈计划的全球植被分类方案,该数据用于掩膜过滤得到农地的遥感信息。
非遥感数据包括河南省的行政区划矢量数据和SM数据集。其中SM数据集来源于中国气象数据网的“中国农作物生长发育和农田土壤湿度旬值数据集”(http://data.cma.cn/site/index.html),该数据集是河南省17个土壤墒情站每旬观测的10和20 cm土层的土壤相对湿度(记为SM10与SM20),即土壤含水量占田间持水量的百分率,以百分比(%)表示。研究区墒情监测站点分布如图1所示。
基于前人的研究基础[22],将冬小麦的返青期时间设定为3月上旬,对应的土壤墒情观测时间是3月8日。由于2011—2012年3月上旬南部降雨量较同期偏少,其他地区基本无降水,因而选取与之时间最接近的遥感数据MOD065,并下载表1中前3类产品共36景遥感数据。基于ENVI与ArcGIS软件,对遥感数据进行质量检查、投影、重采样、裁剪、掩膜、中值滤波等预处理过程。
1.3 研究方法
首先分析土壤含水量、作物需水形态变化、冠层含水量及冠层温度等参量的8种遥感干旱监测指数自身的适应性[23](见表2);然后与冬小麦返青期实测的SM做相关性分析,选取出与SM相关性相对较高的指标集,得到综合评价指标集(输入层);以SM为输出层,基于RBFNN构建农地的SM反演模型。同时与BP-NN和LR构建的SM反演模型进行对比分析。
1.3.1 构建基于MODIS遥感干旱指数的评价指标体系
SM是表征农业干旱信息最重要的因子之一[1],国内外学者曾利用SM来验证不同遥感干旱监测指数的区域适用性[24-25]。本文基于MODIS多波段遥感信息构建的遥感干旱监测指数作为综合评价指标,结合RBFNN协同反演农地的SM。
针对冬小麦返青期,首先计算出监测土壤含水量、作物需水形态变化、冠层含水量及冠层温度等参量的8种原始遥感干旱监测指数值,包括:监测土壤含水量指数:ATI[6]和VSWI[9];监测作物需水形态变化指数:增强型植被指数(enhanced vegetation index,EVI)[26]和VCI[27];监测冠层含水量指数:NDIIB6/7[28-30]和NMDI[12];监测冠层温度指数:TCI[7];由于这些指数的构建来源于MODIS不同波段,能够综合反映可见光、近红外、短波红外及热红外等波段对SM的变化。取土壤墒情站点对应的影像位置上3×3窗口内遥感信息,根据表2计算各指数的值。
1.3.2 RBFNN模型原理
RBFNN模型是一种具有单隐层的3层前馈网络,其设计与数值分析、线性适应滤波很好地结合,在逼近能力、分类能力和学习速度等方面都优于BP-NN[16-19],RBFNN的网络拓扑结构共分为3层,如图2。
注:H1, H2… Hj指有个隐含层神经单元,Wj指个隐含层到输出层的线性连接权值,SM指土壤湿度。
第二层为隐含层,其节点数视所描述问题的需要而定,该层的变换函数采用RBF。RBF作用是对输入模式进行一次变换,将低维模式输入数据变换到高维空间内,使得在低维空间的线性不可分问题在高维空间内线性可分。隐含层是非线性优化策略,采用高斯核函数。
第三层为输出层,即为2011—2012年墒情监测站点的SM10。该层对输入模式做出的响应采用线性优化策略,对隐含层神经元输出的信息进行线性加权后输出,本文只有1个输出结点SM,其公式为:
式中表示权值,代表输出层的个数(=1, 2,…,)。
2 结果与分析
由于在不同区域、不同时间段,用于反演SM的遥感干旱监测指数往往存在不同的时空适应性[21]。即使在同一区域,也存在如作物生长的不同季节、土壤及气候等因素的影响,如果笼统地、随意地选用遥感干旱指数,则很难实现在不同区域的SM精确反演。因此,针对研究区冬小麦返青期,本文首先分析不同遥感干旱监测指数与SM10、SM20的相关性,选取适宜于该生长阶段的农业干旱遥感监测指数作为指标集;然后,以选取的评价指标集为输入层,以实测墒情站点土壤湿度作为输出层的输出,构建RBFNN的农地SM反演模型,最后根据该网络模型预测SM的值。
2.1 遥感干旱监测指数与SM的相关分析
首先,利用SPSS Statistics19软件,针对2012年冬小麦返青期,把原始的8种遥感干旱监测指数值进行标准化,使其具有可比性;然后用标准化后的值与实测SM10、SM20进行相关分析,两者的相关系数矩阵见表3。
表3 遥感干旱监测指数与2012年SM的相关系数矩阵
注:SM10、SM20分别表示10和20 cm土层的土壤相对湿度,%。
Note: SM10、SM20 represents soil relative humidity in 10 and 20 cm soil layers, respectively,%.
由表3可见,在冬小麦返青期(即早春麦田半数以上的麦苗心叶长1~2cm时),SM10与反映土壤含水量的指数ATI、VSWI以及反映作物形态与绿度的指数EVI的相关性均高于SM20,且通过0.05水平显著性检验;而反映冠层含水量的指数NDIIB6/7与反映作物温度的指数TCI与SM20的相关性要稍微高于SM10;但从整体来看,除了VCI之外,SM10与其余7个遥感干旱监测指数均达到显著相关(即通过0.05水平显著性检验),故本文选择SM10作为选取合适的遥感干旱指数的基准,从8个原始的遥感干旱指数中选取与SM相关性较高的6个指数(ATI、VSWI、EVI、NDIIB7、NMDI和TCI)作为SM反演模型的评价指标集。
图3 2012年3月上旬研究区遥感干旱指数与SM10的变化规律
在2012年冬小麦返青期,研究区17个墒情站点的SM10与遥感干旱指数ATI、VSWI、EVI、NDIIB7、NMDI和TCI的变化规律如图3。由图3可知,这6个遥感干旱指数相比VCI、NDIIB6与SM10的总体变化趋势更相似,说明这6个指数在该生长期较适宜冬小麦的SM监测。
综上所述,为了使构建的农地SM反演模型既能反映作物因干旱导致的生理变化,也能反映形态变化[22];本文选择监测作物生理变化的干旱指数:ATI、VSWI、NDIIB7、NMDI和TCI;以及监测作物形态的干旱指数EVI(共6个指数)作为反演SM的综合评价指标集。
2.2 基于RBFNN构建土壤湿度反演模型
将2011和2012年共34组墒情站点(样本)获得的前30组数据作为训练样本,后4组数据作为预测样本。根据表4对反演SM的输入输出参数进行统计分析,评价该组测试数据的离散程度较好。
表4 SM反演模型的输入和输出参数
在Matlab神经网络工具箱中用newrb函数设计RBFNN。RBF通常被用作逼近函数,用newrb函数创建RBF网络是一个不断尝试的过程,计算过程中不断给隐含层增加中间层神经元,直到网络的输出满足设定的均方误差(mean squared error,MSE)为止。