APP下载

基于多光谱遥感的裸土土壤含水量反演研究

2020-11-09王启元赵艳玲房铄东杨熙周虎刘金凤

矿业科学学报 2020年6期
关键词:共线性反射率波段

王启元,赵艳玲,房铄东,杨熙,周虎,刘金凤

1.中国矿业大学(北京) 土地复垦与生态重建研究所,北京 100083;2.山东省临沂市城乡建设服务中心,山东临沂 276000

土壤含水量作为重要的土壤理化性质之一,对土壤中的物质和能量的运移以及地表植被生长中水、肥、气、热等状况都有着直接的影响[1]。我国东部草原矿区深居内陆,矿区排土场地表荒芜,植被稀疏,生态环境极其脆弱,干旱缺水是造成该现象的主要原因。因此,土壤水分遥感监测对于矿区排土场的土地整治、生态恢复有着至关重要的意义[2]。

土壤含水量的传统监测方法主要有烘干法、电阻法、重量法和中子水分仪法等,空间范围上均为点测量,一般都需要在实验室进行测定,虽然精度高但范围有限、工作量大、效率低,难以满足现代大范围、快速监测土壤含水量的实际需求[3-4]。近年来,随着遥感技术的迅速发展,利用遥感器获取植被以及土壤的光谱反射特性,实现大范围、高精度的土壤含水量的动态、快速监测已成为可能[5-8],弥补了传统监测方法的不足,也是热点研究领域。

目前国内外对于土壤水分的遥感监测研究,在植被生长区域主要集中于地表表层土壤含水量的反演,常用的监测方法有热惯量法[9]、作物缺水指数法[10]、微波遥感法[11]、温度植被干旱指数法[12-13]等;在无植被覆盖区域多集中在使用地物光谱仪等非成像遥感手段进行裸土土壤含水量反演的探索[14]。应用低空光谱成像仪对裸土土壤水分的反演研究相对不多,已有研究中主要为基于经验的统计模型法,包括偏最小二乘法等回归模型和反向传播(BP)神经网络。例如,张智韬等[15]利用6个多光谱波段的土壤光谱反射率结合多种回归方法,对两种深度的土壤样本建立了土壤含水量反演模型,其结果显示最佳方法为逐步回归法,最佳监测深度为表层1 cm;Sorensen等[16]通过近红外波段处的土壤光谱反射特性,利用BP神经网络强大的自主学习能力及其在处理非线性情况方面的优越性,对土壤含水量进行了反演,结果显示该模型的反演精度优于其他模型。

土壤含水量反演的精度取决于反演因子与反演模型的选择。为得到更优的反演效果,除使用偏最小二乘回归和岭回归法两种反演模型外,本文重点探究不同波段组合作为反演因子的BP神经网络模型反演4种不同深度土层的土壤含水量,以期找到裸土土壤含水量的最佳反演模型与最佳反演深度,为矿区排土场的土壤水分遥感监测提供最优方法。

1 数据来源与处理

1.1 试验区概况

1.2 试验材料

本次试验土壤来自内蒙古自治区锡林浩特市胜利一号露天矿北排土场,土场土壤质地多为砂质土,土壤较紧实,疏松性差,持水能力较弱。表土层均匀采样后,用密封塑料袋带回实验室进行测试,采样深度为0~30 cm。测得土壤干容重为1.51 g/cm3,土壤平均孔隙率为35.80%,土壤含水量均值为4.04%。为使得试验样品水分含量精确配置,对采样土壤先晒干、碾磨、混合,再经过2 mm的筛网过滤制得试验土样。混合均匀后将试样土壤分别装入4个高120 cm、直径25 cm的透明圆柱,每个圆柱顶部预留约10 cm空余,分别在试验土柱距表层土1 cm、3 cm、5 cm、10 cm土层深度处埋设水分传感器。每次试验当天早晨8点注水1 000 ml,室内放置,待试验时使得水分均匀下渗。

1.3 数据采集

试验测量土壤含水量所用仪器为美国DECAGON公司的ECH2O土壤水分测量仪,该传感器是一种电介质型传感器,将探头埋在4根土柱的固定位置,通过测量传感器上电容的变化来确定所在土壤的体积含水量。本次试验土壤水分真实值采样间隔设置为10 min。

土壤光谱反射率获得所用仪器为Spequoia多光谱相机,相机详细技术参数见表1。拍摄时将相机固定在土柱正上方高约1 m处,每张正射影像包含4种不同波长的土壤反射光谱:550 nm(绿)、660 nm(红)、735 nm(红边)、790 nm(近红外)。根据土壤水分下渗的实际情况,拍摄时间间隔由短到长,刚开始每10 min拍摄一次,当水分下渗速率较慢后改为每30 min拍摄一次,每次试验前用标准白板进行标定。此次试验周期共4 d,每天10:00—14:00对土柱样本进行监测。试验现场如图2所示。3月27日至30日每天拍摄一根土柱,对应图1(a)(b)(c)(d)。

表1 Spequoia多光谱相机基本参数Tab.1 Basic parameters of Spequoia multispectral cameras

图1 多光谱相机拍摄土柱试验现场示意图Fig.1 Schematic of multispectral camera shooting test site

1.4 土壤水分和多光谱数据预处理

通过ECH2O土壤水分传感器的数据收集装置将监测的土壤含水量数据输出至计算机中,土壤水分传感器设置的采样间隔为10 min,对照多光谱相机拍摄时间,找到对应时刻的土壤含水量监测值。

多光谱相机每次拍摄产生4张TIF格式灰度影像,对应4个波段。由于土柱上部有约10 cm空余,相机在其正上方1 m处拍摄,边缘处会有阴影,再加上土壤光谱采集过程中不可避免受到当时试验环境、光线、仪器本身等客观因素影响,所以需要构建合适的感兴趣区(ROI),以ROI范围内的平均光谱反射率作为样本该时刻的土壤光谱反射率,并根据标准白板的光谱将拍摄得到的各张影像灰度值校正为反射率值。最后,使用MATLAB R2017a软件对影像进行批量处理,处理过程包括ROI的选取、影像裁剪、反射率校正等。

2 研究方法

2.1 共线性诊断

多元回归分析方法是处理多变量相依关系的常用统计方法之一,广泛应用于数理统计领域。但在实际应用中,当回归方程建立后,由于各自变量间存在相关性,使得参数估计的方差增加,致使回归方程变得不稳定;或者某些自变量对因变量影响的显著性被隐藏,回归系数的符号与实际意义不相符等[17-18]。所以将各个波段土壤光谱反射率与土壤含水量进行多元回归分析之前,需要先对各个波段进行共线性诊断。共线性诊断采用方差膨胀因子[19]来评估4个波段之间的线性关系的强弱。

方差膨胀因子(Variance Inflation Factor,VIF),是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比。VIF越大,显示共线性越严重。

本文采用均匀变异的方式来完成变异操作。均匀变异是一种特殊的基本位变异,用于实数编码。因为它允许搜索点在整个搜索空间上变换,所以能够丰富种群的多样性,避免陷入局部最优。其余操作均按第2、3节提出的改进方法进行。

式中,Ri为自变量对其余自变量作回归分析的负相关系数。

一般建议,当VIF > 10时,表明模型中存在较强的共线性问题。

2.2 回归分析

由于各个土壤反射波段之间很可能存在共线性问题,而常用的最小二乘回归法难以解决变量间的多重共线问题,所以本文采用具有较好鲁棒性的偏最小二乘回归法和岭回归法[19-20]。

2.2.1 偏最小二乘回归法

偏最小二乘(PLS)回归是一种统计学方法。当多个因变量间以及多个自变量间存在严重的多重相关时,PLS是构造预测模型的一种有效方法。偏最小二乘回归法首先在自变量集中提取第一潜因子t1(t1为x1,x2,…,xn的线性组合,且尽可能多地提取原自变量集中的变异信息,比如第一主成分),在因变量集中也提取第一潜因子u1,并要求t1与u1相关程度达最大,然后建立因变量Y与t1的回归;如果回归方程已达到满意的精度,则算法终止,否则继续第二轮潜在因子的提取,直到能达到满意的精度为止;若最终对自变量集提取n个潜因子(t1,t2,…,tn),偏最小二乘回归将通过建立Y与t1,t2,…,tn的回归式,然后再表示为Y与原自变量的回归方程式。

2.2.2 岭回归法

岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,即通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法。当自变量存在多重共线关系时,均方误差将变得很大,而减少均方误差的方法就是用岭回归估计替代最小二乘估计。

设k≥0,则称

为β的岭回归估计,其中k称为岭参数。

2.3 反向传播神经网络

反向传播(BP)是“误差反向传播”的简称,是一种与最优化方法(如梯度下降法)结合使用的、用来训练人工神经网络的常见方法[21-22]。基本BP算法包括信号的正向传播和误差的反向传播两个过程。正向传播时,输入信号通过隐含层作用于输出节点,经过非线性变换产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程。误差反向传播是将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层所有单元,以从各层获得的误差信号作为调整各单元权值的依据。通过调整输入节点与隐层节点的联接强度和隐层节点与输出节点的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线性转换的信息。

在利用BP神经网络反演土壤含水量时,为了得到最佳反演模型,以多光谱相机的绿(550 nm)、红边(735 nm)、近红外(790 nm)三个波段单独或组合作为输入因子,来反演土壤含水量。

2.4 精度验证

本文通过土壤含水量实测值与反演值计算各回归模型和BP模型的决定系数(R2)和均方根误差(RMSE),评价各个模型的反演效果。其中,RMSE计算公式如下:

3 结果与分析

3.1 各波段间共线性分析

应用统计分析软件SPSS 20.0对4种深度的试验土柱的光谱反射率数据进行方差膨胀因子分析,结果见表2。

表2 试验土柱光谱反射率方差膨胀因子VIF统计

在共线性诊断中,通常当自变量的VIF大于10时,可以认为该变量与其他自变量之间存在较强的共线性问题[18]。由表2可见,只有3 cm和5 cm深度的红光波段VIF小于10 ,其余各深度各波段的VIF均远大于10。这说明4个波段间确实存在较为严重的共线性问题,所以在使用回归模型时必须考虑这一点。为最大程度消除自变量间共线性带来的影响,根据前人研究[5],本文构建的多元回归反演模型选用偏最小二乘回归法与岭回归法,同时重点研究反向传播神经网络反演模型。

3.2 回归模型结果分析

使用MATLAB R2017a软件对ECH2O土壤水分传感器在3月27至30日所采集的4种不同深度的土壤含水量数据,分别应用偏最小二乘回归法和岭回归法建立回归模型。样本数据中2/3用来建模,1/3留作模型的精度验证。2种回归模型、相关系数见表3。

表3 各波段反射率的2种回归分析模型Tab.3 Two regression analysis models of reflectance of all bands

根据表3可得出,两种回归模型反演4种深度的土壤含水量时表现出一定的规律性和差异。在规律性方面,两种模型的R2随着反演深度的变化呈现一致性,均为1 cm深度模型最高,而后随深度增加递减,至10 cm深度最小;在差异方面,根据共线性诊断结果,在岭回归法模型中未加入红光波段反射率值,而该模型R2整体优于偏最小二乘回归法。

3.3 土壤含水量BP神经网络反演模型

本文设计了5种反演土壤含水量的BP模型,分别由绿光(GREEN-BP)波段、红边(REG-BP)波段、近红外(NIR-BP)波段、红边-近红外(REG- NIR-BP)波段组合、绿-红边-近红外(GREEN-REG-NIR-BP)波段组合共计5种形式作为输入因子,ECH2O土壤水分传感器监测到的土壤含水量作为输出因子,模型空间拓扑结构分别为1-3-1(输入层为1,隐含层为3,输出层为1)、2-3-1(输入层为2,隐含层为3,输出层为1)、3-3-1(输入层为3,隐含层为3,输出层为1)。网络训练迭代次数设置为500,学习速率为0.03,学习误差设定为0.001。使用仿真软件MATLAB R2017a编写程序,将各波段反射率数据和土壤含水量监测数据导入训练网络模型,结果如图3所示。由于红光波段在此次BP神经网络反演中精度过低,故未考虑与展示。

从图2可以看到,4种不同深度(1 cm、 3 cm、5 cm、10 cm)下5种BP模型的反演结果差异较大。其中,GREEN-REG-NIR-BP模型反演效果最好;GREEN-BP模型反演效果最差,且随深度的增加反演效果越差,其在3 cm深度下R2最高,也仅达到0.473。综合来看,应用BP神经网络构建的土壤含水量反演模型,多波段组合作为输入因子的BP模型反演效果优于单一输入因子BP模型,且对于5 cm、10 cm深度土壤含水量的反演表现优异。

3.4 模型精度评价及分析

使用验证样本对各反演模型中进行精度评价。结果见表4。

由表4可以看出,偏最小二乘回归与岭回归2种回归模型对于各深度土壤含水量的反演精度均不高,回归模型R2最高的是1 cm深度下的岭回归法,仅为0.606。而基于BP神经网络的土壤含水量模型反演效果优越,其中GREEN-REG-NIR-BP模型对5 cm深度土壤含水量反演效果最好,模型R2达到0.975,RMSE为0.103。

4 结 论

(1) 通过对4个波段的土壤光谱反射率进行共线性诊断,其方差膨胀因子大部分都在10以上,表明各波段间有较强的共线性。因此,选择可以消除共线性影响的偏最小二乘回归法、岭回归法和BP神经网络模型对土壤含水量进行反演。

(2) 回归模型中,岭回归法的拟合精度和反演精度均高于偏最小二乘回归法。岭回归法反演1 cm深度土壤含水量的精度最高,但R2仅有0.606。相比之下,BP神经网络各深度对于土壤含水量的反演精度都优于岭回归模型,在实际应用中可优先采用BP神经网络在反演土壤含水量。

(3) 根据5种BP模型对4种深度的土壤含水量进行反演的结果,G-R-N-BP模型最优,对各深度土壤含水量反演精度均为最高。土壤含水量反演最佳深度为5 cm,模型R2达到0.975,RMSE为0.103。综合来看,G-R-N-BP模型反演精度高,可用性强,能够为矿区地表水分监测提供较好的支持。

猜你喜欢

共线性反射率波段
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
最佳波段选择的迁西县土地利用信息提取研究
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
银行不良贷款额影响因素分析
我国寿险需求影响因素的岭回归分析