小开河引黄灌区土壤盐渍化定量遥感反演
2019-12-27王军涛常步辉王东琦
刘 恩,王军涛,常步辉,王东琦
(1.黄河水利科学研究院,郑州 450045;2.河海大学水文水资源学院,南京 210098)
黄河三角洲地区自然资源丰富,开发前景广阔,是我国重要的后备土地资源区,也是我国滨海盐碱地集中分布区。土壤的盐渍化不仅会引起土壤肥力下降,土壤板结,而且会导致农作物减产,严重制约着该区域的农业与经济发展,对生态环境的稳定性也造成了一定影响。因此开展黄河三角洲土壤盐渍化动态监测与治理,改善土壤状况,对区域农业和生态资源的可持续发展具有重要意义。
国外卫星遥感应用于土壤盐渍化监测始于20世纪70年代[1],到了90年代,遥感数据源变得更丰富,遥感监测方法也更加成熟。Bao.B.R.M作了盐渍土光谱特征的专门研究,与一般耕地相比,盐渍土在可见光和近红外波段光谱反射强;土壤盐渍化程度越高,光谱反射越强[2]。Dwivedi.R.S作了盐渍土监测中最佳波段组合的试验,研究表明:TM数据1、3和5波段组合所含遥感数据信息量最大,但盐渍土信息提取精度并不与遥感数据信息量的大小成正比[3]。Mougenot等对不同地表形态研究得出:一般情况下,盐渍化地表在可见光和近红外波段的反射较一般地表强。相同含盐量的盐壳,表层破坏使得粗糙度增加,虽然其总体反射会降低,但光谱曲线没变化[4]。
国内学者在盐渍化监测方面也取得了长足的进展。曹建荣在基于landsat TM/ETM影像的黄河三角洲盐渍土动态变化分析中,发现盐荒地在1、5波段的DN值远高于其他地类,因此用来构建土地指数并制作土地退化等级图。结果表明黄河三角洲近10 a来盐碱地呈加重的趋势,土地退化明显[5]。扶卿华等以河北省黄骅市为研究区对实测土壤光谱进行分析,发现波长451.42~593.79 nm范围内的反射率对土壤盐分含量较为敏感,建立了土壤盐分含量反演模型,结果表明BP神经网络有很强的非线性拟合能力,能显著提高反演精度[6]。樊彦国在基于Landsat8的黄河三角洲盐渍化反演中,发现光谱反射率在近红外波段最大,同时BP神经网络的反演精度要高于多元回归模型[7]。
本文以黄河三角洲小开河灌区为研究区,以Landsat8 OLI影像为数据源,结合野外取样并在实验室测得的土壤全盐量,分别采用多元线性回归模型和BP神经网络模型构建土壤盐分反演模型,对比两个模型的反演精度后采用BP神经网络模型进行土壤盐分定量遥感反演,为提高黄河三角洲引黄灌区盐分定量反演精度提供一种新的手段,为土壤盐渍化的改善和治理提供依据。
1 研究区概况与数据获取
1.1 研究区概况
小开河引黄灌区位于黄河下游左岸,地处黄河三角洲腹地,纵贯山东省滨州市中部,南起黄河大堤,北至无棣县,东以秦口河及新立河为界,西以崔灌区为邻。地理坐标东经117°42′~118°04′,北纬37°17′~38°03′。该地区属半干旱、半湿润季风气候,有明显季节变化,多年平均降雨584 mm,多年平均水面蒸发量为1 154 mm,蒸降比约为2∶1,地下水矿化度在2.0~5.0 g/L之间,地下水埋深为1~2 m,排水不畅,绝大多数浅层地下水不能作为灌溉水源,并极易引起土壤盐渍化,灌区内的土壤类型主要为潮土和盐化潮。
1.2 野外实测土壤盐分数据
根据研究区的气候特征和土壤盐分的季节性变化,于2017年4月23-30日在研究区进行野外调查和取样,取样时间与Landsat8影像获取时间保持同步。设计采样点51处,采样深度为表层土壤0~20 cm,每个采样点用GPS记录其地理坐标。随机选取21个样点带回实验室分别测EC1∶5和全盐量,并建立这21个样点的全盐量和电导率的关系,如图1所示。
图1 实测样点全盐量和电导率的关系Fig.1 Relationship between total salt content and conductivity of sampling points
土壤全盐量和电导率的关系式如下:
y=0.002 4x+0.242 5
(1)
式中:y表示土壤可溶性全盐量,g/kg;x表示电导率,mS/cm。
1.3 遥感影像获取与预处理
Landsat 8卫星发射于2013年,该卫星携带两个主要载荷:OLI和TIRS,OLI陆地成像仪包括了9个波段,其中包括1个分辨率为15 m的全色波段,7个分辨率为30 m的多光谱波段,一个卷云波段,成像宽幅为185 km×185 km。
综合取样时间和遥感影像的质量,研究采用2017年4月30日的landsat8 OLI影像,利用ENVI软件对影像进行预处理。
(1)几何校正:下载的影像是已经校正过的,且精度符合要求,所以无需做几何校正。
(2)辐射定标:对多光谱波段和全色波段分别做辐射定标,将影像DN值转换为光谱辐射率。
(3)FLASSH大气校正:为了消除大气、水汽对各波段反射率的影响,对多光谱数据进行FLASSH大气校正,校正后遥感影像得到真实的地表反射率值。
(4)图像融合和裁剪:将处理后的全色和多光谱波段进行融合,在ENVI中利用ROI工具裁剪出研究区。
(5)地表反射率提取:将包含经纬度坐标的样点导入ENVI Classic,在ENVI Classic中提取并导出各个波段的地表反射率数据。研究区影像及样点分布见图2。
图2 研究区及采样点分布Fig.2 Distribution of study area and sampling points
2 数据分析处理
2.1 盐渍土光谱特征分析
从定性的角度分析小开河灌区土壤盐分含量与影像反射率值的关系,根据测得的土壤盐分含量数据,选择六组具有代表性的典型样点分析其光谱曲线特征。由图3可知:①曲线的整体变化趋势基本一致,同一盐分含量的光谱反射率值在可见光部分较低,随着波长的增大而逐渐增大,在红光波段(Band 4)反射率值陡增,当波长达到近红外光(Band 5)时,反射率值达到最大,随后随着波长的增加而减小;②对于同一波段的样点,随着盐分含量的增高光谱反射率值逐渐减小。
图3 不同盐分含量的盐渍土光谱曲线特征Fig.3 Spectral curve characteristics of saline soil with different salt contents
2.2 敏感波段的选取
分析遥感影像的光谱曲线特征,筛选出能定量反演土壤盐分含量的敏感波段。首先计算遥感影像51个样点的反射率数据和土壤含盐量的相关系数,见表1,结果表明:光谱反射率数据与土壤含盐量均呈负相关,且第5、6、7波段的相关性要高于前4个波段。研究表明第5波段即近红外波段的反射率与土壤盐分含量的相关系数最高[8,9],这也与本文研究结果一致。
为了进一步研究遥感影像光谱数据对土壤盐分含量的敏感程度,采用诊断指数法来计算landsat8影像各波段反射率的诊断指数。诊断指数(Pi)公式如下:
Pi=σiRi
(2)
式中:Ri为波段i光谱反射率和土壤盐分含量的相关系数;σi为波段i反射率值的均方差。
诊断指数Pi越大,表明该波段对土壤盐分含量越敏感。分别计算各波段的诊断指数,结果表明第5、6、7波段的反射率数据适用于研究区盐分含量的反演,见表1。
表1 各波段反射率与土壤含盐量的相关系数、均方差和诊断指数Tab.1 Correlation coefficient、mean square error and diagnostic index between soil salinity and reflectance of each band
3 多元线性回归模型的建立与应用
3.1 基于敏感波段的多元回归模型
研究采用SPSS构建多元线性回归模型,将51组样本随机分为两组,其中一组41个样本用于建立回归模型,另一组10个样本用于验证回归模型的精度。将41组样点的反射率数据进行倒数、对数、对数的倒数变换作为自变量,以对应土壤盐分含量作为因变量,进行多元线性回归分析。回归模型的效果用决定系数R2和校正的决定系数(AdjustedR2)进行检验,经过校正的R2能消除无关变量对决定系数R2的影响,AdjustedR2越接近1,表示回归模型拟合效果越好。RMSE(均方根误差)表示实测值和回归方程模拟值的误差,RMSE越小,预测效果越好。
表2是以遥感影像b5、b6、b7波段的光谱反射率及变换形式为自变量,土壤盐分含量为因变量建立的多元线性回归模型。
在4个回归模型中,通过比较AdjustedR2和RMSE,盐渍土反射率的倒数和盐分含量建立的回归模型(Y=-20.392+5.179/b5+0.76/b6-0.148/b7 )AdjustedR2最大,均方根误差RMSE最小,回归效果最好,可以用来反演土壤盐分含量。
3.2 模型的精度验证
利用剩余的10个土样的盐分含量值对建立的多元线性回归方程进行验证,结果见表3。
表2 敏感波段反射率及变换形式的回归方程Tab.2 Regression equations for reflectance and transformation of sensitive bands
表3 多元回归模型土壤盐分反演结果Tab.3 Soil salinity inversion results of multi-regression model
对这10个土样的实测值和预测值进行误差分析可知,多元回归模型的预测值最大相对误差达到86.41%,最小相对误差为-9.63%,平均相对误差为39.1%,误差分布不均匀,预测效果不稳定,这表明多元回归模型反演精度较差。由于土壤光谱是多种因素共同作用的结果,土壤盐分含量的反演与不是简单的线性关系。
4 BP神经网络模型的建立和应用
本研究采用MATLAB 9.4编程BP神经网络模型,将51个土壤盐分数据分为两组,一组作为训练样本,共41个;另一组作为测试样本,共10个。Landsat 8影像的b5、b6、b7的反射率数据作为网络的输入,土壤盐分含量作为网络的输出。设计BP神经网络时主要考虑隐层数、隐层节点数和激励函数、期望误差等。根据研究区土壤盐分反演的实际情况,单隐层即可达到建模要求,隐含层节点数k可以根据经验公式计算:
式中:m和n分别为输入层和输出层的变量个数;a为0~10之间的整数。
为了确定最佳的隐层节点数,分别计算了当其他网络参数相同时,不同节点数的R2和RMSE,见表4。综合时间效率和模拟效果,最终确定隐含层的节点数为12个。
在对神经网络训练之前,为了加快神经网络的收敛,需要对神经网络的输入和输出数据做归一化处理,仿真之后再反归一化。神经网络模型的隐层和输出层分别采用Tansig和Purelin传递函数,训练函数有traingdx、trainlm、trainscg等,经过多次尝试决定采用traingdx训练函数。神经网络训练次数为3 000次,目标误差为0.000 1,学习速率为0.01,训练模型的样本预测值见表5。
表4 不同隐层节点数训练样本的R2和RMSETab.4 R2 and RMSE of training samples with different hidden layer nodes
表5 BP神经网络模型反演结果Tab.5 Inversion results of BP neural network model
由表5可知,利用BP神经网络模型对土壤盐分进行反演,预测值和实测值的最大相对误差为-61.61%,最小相对误差为0.53%,有60%的样点反演误差低于10%,平均相对误差为15.4%,与多元回归模型的39.1%相比,BP神经网络模型反演精度更高。
图4 模型反演结果与实测盐分含量对比Fig.4 Comparison between model inversion results and measured salt content
利用BP神经网络模型对研究区的土壤盐分含量反演,见图4。结果表明:研究区北部和中部含盐量较高,南部盐分含量较低;由于北部地区有较多的盐池,中部地势低洼,地下水位高,容易积累盐分,所以导致这两部分区域盐分含量较。综上所述,利用BP神经网络反演土壤盐分含量分布与研究区实际调查情况较为符合。
图5 BP神经网络盐分反演结果Fig.5 BP neural network salt inversion results
5 结 语
本研究以小开河引黄灌区为研究对象,将野外调查取样和室内实验相结合,分析土壤盐分含量与Landsat8 遥感影像光谱反射率数据的相关关系,利用多元回归模型和BP神经网络模型定量反演研究区土壤盐分含量,进而反演出研究区土壤盐渍化信息并制图。
(1)利用诊断指数法筛选出Landsat8遥感影像的敏感波段,结合实测土壤盐分含量建立多元回归模型,模型的决定系数R2为0.812,最大相对误差为86.41%,最小相对误差为7.62%,模型预测具有较大的波动,土壤盐分含量和影像光谱反射率不是单纯的线性关系,因此反演精度不佳。
(2)利用BP神经网络反演研究区土壤盐分含量,最大相对误差为61.61%,最小相对误差为0.53%,平均相对误差为18.6%。相比多元回归模型来说,BP神经网络具有较强的非线性拟合能力,反演精度更高。
(3)土壤盐分含量的影响因素有很多,如地下水埋深、土壤含水量、地下水矿化度和土壤有机质含量等,遥感信息的影响因素较多,仅将遥感信息与土壤盐分含量相结合反演土壤盐分含量会有较大误差,下一阶段应结合实测数据对盐渍土反演,反演精度会进一步提高。
(4)本研究只是反演了研究区某一时间点的土壤盐分含量,分析了土壤盐分含量的空间分布,下一阶段应从时间尺度和空间尺度考虑,分析土壤盐分含量的时空演变规律。
(5)利用BP神经网络反演土壤盐分含量时,神经网络仅是在有限次训练对比得到的优解,并非是模型最优解。应尝试偏最小二乘法、支持向量机、主成分回归分析等方法,以提高神经网络的泛化能力。
□