内蒙古河套灌区土壤盐分多源多指数估算模型
2023-10-27李瑞平李正中魏美玲
王 欢,李瑞平*,张 寅,2,李正中,魏美玲
(1.内蒙古农业大学 水利与土木建筑工程学院,呼和浩特 010018;2.河套学院 水利与土木工程系,内蒙古 巴彦淖尔 015000;3.内蒙古河套灌区水利发展中心解放闸分中心,内蒙古 巴彦淖尔 015000)
内蒙古河套灌区土壤盐分多源多指数估算模型
王 欢1,李瑞平1*,张 寅1,2,李正中3,魏美玲3
(1.内蒙古农业大学 水利与土木建筑工程学院,呼和浩特 010018;2.河套学院 水利与土木工程系,内蒙古 巴彦淖尔 015000;3.内蒙古河套灌区水利发展中心解放闸分中心,内蒙古 巴彦淖尔 015000)
【目的】探究河套灌区乌拉特灌域土壤盐分遥感反演的最优方法。【方法】针对单一数据源、单一指数、单一算法对土壤盐分反演精度不高的问题,分别以光谱指数、极化组合指数为建模因子,利用偏最小二乘回归(PLSR)、自适应增强回归(AdaBoost)、随机森林回归(RF)3 种算法构建土壤盐分反演模型,筛选出最优的土壤盐分反演模型,并监测了2019—2021 年10 月乌拉特灌域土壤盐分的时空分布。【结果】对于PLSR 和AdaBoost 模型,光谱指数的预测效果优于极化组合指数,对于RF 模型,极化组合指数的预测效果优于光谱指数。PLSR 模型在反演10 cm深度处的土壤盐分时,光谱指数的反演效果最优,决定系数为0.70;AdaBoost 模型在反演2 cm 深度处的土壤盐分时,光谱指数反演效果最优,决定系数为0.74;RF 模型在反演2 cm 深度处的土壤盐分时,极化组合指数的反演效果最优,决定系数为0.64。乌拉特灌域土壤盐渍化程度较重的区域主要位于灌域东南部,而西北部和中部盐渍化程度较轻。【结论】应用AdaBoost 算法并结合改进的光谱指数有望提升河套灌区乌拉特灌域表层土壤盐分的反演精度。
哨兵遥感数据;土壤盐分;光谱指数;极化组合指数;机器学习
0 引 言
【研究意义】中国干旱、半干旱地区的农业可持续发展正面临着土壤盐渍化威胁[1-2]。传统的野外观测方法耗时耗力,无法大面积监测土壤盐渍化状况。相比之下,遥感技术的发展为大面积土壤盐渍化监测提供了技术支持[3]。【研究进展】Allbed 等[4]通过提取土壤盐分的敏感光谱指数和土壤盐度指数构建了土壤盐分反演模型,以监测区域土壤盐分分布。Fourati等[5]基于偏最小二乘回归构建了土壤盐分反演模型,得出短波红外波段在预测土壤盐分浓度方面的精度较高。马驰[6]通过研究不同极化组合指数与土壤盐分之间的交互作用,构建了土壤盐分反演模型。Ma 等[7]基于机器学习对土壤盐分进行了反演,证实了光学与雷达融合数据在土壤盐渍化监测中的可行性。大量研究表明,偏最小二乘回归(PLSR)、随机森林(RF)、自适应增强回归(AdaBoost)是反演区域土壤盐分的可行方法[8-10]。【切入点】尽管前人在土壤盐分反演领域取得了一定进展,但多数研究仅基于单一算法或单一指数,尚缺乏对不同算法、不同指数在土壤盐分反演中的对比分析。【拟解决的关键问题】鉴于此,本研究分别以改进的光谱指数、极化组合指数为建模因子,应用PLSR、AdaBoost、RF 这3 种方法构建土壤盐分反演模型,筛选出最优的土壤盐分反演模型,并量化2019—2021 年10 月乌拉特灌域的土壤盐分时空分布。研究结果可为内蒙古河套灌区乌拉特灌域的土壤盐分遥感反演提供理论指导与技术支持。
1 材料与方法
1.1 研究区概况
内蒙古河套灌区位于内蒙古自治区巴彦淖尔市,是我国最大的干旱型灌区[11]。研究区位于河套灌区最下游的乌拉特灌域(108°06′12″—109°39′43″E,40°27′39″—41°10′15″N),该地区为中温带大陆性气候区,年平均气温为6~8 ℃,年平均降水量为196~215 mm,年平均蒸发量为2 172. 5 mm[12]。乌拉特灌域的盐渍化土壤严重制约着该区域的农业可持续发展。
1.2 数据来源
1.2.1 野外数据的采集与测定
于2021 年10 月13—14 日开展野外土壤样品采集,采样期间天气晴朗,在研究区域内平行布设24个采样点,各采样点间隔25 m。在2、10、30 cm 土壤深度处依次采集土壤样品,每个深度处重复采样5次,记录采样点经纬度及周围环境状况。土样经风干、研磨、过2 mm 筛后,按蒸馏水与土样质量5∶1 的比例配置土壤溶液以测定土壤电导率,通过经验公式[13]计算土壤含盐量。
1.2.2 遥感数据的下载与处理
选取哨兵一号(Sentinel-1)和哨兵二号(Sentinel-2)作为遥感数据来源,影像数据下载于USGS 官网(http://glovis.usgd.gov/),所用Sentinel-1 影像为干涉宽幅模式(IW),产品数据为地距格式(GRD),数据级别为Level-1,极化方式为双极化(垂直极化VV、交叉极化VH),成像时间为2021 年10 月17 日,利用SNAP 软件进行轨道校正、去噪、辐射定标、地形校正处理。所用Sentinel-2 影像产品数据为L2A 级,成像时间为2021 年10 月13 日,利用Sen2cor 软件进行辐射定标、大气校正、重采样处理,采用ENVI软件进行波段融合、波段运算处理。
1.3 指数变量
Sentinel-2 通过不同波段的反射率来反映地物特征,并利用ENVI 软件提取光谱反射率。传统光谱指数由蓝、绿、红和近红外波段构成,易受植被和土壤等因素的影响,导致土壤盐分反演精度低,而短波红外波段(SWIRi)不易受上述因素影响,且能较好地识别土壤盐分浓度。因此,本研究引入SWIRi对传统光谱指数进行改进。分别选取5个植被指数(NDVI、EVI、SAVI、RVI、DVI)和5 个盐分指数(SI、SI3、S2、SI-T、NDSI)作为传统光谱指数,通过在上述10 个指数的计算式中添加SWIRi(i=1 或2)以改进传统光谱指数,每个传统光谱指数均对应4 种改进方法(2 种改进公式×2 种SWIRi取值)[14],详见表1。
表1 传统光谱指数的改进公式Table 1 Improved spectral index calculation formula
Sentinel-1 通过不同极化方式的后向散射系数表示地物后向散射特征,利用ENVI 软件提取出VV、VH后向散射系数,VV为垂直极化,VH为交叉极化。极化方式较少时,提取的土壤信息也会相对较少,而极化组合通过削弱噪声的影响且增强后向散射系数与土壤盐分的相关性[15],能够较好地解决该问题。因此,对VV、VH的2 组后向散射系数进行组合运算,得到21 个极化组合指数,分别为:VV、VH、VV+VH、VV-VH、VV2+VH2、VV2-VH2、VV2+VH、VV2-VH、VH2+VV、VH2-VV、(VV2+VH2)/VV、(VV2+VH2)/VH、(VV2-VH2)/VV、 (VV2-VH2)/VH、VV/VH、(VV+VH)/(VV-VH)、(VV2+VH2)/(VV2-VH2)、(VV2+VH2)/(VV+VH)、(VV2+VH2)/(VV-VH)、(VV2-VH2)/(VV+VH)、(VV2-VH2)/(VV-VH)。
1.4 建模方法及模型评价
PLSR 是一种基于多重线性回归的算法,其基本思想是将原始输入变量与响应变量不断进行线性组合,以获取相关性最大的新变量,从而降低数据维度,提取出关键特征信息[8]。AdaBoost 是一种迭代算法,其基本思想是对每个样本赋予一个权重,然后在每次迭代中依据当前样本权重分布来训练一个新的弱分类器,并根据分类器的分类误差值调整样本权重,将所有弱分类器按权重加权的方式组合成一个更强的分类器[9]。RF 是一种基于决策树的集成学习算法,其基本思想是通过构建多个相互独立且具有差异化的决策树形成随机森林,并对其进行投票集成来提高预测精度[10]。对野外实测的土壤盐分数据(24 个)随机分为训练集和验证集,训练集(70%,17 个样点)用于训练模型,验证集(30%,7 个样点)用于验证模型,以决定系数(R2)和均方根误差(RMSE)为模型精度评价指标,R2越接近于1、RMSE值越小,模型精度越高[14]。
2 结果与分析
2.1 土壤盐分统计分析
土壤盐分数据的统计特征见表2。随着土壤深度的增加,土壤盐分量随之降低。根据变异系数评估标准[16],不同深度处土壤盐分存在弱变异性。
表2 土壤盐分的描述性统计分析Table 2 Descriptive statistical analysis of soil salinity
2.2 光谱指数与土壤盐分之间的相关分析
光谱指数(传统光谱指数、改进光谱指数)与土壤盐分之间的相关系数见图1。ca、cb、cc分别表示2、10、30 cm 深度土壤处的传统光谱指数,gaa、gab、gac、gaaa、gaab、gaac、gba、gbb、gbc、gbba、gbbb、gbbc分别表示2、10、30 cm 土壤深度处的SWIR1(a)、SWIR2(a)、SWIR1(b)、SWIR2(b)的改进光谱指数。土壤深度为2 cm 时,土壤盐分与植被指数之间的相关性较高,土壤深度10 cm 时,土壤盐分与植被指数的相关性及其与盐分指数的相关性基本一致,土壤深度30 cm 时,土壤盐分与盐分指数之间的相关性较高。
图1 光谱指数与土壤盐分的相关性Fig.1 Correlation of spectral index with soil salinity
基于光谱指数与土壤盐分之间的相关性筛选出改进光谱指数的最优计算式,见表3。GNDVI、GEVI、GSAVI、GRVI、GDVI、GSI、GSI3、GS2、GSI-T、GNDSI表示最优计算式下的改进光谱指数,a、b、aa、bb为SWIR1(a)、SWIR1(b)、SWIR2(a)、SWIR2(b)计算式。由表3 可知,当土壤深度2 cm 时,应选用改进的DVI、NDSI、SAVI、SI-T作为反演模型的相关变量;当土壤深度为10 cm 时,应选用改进的DVI、NDSI、SI-T、SI3 作为反演模型的相关变量;当土壤深度30 cm 时,应选用改进的SI3、DVI、SI、RVI作为反演模型的相关变量。基于整体相关性特征,选取DVI、NDSI、SI-T、SI3 作为土壤盐分反演模型的相关变量。
表3 最优改进光谱指数与土壤盐分的相关性Table 3 Optimally improve the correlation between spectral index and soil salinity
光谱指数与土壤盐分之间的灰色关联度见表4。改进的光谱指数与土壤盐分之间的灰色关联度均高于传统光谱指数与土壤盐分之间的灰色关联度。土壤深度为2 cm 时,应选用改进的RVI、NDVI、EVI、SAVI作为反演模型的相关变量;土壤深度为10 cm 时,应选用改进的RVI、EVI、NDVI、S2 作为反演模型的相关变量;土壤深度为30 cm 时,应选用改进的RVI、EVI、NDVI、S2 作为反演模型的相关变量。考虑整体的关联度,应选用RVI、NDVI、EVI、S2 作为土壤盐分反演模型的相关变量。
表4 光谱指数与土壤盐分的灰色关联度Table 4 The grey correlation between spectral index and soil salinity
综合考虑相关性与关联度2 个层面,本研究最终选取DVI、NDSI、SI-T、SI3、RVI、NDVI、EVI、S2作为盐分反演模型的相关变量。
2.3 极化组合指数与土壤盐分之间的相关分析
后向散射系数与土壤盐分之间的相关分析见表5。VV与土壤盐分之间的相关程度(相关系数的绝对值)均高于VH,可见VV对土壤盐分的变化更为敏感。
进一步计算各极化组合指数与土壤盐分之间的灰色关联度可知,对于同一极化组合指数,其与土壤盐分之间的灰色关联度在大部分情况下随着土壤深度的增加而增大(表6)。
表5 后向散射系数与土壤盐分的相关性Table 5 Correlation of backscatter coefficient with soil salinity
表6 极化组合指数与土壤盐分的灰色关联度Table 6 The grey correlation between the polarization combination index and soil salinity
基于灰色关联度,按照由大到小的次序依次选取11 个极化组合指数,分别为:VV、VV+VH、VV2+VH2、VV2+VH、VV2-VH、(VV2+VH2)/VH、VV/VH、(VV+VH)/(VV-VH)、(VV2+VH2)/(VV2-VH2)、(VV2+VH2)/(VV-VH)、(VV2-VH2)/(VV-VH),依次记为a、b、c、d、e、f、g、h、l、m、n,土壤盐分记为s,对这11 个极化组合指数与土壤盐分进行相关分析,结果见图2。a与土壤盐分的相关性随着土壤深度的增加呈先增加后减小的趋势,b、d、n与土壤盐分的相关性随着土壤深度的增加呈先减小后增加的趋势,g与土壤盐分的相关性随着土壤深度的增加呈逐渐降低的趋势,c、e、f、h、l、m与土壤盐分的相关性随着土壤深度的增加变化不大。
图2 土壤盐分与极化组合指数的相关系数Fig.2 Correlation coefficient plot of soil salinity and polarization combination
2.4 土壤盐分反演模型优选
基于MATLAB 软件,构建基于PLSR、AdaBoost、RF 的土壤盐分反演模型,见表7—表9。2 cm(G)表示土壤深度为2 cm 的光谱指数,2 cm(J)表示土壤深度为2 cm 的极化组合指数,10、30 cm 同理。由表7 可知,对于PLSR 模型,光谱指数的预测效果优于极化组合指数,土壤深度为10 cm 时,2 种指数的变化趋势与土壤盐分的变化趋势较为相似。由表8 可知,对于AdaBoost 模型,光谱指数的预测效果优于极化组合指数,土壤深度为2 cm 时,光谱指数的变化趋势与土壤盐分的变化趋势较为相似,土壤深度为10 cm 时,极化组合指数的变化趋势与土壤盐分的变化趋势较为相似。由表9 可知,对于RF 模型,极化组合指数的预测效果优于光谱指数,土壤深度为2 cm时,2 种指数的变化趋势与土壤盐分的变化趋势较为相似。
对比分析3 种反演模型可知,基于光谱指数的AdaBoost 模型相比PLSR 模型的预测效果更好,基于极化组合指数的RF 模型相比PLSR 模型的预测效果更好。AdaBoost 模型的R2高于RF 模型,且AdaBoost模型的RMSE低于RF 模型。因此,基于光谱指数的AdaBoost 反演模型效果最佳。
表7 土壤盐分PLSR 反演模型Table 7 PLSR inversion model for soil salinity
表8 土壤盐分AdaBoost 反演模型Table 8 AdaBoost inversion model for soil salinity
表9 土壤盐分RF 反演模型Table 9 RF inversion model for soil salinity
2.5 乌拉特灌域土壤盐分监测
利用上述优选出的基于光谱指数的AdaBoost 反演模型反演了2019 年10 月、2020 年10 月、2021 年10 月乌拉特灌域土壤盐分空间分布,见图3。依据土壤盐分水平将研究区划分为Ⅰ、Ⅱ、Ⅲ共3 类,对应的土壤盐分水平分别为0~1、1~2 g/kg和2~4 g/kg[17]。土壤盐渍化程度较重的区域主要分布于研究区东南部,而西北部和中部区域的土壤盐渍化程度逐渐减弱。相同深度的土壤盐渍化程度逐年减弱,中部地区改良效果最为显著。随着土壤深度的增加,土壤盐渍化程度逐渐减弱。
根据土壤盐分空间分布,统计出乌拉特灌域2、10、30 cm 深度处土壤的Ⅰ、Ⅱ、Ⅲ类土壤所占比例(表10)。2019—2021 年,Ⅱ类土壤所占比例普遍较高,其次为Ⅲ类土壤,表明乌拉特灌域土壤盐碱化问题仍较为严峻。
图3 乌拉特灌域土壤盐分空间分布Fig.3 Spatial distribution of soil salinity in the Urartian irrigation basin
表10 乌拉特灌域土壤盐分不同等级比例分布Table 10 Proportional distribution of soil salinity in different grades in Urartian irrigation %
3 讨 论
中国北部干旱区土壤盐渍化问题尤为严重,这一现状对我国农业可持续发展构成了严峻挑战。遥感技术作为一种实时高效的研究手段,能够实现对土壤盐分的动态监测,符合精准农业的发展要求。本研究的目的是在不同土壤深度处,分别以光谱指数、极化组合指数为建模因子,利用PLSR、AdaBoost、RF 这3 种方法构建土壤盐分反演模型,得到土壤盐分反演的最优模型,并以此为基础,为土壤盐分的监测提供科学支撑。传统光谱指数由蓝、绿、红和近红外波段构成,易受植被和土壤背景等因素影响,导致土壤盐分反演精度较低,而短波红外波段不易受上述因素影响,能较好地反馈土壤盐分信息。因此,本研究引入了SWIRi对传统光谱指数进行改进,改进效果与潘肖燕[14]的研究结果相似。极化组合方式可以削弱噪声的干扰,且能够增强后向散射系数与土壤盐分之间的相关性。因此,本研究对VV、VH的2 组后向散射系数进行组合运算,得到21 个极化组合,进一步筛选得到11 个最优极化组合指数,通过机器学习择优筛选出最佳极化组合指数。极化组合指数可以增加土壤盐分的反演精度,不同土壤深度下不同极化组合指数对土壤盐分的敏感程度不同,这与杜瑜燕[18]的研究结果一致。本研究发现,基于光谱指数的AdaBoost模型相比PLSR 模型的预测效果更好,基于极化组合指数的RF 模型比PLSR 模型的预测效果更好。PLSR模型在处理土壤盐分与指数变量之间复杂关系时具有一定的局限性,而较强的非线性拟合和推广能力是机器学习的显著优势,这与陈俊英等[19]的研究结果一致。张智韬等[20]研究表明,土壤水分和盐分对土壤反射光谱会产生一定的干扰作用,从而在一定程度上影响土壤盐分反演。因此,在未来的土壤盐分反演研究中,水盐交互效应有待于进一步明确。
4 结 论
1)改进的光谱指数和极化组合指数能有效提高土壤盐分反演精度,且改进的光谱指数更适用于乌拉特灌域土壤盐分反演。
2)AdaBoost 模型整体表现最优,在反演2 cm 深度处的土壤盐分时精度最佳。
3)乌拉特灌域土壤盐渍化程度较高区域主要分布于东南部区域,而西北部和中部区域的土壤盐渍化程度较轻。
(作者声明本文无实际或潜在利益冲突)
Using Multi-source and Multi-index Method to Assess Soil Salinity in Hetao Irrigation District in Inner Mongolia
WANG Huan1, LI Ruiping1*, ZHANG Yin1,2, LI Zhengzhong3, WEI Meiling3
(1. College of Water Conservancy and Civil Engineering, Inner Mongolia Agricultural University, Hohhot 010018, China;2.Department of Water Conservancy and Civil Engineering, Hetao University, Bayannur 015000, China;3. Liberation Gate Branch Center, Inner Mongolia Hetao Irrigation District Water Conservancy Development Center, Bayannur 015000, China)
【Objective】This study is to propose a method to improve the accuracy of remote sensing-based soil salinity inversion in the Urartian irrigation area within the Hetao irrigation region.【Method】To address the challenge of low accuracy associated with using single data source, indices and algorithms for soil salinity inversion, we propose to use spectral indices and polarimetric-combination indices as the variables. Partial least squares regression(PLSR), adaptive boosting (AdaBoost), and random forest regression (RF) models were used to construct soil salinity inversion model, and the optimal inversion model was identified through comprehensive evaluation based on the spatiotemporal variation of soil salinity measured from the Urartian irrigation from 2019 to October 2021.【Result】The PLSR and AdaBoost models worked better using spectral indices than using polarimetric-combination indices, while RF model was superior in using the polarimetric-combination indices than using the spectral indices.The PLSR model was most accurate for predicting soil salinity at the depth of 10 cm, with the coefficient of determination being 0.70. The AdaBoost model was the best for predicting soil salinity at the depth of 2cm, with the coefficient of determination being 0.74, while the RF model worked best when using the polarimetric combination indices to predict soil salinity at the depth of 2 cm, with the coefficient of determination being 0.64. Soil with high salinity was predominantly located in the southeast, while soil in the northwest and the center were only slightly salinized. 【Conclusion】Combing the improved spectral index and the AdaBoost algorithm is more accurate in using the inversion model to predict the salinity of the surface soil in Urartian irrigation area in the Hetao irrigation district.
sentinel remote sensing data; soil salinity; spectral index; polarization combination index; machine learning
TP19;S156.4
A
10.13522/j.cnki.ggps.2023117
王欢, 李瑞平, 张寅, 等. 内蒙古河套灌区土壤盐分多源多指数估算模型[J]. 灌溉排水学报, 2023, 42(10): 122-128.
WANG Huan, LI Ruiping, ZHANG Yin, et al. Using Multi-source and Multi-index Method to Assess Soil Salinity in Hetao Irrigation District in Inner Mongolia[J]. Journal of Irrigation and Drainage, 2023, 42(10): 122-128.
1672 - 3317(2023)10 - 0122 - 07
2023-03-22
2023-06-13
2023-10-17
国家自然科学基金项目(52269004,52069021);内蒙古自然科学基金项目(2022MS05044)
王欢(1998-),女。硕士研究生,主要从事遥感干旱监测研究。E-mail: 1966096326@qq.com
李瑞平(1973-),男。教授,博士生导师,主要从事节水灌溉与农业水利遥感信息技术研究。E-mail: nmglrp@163.com
@《灌溉排水学报》编辑部,开放获取CC BY-NC-ND 协议
责任编辑:韩 洋