可见-近红外光谱的滨海土壤“除水”盐分估测
2021-10-17曹见飞王召海吴泉源
杨 晗, 曹见飞, 王召海, 吴泉源
山东师范大学地理与环境学院, 山东 济南 250014
引 言
部分沿海中轻度盐渍化土壤经整治可变更为耕地, 其改良和治理对耕地保护的意义重大[1]。 滨海盐碱区位于水陆交替的过渡带, 具有独特而敏感的生态系统[2]。 该地区土壤资源丰富, 但盐渍化问题严重, 土壤盐分的及时监测是保护生态环境, 实现滨海盐碱区资源合理利用的有效途径[2]。
可见光近红外(visible and near-infrared, Vis-NIR)光谱技术以其快速、 无损且经济高效的优势, 在土壤盐分估测和盐渍化监测中得到广泛应用[3]。 水分作为土壤的重要组成部分, 是几乎不可避免的光谱干扰因素, 对土壤反射率存在非线性影响[4]。 随着水分含量的上升, 土壤颗粒表面的水膜厚度将会增加, 从而改变土壤的反射特性, 导致反射率降低[3]。 对于风干土壤而言, 水分对反射率的影响并不显著, 甚至可以忽略不计[5]。 因此多数研究表明, 利用Vis-NIR光谱估测土壤盐分含量, 对实验室可控环境下的烘干土壤[5]或是干燥地区(如干旱半干旱地区)含水率较少的土壤更为适用[6]。 滨海盐碱区土壤的高水分含量将掩盖由土壤盐分引起的光谱变化[3], 同时土壤水分的高变异性特征, 也在一定程度上限制了盐渍土光谱的研究, 降低了Vis-NIR光谱定量估测土壤盐分的准确性。
近些年, 已提出了多种减轻光谱数据集中受噪声干扰的方法, 大多集中在弱化土壤水分的影响上。 “分类校准”是构建定量估测模型, 提高土壤属性估测精度的常用策略。 例如, 采用多因子判别分析(factorial discriminant analysis, FDA)[7]或归一化土壤湿度指数(normalized soil moisture index, NSMI)[8], 将湿土光谱分类为不同的水分组, 通过逐类别建模, 实现土壤属性估测。 该方法对水分高变异性的土壤而言, 选择分类梯度实现不同水分组样本均匀分布的难度较大, 且逐类建模的复杂性较高。 光谱转换和滤波算法可分别通过矩阵转换以及矩阵正交, 最大程度剔除光谱干扰[9]。 分段直接标准化(piecewise direct standardization, PDS)的光谱转换方法, 作为直接标准化(direct standardization, DS)的简化版, 通过不同窗口大小内的相邻波长实现光谱标准化, 以校正噪声影响的光谱[10]; 正交信号校正(orthogonal signal correction, OSC)是基于矩阵正交理论的光谱滤波算法, 通过光谱矩阵和浓度矩阵正交, 滤除因噪声干扰引起的波长偏移, 保留与土壤属性有关的信息, 从而提高Vis-NIR光谱估测精度[11]。 PDS和OSC被认为是有效减轻土壤水分干扰, 实现光谱校正的方法, 且受高变异水分的影响较弱, 具有一定普适性。 偏最小二乘回归(partial least square regression, PLSR)是Vis-NIR建模的常用方法[12], 故利用PDS和OSC与PLSR相结合的建模策略, 以减弱高变异性土壤水分对Vis-NIR光谱的干扰, 提高滨海盐碱区土壤盐分估测精度。
变量投影重要性(variable importance in projection, VIP)是探究模型潜在机理的常用方法, VIP值作为评估变量重要性的指标, 广泛应用于土壤重金属[12], 有机质[13]以及土壤盐分[6]估测过程中重要波长的识别。 Spearman相关系数是分析土壤属性与光谱特征间相关性的常用方法, 相关性高的波长, 同样被认为是相应的重要波长。 为加深对土壤盐分估测过程中重要波长的理解, 采用Spearman相关系数和VIP相结合的方法, 进一步解释模型估测机理。
采用PDS和OSC与PLSR相结合的策略, 建立滨海盐碱区高变异水分条件下“除水”Vis-NIR土壤盐分估测模型。 主要的目标有: (1)通过光谱分析, 探究土壤盐分和水分对土壤光谱的影响规律; (2)基于一阶导数光谱, 建立PDS光谱转换后的PDS-PLSR模型和OSC滤波后的OSC-PLSR模型, 评估PDS和OSC方法提高水分干扰下模型估算精度的潜力; (3)结合Spearman相关系数和VIP探究受水分干扰的土壤盐分估测模型机理, 为“除水”模型推广提供理论基础。
1 实验部分
1.1 样本采集
研究区设在黄河三角洲滨海盐碱区(37°37′—37°46′N, 118°42′—118°49′E), 该地属温带大陆性季风气候, 年平均气温和降水量分别为11.7~12.6 ℃和530~630 mm。 土壤类型为潮土、 盐土和新积土三个土类, 随着土壤中水分的蒸发, 盐分极易上升地表, 形成盐渍土[14]。
实验于2018年10月23日至27日进行, 此时采样区表面蒸发量大于降水量, 土壤盐分普遍增加。 结合Landsat影像, 在该地主要土地利用类型耕地、 草地和未利用地上, 分别设置密度小于1 km的67, 45和32个采样点共144个(图1)。 使用GPS接收器记录采样点坐标。 为减少空间分布不均匀造成的误差, 根据网格采样法, 使用木铲采集20 m半径内的五个表层土壤(0~20 cm)。 在剔除根组织、 草和叶等植物残留, 充分混合后得到约1 kg的土壤样本, 并全部移至实验室烘干, 压碎, 过2 mm筛, 制备1∶5土水比浸提液, 测定土壤盐分含量。
图1 采样区土壤样点分布
1.2 光谱测定及预处理
17个建模集土壤样本用于实验室控制实验, 共设计10个含水率梯度(0%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%和50%)。 127个验证集土壤样本用于随机验证实验, 根据1~50随机数整数设计随机含水率。 实验容器使用半径3 cm, 深度1 cm的铝制圆盒。 将土壤烘干至恒重, 压碎, 过2 mm筛子。 往铝制圆盒中加入高度约0.5 cm的土壤样本, 并记录土壤重量(精确到0.1 mg)。 距土壤表面中心上方1 cm, 使用滴管向土壤中添加不同重量的水。 将铝盒密闭静置在暗室中6个小时, 保证土样恒重。 再次测量容器总重量, 减去先前的重量即可得出土壤中水的准确重量。 使用以下公式计算土壤含水率(重量含水量)
(1)
式(1)中,SW是土壤含水率,mw是含水土壤样本的质量,mg是烘干土壤样本的质量。
土壤反射光谱使用ASD Field Spec3地物光谱仪(Analytical Spectra Devices, USA)在暗室中测得。 将两个50 W的卤素灯设置在距地面50 cm处, 作为唯一且稳定的光源。 以45°的照明天顶角, 在每个土壤样本表面10 cm的垂直高度上获取10条光谱曲线, 取算术平均值作为该土样实际反射光谱数据。 使用ViewSpec 6.2软件(Analytical Spectra Devices, USA)对光谱进行一阶导数变换, 以增强信噪比(SNR)锐化光谱特征。
1.3 “除水”模型建立与验证
PDS通过校正“主”仪器向“从”仪器传递的光谱, 实现“主”仪器上所建模型在“从”仪器上的应用并估测“从”仪器光谱[10]。 本研究中“主”对应干燥土壤光谱, “从”对应不同含水率的土壤光谱。 为确保PDS转换过程中不会对噪声建模, 测试了不同窗口大小的校正效果, 结果所得PDS的最佳窗口大小为5。 OSC通过矩阵正交的数学方法, 滤除自变量光谱矩阵中与因变量(土壤盐分)无关的光谱信息, 达到简化模型, 提高模型估测能力的目的[11]。
1.4 模型估测机理分析
为探究土壤盐分“除水”模型估测机理, 采用Spearman相关系数分析光谱与土壤盐分之间的相关性, 并利用VIP识别土壤盐分估测的最佳因子, 即估测模型中的重要波长[13]。 VIP得分大于1且相关系数值越接近1的波长, 即土壤盐分估测的重要波长与土壤盐分高相关性波长吻合, 则该波长视为对“除水”估测模型有重要意义的波长。 Spearman相关系数在SPSS 24(IBM, USA)件中计算, VIP值使用SIMCA 16软件(Sartorius Stedim Data Analytics AB, SE)计算。
2 结果与讨论
2.1 盐分影响下的土壤光谱
包含144个样本的总样本集土壤含盐量在0.56~35.87 g·kg-1之间, 平均值为3.51 g·kg-1, 标准差为6.22 g·kg-1。 建模集(17个土壤样本)土壤含盐量在0.56~34.66 g·kg-1之间, 平均值和标准差分别为4.49和4.1 g·kg-1。 验证集(127个土壤样本)土壤含盐量在0.78~35.87 g·kg-1之间, 平均值和标准差分别为3.47和6.34 g·kg-1。
采样区的主要可溶性盐是NaCl和MgCl2, 其中MgCl2作为高度吸湿盐, 可吸收环境中的水蒸气, 使土壤样本中的水分含量增加, 导致反射率降低[15]。 不同含盐量的干土光谱曲线如图2所示。 在整个波长范围内, 光谱反射率随着盐分的增加逐渐降低。 不同盐分的光谱曲线变化趋势相似, 突出特征出现的位置基本一致。 具体来说, 光谱曲线肩部在800和2 350 nm波段, 吸收特征在1 410, 1 940和2 210 nm附近。 在到达第一个吸收特征(1 410 nm)前, 反射率均随波长的增加逐渐上升, 光谱间的差异相对较小。 在之后的1 401~2 498 nm光谱区域, 反射率在0.35~0.5的范围内波动, 曲线的“峰”和“谷”位置相对稳定。 13.3和22.72 g·kg-1盐分光谱在800 nm之前没有明显区别。 800 nm之后, 特别是在1 940 nm吸收特征之后的波长域上, 盐分引起的光谱变化逐渐显著。 在800~1 382 nm的波长范围内, 低盐分含量的反射率低于高盐分的反射率。 相反, 1 410~2 498 nm波长范围内, 低盐分含量的反射率高于高盐分的反射率, 且差异增大。
图2 不同含盐量的干土平均反射率
2.2 水分和盐分共同影响下的土壤光谱
不同含水率(1%~50%)盐渍土(土壤盐分接近35 g·kg-1)的平均反射率如图3所示。 土壤盐分和水分共同影响下的反射光谱, 同样存在1 410, 1 940和2 210 nm附近的吸收特征, 以及800和2 350 nm的肩部特征。 水分放大了1 410和1 940 nm的两个强吸收特征, 位于1 410 nm的吸收中心波长随含水率增加, 不断向更长的波长偏移。 位于2 210 nm的吸收特征和800和2 350 nm的肩部特征在逐渐消失, 这主要是O—H和H—O—H的共同作用所导致的[5]。
图3 不同含水率的盐渍土(土壤盐分接近35 g·kg-1)平均反射率
干土的含水率在增加到40%的过程中, 整个光谱域上的光谱反射率持续降低。 降低趋势在长波长处更为明显, 这是由于长波长(>1 400 nm)对水的强烈吸收, 水分对光谱造成了更多影响[8]。 水分对1%和5%较低含水率的光谱影响不大, 反射率仅小幅(小于0.1)降低。 当含水率从5%增加到10%, 15%, 20%和25%, 整个波长范围内的反射率急剧下降, 在25%~40%含水率之间, 反射率降低速度减缓, 这主要因为土壤逐步从干土变为湿土, 吸附作用到毛细作用的转化基本完成[3], 光谱对水分变化的敏感程度减弱。 当含水率进一步升至50%, 反射率从下降转为上升, 在1 410 nm前上升幅度更大。 根据Liu等的研究结果, 此时已到达土壤“临界含水率”, 土壤孔隙中的水含量开始饱和[16]。
2.3 光谱转换和滤波后的土壤盐分估测模型
图4 含水条件下的土壤盐分估测模型
值得注意的是, PDS似乎没有表现出令人满意的弱化水分干扰的效果, PDS-PLSR建模后的估测精度不如PLSR, 可能的原因主要在两方面。 一方面, 水分对土壤光谱影响的非线性关系, 一般可用指数模型描述[4]。 PDS基于线性假设函数[10], 完成“从”光谱(不同含水率光谱)向“主”光谱(干燥光谱)的传递, 这种非线性关系定性为线性后的光谱转换, 存在波长偏移; 另一方面, 在PDS的转换过程中可能会去除某些特定的光谱特征[10], 从而剔除或减弱了部分有效的光谱反射, 造成模型估测结果不理想。 相比PDS, OSC算法可在不丢失有用信息的基础上, 删除与土壤属性不相关(正交)的光谱信息[13], 从而有效处理被水分掩盖的土壤盐分信息。 OSC-PLSR模型提高了土壤盐分定量估测的精度。 总结来说, 三种模型均能实现土壤盐分估测, 估测性能OSC-PLSR>PLSR>PDS-PLSR。
2.4 土壤盐分估测模型机理分析
显著性水平为0.01的Spearman相关系数(r)曲线以及VIP 大于1的区域分布如图5所示。 一阶导数光谱与土壤盐分的r介于-0.6~0.5之间, 除了830, 1 940和2 050 nm波长附近的相关性较高(|r|>0.4)外, 其余波长域上的r均在-0.2~0.2上下波动, 且相关曲线的“峰”和“谷”特征较弱。 PDS对光谱的校正作用并不明显, 相关系数曲线与一阶导数光谱相似,r同样介于-0.6~0.5之间。 OSC滤波后的光谱对土壤盐分的敏感性有所提升,r介于-0.8~0.7之间。 同时, OSC有效弱化了水分对1 410, 1 500以及2 100nm附近光谱的干扰, 扩大了“峰”和“谷”特征处的高相关性光谱区间。 在VIP 大于1的灰色区域内, 可观察到土壤盐分估测的重要波长。 与一阶导数光谱相比, PDS转换后的重要波长分布更加分散, 似乎包含了更多的冗余信息[13], 相反, OSC滤波后的重要波长分布更加集中和连续。
图5 在(a) PLSR; (b) PDS-PLSR; (c) OSC-PLSR模型中的变量投影重要性(VIP)以及土壤光谱与盐分之间的Spearman相关系数曲线(a)一阶导光谱数; 基于一阶导数光谱的(b) PDS转换和(c) OSC滤波
VIP与Spearman相关系数结合来看, 三种模型具有大致相同的重要波长。 具体来说, 均保留了830 nm附近与土壤盐分中的阳离子(Na+, Mg2+等)和振动基团(Cl-等)有关[17]的光谱特征, 均减轻了水中—OH基团[13]对1 940和2 050 nm附近光谱的干扰。 三种模型在830, 1 940和2 050 nm附近光谱域上实现了敏感波长(|r|>0.4)与重要波长(VIP>1)的吻合, 均可用于土壤盐分估测。 与常规的PLSR和基于PDS的PLSR模型相比, OSC-PLSR更精确的提炼了对土壤盐分估测有重要意义的波长, 进一步证明了模型OSC-PLSR>PLSR>PDS-PLSR的土壤盐分估测性能。
3 结 论
通过严格加水控制实验和随机验证实验, 研究水分对滨海含盐土壤光谱的影响规律, 探究了PDS和OSC减轻滨海土壤盐分估测模型中水分干扰的潜力, 并利用Spearman相关系数和VIP得分分析了土壤盐分估测模型机理。 得出以下结论:
(1)土壤中的盐分和水分对光谱吸收特征1 410, 1 940和2 210 nm附近波长的影响相似。 水分引起的反射率降低与土壤盐分引起的光谱变化重叠, 从而降低了土壤盐分估测准确性;
(3)位于830, 1 940和2 050 nm附近的波长(VIP>1)与土壤盐分显著相关的敏感波长(|r|>0.4)吻合程度, 是含水条件下模型估测盐分的关键。 相比PLSR和PDS-PLSR模型, OSC-PLSR更能有效“除水”提高模型估测精度, 主要机理在于OSC-PLSR更精确的提炼了以上对土壤盐分估测有重要意义的波长。 变量投影重要性(VIP)和Spearman相关系数(r)结合的分析策略成功解释了模型有效“除水”的原因, 为其推广提供理论基础。