APP下载

基于去包络线和连续投影算法的枣园土壤电导率光谱检测研究

2019-11-22喻彩丽张楠楠白铁成

干旱地区农业研究 2019年5期
关键词:包络线电导率波长

王 涛,喻彩丽,张楠楠,王 斐,白铁成

(1. 塔里木大学信息工程学院,新疆 阿拉尔 843300;2. 新疆南疆农业信息化研究中心,新疆 阿拉尔 843300;3. Gembloux Agro-Bio Tech, University of Liège, Gembloux, Belgium 25030)

土壤盐渍化可造成生态环境恶化、作物生产力下降、土壤肥力衰退,是制约农业生产和生态环境可持续发展的主要因素之一[1]。如何快速、实时地获得盐渍化土壤盐分信息,一直是精准农业所面临的一个重大课题,传统土壤盐渍化监测方法不但费时、费力,而且分析人员必须接触一些对人体有害的化学试剂,这显然有悖于现代农业的要求[2-4]。高光谱遥感凭借其波段多且连续、信息丰富、可同时估算多种成分等特点,为土壤盐渍化监测提供了新手段,很好地克服了传统人工监测方法的不足,在土壤盐渍化监测中获得广泛应用[5-8]。

土壤电导率是衡量土壤盐渍化程度的重要指标,研究土壤电导率与土壤盐分的相关性以及构建土壤盐渍化的高光谱定量反演模型是高光谱遥感的重要内容之一。不同学者对土壤盐渍化的高光谱定量反演进行了相关研究。Goldshlege等[9]通过获取番茄地高光谱反射率与土壤盐分含量,使用偏最小二乘法建立预测模型,取得了较好的预测精度,其中预测均方根误差RMSE是0.6%,决定系数R2是0.87。Rocha Neto等[10]在巴西半干旱地区使用土壤电导率进行土壤盐渍化评价,对比使用主成份回归、多元线性回归和偏最小二乘法建立的预测模型,其中使用偏最小二乘法获得了较好的预测精度,RMSE是1.22,RPD是2.21。Peng等[11]通过获取内蒙河套地区土壤光谱与盐分信息,使用偏最小二乘法建立土壤盐分监测模型,证明了通过外部参数预处理(EPO)光谱,能够剔除干扰信息,提升预测精度,RMSE是0.183,R2是0.878。彭杰等[12]通过分析南疆地区土样的高光谱数据和室内测定的盐分与电导率数据,发现高光谱信息对土壤含盐量的响应比电导率更敏感,以含盐量为监测指标的高光谱反演精度明显要优于电导率。李晓明等[13]通过研究陕北典型半干旱区土壤高光谱特征对盐分进行反演,发现土壤反射率经过包络线去除后,利用偏最小二乘回归方法建立的反演模型具有良好的精度,RMSE是1.253,R2是0.761。柴思跃等[14]以黄河三角洲土壤体积含水率、电导率为研究对象,应用遗传偏最小二乘法(GA-PLS) 建立了土壤水分与电导率光谱模型并验证其具有良好的预测精度,其中RPD是14.87,R2是0.71。王爽等[15]对库车河三角洲土壤的高光谱反射率及其土壤含盐量进行了研究,通过对土壤光谱反射率进行对数、均方根、连续统去除等处理筛选敏感光谱波段,构建地表实测光谱模型,证明反射率一阶微分光谱变换方式最好,与土壤含盐量相关性最佳,最大相关系数可达0.987。

尽管已有研究利用土壤电导率和含盐量指标,取得了相对理想的反演效果, 但不同区域的土壤结构、成分差异显著,高光谱响应和敏感波长也具有一定的差异性。因此,本文在总结前人研究基础上,以新疆阿拉尔典型沙壤土为研究区,依据高光谱影像数据与土壤电导率实测数据,重点验证连续投影算法(SPA)用于土壤电导率敏感特征波长的选择能力,并分析了去包络线方法的光谱预处理能力,使用偏最小二乘回归法(PLSR)建立土壤电导率检测模型。为利用遥感技术快速监测新疆南部地区土壤盐渍化提供理论依据和模型。

1 材料与方法

1.1 研究区概况

试验区位于新疆阿拉尔市十团,东经 81°13′3″,北纬40°34′45″,试验地海拔约1 020 m,为典型极端干旱气候区。年均降水量40.1~82.5 mm,年均气温10.8℃,年均蒸发量1 976.6~2 558.9 mm,土壤质地为沙壤土,属氯化物-硫酸盐类土壤类型,0~100 cm平均土壤容重1.34 g·cm-3,土壤含盐量1.2~1.5 g·kg-1,pH 8.49,土壤盐碱化严重。

1.2 样品采集与土壤电导率测定

以样区中心为起点,沿东、南、西、北四个方向采样,每个方向的样点分布于一条直线上,样点之间的距离为50 m左右,分别采集土壤表层盐分已结晶的表层土和0~20 cm的正常土壤,每个土样采集重量为2 kg左右,分别按1∶99,2∶98,…,99∶1的比例混合共获得142份不同盐分的土壤样本。将样本带回实验室自然风干,磨细过筛,过筛孔径为2 mm,用于光谱测试和电导率的测定, 电导率采用水土比为5∶1,利用DDS-307电导率仪直接进行测定[12]。如表1是根据SPXY算法[16]挑选出的100份样品作为定标集,其他40份土壤样品作为预测集。

1.3 土壤光谱测定

土壤光谱测定采用Zolix Gaia Sorter近红外成像高光谱仪,光谱测定范围 900~1 700 nm(实际测量到 1 750 nm),光谱分辨率5 nm,光谱采样点4 nm,共256个波段测定获取高光谱数据,每次测量前进行标准白板校正,每个样点重复采集10条光谱曲线(在ENVI 5.3 软件中导出光谱曲线),取平均值作为该样本的光谱吸收度,具体采集方法参考文献[12-13],剔除了2份异常样本后(光谱曲线缺失),共获得140个有效样本,如图1光谱吸收谱。

1.4 建模方法及评价指标

通过获取试验区样点光谱特征,分析其与土壤电导率的相关性遴选敏感波长,同时使用连续投影算法筛选敏感波长,分别用于土壤电导率的定量反演,采用PLSR方法建立土壤电导率的定量反演模型,并利用检验样点进行反演精度的对比研究。

表1 校正集和预测集土壤电导率统计

图1 土壤原始光谱曲线Fig.1 Original spectrum of soil

1.4.1 去包络线算法 在光谱曲线相似的情况下,直接从中提取光谱特征不便于计算, 因此需要对光谱曲线做进一步处理, 以突出光谱特征。包络线消除法可以有效突出光谱曲线的吸收、反射和发射特征,并将其归一到一个一致的光谱背景上, 有利于和其他光谱曲线进行特征数值的比较,本研究使用matlab编程实现对土壤原始光谱进行包络线去除处理,具体算法参考文献[17-19]。

1.4.2 相关性分析 通过对土壤高光谱进行去包络线归一化处理与不同的土壤电导率逐波段来进行相关分析,筛选相关系数高的波长为土壤含盐量敏感波长[7,11],计算土壤光谱每个波长与土壤盐分的相关系数ri,如式:

式中,ri为土壤电导率(EC)与光谱吸光度及其变换形式(R)的相关系数,i为波段号,D表示方差。

1.4.3 SPA方法 连续投影算法(successive projections algorithm, SPA)通过计算吸光度矩阵中某一波长对其他波长的投影,在该波长序列中选取投影量最大的波长作为下一个波长,序列中的每个波长都与其前一个波长相关性最小,能最大程度消除共线性对模型的干扰,降低建模过程的复杂度,以其简便、快速的特点得到越来越多的应用,本文对土壤的原始光谱和预处理光谱数据的校正集与验证集进行SPA选择,SPA选择变量数的最优区间是[2,50],具体算法参考文献[20-22]。

1.4.4 PLSR方法 通过获取样点光谱特征,遴选特征波段,采用最小二乘回归方法(partial least squares regression, PLSR)方法[23-25]建立土壤电导率的定量监测模型,并利用检验样点进行模型精度对比研究。

1.4.5 反演精度检验 反演模型精度检验通过对比均方根预测误差(root mean square error,RMSE),决定系数(R2)以及相对分析误差(residual predictive deviation,RPD)进行判断[27-28]。RMSE是一个表示模型预测值误差大小的指标,均方根误差越小,其预测精度越高;计算检验样点的RMSE,如式:

其中,Pi为检验样点定量反演预测值,Mi为检验样点的实测值。

R2是一个判断模型预测值和实测值之间相关性大小的指标,其值越接近1,其精度越高,拟合程度越好,预测值与实测值的相关性越好,观测点在回归直线附近越密集,一般来说R2>0.7则模型的预测结果可信度较高,反之,模型预测结果不可靠。R2计算公式如下:

其中,SR为回归平方和,Sε为残差平方和,Sr为总离差平方和。

RPD用来验证模型的稳定性和预测能力。一般情况下,当RPD>3,则模型具有较高的稳定性和良好的预测能力。RPD计算公式如下:

其中,SD为预测样品的标准偏差,SEP为预测标准分析误差。

2 结果与分析

2.1 相关性分析法与PLSR模型

分析土壤电导率与不同波长光谱特征的相关性,基于原始光谱相关性分析如图2a所示,相关系数曲线表明,光谱吸光度与土壤电导率在1 400~1 600 nm之间曲线变化相对平稳波动小,具有良好相关性;在1 350~1 400 nm之间相关系数曲线呈明显的波峰;在1 000~1 300 nm之间,随着波长的增加,相关系数整体呈增减趋势;在900~960 nm,1 650~1 750 nm之间相关系数曲线跳跃厉害,不宜用作土壤电导率模型的建立[11]。对原始光谱经过包络线去除获取的归一化吸光度如图2b所示,土壤电导率与光谱吸光度在1 400~1 500 nm之间具有良好相关性,且曲线变化相对平稳波动小;960~1 300 nm之间随着波长的增加,相关系数呈递减趋势;900~960 nm,1 500~1 750 nm曲线跳跃厉害,不宜用作土壤电导率模型的建立。

基于土壤原始光谱选择相关系数高的波长,用于建立土壤电导率监测模型[13,15]。通过研究不同波长吸光度与土壤电导率相关性,发现在1 350~1 560 nm波长的相关性较好,其中以1 439 nm相关系数最高,另一方面,在相关系数曲线上具有明显的波谷的波长是土壤电导率的特征波长,如:1 350~1 400 nm及1 450~1 560 nm范围之间,1 358,1 378,1 439, 1 491,1 549 nm可作为土壤电导率监测模型的特征波长[13],如图3a。然后利用PLSR方法,建立电导率监测模型为:

TS=-49.1190+1.0411×R1358

-0.3164×R1378-1.7389×R1439

-0.5499×R1491+1.6138×R1549

其中,R1358,R1378,R1439,R1491,R1549分别为1 358,1 378,1 439, 1 491 nm和1 549 nm波长的吸光度,TS为土壤电导率。提取的主成份个数是3个。为了考察回归方程的模型精度,在样品光谱采集时,利用同步采集的40个样本点作为检验样点绘制预测图,如图3b。定量反演的预测均方根误差RMSE为0.85566,决定系数R2为0.7479,相对分析误差RPD为2.7569,预测精度相对较低。

基于去包络线归一化光谱选择相关系数高的波长,用于土壤电导率监测模型[13,15]。如图4,通过研究不同波长吸光度与土壤盐电导率相关性,发现在1 350~1 500 nm波长的相关性较好,其中以1 443 nm相关性最高;另一方面,在相关系数曲线中具有明显的波谷的波长是土壤电导率的特征波长,如:1 350~1 400 nm及1 450~1 560 nm范围之间,1 341,1 358,1 385, 1 443,1 467 nm可作为土壤电导率反演的特征波段[13,19],如图4a。然后利用PLSR方法,建立土壤电导率监测模型为:

图2 土壤光谱与土壤电导率相关性分析Fig.2 Correlation analysis of soil spectrum and soil electrical conductivity

注:图中“□”为选择的特征波长。下同。Note: “□” in the figure is the selected characteristic wavelength. The same below.图3 基于土壤原始光谱筛选特征波长与土壤电导率预测Fig.3 The prediction model of soil electrical conductivity based on the original spectra correlation analysis

图4 基于包络线去除光谱筛选特征波长与土壤电导率预测Fig.4 The prediction model of soil electrical conductivity based on the continuum-removal original spectra

TS=1.1376+4.5626×R1341

-4.6909×R1358-9.6961×R1385

-4.0857×R1443-1.4945×R1467

其中,R1341,R1358,R1385,R1443,R1467分别为1 341,1 358,1 385,1 443,1 467 nm波长的吸光度,提取的主成份个数是3个。为了考察回归方程的模型精度,使用采集的40个样本点作为检验样点绘制预测图,如图4b。定量反演的预测均方根误差RMSE为0.44490,决定系数R2为0.9500,相对分析误差RPD为6.4510,预测精度相对原始光谱较好。

2.2 SPA特征波长选择与PLSR模型

对土壤原始光谱的数据校正集进行SPA选择,SPA选择变量数的最优区间是[2,50][20]。如图5a为SPA算法对土壤原始光谱数据进行压缩后所选择的特征波长。统计建模结果表明:针对原始光谱反映土壤电导率对应波段主要集中在1 300~1 600 nm附近,与图3a在1 300~1 600 nm的吸收峰和吸收谷基本一致。利用PLSR方法,建立土壤电导率监测模型为:

TS=3.1575-0.9573×R1443

+0.7783×R1501+0.3237×R1136

+0.0811×R1595-0.1639×R1355

其中,R1443,R1501,R1136,R1595,R1355,分别为1 443,1 501,1 136,1 595 nm和1 355 nm波长的吸光度,提取的主成份个数是5个。为了考察回归方程的模型精度,使用采集的40个样本点作为检验样点绘制预测图,如图5b。定量反演的预测均方根误差RMSE为0.31178,决定系数R2为0.9707,相对分析误差RPD为8.4445,预测精度相对于相关性分析建模的预测精度更好。

对去包络线归一化光谱的数据校正集进行SPA选择,如图6a,利用PLSR方法,建立土壤电导率监测模型为:

TS=15.4226-0.5074×R1446

+0.4355×R1402+0.4201×R1341

-0.5404×R1375+0.0835×R1661

+0.1112×R1595

其中,R1446,R1402,R1341,R1375,R1661,R1595,分别为1 446,1 402,1 341,1 375,1 661 nm和1 595 nm波长的吸光度,提取的主成份个数是5个。为了考察回归方程的模型精度,使用采集的40个样本点作为检验样点绘制预测图,如图6b。定量反演的预测均方根误差RMSE为0.30173,决定系数R2为0.9764,相对分析误差RPD为9.3215,预测精度最好。

图5 基于土壤原始光谱筛选特征波长与土壤电导率预测Fig.5 The prediction model of soil electrical conductivity based on original spectra used by SPA

图6 基于包络线去除光谱筛选特征波长与土壤电导率预测Fig.6 The prediction model of soil electrical conductivity based on the continuum-removal and SPA

2.3 PLSR模型定量反演精度比较

本文提出的不同处理方法的结果如表2所示,综合比较,本研究使用去包络线+相关性分析方法的定量反演模型的RMSE=0.44490,R2=0.9500和RPD=6.4510,要优于直接对原始光谱进行相关性分析的建模预测精度RMSE=0.85566,R2=0.7479和RPD=2.7569,这与柴思跃[14]和李晓明等[13]的研究结果类似,证明了去包络算法的可行性。通过SPA选择特征波长的反演精度可以发现,SPA方法的预测精度较高,优于相关性分析法。去包络处理+SPA定量反演模型的RMSE=0.30173,R2=0.9764和RPD=9.3215,是所有模型预测精度最好的,说明SPA具有较强的特征波长选择能力,采用去包络处理结合SPA方法的建模效果最为理想。

3 讨 论

在使用偏最小二乘法建立土壤电导率监测模型的方法中,不同的学者在选取特征波长和进行光谱预处理时选择了不同的方法,得出了不同的结论。

表2 不同方法对土壤电导率的检测精度对比

仅从方法的选取上进行对比,以经过预处理的光谱进行建模的效果基本上要好于原始光谱,其中柴思跃等[14]在使用包络线进行光谱预处理的基础上利用GA选取特征波长建立预测模型的精度明显要好于原始光谱;李晓明等[13]的结论中采用包络线去除方法,通过相关分析选取特征波长,预测的均方根误差明显降低了,证明了土壤反射率经过包络线去除后,利用偏最小二乘回归方法建立的反演模型具有良好的精度;Peng X等[11]通过偏最小二乘法建立的土壤盐分监测模型,预测的决定系数和相对分析误差明显提高,均方根误差明显降低,证明了通过外部参数预处理(EPO)光谱,能够剔除干扰信息,提升预测精度;彭杰等[12]在土壤含盐量与电导率的高光谱反演精度对比研究中,经过连续统去除处理,通过相关性分析选取特征波长,模型预测的决定系数和相对分析误差均没有提高。

结合本文的结论从光谱预处理方法进行分析,无论采用相关性分析法或SPA特征波长选择方法,在包络线去除归一化光谱后模型的建模精度皆优于原始光谱,通过去包络线归一化处理,既保持了光谱的吸收特征又达到了去除包络线的目的,减少其他物质光谱特征的干扰,证明了去包络线去除法的光谱预处理能力。

4 结 论

通过分析新疆阿拉尔市十团不同试验区枣园沙壤土的高光谱特征,对光谱进行预处理,选取特征波长建立土壤电导率反演模型,实现了对土壤电导率的快速检测。在包络线去除归一化光谱后的建模精度皆优于原始光谱,经过包络线去除处理后,相对于相关性分析法,连续投影算法选取特征波长进行建模的精度要更好,说明基于去包络线光谱预处理和连续投影算法建立偏最小二乘法回归模型,可实现土壤电导率的快速检测。本研究为南疆干旱区盐渍化土壤电导率的快速、准确检测提供了一定的理论依据。然而对于南疆耕作的沙壤土,其电导率是否能够完全反映土壤的含盐量,盐分含量和电导率之间的相关关系等需要在未来工作中加强对比研究。

猜你喜欢

包络线电导率波长
平面曲线运动中的包络线问题探讨
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
抛体的包络线方程的推导
一种用于故障隔离的参数区间包络线计算方法
基于比较测量法的冷却循环水系统电导率检测仪研究
低温胁迫葡萄新梢电导率和LT50值的研究
双波长激光治疗慢性牙周炎的疗效观察
日本研发出可完全覆盖可见光波长的LED光源
便携式多用途光波波长测量仪
EMD 包络线拟合算法改进及在泡沫尺寸趋势提取中的应用