土壤钾含量高光谱定量反演研究
2012-12-27蔺启忠王钦军王亚军
胡 芳,蔺启忠,王钦军,王亚军
(1.中国科学院对地观测与数字地球科学中心,北京 100094;2.中国科学院研究生院,北京 100049)
土壤钾含量高光谱定量反演研究
胡 芳1,2,蔺启忠1,王钦军1,王亚军1,2
(1.中国科学院对地观测与数字地球科学中心,北京 100094;2.中国科学院研究生院,北京 100049)
为了更快捷准确地进行土壤钾(K)含量的预测,基于土壤高光谱数据和化学元素分析数据,研究土壤光谱与土壤钾含量之间的定量关系。在对土壤原始光谱进行处理分析基础上,提取反射率(R)、反射率倒数的对数(log(1/R))、反射率一阶微分(R')和波段深度(BD)4种光谱指标,运用偏最小二乘回归方法建立相应的预测模型,并对模型进行检验。结果表明,波段深度是估算土壤钾含量最好的光谱指标,其建模精度超过0.85,均方根误差不超过0.1;全波段高光谱分辨率反射光谱具有快速有效估算土壤钾含量的潜力。
土壤;高光谱遥感;钾
0 引言
土壤作为陆地生态系统的关键组成部分,是农业生产的重要载体,通过与其他生态系统的物质交换(温室气体的排放、元素的淋失和积累等)影响全球变化进程[1-3]。钾(K)是植物生长必须的营养元素之一,也是土壤中含量最高的营养元素,在地壳所有矿物质营养元素中居第4位[4]。土壤钾含量高光谱定量反演研究可为土壤肥力变化及全球钾储量的可持续发展研究提供一种新型、快速的研究手段,具有重要的科学意义。
研究表明,原生矿物对土壤光谱具有一定影响[5],而钾元素主要以矿物态的形式存在于土壤中[6],因此可利用高光谱数据反演土壤钾含量。目前,国内外学者利用遥感技术研究土壤性质,多在可见光—近红外光谱条件下,运用多元线性回归、偏最小二乘回归等方法对影响土壤光谱反射特性的主要因素(如有机质[7]、水分[8]、盐渍度[9]、总氮[10]及重金属[11-12])含量进行预测,但是对土壤中矿物含量的研究较少,对土壤与高光谱遥感联合反演土壤矿物含量的研究更少。利用高光谱数据预测样品中某成分含量时,作为解释变量的反射光谱波长有几千个,往往超过了样本的个数,造成多重相关,用普通的多元线性回归方法难以建立稳健、精度较高的数学模型。
本文应用偏最小二乘回归方法,建立基于室内实测土壤光谱及其一系列变换产生的光谱指标(R,log(1/R),R',BD)与土壤钾含量的反演模型,探讨利用高光谱估算土壤钾含量的较好方法。
1 土壤光谱特征及研究区土壤钾含量分析
1.1 含钾矿物的光谱特征及其对土壤光谱曲线的影响
土壤中的钾主要以3种形式存在着:①速效钾,占土壤全钾量的1% ~2%,主要包括水溶性钾及交换性钾,其中交换性钾占速效钾总量95%以上,水溶性钾极少;②非交换态钾,指层状硅酸盐矿物层间固定的钾,主要存在于高岭石、伊利石等次生矿物中,占土壤全钾量的1% ~8%;③矿物结构钾,是土壤中钾的主要存在形态,占土壤全钾量的90% ~98%,主要存在于正长石、微斜长石、透长石和白云母等原生矿物中[13]。由此可知,土壤中钾98%以上存在于正长石、白云母等原生矿物及高岭石、伊利石等次生矿物中。利用ENVI提供的矿物光谱库,可分析各种含钾矿物的光谱特征。图1为几种典型含钾矿物的光谱曲线。
图1 含钾矿物光谱曲线Fig.1 Spectral curves of potassium -bearing
从图1可以看出,长石族(正长石、透长石、微斜长石)反射率在400~450 nm之间陡升,在整个波段范围内无明显特征吸收,反射率均很高。白云母反射率曲线在440 nm处存在吸收谷,这是由于白云母中Fe2+引起的[14];在1400 nm和1900 nm处存在水吸收谷;在2200 nm处存在较强吸收谷,为Al—OH作用吸收带[15];除这些吸收谷外白云母整体表现为强反射。高岭石在1400 nm和1900 nm处存在强水吸收带,1400 nm处吸收明显,分裂为两个谷;在2160~2170 nm和2200 nm处存在双吸收谷且前者弱后者强,为典型Al—OH吸收带;在可见—近红外波段整体反射率较高,在短波红外区间,整体吸收较强。伊利石在可见—近红外区整体反射率较低,在1400 nm和1900 nm处存在水吸收谷,在2200 nm处存在Al—OH吸收谷;与高岭石相比,伊利石的吸收带相对较弱。
自然状态下土壤表面的反射率没有明显的峰值和谷值[15],长石没有明显光谱特征但反射率很高,能使土壤颜色变亮,提高土壤反射率;受土壤水分的影响,土壤光谱在1400 nm和1900 nm处存在吸收谷;土壤中含有的高岭石、伊利石等含钾矿物使土壤光谱在2200 nm附近出现吸收谷。
1.2 实验区土壤中含钾状况
研究区域包括2个子区,分别位于内蒙古额济纳区域和甘肃疏勒河区域。灰棕漠土为额济纳区域的主要地带性土壤;疏勒河区域在暖温带极干旱气候背景下普遍发育的地带性土壤为棕漠土,植被主要为温性荒漠植被类型。经调查,实验区土壤钾含量范围在0.3~1.4 g/kg之间,其中额济纳区土壤钾含量平均为0.668 g/kg,疏勒河地区土壤钾含量平均为 0.579 g/kg。
2 数据获取及处理
2.1 采样与制作
2011年项目组人员在额济纳和疏勒河区域共采集了102个样本。采集样本时根据地域特征分为两类,一类是土壤表层(0~20 cm)样本;另一类是选取代表性的土壤剖面,进行分层采样(以手持GPS定位)。土壤样本经过剔除杂质、风干、磨碎后过0.2 mm土壤筛,将过筛后的样品分为2份,分别用于光谱测量和化学元素含量分析。
2.2 光谱数据及元素含量数据的获取
土壤光谱反射率在实验室内测量。采用ASD FieldSpec Pro FR全光谱便携式地物光谱仪,波长范围350~2500 nm,在350~1000 nm范围内采样间隔和光谱分辨率分别为1.4 nm和3 nm,在1000~2500nm范围内分别为2 nm和10 nm,输出波段数为2150(重采样间隔为1 nm)。传感器置于离土壤样本表面0.3 m的垂直上方,视场角为8°;设置1000 W的卤光灯,距土壤表面0.5 m,天顶角15°,可提供到土壤样本几乎平行的光线。每个土壤样本连续获取5条测量光谱,以白板光谱为参考获取样本的绝对反射率曲线,去除异常光谱曲线后进行算术平均运算,得到该样本的光谱反射率数据。
土壤化学元素含量的测量采用美国INNOV-X ALPHA-c8200便携式矿石(合金)元素分析仪在室内进行,测量的元素含量单位为g/kg。
2.3 光谱数据处理
由于光谱采样时不同波段采用不同的探测元件,导致探测元件分区接点处的光谱曲线数据出现轻微跳跃现象。本研究采用抛物线拟合校正方法[16]对此进行了处理。由于光谱仪各波段间对能量响应的差异,使得光谱曲线上存在一些噪声,利用卷积(Savitzky-Golay)平滑方法,选取3像元×3像元大小的窗口对光谱进行平滑去噪处理。测量光谱数据在2350~2500 nm之间噪声比较大,为了提高建模精度,将该波段范围的数据去掉。91个土壤样本的原始测量光谱和预处理后光谱曲线见图2(每种颜色光谱曲线代表1个样品的光谱曲线)。
图2 原始测量(左)及预处理后(右)的土壤样本光谱曲线FIg.2 Original spectral(left)and pre-processed(right)spectral of soil samples
由图2可知,研究区域土壤在可见光部分(350~780 nm)反射率呈上升趋势,在600 nm附近存在反射峰,此后缓慢上升,在1350 nm附近达到峰值后再缓慢下降;在1900 nm附近存在较大的吸收谷,与土壤中含水量相关;此后曲线又有一个比较缓的上升,在2200 nm附近存在较缓的吸收谷,符合土壤光谱曲线特征。
2.4 光谱指标提取
为了得到土壤样本的光谱反射率特征信息,对预处理后的光谱曲线进行了特征分析,利用参数表征光谱曲线的主要特征。本文对原始光谱反射率进行了3种变换,从中寻找对钾元素含量敏感的光谱指标,并利用其建立预测精度较高及稳定性较好的模型来预测实验区土壤钾含量。
将反射率进行倒数的对数变换(log(1/R))是处理非线性问题的方法。光谱反射率倒数的对数变换不仅趋向于增强可见光区的光谱差异,而且趋向于减少因光照条件变化引起的乘性因素的影响[17]。图3为土壤样品光谱反射率倒数的对数曲线。
图3 土壤光谱反射率倒数的对数曲线Fig.3 Spectral curves of inverse-log
光谱反射率的一阶微分是常用的光谱数学处理方法,对光谱曲线作一阶微分变换,可以对重叠混合光谱进行分解以便识别,扩大样本之间的光谱特征差异,去除与波长无关的漂移。同时,有研究表明,光谱经低阶微分处理后对噪声影响的敏感性有所降低[17],因而在实际应用中较有效。一阶微分光谱的近似计算公式为
式中:λi为每个波段的波长;f'(λi)为波长λi的一阶微分光谱;Δλ是波长λi-1到λi的间隔。由于土壤光谱反射率较小,光谱重采样后输出间隔为1 nm,其相邻的光谱的差值随波长变化较大,随着Δλ的增加,光谱微分曲线趋向于平滑,可能滤除掉许多细微的光谱特征,因此本研究中Δλ取5 nm。91个土壤样本的一阶微分光谱曲线见图4。
图4 土壤光谱反射率一阶微分曲线Fig.4 Spectral curves of first derivative
研究表明,土壤中含有的营养元素对土壤光谱有吸收作用,表现为光谱反射率降低。因此,本研究将基于反射率光谱曲线上的这些特征吸收带进行分析建模,估算土壤中钾含量。首先利用连续统去除法对光谱反射率曲线上的特征吸收带进行提取,图5为土壤样本反射率连续统去除后的光谱曲线图,它将每一样本点的反射率归一化到对应的光谱背景上,有利于光谱曲线之间特征波段的比较,并且可以有效地突出光谱曲线的吸收和反射特征,然后计算光谱波段深度。
图5 土壤反射光谱连续统去除曲线Fig.5 Continuum removed spectral curves
光谱波段深度计算公式为
式中:BD(λ),RC(λ)分别是光谱波段深度和连续统去除后光谱曲线。光谱波段深度曲线见图6。
图6 土壤反射光谱波段吸收深度曲线Fig.6 Band depth of soil samples
3 研究方法
本文采用偏最小二乘回归(partial least squares regression,PLSR)方法进行研究。PLSR法是因子分析和回归分析相结合的方法,能很好地解决许多普通多元线性回归难以解决的问题。它通过因子分析将光谱压缩为较低维空间数据,即将光谱数据向协方差最大方向投影,将原高光谱分解为多种主成分光谱,不同高光谱的主成分分别代表不同组分和因素对光谱的贡献,通过对主成分的合理选取,去掉代表干扰组分和干扰因素主成分,选用有用的主成分参与回归[18]。
本研究中考虑的是单因变量y和k个自变量{x1,x2,…xk}的建模问题。回归分析步骤如下:设样本数为n,自变量与因变量的数据集为X=[x1,x2,…xk]n×k,Y=[y]n×1,从 X 中提取出第一个成分t1(t1是x1,x2,…xk的线性组合,且携带X中最大的变异信息并与y相关程度最大),建立y对t1的回归方程,若精度符合要求,则算法中止;否则继续提取第二成分,直到达到满意精度。计算公式为
将式(4)代入式(3)中,即可得到y对x的偏最小二乘回归方程,即
式中:m为X中提取成分个数;a,b分别为y对t及y对x回归分析的回归系数;w为t对x的线性系数。
在回归分析中,采用方差分析法对建立的回归模型进行评价,首先利用相关系数来验证自变量与因变量之间的关系,保证自变量和因变量之间相关性符合回归模型允许范围;然后利用标准化均方根误差(RMSE)来评价测量数据偏离真实值的程度,RMSE越小,r越大,说明模型预测精度越高,模型稳健性就越好。其计算公式为
式中:ui为钾元素含量实测值;^ui为模型预测值;n为样本个数。
4 结果与分析
4.1 土壤样本钾元素含量分析
对91个土壤样本钾含量进行了简单的统计分析,结果如表1所示。
表1 土壤样本钾含量Tab.1 Statistical result of soil potassium content of soil samples
由表1可知,研究区域土壤样本中钾含量变异系数较小,比较平均,但偏度较高。不符合正态分布,说明本区域土壤钾含量不均衡,可能在土壤光谱曲线上特征不会很明显。
4.2 模型分析
91个土壤样本来自额济纳和疏勒河2个研究区,包含矿物成分比较复杂,因此将全部样本参与到建模及验证过程中,利用R,log(1/R),R'及BD这4种光谱指标,采用交叉验证(cross validation)中留一法(leave-one-out)建立 PLSR模型。RMSEC和RMSEP分别表示在建模和验证过程中的均方根误差,主成分数表示从光谱数据集中选出的用于解释钾含量数据集的成分个数。回归分析结果见表2。
表2 偏最小二乘回归分析土壤K含量结果Tab.2 PLSR results of K based on many spectral indexes
从表2可以看出,利用这4种光谱指标对钾含量进行回归分析建模的精度都比较高,除了R'的回归模型的相关系数为0.677偏低外,其余3种光谱指标 R,log(1/R),BD 分别为 0.802,0.8 和 0.853,均较高。对于钾元素,R'和BD的偏最小二乘回归收敛速度最快,分别选用了1和4个主成分。可能由于光谱作一阶微分时重采样而使光谱变得较平缓,同时扩大了某些特征差异,从而R'收敛时只选取第一个主成分。R和log(1/R)的偏最小二乘回归速度则要稍微慢一点,都选择了5个主成分。比较建模过程和验证过程可以发现,除了R'建模与验证的相关系数之差超过0.1外,其余3个光谱指标的相关系数之差均小于0.1,同时建模过程和验证过程中RMSE均比较小,两者之间差异也不超过0.03。这表明利用PLSR方法建立的回归模型比较稳定,预测精度较高。说明利用土壤可见—近红外高光谱对土壤中钾元素进行预测是可能的。
图7为91个建模样本与验证样本的实测钾含量与不同光谱指标建立的PLSR经验方程估算值的散点图。
图7 土壤K元素含量实测值与PLSR模型预测值比较Fig.7 Comparison of predicted potassium and measured potassium by PLSR
从图7可以看出:利用吸收深度BD得到的回归方程对于钾含量的反演结果比较好,其截距比较小,系数比较接近于1;R和log(1/R)得到的结果比较相近;而R'中样本截距较大,回归方程系数离1略远,且比较集中。钾含量高的样本点,其估算值与实测值更为接近,离回归线更近,而含量低的样本点相差较大,说明PLSR回归方程对中钾含量高处解释能力更好。
5 结论
1)在反演土壤钾含量的偏最小二乘回归分析中,采用波段吸收深度BD光谱指标的反演精度较高,且收敛速度很快;R和log(1/R)这2种光谱指标的建模精度与验证精度都很相近,收敛速度也相近;R'收敛速度很快,但是建模和验证稳定性不如前面3种光谱指标。
2)利用反射光谱波段吸收特征能有效地反演土壤钾含量,是反演钾含量的最佳模型,模型的建模相关系数和验证相关系数均大于0.75,均方根误差均小于 0.1,最小值仅为 0.072。
3)全波段高分辨率反射光谱具有快速有效估算土壤钾含量的潜力,将其结合偏最小二乘方法建立的预测模型稳健性较好,且预测精度较高,是高光谱技术与地球化学技术结合的集成研究,可为高光谱遥感在土壤地球化学实用性进程做前驱探索,也为土壤遥感地球化学研究提供了新的研究手段和方法。
[1]Uphoff N,Ball A S,Fernandes E C M,et al.Biological Approaches to Sustainable Soil Systems[M].London:Taylor& Francis Group,LLC,2006:3 -12.
[2]孙 波,解宪丽.全球变化下土壤功能演变的响应和反馈[J].地球科学进展,2005,20(8):903 -909.Sun B,Xie X L.Response and Feedback of Soil Function Evolvement to Global Change[J].Advance in Earth Science,2005,20(8):903-909(in Chinese with English Abstract).
[3]赵其国.提升对土壤认识,创新现代土壤学[J].土壤学报,2008,45(5):771 -777.Zhao Q G.Improving Knowledge of Soil,Innovating Modern Pedology[J].Acta Pedologica Sinica,2008,45(5):771 - 777(in Chinese with English Abstract).
[4]从日环,李小坤,鲁剑巍.土壤钾素转化的影响因素及其研究进展[J].华中农业大学学报,2007,26(6):907 -913.Cong R H,Li X K,Lu J W.Advances in Research on Influence Factors of Soil Potassium Transformation[J].Journal of Huazhong Agricultural University,2007,26(6):907 - 913(in Chinese with English Abstract).
[5]Lagacherie P,Baret F,Feret J B,et al.Estimation of Soil Clay and Calcium Carbonate Using Laboratory,Field and Airborne Hyper-spectral Measurements[J].Remote Sensing of Environment,2008,112(3):825-835.
[6]王 璐,蔺启忠,贾 东,等.基于反射光谱预测土壤重金属元素含量的研究[J].遥感学报,2007,11(6):906 -913.Wang L,Lin Q Z,Jia D,et al.Study on the Prediction of Soil Heavy Metal Elements Content Based on Reflectance Spectra[J].Journal of Remote Sensing,2007,11(6):906 - 913(in Chinese with English Abstract).
[7]Liu H J,Zhang Y Z,Zhang B.Novel Hyperspectral Reflectance Models for Estimating Black-soil Organic Matter in Northeast China[J].Environ Monit Access,2009,154(1/4):147 -154.
[8]Liu W D,Baret F,Gu X F,et al.Relating Soil Surface Moisture to Reflectance[J].Remote Sensing of Environment,2002(81):238 -246.
[9]Farifteh J,Van der Meer F,Atzberger C,et al.Quantitative Analysis of Salt-affected Soil Reflectance Spectra:A Comparison of Two Adaptive Methods(PLSR and ANN)[J].Remote Sensing of Environment,2007,110(1):59 -78.
[10]Chang C W,Laird D A.Near-infrared Reflectance Spectroscopic Analysis of Soil C and N[J].Soil Science,2002,167(2):110 -116.
[11]徐明星,吴绍华,周生路,等.重金属含量的高光谱建模反演:考古土壤中的应用[J].红外与毫米波学报,2011,30(2):109-114.Xu M X,Wu S H,Zhou S L,et al.Hyperspectral Reflectance Model for Retrieving Heavy Metal Content:Application in the Archaeological Soil[J].Journal of Infrared and Millimeter Waves,2011,30(2):109 -114(in Chinese with English Abstract).
[12]邬登巍,吴昀昭,马宏瑞.基于中红外漫反射光谱的土壤重金属元素含量预测研究[J].光谱学与光谱分析,2010,30(6):1498-1502.Wu D W,Wu Y Z,Ma H R.Study on the Brediction of Soil Heavy Metal Elements Content Based on Mid-infrared Diffuse Reflectance Spectra[J].Spectroscopy and Spectral Analysis,2010,30(6):1498-1502(in Chinese with English Abstract).
[13]Tan D S,Jin J Y,Huang S W,et al.Effect of Long - term Application of K Fertilizer and Wheat Straw to Soil on Crop Yield and Soil K Under Different Planting Systems[J].Agricultural Sciences in China,2007,6(2):200 -207.
[14]燕守勋,张 兵,赵永超,等.矿物与岩石的可见—近红外光谱特性综述[J].遥感技术与应用,2003,18(4):191 -201.Yan S X,Zhang B,Zhao Y C,et al.Summarizing the VIS -NIR Spectra of Minerals and Rocks[J].Remote Sensing Technology and Application,2003,18(4):191 -201(in Chinese with English Abstract).
[15]吴昀昭.南京城郊农业土壤重金属污染的遥感地球化学基础研究[D].南京:南京大学,2005.Wu Y Z.Heavy Metal Pollution in Suburban Soils of the Nanjing Area:A Feasibility Study of Remote Sensing Geochemistry[D].Nanjing:Nanjing University,2005(in Chinese with English Abstract).
[16]徐永明,蔺启忠,黄秀华,等.利用可见光/进红外反射光谱估算土壤总氮含量的实验研究[J].地理与地理信息科学,2005,21(1):19-22.Xu Y M,Lin Q Z,Huang X H,et al.Experimental Study on Total Nitrogen Concentration in Soil by VNIR Reflectance Spectrum[J].Geography and Geo- information Science,2005,21(1):19 - 22(in Chinese with English Abstract).
[17]何 挺,王 静,林宗坚,等.土壤有机质光谱特征研究[J],武汉大学学报:信息科学版,2006,31(11):975 -979.He T,Wang J,Lin Z J,et al.Spectral Features of Soil Organic Matter[J].Geomatics and Information Science of Wuhan University,2006,31(11):975 -979(in Chinese with English Abstract).
[18]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.Wang H W.Partial Least Squares Regression Methods and Applications[M].Beijing:National Defence Industry Press,1999(in Chinese).
Quantitative Inversion of Soil Potassium Content by Using Hyperspectral Reflectance
HU Fang1,2,LIN Qi- zhong1,WANG Qin - jun1,WANG Ya - jun1,2
(1.Center for Earth Observation and Digital Earth,Chinese Academy of Sciences,Beijing 100094,China;2.Graduate University of Chinese Academy of Sciences,Beijing 100049,China)
In order to predict the soil potassium content more quickly and accurately,this paper studied the relationship between soil spectrum and soil potassium content based on soil hyper-spectrum and chemical element analytical results.Based on preprocessing,the authors extracted the original soil spectrum and four parameters of spectra,i.e.,reflectance spectra,first derivative reflectance spectra,inverse - log spectra and band depth,so as to establish the prediction model for potassium content by PLSR.The model was tested,and the results indicate that band depth is the optimum parameter for inverting soil potassium content,with a minimum modeling correlation coefficient of 0.85 and maximum RMSE of 0.1.This research shows that,as a non - destructive method,the soil spectrum with high spectral resolution in the whole range has the potential for the rapid simultaneous prediction of potassium concentration.
soil;hyper-spectrum remote sensing;potassium
TP 79
A
1001-070X(2012)04-0157-06
2012-02-12;
2012-05-03
国家自然科学基金项目(编号:41171280)、国家科技支撑计划项目(编号:2012BAH27B05)以及中科院对地观测中心项目(编号:DESP01-04-10)共同资助。
10.6046/gtzyyg.2012.04.26
胡 芳(1988-),女,硕士研究生,主要从事土壤高光谱方面研究。E-mail:hf061314@126.com。
王钦军(1975 -),男,博士,副研究员。E -mail:qjwang@ceode.ac.cn。
(责任编辑:李 瑜)