APP下载

基于宽波段数据定量反演土壤有机质含量的研究

2017-10-30陈旭李明葛芳芳

湖北农业科学 2017年18期

陈旭 李明 葛芳芳

摘要:定量分析了北京顺义、通州区土壤高光谱反射特征,利用资源三号、高分一号、高分二号传感器的光谱响应函数,结合高光谱数据生成相应宽波段模拟数据;将土壤光谱数据、拟合宽波段数据分别与实测土壤有机质含量开展相关性分析,提取并筛选敏感波段,利用偏最小二乘法建立基于高光谱数据的土壤有机质含量预测模型;依据宽波段模拟数据和实测土壤有机质含量的相关性,提取并筛选敏感波段,建立土壤有机质含量预测模型。结果表明,在基于土壤高光谱数据建立的土壤有机质含量预测模型中,以对数的一阶微分为最优,其R和RMSE分别为0.697和0.195,偏最小二乘法得到的反演土壤有机质含量的模型是可靠的;在基于模拟宽波段构建的土壤有机质含量估测模型中,以高分一号的拟合精度最高,R和RMSE分别为0.334和0.240;受室外不可控因素的影响,模拟宽波段数据在估测北方地区土壤有机质含量方面仍需进一步研究。

关键词:宽波段;反射率模拟;土壤有机质;偏最小二乘

中图分类号:TP79 文献标识码:A 文章编号:0439-8114(2017)18-3540-05

DOI:10.14088/j.cnki.issn0439-8114.2017.18.038

Abstract: In this study, the hyperspectral reflectance characteristics of soils in Shunyi and Tongzhou districts of Beijing city were quantitatively analyzed, and the corresponding spectral data were generated by using the spectral response function of resource No.3,high score one and high score two sensors,and the corresponding spectral data were generated by hyperspectral data. The method was used to analyze the soil organic matter content based on hyperspectral data. Based on the broad-band simulation data and the measured soil organic matter content, the soil organic matter content was calculated by using the partial least squares method. And the sensitive bands were extracted and screened to establish the soil organic matter content prediction model. The results show that the soil organic matter content is the best in the soil organic matter content prediction model based on soil hyperspectral data. The R and RMSE are 0.697 and 0.195, respectively. The soil organic matter content The model is reliable. In the soil organic matter content estimation model based on the simulation of wide-band construction, the fitting accuracy of high score number is the highest, R and RMSE are 0.334 and 0.240 respectively. By outdoor uncontrollable factors, the data need to be further studied in estimating the soil organic matter content in the north.

Key words: wide band; reflectance simulation; soil organic matter; partial least squares method

土壤有机质含量(Soil organic matter,SOM)是指土壤内的有机物质,其主要由各种动植物和微生物的躯体及其合成与分解衍生有机物构成。土壤有机质是农田耕层土壤的重要构成成分,其对土壤肥力、土壤健康、生态保护及农业可持续发展等方面均有重要作用。遥感技术具有大尺度同步观测、时效性强、数据综合可比性等优点,在对地观测方面应用广泛。随着高光谱技术的快速发展给土壤有机质含量的监测提供技术支撑,极大地丰富了研究内容。因此,快速、准确、实时监测土壤有机质含量成为可能。分析研究土壤有机质含量与高光谱数据间的内在关系,进而快速精准测定土壤有机质含量,逐渐成为相关专家学者研究热点[1]。

随着光谱分辨率的提高以及算法的日渐成熟,国内外许多专家学者在土壤有机质含量与其光谱响应关系上的研究成果显著。Shepherd等[2]研究发现,高光谱数据在处理时,一阶微分和二阶微分对高光谱函数的处理变换能为模型提供可靠的自变量因子,进而使模型精度得到保障。Krishnan等[3]研究发现,土壤有机质含量在623和564 nm处比较敏感,并用这两组数据反射率进行变换构建了土壤有机质含量多元线性回归的预测模型。随着研究的深入,高光谱数据的一阶微分、倒数等变换形式与土壤有机质建立的模型效果较好,多元线性函数、二次函数能够准确描述黑龙江地区黑土有机质含量,且线性方程预测模型优于二次函数预测模型[4,5]。经过对较大范围内的土壤进行研究后发现600~700 nm处有机质的含量与光谱反射率呈负相关,并建立了精度較高的红外波段预测模型[6,7]。通过对比试验发现,有机质含量高于2%并不是进行土壤有机质预测模型研究的必要条件,对含量较低的有机质含量的研究有重大意义。基于这些研究,人们开始用不同的算法反演有机质含量,通过研究发现神经网络和小波变换定量在反演土壤有机质含量方面精度较高,具有可行性[8,9]。endprint

本研究定量分析了北京顺义、通州区土壤高光谱反射特征,通过12种变换开展相关性分析,筛选敏感波段,建立了基于高光谱与北方土壤有机质含量的预测模型,然后用高光谱数据的拟合宽波段,建立拟合宽波段与北方土壤有机质含量预测模型。对两种模型进行对比,探讨了模拟宽波段数据在土壤有机质含量监测方面的可行性,从而为更好地利用遥感数据对土壤有机质含量监测提供技术支撑。

1 材料与方法

1.1 研究区与土样处理

在北京顺义、通州区野外采集59个土样(表1、图1),采样时间为2015年11月中旬。选择耕作面积较大且轮作模式为小麦、玉米的地块进行采集裸土,采样深度为耕种层0~20 cm。样品采样完成后,将样品置于实验室暗室内自然风干,并进行研磨、过筛(1 mm)处理,进行土壤有机质含量测定,土壤有机质含量采用重铬酸钾容量法测定,其他则用于室外土壤光谱数据的测量。

1.2 光譜测量

为减弱不同土壤粒径对光谱特征的影响,采用已处理土壤进行光谱测量,利用美国ASD公司生产的Field Spec 4地物光谱仪。选择光照充足且无云天气下进行测量,测量时间选在太阳辐射能量稳定的12:00至下午2:00。将土样置于盛样皿上,用直尺将其表面刮平,并保持土壤厚度在2 cm以上。采用5°视场角的光纤探头,垂直置于距样本35 cm处。测量前进行白板定标,每个样本采集10组光谱数据,取10组平均值为该组反射光谱[10]。

1.3 光谱数据处理

1.3.1 光谱数据处理 由于水在近红外1 300、1 900 nm附近具有强烈的吸收作用,导致土壤光谱数据在1 810~1 900 nm处存在大量的噪音,故位于该波段区间的光谱数据无效,将该波段数据去除。由于环境不可控因素和仪器自身测量误差导致光谱函数不稳定,存在与研究内容无关的噪声信息,需对数据进行平滑处理。本研究采用海明窗长度为9的低通滤波器开展平滑去噪工作[11],并将光谱重采样至5 nm,以最大限度减弱噪声信息对有效信息的扰动。由于土壤光谱函数吸收和反射特征较为隐蔽,故采用Clark等[12]提出的包络线来增强光谱信息。

由于资源三号、高分一号与高分二号在可见光-近红外波段处的设置具有相似性,且各传感器的光谱响应存在较大差异,具有一定的互补作用。因此,本研究针对3种卫星波段进行模拟分析,探索其在土壤有机质含量监测方面的特性,将已处理的土壤光谱数据,结合资源三号、高分一号、高分二号波谱响应函数如图2所示,生成宽波段模拟数据,其转换函数如式1所示:

1.3.2 高光谱数据变换及土壤指数构建 为最大程度降低光谱噪声对土壤光谱有效信息的干扰,并变非线性关系为线性关系,故采用12种光谱变换技术对土壤光谱曲线进行处理,其变换形式分别为一阶微分、除以R(450~750)、除以R930、倒数的对数的一阶微分、二阶微分、倒数的对数、倒数、倒数的一阶微分、对数、对数的一阶微分、弓曲差[13]、吸收峰深度。然后将实测光谱数据与土壤有机质含量开展相关性分析,提取并筛选敏感波段,得到最佳组合波段。利用偏最小二乘算法对最佳组合波段和实测土壤有机质含量建立土壤有机质含量高光谱预测模型。采取与土壤高光谱数据处理流程一致的方法对拟合波段处理,并构建基于拟合多光谱数据的土壤有机质含量预测模型。两类土壤有机质含量估测模型均采用相关系数(R)与均方差共同评价模型的精度与稳定性。

利用模拟宽波段数据构建不同的指数:差值土壤指数(Difference soil index,DSI)、比值土壤指数(Ratio soil index,RSI)、归一化土壤指数(Normalized difference soil index,NDSI),为提高宽波段模拟数据对土壤有机质含量的敏感度,故采用资源三号、高分一号与高分二号的第一和第四波段进行指数的构建,对资源三号、高分一号与高分二号模拟数据进行相关性分析,其相关系数如表2所示。三颗卫星的模拟多光谱数据跟B1、B2、B3、B4的相关系数依次增加,且在指数相关系数中,跟差值植被指数的相关系数达到最大。这是由于差值植被指数是由近红外和蓝光波段决定,而土壤有机质含量不同在蓝光波段波谱函数差异并不明显,所以差值植被指数依赖于近红外波段的反射率,这与试验数据的相关系数结果相一致。且由于差值植被指数又具有消除单波段建模光谱不稳定的特性,所以差值植被指数的相关系数最佳并不是偶然的。

1.4 构建模型和精度检验

1.4.1 偏最小二乘算法 目前,土壤有机质含量反演的算法主要有多元统计回归分析、主成分分析法、偏最小二乘回归、小波变换、神经网络等。由于其他算法的不稳定性以及小波变换的冗余度过大,偏最小二乘法又兼有主成分分析法的特点。偏最小二乘回归分析(Partial least squares regression,PLS)是在多元线性回归分析、主成分分析及典型相关分析的基础上对传统多元统计回归分析改进后的一种新型方法,具有对普通最小二乘回归增强的功能,是解决多变量、多重共线、样本较少的一种较为理想的算法[14,15]。但是由于该算法是基于自变量的自身修复运算,导致建立PLS预测模型的精度对自变量的选择有依赖性,所以自变量的选择对土壤有机质含量预测模型的精度具有极大的影响,自变量波段的选择成为该算法的重点。如果选择的过少则不能充分反映土样中的光谱信息,但是波段选择的过多则对统计趋势的认识产生消极影响,进而影响预测模型的精度。本研究采用的是交叉验证法,可以衡量模型预测能力,根据该指标的修正作用可以得到可靠稳定的预测模型。

1.4.2 模型精度检验 通过数据分析发现建模精度和预测模型精度之间并不存在同步性,为最大限度保证精度,通过土壤有机质含量预测模型精度的分析评价模型精度。将试验样本按2/3和1/3随机分为两组,2/3部分用来构建模型,1/3部分用来检验模型精度。模型及预测的精度都用相关系数(R)与均方根误差(RMSE)进行评价,R和RMSE的计算公式如下:endprint

RMSE=■ (2)

R=■ (3)

式中,y为土壤有机质实测值,yf为土壤有机质预测值,■为土壤有机质实测均值,i为某样品,n为样品个数。

2 结果与分析

2.1 反射光谱的建模

将变换后的波谱函数依次与实测土壤有机质含量进行相关性分析,然后根据各组的相关系数选取波段,原则上选取相关系数较大的波段。但由于相关系数系数最大化并不是波段作为最佳拟合的充分条件,本研究利用最佳相关系数和间隔波段选取相结合的方法选取最佳拟合波段(间隔为100 nm),且在敏感波段周围通过中值法进行不少于4次的优值选择,进行因变量样本的优化,进而得到实测光谱经变换后的模型及预测精度(表3),各模型的精度都达到0.001的水平,发现R/R930、原数据建立的模型预测精度较低。由于成土母质、铁、土壤机械及粗糙度等原因导致原数据受干扰较多和区分度低,所以精度不高,比值法虽在一定程度上具有去燥和增强区分度的作用,但由于受所选波段的影响,导致比值法的预测模型不稳定,所以这两种模型是无效的。对数的一阶微分和倒数的对数的一阶微分构建的预测模型精度较高,这是由于高光谱的对数和微分变换能够充分抑制噪音对高光谱的影响和增强原始光谱的细微信息,其中对数的一阶微分相关系数R和RMSE分别为0.697和0.195,到达最优。这两种模型的建模波段大都在近红外波段,与于士凯等[16]土壤有机质与近红外波段具有强相关性的研究结果具有一致性。

2.2 模拟光谱的建模

本研究利用拟合资源三号、高分一号和高分二号波段的数据分别构建了3种模型,分别是波段模型、指数模型和混合模型(表4)。根据表4可知,高分一号的预测方程精度最高,其相关系数和均方根为0.334和0.240。对比三颗卫星的模拟数据不难发现,三颗卫星模型预测具有精度同步性,指数、波段、混合建模的精度依次增大,取得较高精度模型引入的数据波段都在红色-经红外波段,与纪文君等[7]研究结论一致。在同一颗卫星的模拟数据中发现引入相关指数后拟合精度都有提高,证实引入相关指数构建模型的方法是正确的。由于三颗卫星的模型精度较高且稳定性较好,据此分析得出多光谱监测土壤有机质含量的方法具有可行性。

2.3 模型的对比

对比模拟宽波段所见的预测模型和高光谱模型分析发现,高光谱模型和宽波段预测模型在波段的选取上具有一致性,选取的波段都在红光-红外波段,这是由于红外波段对土壤中有机质含量的波动比较敏感以及有机质含量对土壤颜色、温度的影响造成的。

3 结论

通过利用偏最小二乘算法在北方地区土壤高光谱数据与实测土壤有机质含量间构建预测模型,以及利用高光谱数据模拟资源三号、高分一号和高分二号得到宽波段并构建相应的宽波段与实测土壤有机质含量间的模型,得出以下结论:

1)通过相关系数分析,根据平滑去燥处理后的实测高光谱数据建立的土壤有机质含量预测模型,其中以对数的一阶微分为自变量的模型预测精度最高,其相关系数为0.697,均方根误差为0.195。

2)利用资源三号、高分一号和高分二号模拟波段数据分别建立了3种预测模型,其中以高分一号数据的混合模型最佳,其相关系数与均方根误差分别为0.334和0.240,利用拟合宽波段监测土壤有机质存在可能性,但预测模型精度尚未达到期望,多光谱宽波段在监测土壤机质含量需要进一步研究。

由于样本数据的选择较少,且具一定的地域性和时效性,另外遥感影像选择、土地耕作类型、算法的选择都对模型精度有较大影响,多光谱监测土壤有机质含量的模型尚不能达理想精度。今后的研究需在以下几方面进行改进:样本点位置及取样时间的选择要更加合理,在遥感数据的选择、土地耕作类型因素的考虑、土壤随时间序列的变化等方面来提高多光谱土壤有机质预测模型的精度。

参考文献:

[1] 王延仓,顾晓鹤,朱金山,等.利用反射光谱及模拟多光谱数据定量反演北方潮土有机质含量[J].光譜学与光谱分析,2014,34(1):201-205.

[2] SHEPHERD K D,WALSH M G. Development of reflectance spectral libraries for characterization of soil properties[J].Soil Science Society of America Journal,2002,66:988-998.

[3] KRISHNAN P,ALEXANDER J D,BUTLER B J,et al. Reflectance technique for predicting soil organic matter[J].Soil Science Society of America Journal,1980,44:1282-1285.

[4] 刘 磊,沈润平,丁 香.基于高光谱的土壤有机质含量估算研究[J].光谱学与光谱分析,2011,31(3):762-766.

[5] 刘焕军,张 柏,刘殿伟,等.基于反射率模拟模型的黑土有机质含量估测[J].光谱学与光谱分析,2008,28(12):2947-1950.

[6] 陈红艳,赵庚星,李希灿,等.基于小波变换的土壤有机质含量高光谱估测[J].应用生态学报,2011,22(11):2935-2942.

[7] 纪文君,史 舟,周 清,等.几种不同类型土壤的VIS-NIR光谱特性及有机质响应波段研究[J].红外与毫米波学报,2012,31(3):277-282.

[8] 刘 炜,常庆瑞,郭 曼,等.土壤导数光谱小波去噪与有机质吸收特征提取[J].光谱学与光谱分析,2011,31(1):100-104.

[9] 卢艳丽,白由路,杨俐苹,等.基于主成分回归分析的土壤有机质高光谱预测与模型验证[J].植物营养与肥料学报,2008,14(6):1076-1082.

[10] 刘焕军,张 柏,张渊智,等.基于反射光谱特性的土壤分类研究[J].光谱学与光谱分析,2008,28(3):624-628.

[11] 徐永明,蔺启忠,王 璐,等.基于高分辨率反射光谱的土壤营养元素估算模型[J].土壤学报,2006,43(5):709-802.

[12] CLARK R N,ROUSH T L. Reflectance spectroscopy:Quantitative analysis techniques for remote sensing applications[J].Journal of Geophysical Research,1984,89:6329-6340.

[13] 徐彬彬,戴昌达.南疆土壤光谱反射特性与有机质含量的相关分析[J].科学通报,1980,25(6):282-284.

[14] RAO C R,TOUTENBURG H. Linearmodels[M]. NewYork:Springer Verlag Press,1995.

[15] WOLD S,RUHE A,WOLD H,et al. The collinearity problem in liner regression. The partial least squares(PLS) approach to generalized in verses[J].J Stat Comp,1984,5:735-743.

[16] 于士凯,姚艳敏,王德营,等.基于高光谱的土壤有机质含量反演研究[J].中国农学通报,2013,29(23):146-152.endprint