APP下载

黑土典型区有机质高光谱预测模型

2016-10-18李胜男曹萌萌李盛楠董姝含刘焕军

国土与自然资源研究 2016年4期
关键词:微分对数反射率

李胜男,曹萌萌,李盛楠,董姝含,刘焕军

(东北农业大学资源与环境学院,黑龙江哈尔滨150030)

黑土典型区有机质高光谱预测模型

李胜男,曹萌萌,李盛楠,董姝含,刘焕军*

(东北农业大学资源与环境学院,黑龙江哈尔滨150030)

土壤有机质(SOM)是鉴别土壤肥力的重要指标,是土壤肥力的物质基础,其含量预测模型研究对于土壤肥力评价、土壤碳库估算、土壤资源利用与保护具有重要意义。该文以黑龙江省黑土带典型区为例,采集区域土壤样本,基于有机质含量与土壤反射率的定量关系,对光谱反射率进行一阶微分和倒对数的处理,建立偏最小二乘法模型(PLSR)、一元线性回归模型和多元线性逐步回归模型。结果表明:(1)土壤有机质敏感波段位于650-750nm。(2)通过比较建模样本与检验样本的决定系数(R2)和均方根误差(RMSE)的大小,得到反射率和倒对数处理后的数据最优模型都为PLSR模型,一阶微分处理后的最优模型为多元线性逐步回归模型。(3)PLSR模型的建模效果优于回归模型,但其预测效果却并不理想。该研究将为改进土壤理化参数、遥感反演、土地质量评价等工作方法提供理论与技术支持。

黑土;有机质;遥感;高光谱;预测模型

引言

土壤有机质(soil organicmatter,SOM)是反映土壤肥力的重要物质,高光谱技术为土壤评价与理化性状的监测提供了强有力的工具,为定量化监测土壤有机质含量提供了可能。目前,高光谱技术不仅广泛应用在土壤有机质理化指标的定量反演中,而且也为土壤分类提供了重要依据。

传统的土壤养分化学测定方法是基于点测量的,且测点稀少、速度慢、范围有限,已不能满足现代农业发展的需要,而高光谱遥感凭借其极高的光谱分辨率,具备获取土壤化学组分的潜力,为土壤有机质含量的精细诊断提供技术支持。土壤有机质与土壤有机碳存在定量关系,土壤有机质的遥感监测将有助于提高土壤有机碳库储量的估算。土壤有机质在可见光和近红外波段有独特的光谱特性。土壤光谱反射率与SOM含量呈显著负相关,SOM含量可以从土壤反射光谱中得到一定程度的反映[1,2]。利用土壤高光谱反射率及其数学变化可以进行有机质含量的速测。

近年来,国内外学者在利用土壤的反射光谱估算其有机质含量方面已经进行了卓有成效的研究。Galvao等分析了AVIRIS数据和巴西3个主要土壤类型样品的成分(有机质、Fe、TiO2、Al2O3和SiO2)之间的关系,发现不同土壤类型的光谱变化和土壤组成之间具有很好的一致性[3]。

东北黑土区作物生长一年一季,裸土时间长,且保护性耕作少,秸秆覆盖影响小,容易获取土壤野外高光谱反射率与遥感影像,适于土壤遥感研究。因此,本研究获取黑龙江典型黑土,利用统计分析方法建立土壤有机质遥感反演模型,联系土壤有机质和光谱反射率的关系,得出最优模型。揭示黑土典型区土壤有机质空间分布规律。

1 材料与方法

1.1土样采集与处理

采集土壤样品均为0-20cm的表层土壤。2015.5.22-2015.05.27,在作物播种后、出苗前,沿县级以上公路,在黑龙江省典型黑土区(北安市南部、海伦市中部、绥化市东部、绥棱县西南部、望奎县中部)采集了133个土样;同时利用GPS记录样点的经纬度,并获取样点的数码相片、前茬作物类型、田块的大小、天气状况、采样点周边环境等。土壤样本经风干、研磨并通过2mm孔筛,采用四分法分成两份,分别供化学分析和光谱测试用[4]。采用重铬酸钾容量法—外加热法分析有机质含量。在加热条件下,用过量的重铬酸钾—硫酸溶液氧化土壤有机碳,多余的重铬酸钾用硫酸亚铁铵标准溶液滴定,以样品和空白消耗重铬酸钾的差值计算出有机碳量,室内测定土样有机质含量如表1。

1.2反射光谱测量

采用ASD Field Spec Pro地物光谱仪测量土壤样品的反射光谱数据。该光谱仪波长范围为350-2500 nm,采样间隔为5nm(360-2500nm),重采样间隔也为5nm,输出波段数为428。光源为仪器配套的功率为1000W的卤素灯,探头视场角为5°。操作过程在四周黑暗的实验室进行,光源照射方向与垂直方向夹角30°。探头到土样表面距离15cm,把适量经处理的1mm土壤样品倒入盛样皿中。用玻璃稍稍压实,使其表面尽量平整。每个样品旋转3次,每个角度扫描12次,共36次,求其平均值。

1.3光谱数据的平滑处理

光谱曲线的平滑处理是为了去除包含在信号内的少量噪声,得到平稳的光谱波形。

本文采用9点加权移动平均方法对光谱数据进行平滑处理[5]。由于光谱仪波段间在能量响应上的差异,使光谱曲线存在一些噪声,为得到平稳的变化模式,需平滑波形,以去除包含在信号内的少量噪声。如果噪声的频率较高,且量值也不大,用平滑方法可在一定程度上降低噪声。本研究采用Savitzky-Golay多项式平滑去噪处理,光谱曲线给出了N个测定点的序列{Ri,i=1,2,3,…,N}(本研究中,N=2151)。平滑中,对窗口7个数据点拟合三次多项式,并由所得数学模型对平滑的点进行计算。

1.4模型建立与检验

1.4.1模型的建立

本文共采用93个建模样本,40个检验样本,对有机质的含量以及光谱数据的一阶微分,倒对数等数学变换形式进行相关性分析,建立光谱数据不同数学变换下与有机质含量的一元线性回归模型,多元线性逐步回归模型。同时采用133个样本数据交叉验证建立PLSR(最小二乘回归)模型。

1.4.2模型的检验

模型的稳定性用决定系数R2检验,R2越大,模型越稳定;其计算公式为:

模型的预报能力用建模和验证样本的总均方根误差(RMSE)来检验,RMSE越小,模型精度越高、预测能力越强。其计算公式如下:

式中yi和i分别为检验样本的观测值和预测值,n为预测样本数。

表1 样本有机质统计量

2 结果与分析

2.1对黑土光谱特征分析

选取25个样本,建立不同有机质含量土壤反射光谱曲线图,如图1。以不同波长下的土壤反射率的倒对数和一阶微分处理后的数据为因变量,以波长为自变量,建立关系图如下图2。

由图知,有机质含量不同的土壤反射光谱曲线趋势相同,大致除1400nm和1900nm两个水分吸收峰外,土壤光谱曲线整体表现平缓,在350-1350nm的范围内土壤有机质的反射率随波长的增大而增大,其中在350-850nm范围内曲线斜率逐渐增大,在850-1350nm范围内曲线斜率逐渐减小。

图2为其一阶微分和倒对数处理光谱反射率与波长图,表明经一阶微分变换后,在580nm、1350nm、1900nm附近分别出现了不同的正负峰值,可见一阶导数较有利于显现原始谱图中的肩峰。同时,经倒对数处理后,在400nm-650nm波段附近出现了波峰波谷交替出现的现象,在1350nm,1850nm附近也出现了正负峰值,综上所述,对土壤反射率进行一阶微分处理和倒对数处理,都有利于显现原始谱图中的肩峰,对后续的一元建模波段选取具有指导意义。

2.2一元线性回归模型

以土壤有机质含量为因变量,以光谱数据的数学变换为自变量,通过两者相关性分析,分别确定出不同变换形式下的光谱响应程度大的范围,在此基础上建立各自的一元回归模型和对光谱数据进行数学变换后建立的一元模型,相关特征如下表2。

由表知,反射率及其各种形式变换后与有机质含量的相关系数的绝对值的差别并不大,从建模样本看,一介微分形式的决定系数最大,均方根误差最小,可见三种变换形式中一介微分形式变换后其建模效果最好,且由表中可以发现,与有机质相关系数绝对值大的,其建模效果也好。

图1 不同有机质含量土壤反射光谱曲线图

图2 倒对数与一阶微分处理后的土壤反射率与波长的关系图(系列1为倒对数、系列2为一阶微分)

表2 反射率不同变换形式有机质特征波段位置及模型相关数据

从检验样本来看,一阶微分的预测效果并不好,三者相比其预测效果最差,可见建模样本效果较好的模型并不一定具有较好的预测的能力,且由表知反射率、倒对数形式的预测效果决定系数的值均大于0.77,均方根误差的值也都小于0.385,而一阶微分的决定系数小于0.7,均方根误差却大于0.55。

2.3多元线性逐步回归模型

对光谱数据进行不同变换处理后的三组数据,以有机质含量为因变量,不同波长对应的处理后的数据为自变量,将全部变量的方差贡献值按大小进行排列,进行多元线性逐步回归分析,在分析中,选入以及剔除自变量的概率参数为0.05和0.1,如表3。

由表3可知,建模样本和预测样本R2(log1/R)>R2(R)>R2(R'),而RMSE值则为RMSE(R)>RMSE(R')>RMSE(log1/R),故而,在多元线性逐步回归模型中,建模效果最好的模型是倒对数模型,预测效果最好的也为倒对数模型。

2.4偏最小二乘回归模型

建立3种光谱数据处理后的土壤样本建立了全波段的PLSR模型,如图3。

当提取包含更多自变量信息的因子时,它能保证提取因子与因变量之间的最大相关性,它可以将大量光谱变量压缩为几个主要部分,消除自变量之间的共线性问题。有效提取到对有机质解释强的综合变量,排除解释力弱或无解释力的信息,从而使它对模型的因变量由最强的解释能力。本文采用交叉验证的方法进行建模,利用R2与RMSE对模型进行选择。下表4即为建模结果。

由表4知,反射率和倒对数处理后其建模样本R2都在0.9以上,RMSE值均小于0.3,其检验样本R2都在0.7以上,RMSE值均小于0.5,故而反射率和倒对数处理后建模效果好,而一阶微分处理后建模样本R2为0.614,RMSE值最大为0.597,且其检验样本的R2小于0.5,RMSE值也大于另外两种处理方式。综上所述,R和log1/R的模型优于R'模型,同时反射率模型预测效果优于倒对数处理后的模型,但是建模效果略差于后者。

图3 PLSR建模图(A为倒数对数微分、B为反射率、C为反射率)

3 结论

本文建立一元线性回归、多元线性逐步回归、偏最小二乘法(PLSR)模型。实验结果表明如下。

3.1土壤反射率进行一阶微分处理和倒对数处理后,在580nm、1350nm、1900nm附近分别出现了不同峰值,倒对数处理后出现了波峰波谷交替的现象,说明对土壤反射率进行数学变换后有利于显现原始谱图中的肩峰,对后续的一元建模波段选取具有指导意义。3.2反射率和倒对数处理后的数据最优模型都为PLSR模型,两者的建模样本R2均大于0.9,RMSE值均小于0.3,检验样本R2均大于0.7,RMSE值均小于0.5。一阶微分处理后的最优模型为多元线性逐步回归模型,其建模样本和检验样的R2和RMSE值均优于其余两个模型。不同的建模方法影响土壤有机质含量高光谱反演的精度。因此,在重视土壤有机质光谱反演机理研究的同时,加强光谱反演建模方法的研究是必要的。

3.3由研究可得,PLSR模型的建模效果优于回归模型,但其预测效果却并不理想,可见PLSR模型具有不稳定性。

本研究的结果是在黑土区干旱较严重、土壤含水量相对较低的前提下得到的,是否适用于雨后不久、土壤含水量较高的情况,还有待下一步研究解决。另外应引入土壤类型、地形、地质等因子的空间信息,提高土壤有机质时空变异规律研究水平。

表3 有机质含量预测多元线性逐步回归模型列表

表4 PLSR模型结果

[1]Ben-dor E,Banin A.Near-infrared analysis as a rapid method to simultaneous ly evaluate several soil properties[J].Soil Sci.Soc.Am. J.,1995(59):364-372.

[2]Mccarty G W,Reeves J B,Reeves V B,et al.Mid-infrared diffuse reflectance spectroscopy for soil carbonmeasurement[J].Soil Sci.Soc.Am.J.,2002,66(2):640-646.

[3]Galvao LS,Pizarro M A,Epiphanio JC N.Variations in reflectance of tropical soils:spectral-chemical composition relationships from AVIRIS data[J].Remote Sensing of Environment,2001,75(2):245-255.

[4]刘焕军,赵春江,等.“黑土典型区土壤有机质遥感反演”农业工程学报[J].2011,27(8):211-214.

[5]吕秀琴,艾自兴.“地理信息系统课程设计”教学内容和模式探讨[J].实验技术与管理,2012,29(1):165-167.

(2016-07-26收稿刘晓佳编辑)

Hyper spectral prediction model of organic matter in black soil region

LI Sheng-nan et al
(The northeast agricultural college of resources and environment,Harbin 150030,China)

The study on spatial heterogeneity of soil organic matter(SOM)is significantly important to soil fertility evaluation,soil carbon pool estimation,soil resources utilization and protection.Based on Chernomyrdin typical area in Heilongjiang province as an examp le,the soil samples in the area of acquisition,based on the quantitative relationship between organic matter content and soil reflectance,for first order differential spectral reflectance,logarithmic and remove abnormal numerical processing,establish a model of partial least squares(PLSR),a yuan linear regression model and multiple linear regression model. Results show that:(1)the sensitive wavelengths of organic matter in 650-750 nm.(2)by comparing the determination coefficient(R2)and the size of the root mean square error(RMSE),after processing the data of the optimal models for the PLSR model. The results can provide theoretical and technical support for improving RS retrieving of soil physic-chemical parameters,evaluating soil quality and carbon pool.

Black soil;Organic matter;Remote sensing;Comprehensive practice course;Predicting model

S153

A

1003-7853(2016)04-0073-04

李胜男(1995-),女,在读本科生,研究方向:生态环境科学。

刘焕军。

展开全文▼

猜你喜欢

微分对数反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
含有对数非线性项Kirchhoff方程多解的存在性
具有颜色恒常性的光谱反射率重建
指数与对数
Ap(φ)权,拟微分算子及其交换子
拟微分算子在Hp(ω)上的有界性
多复变整函数与其关于全导数的微分多项式
指数与对数
上下解反向的脉冲微分包含解的存在性