黄河三角洲土壤有机质含量的高光谱反演
2014-04-09韩兆迎朱西存房贤一王卓远
韩兆迎, 朱西存, 2*, 刘 庆, 房贤一, 王卓远
(1 山东农业大学资源与环境学院, 山东泰安 271018; 2 土肥资源高效利用国家工程实验室, 山东泰安 271018;3 山东省黄河三角洲生态环境重点实验室(滨州学院), 山东滨州 256603)
1 材料与方法
1.1 研究区概况
黄河三角洲以山东省东营市垦利县宁海为轴点,北起套尔河口,南至淄脉河口,向东散开的扇状地形,海拔高程低于15 m,面积达54.5×104hm2。本研究区为东营市垦利县,位于东北部黄河入海口处。东濒渤海,南接东营市东营区,西、 北与利津县隔河相望,东北部与东营市河口区接壤。属暖温带季风气候,光热资源较为丰富,降水少,且年际年内分配不均,蒸降比较大,春旱及夏涝灾害频繁。研究区有潮土、 盐土两大土类,土壤母质为黄河冲积物。土壤多为黄河泥沙经长途搬运、 分选、 河床淤积的细小颗粒,表层质地偏轻,砂壤占24.2%、 轻壤占46.1%、 中壤占14.8%、 重壤10.1%、 粘土4.8%,由此可见,砂、 轻壤面积占总面积的70.3%。
1.2 土壤样品制备
1.3 土壤光谱与有机质含量的测定
光谱测定在等同于暗室的条件下进行。将盛样皿内装满的土壤刮平后,放在反射率近似为0的黑色橡胶垫上。采用功率为50 W卤化灯作为光源,探头视场角为25°,光源入射角度为45°,光源距离为30 cm,探头距离为15 cm。每次采集目标光谱前后都要进行参考板校正,重复测量10次,为降低土样光谱各向异性的影响,测量时转动盛样皿3次,每次转动角度约90°,共获取4个方向的土样光谱,取算术平均后得到该土样的反射光谱数据。
将测定完光谱的土样再进行有机质含量的测定。有机质含量的测定采用重铬酸钾容量法—外加热法[24]。
60个土壤样本有机质含量检测结果如表1 所示。
1.4 数据预处理
对60个土样的光谱进行去包络线处理。包络线法最早由Roush 和Clark 提出,定义为逐点直线连接随波长变化的吸收或反射凸出的“峰”点,并使折线在“峰”值点上的外角大于180°[25]。去包络线法是常用的光谱分析方法之一,可以明显的突出光谱曲线的反射和吸收特征,并且将其归一到一个一致的光谱背景上,有利于和其他光谱曲线进行特征数值的比较,从而有利于提取特征波段。
具体算法为:Rc(λ)=Rcr(λ)-R(λ)
(1)
其中,Rc、 Rcr和R分别为去包络(特征吸收)、 包络线和光谱反射率值,λ为波长。
表1 样本有机质含量特征统计量
1.5 敏感波段的筛选
对60个样本的有机质含量与去除包络线后的光谱数据逐波长地进行相关性分析,计算出每个波长与SOM含量的相关系数,选取相关系数较高或突变的波长作为敏感波长。相关性分析的公式下:
(2)
1.6 反演模型的建立与验证
60个土样中随机抽取40个土样,用于建立SOM含量的反演模型,其余20个土样用于模型验证。土壤有机质估测模型的估测精度采用估测值和实际值的决定系数R2、 Durbin-Watson统计量和相对分析误RPD(检验样本标准差SD与预测均方根误差RMSE的比值)来衡量。模型的决定系数R2越大、 Durbin-Watson统计量越接近2,说明模型的精度越高。另外,当RPD>2 时表明模型具有极好的预测能力,当1.4 图1 土壤光谱反射率曲线Fig.1 Reflectance curves of the soil samples 将原始光谱反射率与土壤有机质的含量进行相关性分析,其相关系数如图2所示。从图中可以看出,原始土壤光谱反射率与有机质含量的相关系数小于0.1,并且整条曲线比较平滑,很难选出与SOM具有良好相关性的敏感波长。为突出光谱曲线的反射和吸收特征,利用去除包络线后的光谱与有机质含量进行相关分析,结果见图3。可以看出去除包络线的光谱数据与有机质含量的相关性有了显著的提高,相关性较好的波段主要集中在近红外波段,特别是在波长1278 nm处,其相关性达到了0.88,另外在波长1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm处,其相关性分别为0.77、 0.77、 0.78、 0.83、 0.77、 0.76。因此,选取这7个波长为反映土壤有机质的敏感波长。 图2 光谱反射率与有机质含量的相关性Fig. 2 Correlation between the soil organic matter and spectral reflectivity 图3 去包络线的光谱与有机质含量的相关性Fig.3 Correlation between the soil organic matter and removed the envelope spectral data 将选取的7个敏感波长,运用主成分回归、 二次多项式逐步回归、 多元线性回归和支持向量机回归方法,分别建立有机质含量的高光谱反演模型。 主成分回归法是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的主成分,从而在不丢掉重要信息的前提下,避开变量间的共线性,便于进一步分析。在主成分分析中提取出的每个主成分都是原来多个指标的线性组合。主成分回归包含两步:一是将自变量重新线性组合;二是在新的组合变量中去掉那些变差小的而留下主成分。 利用选取的7个敏感波长建立主成分回归模型的过程中,根据方差贡献率确定主成分个数。当选用2个主成分时,累积方差贡献率达到了94%。因此本研究选取2个主成分,建立主成分回归模型: y=-151+137×X1+6.13×X2+0.688×X3+3.18×X4+14.7×X5-2.48×X6-6.08×X7 (3) 二次多项式逐步回归是基于最小二乘法原理,通过逐步回归剔除对因变量不起作用或作用极小的因子,挑选出显著性因子,最终得出最优回归模型的经典数理统计方法。建立模型时,首先在0.1的置信度下挑选自变量,并调整F值进行逐步回归(引入显著的变量,剔除不显著的变量),对模型进行优化,最终得到二次多项式逐步回归模型。 二项式逐步回归分析模型为: y=1.34×104-2.72×104×X1+1.37×104×X1×X1-39.1×X2×X6+53.5×X5×X7 (4) 方程(4)中:y为土壤有机质含量; X1、 X2、 X5、 X6、 X7分别为去除包络线后1278 nm、 1307 nm、 1328 nm、 1334 nm、 1343 nm敏感波长对应的光谱数据。 线性回归(Linear Regression)是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间的关系进行建模。 线性回归分析模型方程为: y=-156+132×X1-39.6×X2-2.67×X3+19.2×X4+49.9×X5-28.8×X6+28.2×X7 (5) 方程(5)中:y为土壤有机质含量; X1、 X2、 X3、 X4、 X5、 X6、 X7分别去除包络线后1278 nm、 1307 nm、 1314 nm、 1322 nm、 1 328 nm、 1 334 nm、 1 343 nm敏感波长对应的光谱数据。 支持向量机(SVM)最初于20世纪90年代由Vapnik提出,包括支持向量机分类(SVC)和支持向量回归(SVR),是目前发展最快的机器学习方法。选取了去除包络线后1278 nm、 1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm敏感波长对应的光谱数据为自变量,有机质含量作为决策属性,经过参数优选(表2),通过多次训练,最终确定支持向量机类型为EPSILON-SVR,核函数类型为RBF。 表2 支持向量机回归模型的参数 从运用不同方法反演土壤有机质(SOM)含量的诊断系数(表3)可以看出,四种模型校正集的决定系数R2都大于0.8,表明四种模型的拟合效果都较好。相比较而言,二次多项式逐步回归模型的校正集决定系数仅次于支持向量机回归模型,其Durbin-Watson统计量d=2.14。 表3 土壤有机质反演模型的诊断系数 图4 土壤有机质实测值与预测值的散点图Fig. 4 Scatter plot of the measured values and predicted values of soil organic matter 利用验证集的20个样本对这四种模型进行精度验证,验证结果见表3和图4。从表3和图4中可以看出,基于主成分回归、 多元线性回归、 二次多项式逐步回归和支持向量机回归分析,建立的土壤有机质(SOM)含量的高光谱反演模型的预测效果均较好,其中二次多项式逐步回归模型的验证集的决定系数最高,相对分析误差RPD最大。 因为二次多项式逐步回归模型的校正集的决定系数较高以及其Durbin-Watson统计量d=2.14最接近2,并且其验证集的决定系数最高、 RPD最大,所以基于二次多项式逐步回归分析建立的土壤有机质的高光谱反演模型的拟合效果要优于主成分回归、 线性回归分析和支持向量机回归分析建立的高光谱反演模型。 由于土壤光谱反射率受光谱测试环境以及土壤自身理化性质的影响,对土壤样本进行风干、 研磨等处理,可在一定程度上消除非有机质特性对土壤光谱的影响。对原始光谱数据进行去包络线处理,使其归一到一个一致的光谱背景上,有利于和其他光谱曲线进行特征数值的比较[27]。本研究结果表明,近红外区是反演土壤有机质含量的敏感波段,与前人得出的土壤有机质含量的敏感波段在可见光和近红外区的研究结果基本一致[9,11,18-22]。由于高光谱的单个波长能量较低,而前人研究多以单波长反射率建立土壤有机质含量反演模型[28],其容易受到环境影响而产生较大的差异,因此建立的模型稳定性较差。本文选取了与土壤有机质含量相关性较高的7个波长建立了反演模型,提高了模型的稳定性。 在室内几何条件基本一致的情况下,获取了黄河三角洲土壤样品高光谱反射率,去除包络线后的光谱数据与土壤有机质含量的相关性有了明显的提高,确定了1278 nm、 1307 nm、 1314 nm、 1322 nm、 1328 nm、 1334 nm、 1343 nm波长为诊断有机质含量的敏感波长。建立的主成分回归、 多元线性回归、 二次多项式逐步回归和支持向量机回归的有机质含量的高光谱反演模型,都可以实现对黄河三角洲土壤有机质含量的反演。经验证,二次多项式逐步回归模型验证方程的决定系数最高、 均方根误差最小、 RPD最高,其拟合效果最好,并且这种模型还具有较高的稳定性。因此,二次多项式逐步回归模型对黄河三角洲土壤有机质含量的反演效果最好。 利用从60个土样中随机选取的40个样本,建立了支持向量机回归模型,其建模方程的决定系数达到了0.91,但是当用剩余的20个样本进行检验时,其决定系数仅为0.78。经对建模的参数进行多次调整之后,得到了新的回归模型,新模型验证集的决定系数达到了0.807,但是校正的决定系数降到了0.866。因此,如何通过合理的调整模型参数,使得在不降低建模方程决定系数的前提下,提高验证方程的决定系数,以及如何合理的选择校正集和验证集,使得所建立的模型能够解释所有土壤有机质的变异,从而提高模型的预测精度,将有待于进一步的研究。 本研究以黄河三角洲的土壤为研究对象,获取的土壤光谱反射率是该区土壤母质、 土壤有机质、 盐分、 氧化物、 土壤质地、 结构、 颜色等多种因素的内在理化性质的综合反映,因此这些因素会对有机质含量的反演产生影响即影响模型的精度。这些因素如何影响光谱反射率以及如何提高反演模型的精度,有待深入分析,所建立的土壤有机质反演模型对其他地区的土壤是否适用,有待于进一步验证。 参考文献: [1] 科技日报. 渤海粮仓科技示范工程启动计划到2020年增粮100亿斤[EB/OL]. http://www.most.gov.cn/kjbgz/201310/t20131030_110069.htm, 2013-4-10. Journal of science and technology. The bohai sea granary demonstrative project of science and technology initiative to increased 10 billion catties of grain by 2020 [EB/OL]. 2013-4-10.http://www.most.gov.cn/kjbgz/201310/t20131030_110069.htm, 2013-4-10. [2] 蒲智, 于瑞德, 尹昌应, 陆亦农.干旱区典型盐碱土壤含盐量估算的最佳高光谱指数研究[J]. 水土保持通报, 2012, 32(6):129-133. Pu Z, Yu R D, Yin C Y, Lu Y N. Optimal hyperspectral indices for soil salt content estimation on typical saline soil in arid areas[J]. Bulletin of Soil and Water, 2012, 32(6):129-133. [3] 陈红艳, 赵庚星, 李希灿, 等. 小波分析用于土壤速效钾含量高光谱估测研究[J]. 中国农业科学, 2012, 45(7):1425-1431. Chen H Y, Zhao G X, Li X Cetal. Application of wavelet analysis for estimation of soil available potassium content with hyperspectral reflectance[J]. Scientia Agricultura Sinica, 2012, 45(7):1425-1431. [4] 徐丽华, 谢德体, 魏朝富, 李兵. 紫色土土壤全氮和全磷含量的高光谱遥感预测[J]. 光谱学与光谱分析, 2013, 33(3):723-727. Xu L H, Xie D T, Wei C F, Li B. Prediction of total nitrogen and total phosphorus concentrations in purple soil using hyperspectral data[J]. Spectroscopy and Spectral Analysis, 2013, 33(3):723-727. [5] 姚艳敏, 魏娜, 唐鹏钦, 等. 黑土土壤水分高光谱特征及反演模型[J]. 农业工程学报, 2011, 27(8):95-100. Yao Y M, Wei N, Tang P Qetal. Typer-spectral characteristics and modeling of black soil moisture content[J]. Transactions of the CSAE, 2011, 27(8):95-100. [6] 彭玉魁, 张建新, 何绪生, 卢恩双. 土壤水分、 有机质和总氮含量的近红外光谱分析研究[J]. 土壤学报, 1998, 35(4):553-559. Peng Y K, Zhang J X, He X S, Lu E S. Analysis of soil moisture, organic matter and total nitrogen content in loess in China with near infrared spectroscopy[J]. Acta Pedologica Sinica, 1998, 35(4):553-559. [7] 卢艳丽, 白由路, 杨俐苹, 等. 东北平原不同类型土壤有机质含量高光谱反演模型同质性研究[J]. 植物营养与肥料学报, 2011, 17(2):456-463. Lu Y L, Bai Y L, Yang L Petal. Homogeneity of retrieval models for soil organic matter of different soil types in Northeast Plain using hyperspectral data[J]. Plant Nutrition and Fertilizer Science, 2011,17(2):456-463. [8] 王小攀, 郑晓坡, 刘福江, 等. 高光谱遥感土壤有机质含量信息提取与分析[J]. 地理空间信息, 2012, 10(5):75-78. Wang X P, Zheng X P, Liu F Jetal. Analysis and extraction soil organic matter information based on hyperspectral remote sensing[J].Geospatial Information, 2012, 10(5):75-78. [9] 徐彬彬, 季耿善, 朱永豪. 中国陆地背景和土壤光谱反射特性的地理分区的初步研究[J]. 环境遥感, 1991, 6(2):142-151. Xu B B, Ji G S, Zhu Y H. A preliminary research of geographic regionalization of China land background and spectral reflectance characteristics of soil[J]. Remote Sensing of Environment, 1991, 6(2):142-151. [10] 程朋根, 吴剑, 李大军, 何挺. 土壤有机质高光谱遥感和地统计定量预测[J]. 农业工程学报, 2009, 25(3):142-147. Cheng P G, Wu J, Li D J, He T. Quantitative prediction of soil organic matter content using hyper spectral remote sensing and geo-statistics[J]. Transactions of the CSAE, 2009, 25(3):142-147. [11] 卢艳丽, 白由路, 杨俐苹, 王红娟. 基于高光谱的土壤有机质含量预测模型的建立与评价[J]. 中国农业科学, 2007, 40(9):1989-1995. Lu Y L, Bai Y L, Yang L P, Wang H J. Prediction and validation of soil organic matter content based on hyperspectrum[J]. Scientia Agricultura Sinica, 2007, 40(9):1989-1995. [12] Hummel J W, Sudduth K A, Hollinger S E. Soil moisture and organic matter prediction of surface and subsurface soils using an NIR soil sensor[J]. Computers and Electronics in Agriculture, 2001, 32(2):149-165. [13] Krishnan P, Alexander J D, Butler B J, Hummel J W. Reflectance technique for predicting soil organic matter[J]. Soil Science Society of America Journal, 1980, 44(6):1282-1285. [14] Chang C W, Laird D A. Near-infrared reflectance spectroscopic analysis of soil C and N[J]. Soil Science, 2002, 167(2):110-116. [15] 曾志远. 土壤肥力的卫星遥感探测[J]. 土壤, 1987, 19(2):73-78. Zeng Z Y. Satellite remote sensing survey of soil fertility[J]. Soils, 1987, 19(2):73-78. [16] 廖钦洪, 顾晓鹤, 李存军, 等. 基于连续小波变换的潮土有机质含量高光谱估算[J]. 农业工程学报, 2012, 28(23):132-139. Liao Q H, Gu X H, Li C Jetal. Estimation of fluvo-aquic soil organic matter content from hyperspectral reflectance based on continuous wavelet transformation[J]. Transactions of the CSAE, 2012, 28(23):132-139. [17] 贺军亮, 蒋建军, 周生路, 等. 土壤有机质含量的高光谱特性及其反演[J]. 中国农业科学, 2007, 40(3):638-643. He J L, Jiang J J, Zhou S Letal. The hyperspectral characteristics and retrieval of soil organic matter content[J]. Scientia Agricultura Sinica, 2007, 40(3):638-643. [18] 卢艳丽, 白由路, 杨俐苹, 等. 基于主成分回归分析的土壤有机质高光谱预测与模型验证[J]. 植物营养与肥料学报, 2008, 14(6):1076-1082. Lu Y L, Bai Y L, Yang L Petal. Application of hyperspectral data for soil organic matter estimation based on principle components regression analysis[J]. Plant Nutrition and Fertilizer Science, 2008, 14(6):1076-1082. [19] 张娟娟, 田永超, 朱艳, 等.不同类型土壤的光谱特征及其有机质含量预测[J]. 中国农业科学, 2009, 42(9):3154-3163. Zhang J J, Tian Y C, Zhu Yetal. Spectral characteristics and estimation of organic matter contents of different soil types[J]. Scientia Agricultura Sinica, 2009, 42(9):3154-3163. [20] 田永超, 张娟娟, 姚霞, 等. 基于近红外光声光谱的土壤有机质含量定量建模方法[J]. 农业工程学报, 2012, 28(1):145-152. Tian Y C, Zhang J J, Yao Xetal. Quantitative modeling method of soil organic matter content based on near-infrared photoacoustic spectroscopy[J]. Transactions of the CSAE, 2012, 28(1):145-152. [21] 刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究[J]. 光谱学与光谱分析, 2011, 31(3):762-766. Liu L, Shen R P, Ding G X. Studies on the estimation of soil organic matter content based on hyper-spectrum[J]. Spectroscopy and Spectral Analysis, 2011, 31(3):762-766. [22] 徐明星, 周生路, 丁卫, 等. 苏北沿海滩涂地区土壤有机质含量的高光谱预测[J]. 农业工程学报, 2011, 27(2):219-223. Xu M X, Zhou S L, Ding Wetal. Hyperspectral reflectance models for predicting soil organic matter content in coastal tidal land area, northern Jiangsu[J]. Transactions of the CSAE, 2011, 27(2):219-223. [23] Hartmann H P, Appel T. Calibration of near infrared spectra for measuring decomposing cellulose and green manure in soils[J]. Soil Biology and Biochemistry, 2006, 38:887-897. [24] 鲍士旦. 土壤农化分析[M]. 北京:中国农业出版社,1999. 30-34. Bao S D. Soil Agricultural Chemistry Analysis[M]. Beijing:China Agriculture Press, 1999. 30-34. [25] Clark R N, Roush T L. Reflectance spectroscopy:Quantitative analysis techniques for remote sensing application[J]. Journal of Geographical Research,1984,89(7):6329-6340. [26] 黄应丰, 刘腾辉. 华南主要土壤类型的光谱特性与土壤分类[J]. 土壤学报, 1995, 32(1):58-68. Huang Y F, Liu T H. Spectral characteristics of main types of soils in southern China and soil classification[J]. Acta Pedologica Sinica, 1995, 32(1):58-68. [27] 谢伯承, 薛绪掌, 刘伟东, 等. 基于包络线法对土壤光谱特征的提取及分析[J]. 土壤学报, 2005, 42(1):171-175. Xie B C, Xue X Z, Liu W Detal. Lull-curve-method-based extraction and analysis of soil spectral characteristics[J]. Acta Pedologica Sinica, 2005, 42(1):171-175. [28] 刘焕军, 张新乐, 郑树峰, 等. 黑土有机质含量野外高光谱预测模型[J]. 光谱学与光谱分析, 2010, 12(30):3355-3358. Liu H J, Zhang X L, Zheng S Fetal. Black soil organic matter predicting model based on field hyperspectral reflectance[J]. Spectroscopy and Spectral Analysis, 2010, 12(30):3355-3358.2 结果与分析
2.1 土样的光谱特征分析
2.2 土壤有机质光谱响应的敏感波长
2.3 有机质含量反演模型的建立
2.4 模型的比较和验证
3 讨论与结论