基于无人机多光谱与地面高光谱遥感的土壤主要养分含量估测
2022-02-15杨栋膗李亚强刀剑王建雄
杨栋膗 李亚强 刀剑 王建雄
摘要:耕地土壤作为农业资源的重要组成部分,是我国农业生产的基本资源与保障条件。山原红壤作为云南典型的土壤类型,在云南的农业生产与经济发展中发挥着重要作用。通过多光谱与高光谱遥感结合技术,对山原红壤主要养分含量的高光谱特性进行了研究分析,研究了土壤主要养分含量的多高光谱特性、筛选出了各养分含量的特征波段。而后,通过多光谱波段变换、植被指数合成、构建高光谱土壤指数,与山原红壤主要养分含量进行了相关分析。通过分析得出,多光谱拟合模型效果整体不佳,仅钾元素与合成光谱存在相关性,拟合模型R2大于0.5,有良好的拟合意义。高光谱指数相关性及拟合模型效果较多光谱都有所提升。其中,支持向量机拟合模型效果最佳,R2均在0.75以上,适合用于土壤养分含量估测。
关键词:土壤养分;多光谱;植被指数;高光谱;支持向量机
中图分类号:P237;S127 文献标志码: A
文章编号:1002-1302(2022)02-0178-08
收稿日期:2021-04-16
基金项目:云南省教育厅科学研究基金(编号:2019Y0080、2020Y0177、2020Y186)。
作者简介:杨栋淏(1997—),男,云南曲靖人,硕士研究生,主要从事资源与环境遥感专业研究。E-mail:843765886@qq.com。
通信作者:王建雄,博士,教授,硕士生导师,主要研究方向为资源与环境遥感。E-mail:jianxiongw@126.com。
云南省地处高原山区,耕地资源有限,且山原红壤作为云南典型的土壤类型,研究山原红壤的土壤肥力对云南的农业生产具有重要的作用。近年来,遥感技术快速发展,对土壤调查、土地利用变化及土壤肥力监测起到了独特作用[1]。目前,针对土壤多光谱方面的研究大多针对土壤含盐量、含水量与重金属的反演模型建立,少有针对土壤主要养分含量的分析以及估测研究[2-4],并且国内的研究多以土壤有机质的反演估算为主[5-9],而且取得了较高的反演精度。例如,南锋等以土壤有机质含量为研究对象,研究分析后发现,基于显著波段构建的偏最小二乘回归(PLSR)模型预测精度高于基于全波段的PLSR模型[10]。在高光谱方面,栾福明等使用全波段地物光谱仪针对速效钾养分含量进行了模型估测研究,发现小波分析处理能显著提高模型精度[11]。蒋璐璐等分别采用偏最小二乘支持向量机和偏最小二乘-人工神经网络2种方法进行土壤磷、钾元素含量预测建模,结果表明,中红外波段对磷和钾的预测效果更好[12]。尽管已有不少学者针对土壤养分含量的定量估測进行了研究,但不同土壤类型反射光谱存在差异,使得各土壤类型的养分估测模型不具备普遍适宜性。而目前针对山原红壤光谱反射特性的研究不多,且针对其主要养分含量的估测更为少见。因此,本研究结合上述学者的研究方法,分析山原红壤速效氮、磷、钾含量的光谱反射特性,以期为今后云南的农业生产提供帮助。
1 数据获取与预处理
1.1 数据获取
1.1.1 土壤采集 综合地理位置、无人机影像采集可行性等多方面因素,本研究以昆明市云南农业大学后山试验田为研究对象。试验田为山原红壤地块,位于25°8′N、102°45′E,地势走向为北高南低,海拔为1 959.17 m和1 923.05 m。试验地块为 2.33 hm2 的长方形区域。经土壤区分后,选取符合山原红壤特征的区域地块进行密集采样,选取20个采样点采集土壤样本,采样时间为2019年11月16日。土样采集分布示意图见图1。土壤样本经风干、研磨并通过 2 mm 孔筛,采用四分法分成2份,分别供化学分析和光谱测试用。
1.1.2 多光谱数据采集 使用挂载派诺特镜头的
大疆M100无人机飞行器,进行灰板校正后在晴朗少云天气对实验地块进行多光谱影像采集。飞行高度为60 m,飞行航向重叠率为70%,旁向重叠率为75%,飞行速度在12 m/s以下,拍照间隔时间为 2 s。手持无人机多光谱相机对白板上放置好的20个土样进行多光谱影像的室内采集。
1.1.3 高光谱数据采集 利用FieldSpec4 NG全波段地物光谱仪对所有土样进行采集,光谱仪波长范围350~2 500、350~1 000 nm波段样本间隔 1.4 nm,1 001~2 500 nm波段样本间隔1.1 nm,数据输出通道数2 151个。测试前进行白板矫正,每个土样样本均采集10条光谱反射曲线,对各样本的光谱反射值取平均值得到各土样实际光谱反射值。
1.2 数据预处理
1.2.1 影像拼接 对无人机采集的照片进行剔除和筛选后利用Pix4D mapper软件对照片进行拼接获取实验地的各波段影像、数字正射影像(DOM)、数字表面模型(DSM)、试验区四波段多光谱影像。
1.2.2 土壤养分测定 通过化学和物理方法结合对土样的有机质、速效氮磷钾、全氮共5种土壤主要养分的含量检测。
1.2.3 光谱反射曲线优化处理 由于地物光谱仪在低波段与高波段采用了不同传感器,在光谱反射曲线中会存在断点,因而用Viewspec Pro软件对原始光谱反射率进行断点修正,消除断点陡变。同时使用Origin软件中的Savitizky-Golay平滑处理,消除光谱曲线中的噪声影响,处理后的光谱曲线仍然保持原土壤光谱曲线特征。
2 结果与分析
2.1 山原红壤多光谱反演研究
2.1.1 单波段土壤光谱反演研究
2.1.1.1 土壤主要养分含量敏感波段分析 利用多光谱四波段土壤反射率与测定的土壤养分含量进行正态分布检验后,分别对土壤主要养分与各波段光谱进行Pearson相关分析,结果见表1。
由表1可知,除速效磷和有机质外,其余养分含量与光谱之间存在显著或极显著相关性。因此,对速效氮、磷和全氮3个指标进行回归分析,对主要养分含量进行多光谱模型估测。
2.1.1.2 回归模型分析 分别使用单变量和双变量回归模型对土壤养分进行分析。经试验检验,建立的单变量回归模型效果差,改进使用双相关变量波段组合的方式对山原红壤养分反射率进行研究。通过研究分析发现,仅有速效钾的养分含量与近红外和绿波存在相关性,因此选取两波段为自变量,速效钾含量为因变量建立回归模型。分别构建土壤养分含量的线性回归和非线性回归方程(表2)。
由表2可知,通过双变量波段组合能够有效提高土壤养分速效钾拟合模型的R2,使得土壤反射率能够更好地反映土壤养分。但整体的R2仍然较低,无法选定速效钾的土壤反射率为回归模型。
2.1.2 合成指数土壤光谱反演研究 研究引入9种植被指数:归一化植被指数(NDVI)、比值植被指数(RVI)、差值植被指数(DVI)、红边归一化植被指数(NDVI705)、红绿比值指数(RG)、绿通道植被指数(GNDVI)、叶面叶绿素指数(LCI)、归一化差异红边指数(NDRE)、土壤调节植被指数(OSAVI)对山原红壤的养分进行相关性分析。经检验,仅有速效钾元素含量与较多的土壤指数(NDVI、RVI、DVI、RG、OSAVI)存在显著相关性。
2.1.2.1 单变量回归分析 选取速效钾元素为因变量,与其具有较好相关性的5种植被指数作物自变量,利用SPSS软件进行单变量模型估测。通过分析得出,NDVI、DVI和OSAVI这3种土壤指数拟合模型的R2均大于0.5,但整体模型的拟合误差都比较大,须要对养分含量进行更优的模型拟合。
2.1.2.2 多元回归分析 选取单变量中R2最高的3种植被指数,将模型两两组合构建模型表达式,最终拟合3类曲线回归模型如表3所示。
由表3可知,多元变量曲线回归的拟合程度更高,且选入变量越多,拟合程度越高,选择三元变量三次拟合模型能较好地反演钾元素养分含量。
2.1.3 二维土壤光谱反演研究
进行一维分析后,再通过多光谱二维光谱合成进行土壤养分含量分析,分别对波段进行加减乘除和归一化进行二维处理。经上述分析可知,养分含量反演中,钾元素与波段和各合成指数的相关性较好。因此,利用合成波段分别与钾元素进行相关性分析,结果如图2所示。通过热力圖(图2)可以看出,K元素在不同模型中,相关性较高的波段组合如表4所示。将以上相关性较好的组合提出,构建新的模型,在构建模型中乘法拟合模型与归一化拟合的模型R2低于0.5,因此不使用这2种方法拟合模型,通过对最优合成波段进行再次组合和筛选,最终拟合模型详见表5。由表5分析可得,进行组合后的三元模型拟合程度更好,除法拟合模型中的组合2和组合10构成的反演模型能更好地反演钾元素养分含量。
2.2 山原红壤高光谱反演研究
2.2.1 单相关分析的养分模型估测
在上面的多光谱遥感中,利用合成植被指数和波段组合模型能较好地反演钾元素含量。在构建高光谱指数时,利用对原始光谱反射率(R)进行不同形式的变换,最终选取包含原始反射率、反射率倒数、反射率对数、反射率平方根、反射率倒数的对数、反射率对数的倒数以及以上指数的一阶导数共12种变换光谱作为此次研究的输入光谱。
通过对土壤速效氮含量与光谱指数的相关分析得到,研究中构建的反射率、平方根、倒数、对数等几种光谱指数对土壤主要养分含量相关性均不明显,而经过一阶导数处理后的光谱指数相关性显著提升(表6)。通过相同方法对其他主要养分含量进行相关分析后发现均存在此类现象,因此仅挑选具有特征波段研究特性的土壤合成指数进行研究。
提取土壤各主要养分含量的特征波段后,选取与各主要养分含量相关系数最优的波段及合成土壤指数波段组合进行拟合分析。分别进行一元回归分析和多元回归分析,一元回归分析中除速效磷元素的曲线拟合模型R2大于0.7外,其他养分含量拟合模型的R2均不高,一元回归模型无法完全表述变量信息。通过改进后使用多元回归分析,除全氮元素的拟合模型R2有所提升外,其余土壤养分含量拟合模型没有改善,也无法较好地表达变量贡献率。因此,结合曲线拟合和多元回归结果,再次构建非线性回归模型对土壤养分含量进行估测。
综合一元回归模型和多元回归模型,选取一元回归分析中拟合值最优的两模型构建土壤二元回归曲线回归方程,计算出各养分含量拟合曲线方程如表7所示。
经二元曲线拟合后的土壤养分模型整体较多元线性逐步回归分析的拟合模型R2均有所提升,但RMSE检验值也相对上升。相对于一元回归分析的拟合极值,除速效氮养分含量拟合值有所上升外,其他养分含量拟合值并未上升。
利用相关分析法进行分析,一定程度上可以提取土壤主要养分含量的的特征波段范围,为回归分析提供依据。但选取相关系数极值点的敏感波段进行拟合的方法难以体现波段间的相关影响,仅靠相关系数极值选定变量构建模型进行养分回归估测这一方法存在一定片面性,取得的建模效果并不理想。
经研究发现,机器学习算法在土壤有机质等主要养分含量的估测研究中,能够较好地预测精度[15]。结合前人的研究[16-17],本研究选取了偏最小二乘(PLSR)回归与支持向量机(SVM)2种方法对山原红壤主要养分含量进行估测研究。
通过以上相关性分析发现,除一阶微分变换能较好地提升光谱反射曲线与养分含量的相关性外,其余光谱变换均无很好效果。因此,在PLSR回归和SVM回归分析中,只使用原始反射率和平方根一阶导光谱指数进行分析。
2.2.2 PLSR回归养分含量反演研究
通过The Unscrambler X多变量数据分析软件对目标数据进行处理。以20个山原红壤土壤样本的原始光谱率及平方根一阶导光谱指数为自变量,速效氮磷钾及其余养分含量为因变量。各主要养分含量回归分析结果如图3至图7所示。由表8和图3至图7可知,利用PLSR回归分析得到的结果中,速效氮磷钾元素一阶微分变换指数的R2较原始反射率有所提高,但有机质和全氮一阶微分变换指数的R2降低,并且PLSR拟合的模型整体效果提升很小,不适用于山原红壤养分含量估测。
2.2.3 SVM回归养分含量反演研究
与PLSR回归相同,选择20个山原红壤土壤原始反射率和平方根一阶微分作为自变量,各土壤养分含量作为因变量,分别对5种养分含量进行建模分析,各主要养分含量回归分析结果如图8至图12所示。通过对山原红壤速效氮磷钾及其他主要养分含量的SVM回归分析可以看出,各主要养分含量在与光谱反射率平方根一阶微分的回归模型中,均获得了较好的拟合度。R2依旧呈现一阶微分变换指数高于原始光谱反射率这一现象,且一阶微分变换光谱指数的R2较原始光谱反射率有明显提升,RMSE检验值也相对降低。总之,使用SVM回归分析方法进行拟合的模型,整体效果均有所提升,比较其他方法更适合用于进行养分含量的估测。
3 结论与讨论
3.1 结论
分别使用多光谱和高光谱结合对山原红壤主要养分含量进行估测。在多光谱养分含量估测中,山原红壤在红外波段较为敏感,其土壤反射率值高于其他波段。利用合成植被指数对比,除比值植被指数与差值植被指数波段较为明显外,其他植被指数波动范围较小,通过原始反射率、合成植被指数与土壤各养分含量的相关分析表明,合成波段的相关性高于单波段。应用多种回归分析方法对与土壤养分含量相关性较好的多光谱植被指数进行分析,整体R2系数较低,无法较好地拟合土壤指数与土壤养分的关系,造成这一结果的原因初步估测为分析土壤养分样本量较少或多光谱探测波段分辨率不够高导致。在多光谱养分估测中,利用多种方式拟合了钾元素的合成光谱回归模型,其R2大于0.5,有良好的拟合意义。
由于多光谱进行养分估测效果不理想,再利用高光谱对其进行分析。对特征波段与山原红壤进行多种回归模型拟合,单相关分析拟合的模型效果不好,无法较好地反映土壤养分含量。而后使用机器学习法进行分析,分别使用最小二乘法回归模型和支持向量机回归模型对不同高光谱反射曲线进行拟合分析,拟合结果更好,使用支持向量机拟合模型的R2较高,RMSE均方根误差相对较好,比较适用于山原红壤养分含量的估测,实现了土壤主要养分含量的高光谱估测。
3.2 讨论
基于高光谱多变量的土壤养分含量回归分析由于变量众多因而分析较为复杂,基于机器学习的回归算法能够较好地解决多变量拟合回归的过拟合现象,但需要大量的样本数据。本研究相对其他研究而言样本变量相对较少,因而未采用独立样本检验的方法对模型精度进行验证。同时,由于样本变量较少,在进行BP(back propagation)神经网络与随机森林回归分析时,未能获得较好的拟合效果。因此在今后的多变量估测研究中,为保证拟合模型的拟合精度与独立样本检验的实现,应尽可能提升样本数量,提升样本检测的可能性。
参考文献:
[1]邱 壑. 耕地土壤有机质与速效氮磷钾含量高光谱遥感反演研究[D]. 福州:福建农林大学,2017.
[2]王腾军,赵明海,杨 耘,等. 多光谱影像的陕西大西沟矿区土壤重金属含量反演[J]. 光谱学与光谱分析,2019,39(12):3880-3887.
[3]张智韬,魏广飞,姚志华,等. 基于无人机多光谱遥感的土壤含盐量反演模型研究[J]. 农业机械学报,2019,50(12):151-160.
[4]张智韬,谭丞轩,许崇豪,等. 基于无人机多光谱遥感的玉米根域土壤含水率研究[J]. 农业机械学报,2019,50(7):246-257.
[5]赵 瑞,崔希民,刘 超. GF-5高光谱遥感影像的土壤有机质含量反演估算研究[J]. 中国环境科学,2020,40(8):3539-3545.
[6]刘焕军,张美薇,杨昊轩,等. 多光谱遥感结合随机森林算法反演耕作土壤有机质含量[J]. 农业工程学报,2020,36(10):134-140.
[7]姜雪芹,叶 勤,林 怡,等. 基于谐波分析和高光谱遥感的土壤含水量反演研究[J]. 光学学报,2017,37(10):292-302.
[8]马 驰. 基于Landsat 8遥感图像的长春中北部地区土壤有机质含量反演[J]. 江苏农业科学,2016,44(12):415-419.
[9]楊建锋,马军成,王令超. 基于地貌类型的土壤有机质多光谱遥感反演[J]. 地理空间信息,2015,13(2):48-50.
[10]南 锋,朱洪芬,毕如田.黄土高原煤矿区复垦农田土壤有机质含量的高光谱预测[J]. 中国农业科学,2016,49(11):2126-2135.
[11]栾福明,熊黑钢,王 芳,等. 基于小波分析的土壤速效K含量高光谱反演[J]. 干旱区地理,2015,38(2):320-326.
[12]蒋璐璐,张 瑜,王艳艳,等. 基于光谱技术的土壤养分快速测试方法研究[J]. 浙江大学学报(农业与生命科学版),2010,36(4):445-450.
[13]石萌萌. 全谱段成像仪的地表场景模拟[D]. 西安:西安科技大学,2017.
[14]秦倩如. 基于高光谱的陕西省土壤游离铁与碳酸钙含量预测研究[D]. 杨凌:西北农林科技大学,2019.
[15]叶元元. 多金属矿区土壤重金属的高光谱定量估算研究[D]. 徐州:中国矿业大学,2014.
[16]纪文君,李 曦,李成学,等. 基于全谱数据挖掘技术的土壤有机质高光谱预测建模研究[J]. 光谱学与光谱分析,2012,32(9):2393-2398.
[17]沈兰芝,高懋芳,闫敬文,等. 基于SVR和PLSR的土壤有机质高光谱估测模型研究[J]. 中国农业信息,2019,31(1):58-71.