基于高光谱数据的互花米草叶片功能性状反演
2021-09-01左雪燕崔丽娟窦志国刘志君雷茵茹
左雪燕,崔丽娟,*,李 伟,窦志国,蔡 杨,刘志君,雷茵茹
1 中国林业科学研究院湿地研究所,湿地生态功能与恢复北京市重点实验室,北京 100091 2 北京汉石桥湿地生态系统国家定位观测研究站,北京 101399
滨海湿地生态系统是介于陆地和海洋之间的过渡带,具有独特的生态过程,具备保护海岸线、防止海岸侵蚀、调节气候、净化水质、为生物提供栖息地等功能,是全球生物多样性最丰富、最具价值的生态系统之一[1-6]。但是随着人类活动和气候变化的加剧,滨海湿地面临严重威胁,生态系统功能遭到严重破坏[7-11]。互花米草的入侵是我国滨海湿地生态系统面临的严重问题之一,因为缺少天敌,且对环境的适应性较强而具有超强的竞争力,在滨海滩涂湿地上逐渐蔓延,造成本土植物多样性减少,对经济、社会、生态均产生严重危害[12-14]。
植物功能性状是指与植物获得、利用和保存资源的能力有关的一系列植物形态生理学性状[15-17]。功能性状在器官水平上可以分为:全株性状、叶性状、根性状、茎性状等;还可以分为形态性状、生理性状等[16,18-19]。叶片功能性状是植物功能性状的重要组成部分,能够反映植物的生长策略和适应机制。其中,比叶面积、叶片养分含量等与植物的相对生长速率存在显著相关关系[17];叶绿素浓度、叶氮、比叶面积、氮磷比等反映的是植物对资源的最大化获取的生存策略[20-21]。传统上的实验室内进行功能性状的测定方法费时费力,而高光谱数据以其快速、高效且提供的信息量大为解决这些问题提供了有效手段[22-24]。
目前,对于高光谱数据反演植被功能性状已经取得了很大的进展,但是对于湿地的研究主要集中某一指标(如氮、磷、生物量)的研究[1, 25-34],对互花米草的反演研究则主要集中于叶绿素含量、生物量等方面,对于叶片功能性状的系统研究比较缺乏。因此,本研究利用ASD FS4 便携式地物光谱仪来获取互花米草的光谱数据,基于高光谱数据建立与叶片功能性状之间的定量模型,最后通过决定系数(R2)以及均方根误差(RMSE)比较选出最佳反演模型,为实现无损监测互花米草的生长状况提供理论和技术基础。
1 材料与方法
1.1 研究区概况
江苏盐城滨海湿地,地处32°56′—33°36′N,120°13′—120°56′E(图1,分类图来源于MODIS Land Cover Type Product,MCD12Q1)。位于淮河下游,东临黄海,有582 km海岸线。季风盛行,雨水充沛,冬季盛行来自高纬度陆地的偏北风,夏季盛行来自太平洋的偏南风,全年平均气温受到海洋的调节,年、日变化小,该地区属于弱潮区,潮汐类型为不规则半日潮[35]。盐城滨海湿地是我国滨海湿地生态系统中类型最为齐全的区域,也是中国最大的动态潮间系统。该研究区为淤长型盐沼湿地,样地位于盐城大丰麋鹿自然保护区。植被以盐生植被为主,有互花米草(Spartinaalterniflora)、芦苇(Phragmitescommunis)、白茅(Imperatacylindrica)等[36],其中互花米草自入侵以来,在该保护区不断扩张,对当地的生态和经济造成了严重威胁。
图1 研究区位置以及样点分布
1.2 数据获取
1.2.1高光谱数据获取
本研究于2019年8月在江苏盐城进行试验数据的采集工作,使用的光谱仪是美国Analytical Spectral Device(ASD)公司生产的便携式地物波谱仪FS4,光谱范围为350—2500 nm,采样间隔为1 nm。平行于海岸线设置3个条带,每个条带上采集20个采样点,采样点间隔10 m。采样点植物群落单一,均为互花米草群落,高度为100—175 cm,株数为80—160 株/m2,植被盖度为60%—80%,土壤质地为砂性土和壤性土。在每个采样点采集上、中、下部三片生长健康、无病害的叶片,用ASD FS4搭配的叶片夹测量互花米草叶片的中部,每个叶片采集10条光谱数据,测定时避开叶片的主叶脉,将构成样本的三个叶片光谱反射率值进行平均作为该样点的叶片光谱反射率。
1.2.2叶片功能性状测定
在每个采样选择3株生长状况良好的互花米草植株,采集地上植株上中下3个部位的互花米草叶片,4小时内测定叶片的鲜重、叶厚、SPAD以及叶面积后,在105℃下,杀青15 min,之后85℃恒温,烘干至恒重,得到干重;之后经过粉碎过筛,测定其他指标。总氮和总碳可由元素分析仪同时获得,通过高温燃烧使得植物样品分解,生成混合气体之后由热导检测系统自动测定[37];植物体中的磷以有机态为主,经过H2SO4-H2O2消煮使得有机磷转化为磷酸盐,之后利用分光光度计测定,绘制标准曲线,测定总磷含量[38](表1)。
表1 互花米草主要叶片功能性状测定方法
1.2.3高光谱数据处理
(1)光谱数据转换
通过ViewSpecPro软件对互花米草叶片高光谱数据进行处理,导出互花米草叶片反射率(仪器自动重采样为1 nm分辨率),350—2500 nm共2151条波段,每30条波段取平均作为一个采样点的光谱反射率值,同时对叶片原始光谱反射率进行一阶微分(First derivative,FD)转换,公式为:
式中,λi为每个波段的波长,FDR(λi)为波长λi处的一阶微分光谱值,△λ为波段i到波段i+1的波长值。
(2)主成分分析
高光谱数据的波段数量多、相关性强,存在数据冗余,造成计算复杂。主成分分析是常用的高光谱降维手段,通过主成分分析,将互相关联的多个变量压缩为少数不相关的新的成分变量,少数的几个成分变量包含原始高光谱数据的大量信息。本研究中的主成分分析通过R语言软件中的psych函数来实现。
1.2.4数据分析处理及模型建立与评价
将通过主成分分析获得新的主成分作为自变量,构建互花米草叶片功能性状的预测模型,模型选择逐步回归模型(Stepwise regression,SR)、BP神经网络(BP artificial neural network,BPNN)、支持向量机(Support vector machines,SVM)、随机森林(Random forest,RF)模型,模型的实现依托于软件Weka 3.8。基于R语言实现原始高光谱反射率以及一阶微分转换后的光谱数据与互花米草叶片功能性状的相关性分析,选择最佳波段,构建预测模型。模型精度由决定系数(R2)、均方根误差(RMSE)进行评价。最后,通过Origin 2020软件出图。
2 结果与分析
2.1 互花米草叶片功能性状分析
首先对互花米草的功能性状进行分析,得到表2的结果。从表中可以看出,互花米草的叶片含水率均值为0.66,范围为0.56—0.74,含水率相对较高;SPAD为41.41,标准偏差为5.17;TC/TN、TN、TP、SLA的均值分别为27.12、1.32 g/kg、0.18 g/kg、41.68,其中SLA的标准偏差较大,达到20.26。功能性状的取值范围以及标准偏差的存在说明了互花米草叶片之间的差异,为基于高光谱数据进行功能性状的反演提供了条件。
表2 互花米草叶片功能性状统计表
2.2 主成分分析
本文通过主成分分析将原始光谱反射率数据以及一阶微分数据进行降维,减少自变量个数,提高运算效率。从表3可以看出原始光谱反射率的PC1的贡献率为0.53,PC2的贡献率为0.31,前两个主成分累计贡献率达到0.84,考虑到PC3的贡献率达到0.1,因此保留前3个主成分,累计贡献率达到0.94。从表4可以看出,一阶微分光谱主成分分析的第一主成分的贡献率为0.49,第二主成分的贡献率为0.18,其余主成分贡献率均低于0.1,因此选择了累计贡献率达到0.8的前4个主成分作为新的变量。
表3 原始光谱反射率主成分分析(PC)结果
表4 一阶微分光谱数据主成分分析(FDPC)结果
2.3 原始光谱反射率与叶片功能性状的相关性分析
原始光谱反射率与叶片功能性状之间的相关性如图2所示。分析结果表明,叶片含水率在731—828、1365—1608、1742—1901、1977—2426 nm波段内与原始反射率之间显著相关,与绿色植物的光谱反射率的水分敏感波段相似;SPAD在601—720 nm波段内极显著负相关(P<0.01),符合植物吸收绿光进行光合作用的原理;TC/TN与原始光谱数据的相关性较弱,在426—448 nm,654—687 nm波段内呈显著正相关(P<0.05),TN在1378—1572 nm,1762—1891 nm波段内呈显著正相关,TC/TN与TN与原始光谱数据总体相关性较弱;总磷在1305—1390 nm1509—1836 nm范围内呈极显著正相关;SLA与原始光谱数据在720—1142 nm波段内呈极显著正相关(P<0.01)。根据相关性分析的结果,选择与互花米草功能性状显著相关的敏感波段作为自变量,建立基于原始反射率敏感互花米草功能性状预测模型。
图2 原始光谱反射率与叶片功能性状相关性
2.4 一阶微分光谱与叶片功能性状的相关性分析
一阶微分转换后的高光谱数据与互花米草叶片功能性状的相关性分析结果如图3所示。从结果中可以看出,总体上一阶微分后的高光谱数据与功能性状的相关性明显高于原始光谱反射率,并且相关性更为复杂。首先对于叶片含水率,在541—560、804—967、977—998、1264—1387、1547—1593、1628—1687 nm等波段叶片与一阶微分高光谱数据显著相关(P<0.01);SPAD与一阶微分数据在641—675、679—702、711—760 nm波段内极显著相关(P<0.01);TC/TN在765—775、917—961、1004—1049、1722—1743、2213—2244 nm等波段内显著相关(P<0.05);TN在1076—1087、1275—1362、1725—1743 nm等波段内与一阶微分数据显著相关;TP与一阶微分数据在1461—1542、1678—1712、2055—2127 nm等波段内极显著相关(P<0.01);SLA与一阶微分数据在900—971、1084—1166、1266—1387、1722—1771 nm等波段内呈极显著相关。根据相关性分析的结果,选择与互花米草功能性状显著相关的敏感波段作为自变量,建立基于一阶微分敏感波段的互花米草功能性状预测模型。
图3 一阶微分数据与叶片功能性状相关性分析
2.5 基于主成分分析的功能性状模型的构建与验证
根据上述表3、表4的结果,分别基于原始光谱、一阶微分提取的主成分构建不同功能性状的SR、BPNN、SVM、RF预测模型。随机选择40个样本用于建模,其余用于验证,最优模型的确定由决定系数(R2)和均方根误差(RMSE)来确定。
2.5.1基于主成分分析的叶片功能性状建模与评价
分别基于原始和一阶微分变换的高光谱数据的主成分变量构建SR、BPNN、SVM、RF4种预测模型,建模结果如表5所示。对于两种数据形式的建模结果,除了TC/TN、TN、SLA三个性状的极个别模型一阶微分的建模效果略低于原始高光谱数据外,其余均明显优于原始高光谱数据建模,尤其从SR来看,原始光谱数据对TC/TN以及TN的建模精度极低,而一阶微分则得到了显著性的关系结果,虽然精度较低,但也说明一阶微分有助于减少建模过程中的不确定性,从而提高建模精度。比较4种模型的建模结果,SR、BPNN、SVM、RF的建模R2依次为0—0.75、0.34—0.89、0.58—1.00、0.98—0.99,虽然SVM的部分建模结果优于RF模型,但是较之于SVM模型,RF模型的稳定性更高,综合比较可以发现,4种模型的排序为RF>SVM>BPNN>SR,SR模型整体上较差,可能是由于高光谱数据与叶片功能性状之间的关系是非线性的,因此其建模效果较差。
2.5.2基于敏感波段的功能性状模型的建立与评价
表6 基于光谱敏感波段的互花米草叶片功能性状随机森林模型
3 讨论
3.1 高光谱数据与互花米草叶片功能性状的敏感波段
通过对互花米草不同叶片功能性状与原始高光谱以及一阶变换后的高光谱数据的相关性分析,针对不同指标得到了不同的相关性分析结果,其中MC主要在红外区域与高光谱数据存在显著相关关系,主要是由于在红外光范围内,植物的光谱反射率会受到水分的影响,并且该结果也得到了浦瑞良等[22]和哈布热等[39]研究的证实;与SPAD显著相关的波段主要集中于可见光的绿光波段,这主要是因为植物主要通过吸收绿光来进行光合作用,该结果在前人的研究中得到了肯定[40-42];TC/TN、TN、TP、SLA与高光谱数据显著相关的波段主要集中于近红外和红外波段,其中TC/TN、TN与原始光谱反射率的相关性较低,与易秋香[43]等以及施润和等[44]的相关性绝对值达到0.85和0.81相差较大,但是TN与一阶微分光谱在675、770、850、1076—1850 nm范围内与易秋香等[43]的研究结果存在交叉;TP与原始光谱的结果与郭澎涛等[45]的TP在529—578 nm以及699—746 nm与原始反射率显著相关的结果不同,而TP与一阶微分光谱的相关性与其研究结果存在交叉波段;对于以上结果,推断原因有二,一是由于植物种类的差异,使得光谱以及指标之间都存在差异;二是由于样本数量的不足,导致相关性水平较低[43]。因此,本研究得到的结果既与前人的研究存在相似之处,又存在一定独特性,说明不同的植物类型、样本量以及不同的数据处理方法,会使得功能性状与高光谱数据之间的相关性分析存在差异。
3.2 基于不同数据类型的不同模型估算结果比较分析
两种数据形式与功能性状的相关性分析结果表明,在相关性水平上以及敏感波段数目上均证明了一阶微分光谱数据与叶片功能性状的相关性水平更高。根据表5、6及图4中不同模型建模以及验证精度的结果进一步验证了一阶微分变换的高光谱数据的预测效果优于原始数据。以上结果,与郭超凡等[40]、艾金泉等[42]、余哲修等[46]的结果一致,说明一阶微分光谱能够提高高光谱与功能性状的相关性,提高功能性状的反演精度。在本研究中,选择SR、BPNN、SVM、RF4种回归模型进行功能性状的预测,SR模型的建模R2介于0.10—0.75,BPNN建模R2介于0.32—0.89,SVM建模R2介于0.58—1,RF模型的建模R2介于0.98—0.99,与前人的结果相比较,本研究取得的结果是相对准确的(表7)。
图4 互花米草叶片功能性状随机森林验证集预测值和真实值
表7 模型结果与前人比较
以主成分分析结果为变量,比较4种模型在不同指标上的估算结果发现,逐步回归模型在MC、SPAD、TP以及SLA的估算精度明显优于TC/TN和TN(表5);而其他3种模型在不同指标上的结果无较大变化,因此,其他3种模型较逐步回归模型更加稳定,其中RF模型的结果更加稳定。综上所述,RF优于其他3种模型,可能是因为RF的建模过程随机性强,决策树的节点分裂以及每个节点分割变量的产生都是随机的,且不需要进行参数调整,也不易出现过拟合现象,因而更加稳定和准确[50,51];SVM和BPNN预测效果不稳定的原因可能是其模型的构建需要较大的样本量来支撑,而本研究中的样本量不足以使其稳定,并且在Cui等[52]的研究中发现,RF、SVM、BPNN在不同季节不同指标的反演中均达到了很好的效果,因此排除了采样时间这一影响因素;而SR模型效果较差的原因可能是由于功能性状与高光谱之间的关系是非线性的,因而得到的模型准确性差。由于植物种类和性状指标的差异,模型的适用性会存在差异,本研究中RF模型在现有指标以及现有样本量情况下都取得了很好结果,而其他模型的效果还有待进一步的验证。
4 结论
本研究以江苏盐城滨海湿地的互花米草为研究对象,采用室内光谱仪获得互花米草的高光谱反射率,通过实验室测定获得互花米草叶片的相对叶绿素含量、叶片含水率、比叶面积、叶氮、叶磷、碳氮比指标。阐明了不同叶片功能性状与高光谱数据的相关性,选出了敏感波段;比较了逐步回归、BP神经网络、支持向量机、随机森林4种模型的预测效果,并进一步验证了随机森林模型的适用性和准确性,主要结论如下:
(1)不同性状与高光谱数据对应的敏感波段存在差异,其中,与叶片含水率显著相关的波段主要位于近红外和红外光波段;相对叶绿素含量的敏感波段则位于可见光波段;碳氮比和比叶面积两个性状与原始光谱数据的可见光波段高度相关,总氮、总磷则与原始光谱数据的红外波段高度相关,而对于一阶微分光谱数据,相关性比较复杂,敏感波段既存在于可见光波段,又存在于红外波段,显著相关的波段远多于原始高光谱反射率。总体上来说,一阶微分变换的光谱数据与功能性状之间的相关性更强,有助于提高建模精度。
(2)通过对原始光谱数据以及一阶微分变换后的高光谱数据进行主成分分析提取新的主成分参数,建立不同功能性状的预测模型,综合比较不同性状不同模型的结果,发现随机森林模型>支持向量机>BP神经网络>逐步回归,其中随机森林的建模以及验证精度均大于0.80,逐步回归模型的建模精度明显低于其他模型,原因可能是功能性状与高光谱数据之间的关系是非线性的,因而导致模型结果存在较大差异。
本研究进一步证实了原始光谱数据以及一阶微分数据对互花米草不同功能性状的预测能力,可为大范围监测互花米草的入侵提供先验知识以及基础数据。同时本研究还进一步证实了随机森林模型的适应性和稳定性,但该结果还需要大量的实验来进行检验和修正。