APP下载

退化高寒草甸主要物种花与叶片的光谱识别方法

2022-04-20刘咏梅盖星华董幸枝王怀玉胡念钊

关键词:降维反射率草甸

刘咏梅,盖星华,董幸枝,王怀玉,胡念钊

(1.西北大学 城市与环境学院,陕西 西安 710127;2.西北大学 陕西省地表系统与环境承载力重点实验室, 陕西 西安 710127)

高寒草甸是青藏高原分布最广泛的草地类型之一,约占高寒草地面积的46.7%[1],是高寒草地生态系统的主要组成部分,对于高寒地区生物多样性维护、气候调节及水源涵养发挥着关键作用[2]。近年来,由于气候变化和人类活动的影响,高寒草甸呈现不同程度的退化趋势,草地覆盖度降低、生产力下降、毒杂草类植物增加、土壤退化甚至沙化[3]。传统的草地退化监测以实地调查为主[4],该方法受野外条件限制且覆盖空间有限[5]。遥感技术的快速发展为退化草地监测提供了新途径,高光谱遥感具有波段连续性强、光谱分辨率高的特点,在草地植被分类及制图中具有明显优势。研究典型退化草甸主要植物的光谱可分性,可为草地动态监测和退化草甸修复提供关键技术支持。

近年来多位学者利用实测光谱对草地植物光谱识别方法开展了系列研究。王焕炯等[6]对呼伦贝尔温性草甸草原的羊草(Leymuschinensis)、克氏针茅(Stipakrylovii)和冷蒿(Artemisiafrigida)等植物的叶片光谱使用一阶微分和红边位置提取特征参量,对上述植物的识别精度高于95%。周伟等[7]采用三江源地区8种典型毒杂草和4种优良牧草的冠层光谱,结合Savitzky-Golay平滑、包络线去除、导数变换、光谱特征参数及马氏距离提取特征波段,结果表明毒杂草与优良牧草识别的敏感波段主要位于680~750 nm和900~1 000 nm范围内。喻小勇等[8]对三江源地区矮嵩草(Kobresiahumilis)、高山嵩草(Kobresiapygmaea)和藏嵩草(Kobresiatibetica)3种未退化草甸,以及四种退化程度的高山嵩草草甸的样地光谱进行对比分析,结果显示波长675 nm和760 nm处的反射率以及红边斜率差异能够有效区分不同的高寒草甸类型。现有研究主要侧重于植物绿色叶片或冠层/群落之间的光谱区分,但对于不同植物花的光谱可分性研究较少。盖颖颖等[9]基于呼伦贝尔草原7种花的冠层以及裸土光谱,通过光谱微分、光谱重排、计算NDVI指数并结合线性解混模型,通过花的光谱差异来识别物种。陈晋等[10]在青海海贝牧场采集三裂碱毛茛(Halerpestestricuspis)花的实测光谱,建立Hyperspectral Flower Index模型来估算花的盖度,为植物分类及动态监测提供了新的生态指标。盛花期不同草地植物花的颜色之间及其与绿色叶片之间的光谱差异明显增强,可为退化草甸不同植物种类遥感识别提供新的切入点。

常用的植物光谱可分性方法主要是光谱参量化分析[6-7],如提取蓝边、绿峰、红谷和红边等特征参数、光谱一阶/二阶微分等。这些方法强调了植物生物特性的光谱反映,但特征光谱位置的准确度和波段宽度会随着物种不同而发生变化,从而降低特征波段的提取精度。层次分析法通过对光谱数据的逐次降维,能够精确提取不同植物种类光谱差异的特征波段。Adam等[11]及Fernandes等[12]综合统计检验、分类与回归树算法(classification and regression trees, CART)和Jeffries-Matusita(J-M)距离算法,分层提取了纸莎草(Cyperuspapyrus)及芦竹(Arundodonax)识别的最优特征波段。艾金泉等[13]采用ANOVA检验、CART算法并结合J-M距离,提取互花米草(Spartinaalterniflora)的光谱敏感波段并评估其光谱可分性。以上研究表明层次分析法可以准确识别不同植物种类光谱差异的最优波段,其波段选择的准确性优于传统光谱分析方法。针对退化高寒草甸植物种类之间光谱相似性高而遥感识别存在较大难度的问题,本研究在青海省祁连县青阳沟选择典型退化草甸作为研究区,实测主要植物种类花和叶片光谱,结合Kruskal-Wallis检验、CART算法和J-M距离提取青藏高原退化草甸主要物种花和叶片的最优光谱识别波段,为退化高寒草甸遥感动态监测提供依据。

1 数据与方法

1.1 研究区概况

研究区位于青海省海北州祁连县境内,属于典型的高原大陆性气候,气候寒冷、温差大、日照时间较长,年平均气温2.7℃[14],年降水量420 mm[15]。草地类型主要为高寒草甸,土壤为高山草甸土。近年来由于过度放牧的影响,草地逐渐退化,形成为以狼毒(Stellerachamaejasme)等毒杂草为优势种的草甸群落。光谱实验样地选在狼毒入侵严重的八宝镇青阳沟,地理位置100°21′38″~100°21′52″E、38°9′32″~38°9′40″N,平均海拔3 073 m,地势平坦开阔(见图1)。草甸群落组成种类丰富,优势种有狼毒、高山嵩草、草玉梅(Anemonerivularis)、线叶嵩草(Kobresiacapillifolia)、乳白香青(Anaphalislactea)、披针叶黄华(Thermopsislanceolata)等。

1.2 数据采集与处理

光谱野外测量于2019年7月中旬进行,采用ASD Field Spec4 Hi-Res(350~2 500 nm)地物光谱仪测量试验样地主要植物种类的花及叶片光谱。光谱采样间隔为1.4 nm(350~1 000 nm)和2 nm(1 001~2 500 nm),波长精度为±0.1 nm,镜头视场角为 25°。试验样地退化草甸主要物种花的颜色有3种:白色、黄色、紫色,叶片颜色主要为绿色。① 白色花:狼毒、草玉梅、乳白香青、草血竭(Polygonumpaleaceum)。② 黄色花:黄花棘豆(Oxytropisochrocephala)、蒲公英(Taraxacummongolicum)、石龙芮(Ranunculussceleratus)、委陵菜(Potentillachinensis)。③ 紫色花:秦艽(Gentianamacrophylla)、刺芒龙胆(Gentianaaristata)、肉果草(Lanceatibetica)、高原扁蕾(Gentianopsispaludosa)。④ 绿色叶片:狼毒、草玉梅、高山嵩草、披针叶黄华等主要物种绿色叶片。使用叶片夹进行光谱采集,将花及叶片样本平铺在叶片夹镜片上,每次采集15条光谱,取均值作为每个样本的光谱反射率。每种颜色的花重复20~25个样本,各种绿色叶片重复28个样本,共测量98个光谱样本。

1.3 研究方法

1.3.1 光谱数据预处理 首先采用ViewSpecPro软件中的移动窗口多项式拟合平滑法(窗口大小为9*9)对所有光谱数据进行平滑降噪处理。包络线去除能够突出光谱曲线的吸收和反射特征[16],该方法采用实际光谱反射率除以包络线上相应波段的反射率,将光谱反射率归一化为0~1.0之间的值。在平滑降噪的基础上进一步对光谱数据进行包络线去除处理,增强不同物种花及叶片的光谱特征。

图1 研究区位置图Fig.1 Overview of study area in Qilian County, Qinghai Province

1.3.2 光谱数据降维 本研究借鉴Fernandes等[12]的方法对实验样地植物群落中的4种颜色光谱(白色、黄色、紫色和绿色)进行分层降维处理,提取退化草甸主要植物花和叶片光谱区分的最优敏感波段。Kruskal-Wallis检验是一种非参数检验方法,用于比较多个独立样本。该方法不需要对总体分布做任何假设,当总体方差未知或者不符合正态分布时用于检验多个总体的分布是否存在显著差异[17]。首先对4种颜色光谱的所有波长(n=2 151)进行Kruskal-Wallis检验(p<0.05),并对筛选出的差异显著波长进行Dunn事后检验,确定主要差异波长。其次,采用CART算法进一步筛选花和叶片之间光谱区分的特征波长,并将相邻的波长聚合为特征波段[11]。CART是一种非参数非线性统计模型,该算法构建的树用一个或多个自变量来解释单个因变量的变化,自变量和因变量通常是分类的(分类树)或连续/离散的(回归树)[18-19]。在本研究中将所有光谱样本按四种颜色类别进行划分,随机抽取样本的60%作为训练集,40%作为验证集。基于训练集数据采用二叉树形式递归地重复分割数据来构造分类树,每次分割时根据类别将自变量拆分为互斥的组;再基于验证集数据对构建的最大树进行剪枝,通过评估剪枝序列中每棵树的预测性能确定大小正确的树[20]。

1.3.3 光谱可分性评价 J-M距离被广泛地用作最优波段选择和分类结果评价的可分性准则[21],一定的值域范围表示分类精度达到一定等级。CART算法提取了同一光谱区域中若干个相邻的特征波段,这些波段都具有一定的植物种类区分能力,通过计算J-M距离可以筛选出这些相邻波段中具有最佳光谱可分性的波段。J-M距离具有渐近行为,其值域为[0,2],J-M值为2表示光谱特征之间完全可分,0值对应于完全重叠。本研究采取通用的光谱可分性标准:J-M>1.9代表类别间具有最高可分性,即没有任何重叠完全可分;1.9>J-M>1.0代表类别间具有一定可分性,但是有部分重叠;J-M<1.0代表类别间完全重叠而不可分。

两个类别之间的J-M距离的表达式如下:

J-Mij=2(1-e-a),

(1)

(2)

式中:U为样本的均值向量;Σ为方差矩阵;i和j分别表示两个地物类型。

本研究中光谱数据降维及光谱可分性评价的所有算法均使用Python语言在Anaconda3中编写代码实现。

2 结果与分析

2.1 花与叶片的反射光谱特征

研究区植物群落主要植物花和叶片的反射光谱曲线如图2所示。植物花呈现不同颜色是色素及其含量共同作用的结果,相同颜色的花光谱反射光谱曲线存在一定共性特征。白花不含色素,在700~1 300 nm波段反射率明显高于其他颜色的花。黄花反射率在绿波段500 nm附近的吸收谷与类胡萝卜素有关[22]。在427~464 nm附近花青素含量与光谱反射率成正比,紫花反射率急剧上升到0.2;在500nm附近花青素对绿光的吸收增大,紫花的反射率急剧减小[23]。绿色叶片的光谱在450~500 nm附近及以650~680 nm附近出现了蓝谷和红谷,在550 nm附近则形成了绿峰,700~750 nm处的红边位置区域与叶绿素含量有较强相关性,叶片光谱反射率陡升至0.5[24]。总体来看,在380~1 300 nm波段4种颜色的光谱反射率差异较大,特别是在700~1 300 nm波段随着颜色加深反射率呈现下降趋势,白花的反射率最高,绿色叶片的反射率最低。在1 300~2 500 nm波段4种颜色的反射光谱曲线变化趋于一致,均在1 400 nm和1 800 nm处存在明显的水分吸收谷。

2.2 光谱降维结果

研究区植物4种颜色在350~2 500 nm范围所有波长的Kruskal-Wallis检验结果,以及Dunn事后检验结果如图3所示。在95%的置信水平下Kruskal-Wallis检验筛选的差异显著波长较多,在可见光、红边、近红外及短波红外波段均有分布,主要集中在392~1 388 nm和1 566~1 845 nm两个波段范围内。Dunn事后检验筛选的主要差异波长大幅减少,主要集中在393~528 nm、589~726 nm、886~1 343 nm 3个波段;被剔除的波段有可见光区的529~588 nm、红边及近红外区的727~885 nm及短波近红外区的1 344~1 388 nm和1 566~1 845 nm,差异显著波长数目从1 277减少到732个。在统计检验的基础上使用CART算法进一步筛选的敏感波长减少到490个(见图4),将相邻波长合并为波带,确定4种颜色区分的最优敏感波段主要位于可见光区域的393~449 nm、453~527 nm,红边区的592~608 nm、614~647 nm、653~654 nm、660~684 nm、688~690 nm、699 nm、706~722 nm,近红外和短波近红外的886~1 127 nm、1 131~1 140 nm、1 146~1 156 nm、1 160~1 167 nm、1 170~1 231 nm和1 237~1 342 nm。表1显示CATR模型构建的准确率较高,花和叶片颜色光谱的总分类精度达到了80%。精确率和召回率分别反映了每一类的查准率和查全率,F1值是精确率和召回率的调和平均值。4种颜色的精确率和召回率均在0.6以上,白色、紫色、黄色和绿色的F1值为0.72、0.62、0.72和0.86,说明模型整体性能较好,对于绿色叶片光谱的识别能力最佳,其次是白色、黄色及紫色。

图2 研究区主要花与叶片的反射光谱曲线Fig.2 Spectral reflectance curves of main flowers and leaves in the study area

2.3 花与叶片的光谱可分性

基于CART算法提取的敏感波长对4种植物颜色计算两两之间的J-M光谱距离。由表2可见,白色-黄色、白色-绿色、黄色-紫色之间J-M距离值大于1.9的波长数目分别为72、35和4,表明上述植物颜色之间具有高度光谱可分性。其中,敏感波长数目最多的是白色-黄色,集中在蓝绿波段的415~495 mn及近红外波段的1 064~1 088 mn;其次是白色-绿色,敏感波长主要分布在红光、红边和近红外波段的636~699 nm;黄色-紫色之间的敏感波长相对较少,位于近红外波段的1 052~1 055 nm。相对而言,白色-紫色、黄色-绿色、紫色-绿色之间的光谱可分性降低,无J-M距离值大于1.9的敏感波长,J-M距离值在1.0~1.9之间的波长数目分别为177、99和5。表明这些颜色之间具有一定的光谱可分性(见表3)。其中,敏感波长数目最多的是白色-紫色,集中在蓝绿波段的423~527 nm、红光波段的592~678 nm和红边位置的680~722 nm,少部分位于近红外波段的886~1 097 nm附近;其次是黄色-绿色,敏感波长集中在蓝绿波段的403~495 nm、红光和红边位置的646~690 nm,少部分位于近红外波段的1 044~1 108 nm;紫色-绿色的敏感波长最少,在可见光波段只有527 nm一个波长,其余波长位于近红外波段范围内的886 nm和1 050~1 052 nm。总体来看,4种颜色识别的敏感波长主要位于可见光波段,其次是红边和近红外波段,而在短波红外波段1 300~2 500 nm内则不存在光谱识别的敏感波长。

图3 统计差异显著波长检验结果Fig.3 Statistical test of spectral difference wavelength

图4 CART筛选的特征波段Fig.4 Characteristic bands selected by CART

表1 CART分类精度评价Tab.1 Classification accuracy evaluation of CART

表2 花/叶片之间的光谱可分性评价结果(高度可分)Tab.2 Results of spectral separability between flowers and leaves(good separability)

表3 花/叶片之间的光谱可分性评价结果(中度可分)Tab.2 Results of spectral separability between flowers and leaves(moderate separability)

3 讨论

光谱数据降维方法应确保植被关键特征的保留和冗余数据的剔除,单独使用一种方法很难筛选出最合理的敏感波长[11],基于统计检验、CART和J-M距离3个层级的逐次降维能够有效筛选不同植物种类花与叶片之间光谱区分的最优波段。在本研究中统计检验的降维效率为66.0%,波长数目从2 151减少至732;进一步使用CART算法的降维效率为33.1%,波长数目从732减少至490;随后基于J-M距离筛选出的高度可分性波长数目降到111,降维效率为77.3%;总体降维效率达到94.8%。已有研究中,Adam等[11]、Fernandes等[12]及艾金泉等[13]使用层次分析法的总体降维效率分别约为97.9%、97.6%和96.7%,本文的研究与前人研究结果具有一致性。结果表明,联合统计检验、CART和J-M距离的层次分析法可有效提取退化草甸白色、黄色、紫色花及绿色叶片之间的最优敏感波段,光谱降维效率远高于传统方法[6,9]。

退化草甸主要花与叶片颜色的光谱区分波长与相关色素的特征波长具有一致性。本研究发现,在3种花之间,白花与黄花的光谱可分性最高,其次是黄花与紫花,这两个类对之间基于敏感波段计算的J-M距离值均大于1.9。白花-黄花的光谱区分波段与类胡萝卜素的敏感波段密切相关,而黄花-紫花的光谱特征波段则与类胡萝卜素和花青素的敏感波段有一定关联。已有研究表明类胡萝卜素的敏感波段在425~490 nm 、490~600 nm[25]以及1 039~1 085 nm 附近[22];绿光、红光及红边位置则是花青素最敏感的波段范围[26],在427~464 nm、635~690 nm波段花青素含量与反射光谱呈正相关[23]。本研究显示,白花-黄花的特征识别波段主要集中在415~495nm,少部分集中在1 064~1 088nm,皆为类胡萝卜素的敏感波段。黄花-紫花的特征识别波段位于1 052~1 055 nm,可能的原因在于类胡萝卜素和花青素的敏感波长在可见光波段有一定重叠而难以区分,而在1 052~1 055 nm附近类胡萝卜素的CH2结构与光谱反射率有相关性[23],因而可以区分黄花和紫花。在花与叶片之间,白花与叶片可分性最高,白花-绿叶的光谱区分波段与叶片叶绿素的敏感波段有对应关系。已有研究显示红和红边是叶绿素含量与光谱反射率之间密切相关的波段[24],其中红边位置是红波段叶绿素强吸收和近红外波段叶绿素内部结构多重散射造成的强反射而引起的光谱急剧变化区域[27]。本研究提取的白花-绿叶的光谱区分波段位于636~699 nm附近,进一步从光谱可分性的角度验证了前人研究结果。

退化草甸植物群落4种主要颜色之间均具有一定的光谱可分性,可为草地植被遥感分类提供科学的波段选择依据。白色-黄色、白色-绿色和黄色-紫色三个类对的敏感波长计算的J-M距离值>1.9,具有最佳的光谱可分性。白色-紫色、黄色-绿色、紫色-绿色3个类对的敏感波长计算的J-M距离值在1.0~1.9之间,具有一定的光谱可分性和潜在的应用价值。狼毒是青藏高原危害最严重的有毒入侵植物之一,盛花期狼毒顶花为白色,与绿色草地背景光谱差异明显,本研究显示红、红边和近红外区的636~699 nm波段对于白花和绿色叶片的光谱区分效果最佳,可为狼毒的遥感识别与监测提供重要借鉴。黄色-绿色、紫色-绿色的敏感波段也为退化高寒草地其他主要毒杂草黄花棘豆、披针叶黄华、橐吾(Ligulariasibirica)(黄色花)和马先蒿(Pedicularisreaupinanta)(紫色花)在盛花期的遥感识别奠定了光谱可分性基础,拓展了光谱分析技术在退化草地植被遥感动态监测的应用范围。

4 结论

本研究基于在青海省祁连县青阳沟实测的植物花和叶片光谱,采用Kruskal-Wallis检验、CART算法和J-M距离相结合的层次分析法提取青藏高原退化草甸主要物种花和叶片的最优光谱识别波段,结论如下:

1)退化草甸白花、黄花、紫花及绿色叶片的反射光谱在380~1 300 nm波段存在明显差异,特别是在700~1 300 nm波段随着颜色加深反射率呈现下降趋势,白花的反射率最高,绿色叶片的反射率最低。在1 300~2 500 nm波段4种颜色的反射光谱曲线变化趋于一致,均在1 400 nm和1 800 nm处存在明显的水分吸收谷。

2)层次分析法通过逐次降维可有效筛选退化草甸主要物种花与叶片之间光谱区分的最优敏感波段,Kruskal-Wallis和Dunn事后检验、CART算法和J-M光谱距离的降维效率分别为66.0%、33.1%和 77.3%,总体降维效率达到94.8%。

3)退化草甸植物群落四种主要颜色之间均具有一定的光谱可分性。其中,白花-黄花、白花-绿叶、黄花-紫花的敏感波长计算的J-M距离值>1.9,具有最佳的光谱可分性。白花-紫花、黄花-绿叶、紫花-绿叶的敏感波长计算的J-M距离值在1.0~1.9之间,具有一定的光谱可分性和潜在的应用价值。

本研究显示,花与叶片光谱识别的特征波长与色素的敏感波段密切相关,不同色素的敏感波段存在一定重叠,可能会影响或降低不同颜色花与叶片之间的光谱可分性。采用光谱增强方法提高不同物种之间的光谱差异性,进一步优化花与叶片的光谱区分敏感波段,这方面的工作有待于进一步开展。

猜你喜欢

降维反射率草甸
车灯反射腔真空镀铝反射率研究
基于数据降维与聚类的车联网数据分析应用
馒头草甸
降维打击
新巴尔虎右旗沼泽和草甸信息提取
显微光度计在偏光显微镜鉴定不透明金属矿物的应用
高光谱遥感数据下城市植被碳汇的研究
几种降维算法的研究及应用
我想在草甸躺下来
分步催化制备纳米SiO2减反射膜的性质与结构研究