基于光谱特征参数的果树树种的遥感识别
2015-05-06闫晓勇王振锡岳俊
闫晓勇 王振锡 岳俊
摘 要:本研究通过对南疆盆地主栽5种果树(苹果、香梨、核桃、红枣、杏)的冠层光谱数据进行特征参量的选取,旨在提高林果树种的树种分类精度并筛选出用于这5种树种的冠层光谱树种识别的有效特征参量,从而为完善高光谱果树树种识别研究中大量数据处理的方法提供参考依据。试验采用美国PP Systems公司生产的UniSpec-SC(单通道)便携式光谱分析仪对不同树种的冠层进行光谱测量,利用逐步判别分析法对高光谱数据进行树种识别与有效特征参量的选择。结果表明,采用特征参量进行树种识别的总分类精度可达到86.67%,明显高于全波段参与下的72.00%。逐步判别分析法入选的有效特征参量为蓝边面积、蓝边斜率、黄边面积、近红外平台、红边面积、蓝边位置、黄边位置、红边位置。
关键词:高光谱;冠层光谱反射率;逐步判别分析;特征参量选取
中图分类号: S127 文献标识码:A DOI 编码:10.3969/j.issn.1006-6500.2014.09.007
Abstract: The canopy spectral data characteristic parameters of 5 fruit tree species (apple, pear trees, walnut, red dates, apricots) planted in the southern Xinjiang basin were selected, the object was to improve the classification accuracy of fruit tree species and screened for canopy species identification of the 5 species of the characteristic parameters, so as to provide reference for the high spectrum fruit tree identification data processing methods. The UniSpec-SC (Dan Tongdao) canopy portable spectrum analyzer produced by USA PP Systems were used for different species of spectral measurement, using stepwise discriminate analysis method for species identification and effective characteristic parameters on hyper spectral data selection after the discovery. The results showed that the characteristic parameters of total classification accuracy of species recognition was 86.67%, and significantly higher than that 72% of the total band. The effective characteristic parameters selected for stepwise discriminate analysis method were the blue edge area, blue edge slope, yellow edge area, near infrared platform, red edge area, blue edge position, yellow edge position, red edge position.
Key words: high spectrum; canopy spectral reflectance; stepwise discriminant analysis; feature band selection
高光谱遥感在为树种的精细识别带来可能性的同时,也带来了数据冗余的问题。如何有效地利用高光谱数据的最大信息,同时又能较快地处理高光谱数据成为高光谱遥感研究的热点和未来的发展方向[1-3]。在新疆林果产业化的进程中,特色林果产业的信息化建设明显滞后,传统调查方式以多光谱遥感和地面辅助调查为主,这不仅费时、耗力,且周期较长,而快速、准确掌握特色林果资源布局、规模等基本信息已经成为新疆特色林果产业快速健康发展的迫切需求,林果树种的遥感识别就是这一工作的核心内容。因此,林果树种的遥感识别在特色林果产业的可持续经营中具有重要的现实意义[4-6]。
绿色植被的光谱曲线虽然在整体趋势上具有相似性,但是不同植被类型甚至不同个体间的光谱都会存在一些细微差异,这些差异性往往集中表现在植被光谱曲线的一些特征位置点和特征参量上。在可见光范围内,常用的特征位置点主要包括“蓝边”、“黄边”、“红边”、“绿峰”、“红谷”和 “近红外平台”等[7-10],根据这些特征位置点还能够延伸出蓝边斜率、黄边斜率、红边斜率、包络线斜率、蓝边面积、黄边面积、红边面积和红谷净深度等特征参量[11]。不同植被在这些特征波段范围的光谱反射率差异较大,它们不仅能反映出植被健康状况的变化特征[12],同时还能作为植被识别的主要特征波段[13]。有研究表明,在雪松、樟树、侧柏等主要城市绿化树种的识别过程中,采用特征参数的选择,经距离判别分析后树种的识别精度均可以达到95.00%以上[14]。而在樟树、马尾松、荷花玉兰的识别中,采用特征参数的选择,神经网络判别树种识别总精度也可达到93.33%[13]。
可见,在树种识别过程中,有效特征位置点的选择能够在很大程度上提高树种识别精度。然而关于林果树种的遥感识别的文献并不常见,本研究以5种果树不同的特征位置参量为数据源,利用逐步判别分析进行树种分类识别并选择最敏感的树种识别特征参量。
1 材料和方法
1.1 材 料
试验于2012年7月在新疆阿克苏市红旗坡农场新疆农业大学教学科研实习基地(地理坐标N41°17′56.42″~N41°18′56.16″、E80°20′23″~E80°20′56.16″,海拔1 215 m)进行。试验对象为南疆塔里木盆地5种主栽果树树种:红富士苹果(Malus pumila Mill)、库尔勒香梨(Pyru-bretschneideri Rehd)、核桃(Juglans regia Linn)、红枣(Ziziphus zizyphus Mill)和杏(Armeniaca vulgaris Lam)。试验区果树为东西行向栽植。
1.2 样株选择
样本选择均为结构良好的冠型,苹果、核桃、杏为中冠型,香梨、红枣为小冠型。选择的样本均挂果较多,苹果、核桃处于着色期、香梨处于彭大期、红枣处于开花坐果期、杏处于成熟期。共选择总样本209株。基本生长状况如表1所示。
1.3 光谱数据采集
试验时间选择在南疆果树生长最为旺盛的7月,在晴朗无风的天气条件下,选择正午太阳高度角变化不大的时间段(北京时间12:00—16:00)进行5种果树冠层光谱反射率数据测量。光谱测定仪器为美国PP Systems公司生产的UniSpec-SC(单通道)便携式光谱分析仪,该型号光谱仪可以在可见光\近红外310~1 130 nm波长范围内进行连续测量,光谱分辨率为1 nm,最大视场角为20°。测量时,光谱仪探头垂直向下,与冠幅距离约1.5 m左右并且根据所选样本冠幅大小调整探头与冠幅的距离,对冠层行测量。每个样株重复测量5次。为保证数据的准确性,每测一个单个样本进行一次参考板矫正。在去除异常光谱曲线后每个树种均保留30个样本供研究。
1.4 特征参量定义
光谱曲线由于植被色素以及自身原因的会产生一定的峰谷值。由于植被的色素、微量元素的含量以及叶面结构的不同都会导致不同的植被出现走势类似,但依然有差别的光谱曲线,而这些光谱曲线都较明显地出现在这些峰谷值上,这些具有代表性的波段处就形成了一些常用的特征位置点。因此,本研究拟采用这些特征位置点做树种识别。在所选波段范围内,常用的特征位置点分别为“蓝边”、“黄边”、“红边”、“绿峰”、“红谷”、“近红外平台”等6个特征位置点(表2)。
2 结果与分析
2.1 果树冠层光谱原始全波段数据光谱特征及精度分析
2.1.1 原始全段数据的光谱曲线特征 在去除光谱数据中受首尾噪声影响的波段后,绘制南疆5种果树冠层光谱曲线图(图1)。从图1可以看出,5种果树冠层光谱走势整体上非常相似,但是在525~575 nm、675~720 nm以及750~850 nm这3个波段范围内曲线分离度较大,表现出了明显的差异性。特别是在550 nm、680 nm这2个波段处5种果树反射率差异极显著(P<0.01),而在800 nm处5种果树反射率差异显著(P<0.05),从而说明本研究的5种果树是可识别的。
2.1.2 原始全段数据的树种分类结果 采用逐步判别分析法进行5种果树树种的高光谱识别研究,从冠层光谱反射率数据的树种识别结果(表3)中可以看出,树种的总识别精度为72.00%,可分性较好的树种为香梨,分类精度可达93.33%,其他4种果树的分类效果相对较差,特别是苹果识别精度仅有60.00%,大部分错分为了杏和红枣。
2.2 特征位置点选取与树种识别精度评价
2.2.1 特征位置点选取结果 分别对5种果树树种(苹果、香梨、核桃、红枣和杏)的30个样本分别取均值,得到相应树种的均值光谱曲线,分别计算出5种果树树种的冠层光谱的蓝边位置、黄边位置、红边位置、绿峰位置、红谷和近红外平台6个特征位置点(表4和图2)。同时,根据已选特征位置点计算8个特征参量:蓝边斜率(DA)、黄边斜率(DE)、红边斜率(FE)、包络线斜率(DF)、蓝边面积(SA)、黄边面积(SB)、红边面积(SC)和红谷净深度(HE)。
在450~900 nm波长范围内选择的6个特征位置点“蓝边”、“黄边”、“红边”、“绿峰”、“红谷”、“近红外平台”分别用A、B、C、D、E、F字母表示。本研究的5种果树冠层均值光谱曲线上的6个特征位置点分布非常集中,其“蓝边”、“黄边”、“红边”、“绿峰”、“红谷”和“近红外平台”6个特征位置点分别集中在524,598,724,553,676 ,753 nm附近。特征参量中蓝边斜率(DA)、黄边斜率(DE)、红边斜率(FE)和包络线斜率(DF)反映了524~553 nm、553~676 nm、676~753 nm和553~753 nm这4个波段范围的光谱曲线特征。而蓝边面积(SA)、黄边面积(SB)、红边面积(SC)和红谷净深度(HE)4个特征参数反映了490~530 nm、560~640 nm、680~760 nm以及553~753 nm这4个波段范围内的光谱曲线特征。由此可见,选择的6个特征位置点和8个特征位置参量在光谱序列上的特定位置基本能够表征出可见光至近红外波段的植被光谱特征(表4和图2)。
2.2.2 基于不同特征参数的果树冠层光谱分类及精度分析 为检验上述6个特征位置点和8个特征参量的树种识别效果,经逐步判别分析后分类结果如下(表5)。
从树种识别结果来看,与全波段数据的分类结果相比,经过特征位置点和特征参量的提取后,树种的总分类精度由全波段数据的72.00%提高到了86.67%。核桃的分类精度最高为96.00%,较原始数据有了明显的提高,错分几率仅为3.33%,30个核桃样本中仅有3.33%错分为苹果;香梨和红枣的识别精度也相对较高,均为90.00%,错分几率为10.00%,香梨较原始波段的识别精度均有一定的下降,但是红枣却较原始数据的分类精度提高了16.67%;苹果的分类精度有了大幅度的提高由原来的60.00%提高到了86.67%,错分几率为13.33%,与杏和红枣发生了很大程度的混淆;杏的分类精度最低为70.00%,错分几率最大,为30.00%,大部分错分为苹果,并且与香梨发生了一定程度的混淆现象。由此说明,采用基于果树冠层光谱特征位置点和特征参量进行果树树种识别时,5种果树中核桃、香梨、红枣和苹果识别精度相对较高,而杏的识别精度相对较低。
2.2.3 树种识别的有效特征位置点及特征参量提取 参与树种识别的14特征参量经逐步判别分析后仅保留了8个,包括4个特征位置点和4个特征参量。从他们所处的光谱波段来看,蓝边位置、黄边位置、红边位置和近红外平台分别位于524,598,724,753 nm波段;而蓝边面积、蓝边斜率、黄边面积和红边面积分别位于490~530 nm、524~553 nm、560~640 nm和680~760 nm波段范围内,这些特征位置点和特征参量的波段分布范围基本涵盖了整个可见光和近红外波段,且依树种不同表现出较大差异,而这些差异可能是由于各树种叶片色素含量、叶片形状、大小、冠型等特征的差异所致。因此,可以认为这4个特征位置点和4个特征参量是进行5种果树树种分类的重要敏感波段区间(表6)。
3 讨 论
根据光谱特征选择的特征位置点具有稳定性,或者是在一定范围之内的[11]。本研究根据光谱特征选取了6个特征位置点,分别为蓝边位置、黄边位置、红边位置、绿峰位置、红谷位置以及近红外平台。有研究曾提出一种针对植被光谱维特征的提取模型,主要提取了8个特征位置点,认为这8个特征位置点十分恒定,分别为蓝紫波段吸收峰、蓝边位置、绿峰位置、黄边位置、红谷位置、近红外平台和近红外反射率最大点,对应波段分别为404,525,556,573,671,723,758,900 nm。本研究选取的6个特征位置点均位于这些特征位置点的附近[11]。
在特征位置点和特征参量参与下能够在很大程度上提高树种识别的精度,本研究选取了14个特征位置点与特征参量,筛选出对果树树种识别敏感的8个参量(蓝边位置、黄边位置、红边位置、近红外平台、蓝边面积、蓝边斜率、黄边面积和红边面积),树种识别总精度为86.67%,明显高与全波段参与的树种分类的总精度72.00%。李永亮等运用神经网络分类法对樟树、马尾松、荷花玉兰3种树种进行了识别研究,在波段选择时选用了“红边”、“红谷”和“红谷位置”3个特征位置点以及黄边面积、红谷面积、红边面积和红边宽度4个特征参量。结果表明,运用这些特征位置点和特征参量可以识别出了全部的马尾松成熟林与樟树幼树,总识别精度可达93.33%[13]。何诗静等[14-15] 在做城市树种识别时,选取了蓝紫波段吸收峰、蓝边位置、绿峰位置、黄边位置、红谷位置、近红外平台这7个特征位置点,作为树种识别的主要波段,取得了95.00%以上的分类精度。这说明特征位置点与特征参量组合可以在很大程度上提高树种识别的精度。但由于植被类型差异,所选的特征位置点和特征参量类型及数量也会有所不同。
4 结 论
(1)特征参数的选取能够在很大程度上提高树种识别的精度,本研究选取了14个特征位置点与特征参量,筛选出对果树树种识别敏感的8个参量(蓝边位置、黄边位置、红边位置、近红外平台、蓝边面积、蓝边斜率、黄边面积和红边面积),树种识别总精度为86.67%,明显高与全波段参与的树种分类的总精度72.00%。
(2)在基于特征参数光谱数据的南疆盆地主栽5种果树树种识别研究中,蓝边位置、黄边位置、红边位置和近红外平台4个特征位置点以及蓝边面积、蓝边斜率、黄边面积、红边面积4个特征参量是树种分类的重要敏感波段区间。从他们所处的光谱波段来看,蓝边位置、黄边位置、红边位置和近红外平台分别位于524,598,724,753 nm波段;而蓝边面积、蓝边斜率、黄边面积和红边面积分别位于490~530 nm、524~553 nm、560~640 nm和680~760 nm波段范围内。
参考文献:
[1] 陈述澎,童庆喜,郭华东,等.遥感信息机理研究[M].北京:科学出版社,1998:139.
[2] 王志辉.高光谱遥感在森林树种识别中的应用[D].杭州:浙江农林大学,2011.
[3] 褚希鹏.基于叶片非成像高光谱数据树种分类[D].浙江:浙江农林大学,2012.
[4] 陈国芳,尼和迈提·霍嘉.新疆林果业产业化发展的对策建议[J] .新疆农业科学,2005,42(S1):211-212.
[5] 李金叶, 袁强, 蒋慧.基于区域适应性的特色林果业发展探讨[J] .新疆农业科学,2010,47(4):741-749.
[6] 孙兰凤.可持续视角下的新疆特色林果业发展研究[D].乌鲁木齐:新疆农业大学,2009.
[7] 尹小君.新疆加工番茄主要病虫害遥感监测方法与应用[M].北京:中国农业大学出版社,2013.
[8] Curran P J,Windham W R,Gholz H L.Exploring the relationship between reflectance red edge and chlorophyll content in slash pine leaves[J].Tree Physiology,1995,15(2):203-206.
[9] Gitelson A A,Merzlyak M N. Spectral reflectance changes associate with autumn senescence of Aesculus hippocastanum L. and Acer plantanoides L. leaves. Spectral features and relation to chlorophyll estimation[J].Journal of Plant Physiology,1994,143:286-292.
[10] Bach H,Mauser W. Improvement of plant parameter estimations with hyperspectral data compared to multispectral data[J].SPIE,1997,2959:59-67.
[11] 谭倩,赵永超,童庆禧,等.植物光谱维特征提取模型[J].遥感信息,2001(1):14-18.
[12] 胡珍珠.轮台白杏叶片营养元素浓度光谱估算模型[D].乌鲁木齐:新疆农业大学,2013.
[13] 李永亮,林辉,孙华,等.基于BP神经网络的森林树种分类研究[J].中南林业大学学报,2010,30(11):43-46.
[14] 何诗静.基于叶片何冠层级别的高光谱城市树种识别[D].武汉:华中农业大学,2011.
[15] 何诗静.高光谱遥感在树木识别方面的应用与研究概述[J].北京农业,2013(6):55-56.