基于光谱特征的湿地植物种类识别
2016-07-18柴颖阮仁宗柴国武傅巧妮
柴颖, 阮仁宗, 柴国武, 傅巧妮
(1.河海大学地球科学与工程学院,南京 210098; 2.河南省南阳水文水资源勘测局,南阳 474500)
基于光谱特征的湿地植物种类识别
柴颖1, 阮仁宗1, 柴国武2, 傅巧妮1
(1.河海大学地球科学与工程学院,南京210098; 2.河南省南阳水文水资源勘测局,南阳474500)
摘要:光谱特征的选择对于湿地植被的识别精度和效率有直接的影响作用。以美国舍曼(Sherman)岛水域为研究区,基于HyMap航空高光谱遥感影像数据,分析湿地植被的一阶微分光谱和光谱吸收特征,利用逐步判别分析法筛选识别精度较好的光谱特征参数参与C4.5决策树分类。结果表明: 4种湿地植被的一阶导数光谱特征差异较小,吸收特征差异性相对较大; 基于一阶微分光谱特征和光谱吸收特征利用C4.5决策树进行分类,可以实现湿地植被在物种水平上的识别,并达到较好的分类精度。
关键词:高光谱遥感; 光谱特征; 湿地植被;HyMap
0引言
近年来,高光谱遥感技术在湿地植被的精细识别和分类方面的应用逐渐增多。由于高光谱遥感数据具有波段多、信息量大、信息冗余等特点,如何对高光谱数据进行降维处理是国内外学者研究的重点问题之一[1]。Hestir等采用光谱角分类器对美国加州三角洲的入侵水生植物进行了物种识别和分类制图[2]; 邱琳等基于均值置信区间估计原理筛选高光谱特征波段得到光谱差异显著的波段从而进行湿地植物信息的提取[3]; 刘雪华等采用马氏距离和主成分分析法对高光谱数据进行降维,利用提取的光谱信息构建湿地植物判别模型[4]。然而,这些学者大多通过分析光谱差异进行湿地植物分类研究,目前基于高光谱影像利用光谱特征识别湿地植被种类和组成的研究尚未深入展开。
本文以高光谱和高空间分辨率的HyMap航空遥感影像数据为数据源,基于地面实测数据在影像上提取典型湿地植被的反射光谱,利用光谱微分法和连续统去除法分析湿地植物的光谱特征,基于逐步判别分析法筛选识别精度较好的光谱特征参数参与C4.5决策树分类,使湿地植被达到物种水平上的识别。研究结果可为深入进行湿地资源调查和湿地变化检测等提供科学依据。
1研究区概况
萨克拉门托-圣华金三角洲(Sacramento-SanJoaquinDelta)位于美国加利福尼亚州西北部萨克拉门托河(SacramentoRiver)与圣华金河(SanJoaquinRiver)的交汇处。2条河流经旧金山湾流入太平洋。三角洲流域面积为4.5万km2,是加州的淡水输送系统的主要枢纽[5]。三角洲的水力学异质性体现在该处水体的盐度、潮汐通量、水深的多变以及淡水流量极端的季节与年际变化[5]。一般时候淡水均从各支流顺流流入萨克拉门托-圣华金两河,再流入海湾; 而涨潮时咸水可倒流入至三角洲的上游部位。三角洲淡水流量有明显的季节性变化特征: 冬季的平均流量约1 700m3/s,夏季平均流量则约为540m3/s[6]。
本文选取沉水植被巴西水草、浮水植被水葫芦、挺水植被蒲草及岸栖植被辣椒水草4种研究区比较典型的植物群落作为研究对象。
2研究方法
2.1数据获取及其预处理
研究区域的高光谱遥感数据来源于成像光谱仪HyMap的航摄影像,航摄时间为2007年6月19—21日,航高1 500m,空间分辨率3m。
HyMap是澳大利亚HyVista公司研制的航空成像光谱仪,共126个波段,光谱分辨率由12~16nm不等,波段范围为0.450~2.543μm。
飞行路线贯穿整个三角洲,共64条航带。本文研究区为第42,43和44航带上的舍曼(Sherman)岛水域(图1)。
图1 研究区的地理位置图
本文野外实测样点的点位数据均利用GPS获得,平面精度约1m。实测时记录了样点植被的种类、盖度和位置等属性。每个样点都拍摄2张照片,一张为样本整体景观,另一张为近距离单个植株。每张照片都与相应的点位、拍摄时间建立了关联,方便后续参考和计算。
HyMap数据已由HyVista公司进行了几何纠正和大气校正。本文仅对11个位于大气水汽吸收带的波段和1个数据错误波段进行了剔除; 然后在B29(R)B15(G)B8(B)假彩色合成图像基础上数字化提取水域边界。
2.2光谱特征提取
2.2.1光谱导数计算
光谱微分法能够将原始光谱曲线的变化趋势和曲率等特征进行放大,进而确定光谱曲线的变化区域。一阶导数光谱能反映出植物中叶绿素等物质吸收产生的波形变化,并揭示光谱峰值特征[7]。因此,将一阶光谱微分法应用于本次湿地植被的研究,以期能够获取湿地植被识别的最佳波段。
一阶微分光谱的计算方法为[8]
ρ′(λi)=[ρ(λi+1)-ρ(λi-1)]/2Δλ,
(1)
式中: λi为波段i的波长; ρ′(λi)为波长λi的一阶微分光谱;Δλ为波长λi-1到λi的间隔,视波段波长而定。
2.2.2光谱吸收特征提取
地物光谱曲线反映了地物的吸收和反射特征。湿地植被在可见光和近红外光谱范围内,由于受叶绿素和水体吸收作用的影响存在着精细的光谱吸收特征,可以通过定义光谱吸收特征参数来定量描述。因此,从光谱曲线中提取的光谱吸收特征参数可以用来对湿地植被进行识别和分类。主要的光谱吸收特征量化参数有5种[8],如下所示。
1)吸收深度(H)。归一化值为1的曲线和吸收谷的最小值之间的垂直距离。
2)吸收面积(A)。归一化值为1 的曲线与吸收谷之间的面积。
3)吸收对称度(S)。 其公式为
S=AL/A,
(2)
式中: AL为吸收谷左半端的面积; A为吸收谷整体面积。
4)吸收斜率(K)。其公式为
K=(Re-Rs)/(λe-λs) ,
(3)
式中: λs,Rs分别为吸收谷起始点和对应反射率; λe,Re分别为吸收谷终点和对应反射率。
5)光谱吸收指数(SAI)。其公式为
(4)
式中吸收对称性参数d可表达为
d=(λe-λp)/(λe-λs) ,
(5)
其中λp和Rp分别为吸收点p的波长位置和对应反射率。
2.3逐步判别分析法
通过逐步判别分析可以对湿地植物识别具有最大判别能力的光谱特征参数筛选出来[9]。本文基于SPSS软件进行逐步判别分析。
2.4C4.5决策树
1993年Quinlan提出C4.5算法,该算法改进了ID3算法,用信息增益率取代了ID3算法中的信息增益来选择决策树的测试属性。信息增益率为
R=G/S,
(6)
式中: 信息增益率R为信息增益G与分割信息量S的比值。C4.5算法选取信息增益率最大的测试属性值作为节点,生成决策树[10]。
3光谱特征分析与植被信息提取
3.1光谱特征分析
根据GPS采样数据的属性信息,选取单种植被盖度为80%~100%的629个实测点为样本点,其中训练样本点370个,验证点259个,如表1所示。根据训练样本在影像上提取光谱曲线,由于波长大于1.343 6μm(中红外)的波段受水体的影响较大,因此仅对0.452~1.343 6μm波段进行分析。
表1 研究区地物类别样本情况
(a) 原始曲线 (b) 一阶导数曲线 (c) 光谱连续统去除
图2不同变换方法的光谱曲线
Fig.2Spectralcurveswithdifferenttransformationmethods
从图2(a)可以看出,4种湿地植物的光谱曲线都呈现出典型绿色植物特有的光谱特征。不同水分梯度下的湿地植物由于水体背景噪声的影响,光谱特征(特别是在近红外波段)有着明显的差距。
4种植被的一阶微分光谱曲线如图2(b)所示。不同植被在0.52μm,0.73μm和1.01μm附近有3个较明显的反射率增速极值; 在0.94μm,1.13μm和1.30μm分别达到反射率减速最快的极点,且在这些极值点上的光谱值差异较大。因此,本文选择差异比较明显的波段0.511~0.526 6μm,0.694 6~0.74μm,0.929 9~0.945 5μm,0.992 9~1.024 2μm,1.115 5~1.159 5μm,1.288 2~1.330 2μm共17个光谱值用于物种识别研究。
分析研究区典型湿地植被光谱曲线,发现不同种类湿地植物由于含水量、叶绿素含量和细胞结构的差异,在0.452~0.542μm,0.572 3~0.74μm,0.929 9~1.070 3μm和1.115 5~1.260 2μm波段存在4个差异明显的吸收谷。因此采用连续统去除法[11]对这4个吸收波段进行归一化处理(图2(c)),进而深入分析植被光谱的吸收特征。
根据原始光谱计算斜率(K)和光谱吸收指数(SAI),对光谱连续统去除后的吸收深度做进一步计算,得到各吸收波段的吸收深度(H)、吸收谷面积(A)和对称度(S)。湿地植物在4个吸收谷的特征参数表现不同,有的差异明显,有的变化则比较稳定(表2)。巴西水草由于沉入水中,在第3,4吸收波段的吸收谷最大; 而辣椒水草在第1,2,4波段的吸收谷最小。这些特征可通过吸收深度(H)和吸收谷面积(A)等来定量描述。4种植物在绿光和近红外区间的反射峰值存在差异,可通过斜率(K)和光谱吸收指数(SAI)使光谱特征信息差距加以突出。
表2 不同湿地植被在4个吸收谷处的吸收特征分析
3.2特征选择
由于提取的参数众多,特征重叠,所以在建模之前需进行参数选择,对一阶微分的17个波段和20个光谱吸收特征参数进行了逐步判别分析。其中求解过程中,逐步选择变量的方式采用马氏距离,判别函数系数选择Fisher判别方程的系数。最终判别结果如表3所示。
表3 不同变化方法的植被识别精度及入选特征
3.3基于C4.5算法构建决策树
基于归一化差分水体指数[12](normalizeddifferencewaterindex,NDWI)剔除研究区的水体信息,将逐步判别体分析法入选的14个特征参数作为测试变量,水葫芦、巴西水草、辣椒水草、蒲草和其他植被作为目标变量,将5类地物的ROI文件和14个测试变量合并。基于Matlab处理[13],本研究共构建出57个节点,28条知识规则。
4分类结果与精度评价
利用上述方法,得到的分类结果见图3。
图3 研究区域湿地植被信息提取结果图
从图3可知,蒲草和辣椒水草主要分布于浅滩上,石莲花(属其他植被类)主要分布在水域中流速较缓的区域,巴西水草则分布在离岸有一定距离,河水有一定深度的区域。
对照样点的实测资料,对分类结果进行精度评价,生成的混淆矩阵如表4所示。分类总精度达到84.17%,Kappa系数达到0.801 7,表明本文的分类结果具有较高的精度。
表4 典型湿地植被分类结果精度
5结论
本文基于HyMap高光谱航空遥感数据提取湿地植物光谱曲线,定量分析不同种类湿地植物的光谱特征,进行湿地植物种类识别研究,取得的主要结论如下:
1)研究发现,4种湿地植被由于叶绿素含量和细胞结构的差异,在0.452~0.542μm, 0.572 3~0.74μm,0.929 9~1.070 3μm和1.115 5~1.260 2μm波段存在4个差异明显的吸收谷,可以通过固定的吸收波段来分析不同植物光谱的吸收特征。
2)通过对一阶微分光谱和光谱吸收特征参数进行逐步判别分析可知,4种湿地植被的一阶导数光谱特征差异较小,吸收特征差异性相对较大。这是因为湿地植物特殊的生存环境,光谱反射率受背景水体的影响较大,由于受水体吸收作用的影响,其光谱吸收特征的识别效果更好。
3)基于一阶导数光谱特征和光谱吸收特征,采用C4.5决策树分类法可以使湿地植物的识别达到物种水平上,获得较好的分类精度。
参考文献(References):
[1]柳萍萍,林辉,孙华,等.高光谱数据的降维处理方法研究[J].中南林业科技大学学报,2011,31(11):34-38.
LiuPP,LinH,SunH,etal.DimensionalityreductionmethodofhyperionEO-1data[J].JournalofCentralSouthUniversityofForest,2011,31(11):34-38.
[2]HestirEL,KhannaS,AndrewME,etal.IdentificationofinvasivevegetationusinghyperspectralremotesensingintheCaliforniaDeltaecosystem[J].RemoteSensingofEnvironment,2008,112(11):4034-4047.
[3]邱琳,林辉,臧卓,等.基于均值置信区间带的湿地植被高光谱特征波段选择[J].中南林业科技大学学报,2013,33(1):41-45.
QiuL,LinH,ZangZ,etal.Hyper-spectralcharacteristicbandselectionforwetlandvegetationbasedonmeanconfidenceinterval[J].JournalofCentralSouthUniversityofForestryandTechnology,2013,33(1):41-45.
[4]刘雪华,孙岩,吴燕.光谱信息降维及判别模型建立用于识别湿地植物物种[J].光谱学与光谱分析,2012,32(2):459-464.
LiuXH,SunY,WuY.Reductionofhyperspectraldimensionsandconstructionofdiscriminatingmodelsforidentifyingwetlandplantspecies[J].SpectroscopyandSpectralAnalysis,2012,32(2):459-464.
[5]LawrenceRL,WoodSD,SheleyRL.MappinginvasiveplantsusinghyperspectralimageryandBreimanCutlerclassifications(randomForest)[J].RemoteSensingofEnvironment,2006,100(3):356-362.
[6]JassbyAD,CloernJE.OrganicmattersourcesandrehabilitationoftheSacramento-SanJoaquinDelta(California,USA)[J].AquaticConservation:MarineandFreshwaterEcosystems,2000,10(5):323-352.
[7]BeckerBL,LuschDP,QiJG.IdentifyingoptimalspectralbandsfrominsitumeasurementsofGreatLakescoastalwetlandsusingsecond-derivativeanalysis[J].RemoteSensingofEnvironment,2005,97(2):238-248.
[8]浦瑞良,宫鹏.高光谱遥感及其应用[M].北京:高等教育出版社,2000:51-61.
PuRL,GongP.HyperspectralRemoteSensingandItsApplications[M].Beijing:HigherEducationPress,2000:51-61.
[9]FungT,MaHFY,SiuWL.Bandselectionusinghyperspectraldataofsubtropicaltreespecies[J].GeocartoInternational,2003,18(4):3-11.
[10]时王侠.基于粗糙集理论和C4.5算法相结合的遥感影像分类研究[D].福州:福建师范大学,2008.
ShiWX.TheClassificationofRemoteSensingImageBasedonRoughSetsandC4.5Algorithm[D].Fuzhou:FujianNormalUniversity,2008.
[11]徐元进,胡光道,张振飞.包络线消除法及其在野外光谱分类中的应用[J].地理与地理信息科学,2005,21(6):11-14.
XuYJ,HuGD,ZhangZF.Continuumremovalanditsapplicationtothespectrumclassificationoffieldobject[J].GeographyandGeo-InformationScience,2005,21(6):11-14.
[12]McFeetersSK.Theuseofthenormalizeddifferencewaterindex(NDWI)inthedelineationofopenwaterfeatures[J].InternationalJournalofRemoteSensing,1996,17(7):1425-1432.
[13]刘刚.MATLAB数字图像处理[M].北京:机械工业出版社,2010:35-39.
LiuG.MATLABDigitalImageProcessing[M].Beijing:ChinaMachinePress,2010:35-39.
(责任编辑: 邢宇)
Species identification of wetland vegetation based on spectral characteristics
CHAI Ying1, RUAN Renzong1, CHAI Guowu2, FU Qiaoni1
(1. School of Earth Sciences and Engineering, Hohai University, Nanjing 210098, China; 2. Hydrology and Water Resources Rureau of Henan Province, Nanyang 474500, China)
Abstract:Certainspectralcharacteristicshaveadirectimpactonaccuracyandefficiencyofidentifyingthewetlandvegetation.Inthispaper,theauthorsmappedwetlandvegetationwith3mspatialresolutionforHyMapimagedatafromShermanIslandofCalifornia’sSacramento-SanJoaquindelta.Thefirst-derivativespectralfeaturesandspectralabsorptionfeaturesofdifferentspecieswereanalyzedbythemethodofstepwisediscriminateanalysis,andthespectralcharacteristicparameterswithbetterclassificationaccuracywerescreenedtoidentifyspeciesofwetlandvegetationinC4.5decisiontreeclassifier.Theresultsshowedthattheabsorptionfeaturesoffourplantshavelargerdifferencesthanfirst-derivativespectralfeatures.TheresultsalsoshowedthatC4.5decisiontreeclassifierincombinationwiththefirst-derivativespectralcharacteristicsandspectralabsorptioncharacteristicscouldbeeffectiveindistinguishingwetlandvegetationandallowingforspecies-leveldetection.
Keywords:hyperspectralremotesensing;spectralcharacteristics;wetlandvegetation;HyMap
doi:10.6046/gtzyyg.2016.03.14
收稿日期:2015-01-21;
修订日期:2015-02-16
基金项目:中国科学院战略性先导科技专项(编号:XDA05050106)和生态十年专项项目“复杂背景下地物信息提取规则集构建”(编号:STSN-01-05)共同资助。
中图法分类号:TP751.1
文献标志码:A
文章编号:1001-070X(2016)03-0086-05
第一作者简介:柴颖(1992-),女,硕士研究生,主要从事生态遥感与GIS研究。Email:elysee115@163.com。
通信作者:阮仁宗(1965-),男,副教授,主要从事遥感与GIS等方面研究。Email:ruanrenzong@163.com。
引用格式: 柴颖,阮仁宗,柴国武,等.基于光谱特征的湿地植物种类识别[J].国土资源遥感,2016,28(3):86-90.(ChaiY,RuanRZ,ChaiGW,etal.Speciesidentificationofwetlandvegetationbasedonspectralcharacteristics[J].RemoteSensingforLandandResources,2016,28(3):86-90.)