基于微分变换的高光谱马尾松和杉木识别
2018-12-20徐念旭田庆久申怀飞徐凯健
徐念旭, 田庆久, 申怀飞, 徐凯健
(1.南京大学国际地球系统科学研究所,南京 210023;2.江苏省地理信息技术重点实验室,南京 210023;3.江苏省地理信息资源开发与利用协同创新中心,南京 210023)
0 引言
高光谱遥感经过30多a的迅速发展,因其光谱分辨率高、波段数目多、图谱合一等特点,能为光谱性质相似的地物提供更精细的光谱信息,在地物识别方面具有独特的优势并被广泛应用,同时也为解决森林植被分类提供有效技术途径[1-2]。但是,高光谱遥感存在维度冗余问题,实际运用需要先进行光谱特征分析和波段优选等降维处理[3]。利用光谱微分变换,可以减弱大气吸收、散射和辐射影响,消除系统误差和土壤背景等噪声数据,筛选出差异更明显的波段组合,提高地物分类识别精度[4]。
由于山区地形复杂,针叶林树冠叶片密杂,林下易产生阴影,往往造成林种间“同物异谱”和“异物同谱”现象严重,导致针叶林高光谱分类精度低,树种识别难[5-7]。尽管目前国内外植被类型及森林种群的高光谱分类识别做了大量工作,也取得一定的研究成果,但山地针叶林种间的高光谱识别方法研究进展缓慢,仍然是高光谱遥感识别难题之一[8-9]。支持向量机法(support vector machine,SVM)是与学习算法有关的监督学习模型,通过寻求模型复杂程度和识别新样本无误能力之间的最佳匹配,以获得最好的分类识别效果,在解决小样本、非线性及高维模式识别中表现出许多特有的优势,在高光谱树种识别方面表现出一定的潜力[10]。
马尾松和杉木是国内重要经济树种和南方山区典型针叶林代表。以安徽黄山地区为研究区,基于美国EO-1卫星Hyperion高光谱遥感影像,结合地面林地实测样地数据,在对像元光谱进行一阶、二阶微分变换基础上,采用SVM模型对Hyperion高光谱影像进行马尾松和杉木林种的分类识别与提取,分析研究区马尾松和杉木的分布情况,旨在探索研究微分变换和SVM技术相结合的高光谱遥感针叶林种分类识别能力,评价分析分类识别效果和精度,为山地针叶林种高光谱遥感分类识别提供方法和技术途径。
1 Hyperion影像获取与处理
1.1 研究区与数据源
安徽黄山地区为多山区域,在研究中不可忽略山体阴影的分布。该区也是南方针叶林代表性林区,建有多个经济林培育基地[11]。五城镇位于黄山市屯溪区西南部,林地面积为1 334.35 km2,森林覆盖率达86.3%。研究区经纬度范围为N 29°29′~29°36′,E 118°08′~118°15′。区内针叶林的优势树种为马尾松和杉木。
Hyperion获取可见光—近红外(400~1 000 nm)和短波红外(900~2 500 nm)的光谱数据,共计242个波段,其中可见光35个波段,近红外35个波段,短波红外172个波段。Hyperion数据的空间分辨率达30 m,光谱分辨率约为10 nm,幅宽为7.7 km[12]。本研究所用Hyperion高光谱数据获取时间为2015年5月22日,数据级别为L1R。
1.2 Hyperion影像预处理
Hyperion影像预处理过程包括:未标定及受水汽影响严重波段剔除、坏线去除、条纹修复、Smile效应校正、大气校正和几何纠正等[13]。使用ENVI软件自带的FLAASH大气校正模块,消除大气中的分子及气溶胶等物质对于影像成像过程的影响,转化成地表反射率影像。利用Landsat8标准影像为基准数据,按均匀分布、“米”字型规律随机选取52个控制点,对大气校正后的数据进行几何纠正,使影像数据与基准影像具有相同的地理空间坐标,误差小于0.5个像元。
图1 研究区Hyperion影像及部分实地观测针叶林样地
2 光谱微分变换
植被反射光谱特征主要集中在400~1 000 nm波段范围,特征区域主要包括蓝边、黄边和红边,选取的特征参量主要包括微分值、红边位置、红边幅值以及相应的蓝边特征参量[14]。
光谱一阶微分公式为
(1)
式中:λi表示波长;R(λi)′表示λi处光谱一阶微分值;R(λi)表示λi处光谱反射率值;Δλ表示相邻2个波长间距。
一阶微分后的光谱曲线,可限制植被所受大气和土壤背景噪声的影响,从而进行特征参数的提取。通过光谱曲线斜率的变化,可以分析确定光谱曲线的变化区域,如红边位置。
光谱二阶微分公式为
(2)
式中R(λi)″表示λi处光谱二阶微分值。
光谱二阶微分也是常用的光谱特征分析方法。使用二阶微分变换,即对一阶微分后的光谱再次求导,可以有效放大光谱的变化细节特征,提取光谱特征参数等。
对研究区整幅Hyperion影像分别进行一阶、二阶微分变换处理,根据实地观测点坐标,在预处理后影像对应像元内,对马尾松和杉木各选取多个纯净像元光谱(图2)。
图2 马尾松与杉木典型像元反射率光谱曲线
图2显示,受大气和土壤背景等噪声影响,马尾松与杉木的反射率光谱曲线在700~900 nm波长范围种内出现不稳定的征态,种间的绝对区分度降低,易造成错误分类。计算一阶和二阶微分光谱(图3)。
(a) 一阶微分光谱曲线 (b) 二阶微分光谱曲线
图3(a)显示,反射率光谱曲线经过一阶微分变换后,在700~800 nm波长范围,种内稳定性增强,种间区分度提高,减弱了背景噪声的干扰,有利于提高分类精度;图3(b)显示,反射率光谱曲线经过二阶微分变换后,在670~730 nm波长范围,种内稳定性继续增强,种间区分度继续提高,背景噪声干扰进一步减弱。
红边是绿色植物在670~760 nm之间反射率增高最快的点,也是一阶微分光谱在该区间内的拐点。不同树种的红边效应强度不同,可以由此选取相应波段的一阶微分光谱,进行分类识别。对于二阶微分光谱,可以通过相似性度量算法对变换结果进行距离计算,从而使不同树种间的差异量化。
波段组合应该遵循“种内变化幅度小、种间变化幅度大”的原则,选择种内稳定性高而种间差异明显的光谱波段,以保证分类精度达标。另外,短波红外波段数据获取成本高,800~1 000 nm波长范围反射率受树木冠层结构和光反射散射等因素影响大,光谱不稳定。综上考虑,本文分别选择反射率光谱曲线中742~851 nm范围的连续波段、一阶微分光谱曲线中498~548 nm和701~742 nm范围连续波段和二阶微分光谱曲线中487~559 nm和681~711 nm范围连续波段为研究波段。
3 森林树种分类与精度评价
3.1 监督分类
首先选择合适阈值进行掩模处理。提取出影像中马尾松和杉木等植被的分布情况,并且掩模去除道路、水系、裸土和人工建筑等不相关地物信息。
基于原始、一阶和二阶微分光谱影像和实地观测样地,选择马尾松和杉木光谱差异较明显的波段组合,采用SVM模型进行监督分类,对研究区马尾松和杉木的分布情况进行识别,结合验证样地计算分类精度及Kappa系数,比较高光谱反射率数据及其2种微分变换方式在针叶林识别中的优势。
对于实地观测样地,共采集了262个杉木纯净像元点数据和173个马尾松纯净像元点数据用于分类。另有89个杉木纯净像元点数据和94个马尾松纯净像元点数据用于精度检验。分类结果如图4所示。
(a) 原始光谱反射率光谱 (b) 一阶微分光谱 (c) 二阶微分光谱
3.2 精度评价
精度评价是利用混淆矩阵(表1)对分类结果与地面实测检验数据进行比较,以检验数据被正确分类的百分比,即分类精度。通常以总体分类精度和Kappa系数评价分类效果(表2)。
表1 原始反射率、一阶微分和二阶微分光谱精度统计
表2 总体精度与Kappa系数统计
4 结论与讨论
1)基于Hyperion高光谱影像,对反射率光谱进行一阶、二阶微分变换。选取差异明显的可见光波段组合,利用支持向量机模型进行监督分类,并检验结果精度。结果表明,原始反射率光谱、一阶和二阶微分光谱的总体精度分别达到76.50%,81.42%和88.52%,Kappa系数分别为0.528 4,0.625 7和0.769 1。研究表明经过微分变换后的光谱信息,大气干扰和土壤背景影响减弱,不同树种间的光谱差异被放大,更有利于识别区分马尾松和杉木,且二阶微分光谱的整体精度和Kappa系数都优于一阶微分光谱。
2)虽然利用光谱微分变换技术,可以减弱系统误差和大气、土壤等噪声影响,同时有效增强不同树种红边效应的差异,但无论外部影响或者内部差异,都局限于定性化表达,目前涉及定量化研究还较少。
3)本研究结果中得出二阶微分变换的分类总体精度和Kappa系数都优于一阶微分变换,然而是否存在微分指数的最优解,还需进一步探讨和研究。