东洞庭湖湿地植被高光谱数据变换及识别
2014-01-02宋仁飞严恩萍
宋仁飞,林 辉,臧 卓,严恩萍
(中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004)
东洞庭湖湿地植被高光谱数据变换及识别
宋仁飞,林 辉,臧 卓,严恩萍
(中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004)
高光谱识别是采用大量比较窄的波段对目标物进行同时观测,以实现对目标物更好的观测效果。以东洞庭湖为研究对象,对典型湿地植被苔草、芦苇、芦蒿、辣蓼和旱柳开展野外高光谱观测的基础上,开展数据变换和分类识别。在对数据进行剔除、滤波和重采样后,对高光谱数据进行导数运算、对数运算、对数的导数运算、归一化运算和归一化后导数运算,以突出植被的光谱特征差异。采用主成分分析方法,对高光谱数据进行降维。并运用BP(Back Propagation)神经网络、马氏距离(Mahalanobis)分类法、贝叶斯(Bayes)分类法、费希尔(Fisher)分类法、光谱角度制图法(Spectral Angle Mapper,SAM)、支持向量机(Support Vector Machine,SVM)等6种方法开展湿地植被识别。结果表明:在多种数据变换方法中,LOG (N(R))变换效果最好,而湿地植被识别方法中,光谱角度制图法的精度最高。
高光谱识别;湿地植被;光谱特征;东洞庭湖
湿地是生产力最高的特殊生态类型,兼具水生生态系统和陆地生态系统的特点。湿地被誉为“天然水库”、“地球之肾”和“天然物种库”,具有蓄洪防旱、保持水源、净化水质维护生物多样性、调节气候和美化环境等重要生态功能[1]。作为湿地生态系统变化的指示器,湿地植被是湿地生态系统的重要组成部分和监测重点。近年来,湿地植被的生理生化特性[2]、去污染能力[3],湿地植被的群落组成[4]及演变趋势[5]等方面得到了广泛的关注和重视。
高光谱遥感(Hyperspectral Remote Sensing)是指在电磁波谱的可见光、近红外和热红外波段范围内,获取许多非常窄的光谱连续的影像数据的技术[6]。由于常规遥感的波段较宽,波段不连续,不完全覆盖可见光至红外光的光谱范围,无法满足湿地植被类型间的识别要求。而高光谱遥感具有光谱分辨率高、波段连续,波段数多,光谱数据信息量大的特点[7],为湿地植被类型的精细分类与识别提供了可能[8]。已有相关学者围绕高光谱遥感开展了相关研究[9-10],但因其数据量巨大,处理技术尚不成熟。本研究旨在寻找能够识别东洞庭湖5种典型湿地植被的特征波段,为大尺度遥感影像分类提供可用参数。
1 材料与方法
1.1 研究区概况
研究区为湖南东洞庭湖,位于长江中下游荆江江段南侧,面积190 300 hm2。介于北纬28°59′~ 29°38′,东经 112°43′~ 113°15′之间,地处湖南省东北部岳阳市境内。东洞庭湖是洞庭湖湖系中最大的湖泊,年平均过湖水量达3 126 亿m3。常年湖容量178亿m3,水深4~22 m,最大水位落差为17.76 m,pH值6.8~8.6。它的地貌呈沟港纵横的湿地景观,土壤为湖沼土和河沼土。年平均气温为17℃,湖水年平均温度17.5℃,总降水量1 200~1 330 mm,无霜期258~275 d。常见湿地植被有苔草、黑藻、浮萍、芦苇等。
1.2 数据采集
高光谱外业数据采集时间为2011年9月20日至2012年9月28日,地点在东洞庭湖。高光谱测定采用美国ASD(Analytical Spectral Device)公司的ASD FieldSpec Pro FRTM光谱仪,波段范围350~2 500 nm,其中350~1 000 nm光谱分辨率为3 nm,1 000~2 500 nm光谱分辨率为10 nm,光谱采样间隔分别为1.4 和 2.0 nm,数据输出时重采样间隔为1 nm。光谱测定一般选择在光照条件良好的晴天,无云、无风的时候进行,测定时间为10:00~14:00,太阳高度角大于45°,阳光几乎直射。高光谱数据采集时,探头必须保持垂直向下。为使数据具有代表性,采集的样点均匀分布于东洞庭湖。观测的5种植被分别为:辣蓼、芦苇、芦蒿、苔草和旱柳,共测得有效数据200余条,各采集数据如表1所示。
1.3 数据预处理
采集数据导出后,剔除不可用数据,得到200条光谱数据,将其中150条作为训练数据,50条作为测试数据,相应植被的光谱数据按比例选取,从每个样点测得的30条数据选取2~3条,以保证数据具有代表性。
表1 研究选取的5种东洞庭湖典型湿地植被数据列表Table 1 Five kinds of the East Dongting typical wetland vegetation data list
由于本次测量数据时,受多种因素的影响,反射率在1 340 nm之后的数据噪声较大,所以将光谱曲线1 340 nm波段以后的数据剔除,只保留350~1 340 nm之间的光谱数据。经平滑去噪后得到光谱反射率见图1和图2。
图1 平滑去噪前的反射率Fig.1 Ref l ectivity before smooth denoising
图2 平滑去噪后的反射率Fig.2 Ref l ectivity after smooth denoising
由于光谱仪在350~1 000 nm光谱分辨率为3 nm,1 000~2 500 nm光谱分辨率为10 nm,而ViewSpecPro软件导出的数据却是1 nm间隔,因此为了减少数据量和随机噪声,将经过平滑后的光谱数据重采样成3 nm,重采样后的数据不会影响光谱曲线的特征表达,同时降低了数据处理的维数[11],如图3。
1.4 高光谱数据变换
简单处理的光谱用R=(r1,r2,…,rn),n=331表示。相对于R的6种变换方法有:
(1) 对R的 一 阶 微 分 变 换,为两倍波段宽;
(2) 对R的 对 数 变 换,log(R)=[log(r1),log(r2),…,log(rn)];
(3)对log(R)的一阶微分变换,d(log(R));
(4) 对R的 归 一 化 变 换,N(R)=(论文使用各波段光谱之平均值,避免变换后的数值偏小);
图3 重采样后反射率数据Fig.3 Ref l ectivity after resample
(5)对N(R)的一阶微分变换,d(N(R))。
(6)对N(R)的对数变换,log(N(R));
通过对高光谱数据进行上述6种变换,得到结果如图4所示。
图4 高光谱反射率数据经6种数据变换产生的结果 (其中(a) d(R); (b) log(R); (c) d(log(R)); (d) N(R); (e) d(N(R)); (f) log(N(R)))Fig.4 The ref l ectivity of hyperspectral data for fi ve wetland vegetations by (a) d(R), (b) log(R), (c) d(log(R)), (d) N(R),(e) d(N(R)) and (f) log(N(R))
分析图3和图4可知,一阶微分可以消除背景因素的影响;对数变化不仅可增强可见光区的光谱差异,而且有助于降低因光照变化所引起的乘性因素影响。然而要完全消除乘性因素的影响,仅对光谱进行对数变换是不够的,还需进行微分处理。由图4(c)和图4(f)可知,对归一化变换结果做微分处理能完全消除乘性因素的影响,取得与一阶微分变换相似的效果。
2 结果与分析
2.1 基于主成分的特征信息提取
运用特征提取的主成分,采用BP神经网络、马氏距离法、贝叶斯、费希尔、光谱角度制图法和支持向量机6种判别方法对降维后的东洞庭湖的5种典型湿地植被类型(苔草,芦蒿,芦苇,旱柳和辣蓼)进行识别。6种判别方法对5种植被类型的判别精度如表2所示。
表2 湿地植被识别的整体精度Table 2 The overall accuracy of wetland vegetation identification
表2可以看出,LOG (N(R))变换较其他几种变换明显提高了植被的判别精度。从识别方法来看,贝叶斯和光谱角度制图法对湿地植被的识别精度较高。说明光谱角度制图法是识别湿地植被的最佳方法。
2.2 典型湿地植被的分类
在运用主成分降维的方法对数据进行降维的基础上,采用BP神经网络、马氏距离、贝叶斯、费希尔、光谱角制图法(SAM)和支持向量机(SVM)6种判别方法对东洞庭湖的5种典型湿地植被类型(辣蓼,芦苇,芦蒿,苔草和旱柳)进行识别,结果如表3。
表3 6种方法对5种典型湿地植被的分类结果Table 3 Accuracy results of every wetland vegetation using six methods
表3列出了研究区典型植被经4种效果较好 的 数 据 变 换(Y(R),LOG(R),N (R),LOG(N(R)))后,采用6种识别方法开展植被分类的精度。分析可知,采用的6种分类方法中,SAM的分类精度最高,Bayes和SVM的识别精度次之;另外,6种数据变换方法中,LOG(N (R))数学变换后的效果均较好,说明LOG(N (R))数学变换是一种比较理想的变换方式。
3 结论与讨论
研究通过东洞庭湖区的典型湿地植被(辣蓼,芦苇,芦蒿,苔草和旱柳)的野外高光谱数据观测,并进行数据变换和分析处理,主要结论如下:
(1)对原始反射率光谱进行合适的数学变换,在一定程度上能提高识别精度。在众多的光谱变换中,将原始反射率光谱进行归一化对数变换能取得较好的效果。
(2)运用BP神经网络、马氏距离、贝叶斯、费希尔、光谱角度制图法和支持向量机6种方法开展湿地植被的识别,光谱角度制图法精度最高,Bayes和SVM的识别精度次之。
(3)高光谱数据量巨大,数据处理技术仍需要研究。对本研究所在的东洞庭湖来说,分类精度比较高,但是否适用于其它湿地植被的分类,还需要进一步对比分析。
[1] 潮洛蒙,李小凌,俞孔坚.城市湿地的生态功能[J].城市问题,2003, (3): 9-12.
[2] 黄朝君. 人工湿地技术在中国水处理领域的应用[J]. 江西科学, 2006, 24(6): 513-516.
[3] 王国生, 钟玉书, 田 敏, 等. 人工芦苇湿地处理城市污水的研究[J]. 辽宁农业科学, 2006, 2: 5-8.
[4] 余 莉, 何隆华, 张 奇,等. 三峡工程蓄水运行对鄱阳湖典型湿地植被的影响[J].地理研究, 2011,30(1): 134-144.
[5] 王 颖, 宫辉力, 赵文吉, 等. 北京野鸭湖湿地资源变化特征[J]. 地理学报, 2005, 60(4): 656-664.
[6] 刘红玉, 林振山, 王文卿. 湿地资源研究进展与发展方向[J].自然资源学报, 2009, 24(12): 2204-2212.
[7] 浦瑞良, 宫 鹏. 高光谱遥感及其应用[M]. 北京: 科学出版社, 2000: 2-8.
[8] 李建平, 张 柏, 张 泠, 等. 湿地遥感监测研究现状与展望[J]. 地理科学进展, 2007, 26(1): 33-43.
[9] 东启亮,林 辉,邱 琳,等.多源遥感数据融合方法在湿地分类中的适用性研究[J].中南林业科技大学学报, 2013,33(1):52-57.
[10] 刘秀英, 臧 卓, 孙 华, 等. 基于高光谱数据的杉木和马尾松识别研究[J]. 中南林业科技大学学报, 2011, 31(11): 30-33.
[11] Demetriades-Shah T H, Steven M D, Clark J A. High restlution derivative spectra in remote sensing[J]. Remote Sensing of Environment, 1990, 33(1): 55-64.
Hyper-spectral data transformation and identif i cation of wetland vegetation in east Dongting lake region
SONG Ren-fei, LIN Hui, ZANG Zhuo, YAN En-ping
(Research Center of Forest Remote Sensing & Information Engineering, Central South University of Forestry & Technology, Changsha 410004, Hunan, China)
In order to get better observation effect of the target, the objective of hyper-spectral identif i cation is to simultaneous observe the target by using lots of narrow bands. By taking east Dongting lake area as the studied object, the fi eld observations of fi ve typical wetland vegetation such as moss grass, reeds, selengensis red-knees herb and willow were conducted with method of hyper-spectral remote sensing, then, the measured data were transformed, classified and identified. After culling, filtering and re-sampling of the data, the hyper-spectral data obtained were treated with six kinds transformation operations (includingd(R)(b), log(R), d(log(R)),N(R),d(N(R)) and log(N(R)) in order to highlight the differences of spectral characteristics for various wetland vegetation. By using principal component analysis method, the dimensionality reduction of hyper-spectral data was carried out. Then six classification methods including back propagation, mahalanobis, bayes, fi sher, spectral angle mapper (SAM) and support vector machine (SVM) were employed to identify different wetland vegetation based on the principal component analysis. The results show that for the methods of data transformation, log (N(R)) had the best effect; while for the methods of vegetation identif i cation, SAM had the highest accuracy.
hyper-spectral remote sensing; hyper-spectral data transformation and identification; wetland vegetation; spectral characteristics; east Dongting lake region
S771.8
A
1673-923X(2014)11-0135-05
2014-01-12
国家自然科学基金资助项目(31370639);湖南省高校产业化培育项目(13CY011)资助
宋仁飞(1991-),男,江苏宿迁人,硕士研究生,主要从事林业遥感和地理信息系统研究
林 辉(1965-),女,湖北黄冈人,教授,博士,博士生导师,主要从事森林经理学、遥感技术与地理信息系统的教学和科研工作
[本文编校:吴 毅]