基于最优波段组合的TM影像土地覆盖信息分类*
2013-06-09刘德儿于海霞兰小机陈元增
刘德儿于海霞兰小机陈元增
(1.江西理工大学建筑与测绘工程学院;2.赣州市城市规划设计院)
·地质与测量·
基于最优波段组合的TM影像土地覆盖信息分类*
刘德儿1于海霞1兰小机1陈元增2
(1.江西理工大学建筑与测绘工程学院;2.赣州市城市规划设计院)
针对TM遥感影像光谱特征利用率不高,影响土地覆盖信息分类精度的问题,提出一种基于最优波段组合的分类方法。以赣州市章贡区2006年的TM遥感影像为研究对象,首先根据遥感影像的光谱特征和波段间的相关性计算最佳指数;其次根据研究区域特征,引入修正植被指数,并对原影像进行主成分分析,综合分析最佳指数、修正植被指数和前3个主成分量,认为PC3、RNDVI、Band1为最优波段组合。最后结合监督分类与非监督分类法对最优波段组合成的遥感影像进行分类,得到的整体分类精度为86.237 5%,kappa系数为0.825 3。
最优波段组合 最佳指数 修正植被指数 主成分分析
20世纪90年代以来,涌现出了大量的遥感图像分类方法[1],如人工智能分类法、遥感与GIS结合法、面向对象的分类法、多源信息复合分类法等[2],在这些分类方法中,地物光谱特性是分类的最重要的依据。理论上,遥感影像的光谱数量越多,所表达的信息越精细,但同时波段间数据的冗余度也会随之加大,而且冗余的数据反而影响对地物的提取,降低其精度[3],所以选择最优波段组合对于遥感信息快速、准确分类具有重要意义。
总体来说,波段选择需要满足以下条件:①波段所含有的信息量要大;②波段间的相关性要尽量低[4];③在所选波段组合中能够很好区分出目标地物类型。本研究以TM遥感影像作为实验数据,在现有相关成果基础上,结合研究区的特点,寻找适合本区域土地覆盖信息分类的遥感影像波段的最优波段组合,并利用监督分类与非监督分类相结合的方法对研究区进行土地覆盖信息分类,以提高信息提取的精度。
1 研究区概况及数据预处理
赣州市章贡区为赣州市中心城区,位于章江和贡江交汇处,属低山丘陵区,地势由东南、西北向中部倾斜,略呈马鞍形。东南、西北高,为丘陵山地,中部平缓,为河谷平原,自京九铁路通车以来,区域经济发展加速,土地覆盖变化也随之加快。快速准确地获取土地覆盖信息成为当务之急。
图像数据的预处理工作主要包括影像的几何校正、研究区裁剪等。本研究以1∶5万地形图为基准,选取地面控制点,采用二次多项式变换,双线性内插法对遥感影像进行重采样,配准几何均方差(RMS)控制在1个像元以内。然后,利用ARCGIS软件提取研究区行政边界,作为遥感影像裁剪的矢量文件,在ENVI中对遥感影像进行裁剪和提取。
2 最优组合波段建立
根据最优组合波段选取的原则,目前使用的主要方法有最佳指数法、衡量波段间相关系数法、各波段数据的熵和联合熵等方法。本次综合考虑研究区的特征以及遥感影像的波段特征等影响因素,最终确定利用最佳指数法与主成分分析法、修正植被指数相结合的办法来确定波段的选取。
2.1 波段光谱特征分析
各波段的最大(小)值、均值、标准差、特征值等共同表征了波段光谱特征。其中标准差表示遥感影像中各个像元的灰度值与平均值的离散度,在一定程度上,可用它来衡量波段所含信息量大小。若标准差大,则图像灰度级分布分散,图像的反差大,可以看出更多的信息[5]。在选择最优组合波段时,还要考虑波段间的相关系数。相关系数矩阵反映了两个随机变量之间线性关系密切程度[6]。波段间的相关系数越高则数据冗余度越高,仅选择其中一个最佳波段。对于TM影像,第6波段分辨率较低,第8波段为全色波段,主要用于提高分辨能力,本次不将其作为最佳波段的候选项,只对1~5波段和第7波段进行光谱信息统计分析,分析结果见表1和表2。
表1 各波段光谱特征
表2 波段间相关系数矩阵
从表1可知,第5波段标准差最大,第2波段标准差最小,说明第5波段所含信息量最大,第2波段所含信息量最小。从表2可知:①可见光的3个波段之间的相关性较高,说明这3个波段所含的信息具有较高的一致性;同理,2个中红外波段的信息也有很大的冗余性;②第4波段与除第5波段外的其他几个波段间的相关系数相对较小,说明第4波段相对比较独立。由此可知,分别从3个可见光波段和2个中红外波段中各选取一个波段与第4波段进行假彩色合成,效果会比较明显。
2.2 最佳指数(OIF)计算
计算最佳指数的目的主要是为了用一个比较客观的衡量标准来进行波段的选取。最佳指数主要原理是计算所要选取的波段的标准差之和与波段间的相关系数之和的商与波段内的标准差成正比,与波段间的相关系数成反比,所得的OIF结果值越大,说明所选波段所含信息量越大,且波段间的相关性越差。通过计算,各波段组合方案的最佳指数OIF结果见表3。
表3 最佳指数OIF计算结果
从表3可知,排在前5位的波段组合方案OIF值按从大到小顺序是Band1、4、5,Band2、4、5,Band1、4、7,Band3、4、5,Band1、3、4。综合考虑研究区的特点以及预识别地物的光谱曲线特点,最终确定以Band1、Band4和Band7为最佳波段组合。
2.3 修正植被指数
由于研究区耕地分布零散且多林地,为了提高这些地类信息提取的精度,本次引入修正植被指数。修正植被指数是在归一化植被指数的基础之上建立起来的。归一化植被指数是指由多光谱数据,经过线性或非线性组合构成的对植被有一定指示意义的各种数值[7]。归一化植被指数计算公式为
式中,N代表近红外波段,R代表红外波段。由于归一化植被指数的值域为[-1,1],为了方便计算机计算以及图像的处理和显示,常将P转化为修正植被指数Q[8],转化公式为
上式将植被指数的域值转变为0~255,最终得到研究区的修正植被指数图见图1。
2.4 主成分分析(PCA)
黎夏等在研究珠三角地区土地利用变化时采用了主成分分析方法,大大改善了遥感动态监测精度[9]。为了达到隔离噪声和降低数据集维数的目的,本次引入主成分分析方法。对TM影像的1~5及第7波段进行主成分分析,然后使前3个主成分分量与修正植被指数以及通过最佳指数计算得到的1、4、7波段进行波段组合,得到波段间的相关系数见表4。由表4可知,PC3、RNDVI、Band1 3个波段性质不相同且波段间的相关性相对较差,将这3个波段进行组合,并依次赋予红、绿、蓝颜色,所形成的遥感影像色彩明快,层次清晰,目视效果较佳,认为比较适合目视判读,最终选择这3个波段为最优组合波段。
图1 修正植被指数
表4 波段分量间的相关系数
3 土地覆盖信息分类
目前遥感信息分类方法有很多,对此,陈绍杰等以TM影像为例对最大似然法、最小距离法、支持向量机法和面向对象分类法进行比较,结果表明最大似然法精度最高,其次是支持向量机法[10]。但是,由于遥感数据的多源性、复杂性以及不同方法使用限制条件不同,所以需要具体情况具体分析。综合考虑研究区特点、研究目的及现有研究成果等因素,使用非监督分类与监督分类相结合的方法对由最优波段组合成的遥感影像进行土地覆盖信息分类,并取得了良好的分类效果。
3.1 动态聚类法(ISODATA)
首先选择若干个样本作为聚类中心,再按照事先确定的聚类准则进行聚类,在聚类过程中根据聚类准则对聚类中心进行反复的修改,直到分类合并为止。根据以往经验及反复尝试,对由最优波段组合成的遥感影像进行非监督分类,并对分类结果进行分类后处理。最终确定的分类训练样本有林地、草地、无农作物的耕地、有作物的耕地、水体、交通用地、城市建设用地、居民地、未利用地、类别不明确用地。
3.2 利用相关辅助性资料进行监督分类
利用较高分辨率的遥感影像、土地利用现状图等相关资料并结合国土资源部采用的土地资源分类系统建立解译标志,根据解译标志建立感兴趣区,然后在非监督分类的基础上利用监督分类中的最大似然法对遥感影像进行分类。并将分类类型进行进一步的合并,最终确定的土地覆盖的类型有水体、林地、草地、耕地、建设用地、未利用地6类。
3.3 分类后处理
结合n维可视化散点图、类别修改等功能对分类结果进行修改,纠正错分、漏分的部分,以提高分类精度,然后采用主/次要分析对分类过程中产生的小斑点进行进一步处理,提高目视显示效果,经过一系列校正得到土地覆盖分类结果,见图2。
图2 土地利用/覆盖分类信息提取
3.4 分类结果精度评价
对遥感影像信息提取结果精度进行评价是检测分类技术的有效方法,它客观描述了分类精度。通过精度评价,可以找出分类方法的不足并进一步查漏补缺,使得信息提取技术更加精确、完善。本次利用建立感兴趣区的方法对分类结果进行精度验证。并计算总体分类精度、Kappa系数、混淆矩阵等。最终得到整体分类精度为86.237 5%,kappa系数为0.825 3,详细信息见表5。
表5 误差/精度统计结果 %
经分析,影响影像分类结果精度的主要原因为:①研究区的地形复杂使得耕地多零散分布,且形状不规则,大量的水田与水体相混淆使耕地分类精度较低。②遥感影像的质量及相关辅助资料对分类精度影响较大,并存在“同物异谱,同谱异物”的现象,增加分类的难度。
4 结 论
为了充分利用遥感影像的光谱信息来提高土地覆盖信息分类精度,本研究对遥感影像进行预处理后,通过计算最佳指数和修正植被指数并结合主成分分析来获取最佳波段组合,并认为第4波段、修正植被指数以及第3主成分分量为最佳的波段组合,结合非监督分类中的动态聚类法和监督分类的最大似然法进行土地覆盖信息分类,利用n维可视化散点图、类别修改、主/次要分析等方法进行分类后处理,得到6种地物的土地覆盖分类结果图,并利用高分辨率的遥感影像、土地利用现状图等辅助资料对分类结果进行精度评价,最终整体分类精度为86.237 5%,kappa系数为0.825 3,说明分类精度较高,达到了预期的分类效果,具有现实意义。
[1]韩 鹏,龚健雅,李志林,等.遥感影像分类中的空间尺度选择方法研究[J].遥感学报,2010,14(3):507-518.
[2]史泽鹏,马友华,王玉佳,等.遥感影像土地利用/覆盖分类方法研究进展[J].中国农学通报,2012,28(12):273-278.
[3]曹 敏,史照良,沈泉飞.ALOS影像在土地覆被分类中最佳波段选取的研究[J].测绘学报,2008(9):16-18,27.
[4]王培忠,严卫东,边 辉,等.提取蚀变信息时TM影像的最佳波段组合研究[J].地球科学与环境学报,2010(2):173-175.
[5]许 菡,燕 琴,徐泮林,等.多源遥感影像融合最佳波段选择及质量评价研究[J].测绘科学,2007,32(3):72-74.
[6]孙 华,林 辉,熊育久,等.Spot5影像统计分析及最佳组合波段选择[J].遥感信息,2006(4):57-60,88.
[7]刘 瑜,韩 震,李 睿.基于主成分分析和植被指数的潮滩植被信息提取研究[J].遥感信息,2010(4):45-50.
[8]师庆东,吕光辉,潘晓玲,等.遥感影像中分区分类法及在新疆北部植被分类中的应用[J].干旱区地理,2003,26(3):264-268.
[9]黎 夏,叶嘉安.利用主成分分析改善土地利用变化的遥感监测精度——以珠江三角洲城市用地扩张为例[J].遥感学报,1997,1(4):282-289.
[10]陈绍杰,单丹丹,赵卫常.土地覆盖遥感分类方法的比较与分析[J].辽宁工程技术大学学报:自然科学版,2010,29(4):567-570.
Land Cover Information Classification Based on the Optimal Band Combination of TM Image
Liu De'er1Yu Haixia1Lan Xiaoji1Chen Yuanzeng2
(1.School of Architectural and Surveying Engineering,Jiangxi University of Science and Technology;2.Urban Planning and Design Institute of Ganzhou)
The accuracy of land cover classification is affected by the low utilization efficiency of the TM image spectral characteristics.Aimed at this issue,a classification method is proposed based on the optimal band combination.Taking the TM image in 2006 in Zhanggong district of Ganzhou as a study goal,the optimum index factor(OIF)is firstly calculated by the spectral characteristics of remote sensing image and the relation of bands.Then,the revised normalized difference vegetation index(RNDVI)is introduced according to the topographic feature in study region,and the original image is analyzed by principal componentanalysis(PCA).Through comprehensive analysis on the optimum index factor,the revised normalized difference vegetation index and three former principal components,it is concluded that the optimal band combinations are PC3,RNDVI and Band1.Finally,with combination of supervised classification and unsupervised classification,the composite remote sensing image is classified,obtaining that the overall classification accuracy is 86.2375%and the kappa factor is 0.8253.
The optimal band combination,Optimum index factor(OIF),Revise normalized difference vegetation index(RNDVI),Principal component analysis(PCA)
2013-07-24)
*国家自然科学基金项目(编号:40971234),江西省教育厅科学研究项目(编号:GJJ13431),江西理工大学基金项目(编号:jxxj11012)。
刘德儿(1976—),男,博士研究生,副教授,硕士研究生导师,341000江西省赣州市红旗大道86号。