LANDSAT数据在沙地动态监测中提取沙地信息的最佳波段组合研究
2011-04-23荆耀栋周淑琴吴发启张青峰
荆耀栋 周淑琴, 吴发启 张青峰
(1山西农业大学资源环境学院 2西北农林科技大学资源环境学院)
我国是世界上荒漠化危害最严重的国家之一,其中风蚀荒漠化主要分布在干旱、半干旱地区,在各类荒漠化土地中,面积最大、分布范围最广的区域,多位于我国的西北地区[1]。风蚀荒漠化的最终结果是土地的沙漠化。土地沙漠化不仅导致可利用的土地资源锐减,加速生态环境的恶化,加深沙区人民的贫困程度,还会造成巨大的经济损失[2]。遥感可以提供多时相大范围的高精度沙地信息数据,为动态监测沙地的发展变化提供了有效手段。监测过程中的关键技术环节是沙地信息提取,而影像中波段的优化组合则是该技术的基础。因此,波段选择是否最优,对快速准确地提取目标地物信息具有重要的意义。本文以定边县的数据为研究对象,结合当地的实际情况,分析数据特征,评价各种波段的组合方案,得出提取沙地信息的最佳波段组合,为后期数据的处理提供了有力的技术支撑。
1 研究区概况
定边县地处陕西省西北角、榆林市最西端,是黄土高原与内蒙古鄂尔多斯荒漠草原的过渡地带。县境中部白于山横亘东西,辐射南北,将全县分为两大地貌类型:南部为白于山区丘陵沟壑区,占总面积的52.78%;北部为毛乌素沙漠南缘风沙滩区,占总面积的 47.22%。境内水域较多,北部风沙区有多个海子,沿县界由西向东分布,南部多条河流均发源于白于山区。定边县属温带半干旱大陆性季风气候,春季多风、夏季干旱、秋季阴雨、冬季严寒,日照充足。定边县处于生态环境脆弱的农牧交错带(赵松乔,1953年),沙地的发展变化严重影响该地区人民的生产和生活。
2 数据源
Landsat-5是美国 1984年发射的陆地卫星,仪器舱装有专题绘图仪(TM)传感器,有 7个波段的感应器,地面分辨率为 30 m(第 6波段为 120 m)。Landsat-7卫星于 1999年发射,传感器改型成增强型专题绘图仪(ETM),有 8个波段的感应器,第 6个波段的地面分辨率提高为 60 m,增加的第 8波段是地面分辨率为 15 m的全色波段[3-5]。本研究选取的数据源为 1991年 8月 23日的 Landsat-5/TM影像和 1999年 9月 22日的 Landsat-7/ETM+影像,轨道号为 128/034。
3 最佳波段选择
根据加色法彩色合成原理,选择遥感影像的某三个波段,分别赋予红、绿、蓝三种原色,可以合成彩色影像[3,4]。而人眼对彩色的分辨率比对黑白灰度的分辨率强的多,所以在影像解译时常采用这个方法显示地物丰富的信息或突出某方面的信息。但是对于多波段影像的合成,方案的选择十分重要。波段选择一般要遵循以下 3个原则:①波段或波段组合信息含量要大;②所选的 3个波段的相关性要弱;③目标地物类型在所选的波段组合内与背景有优良的可分性[5-8]。
在实际应用中,主要的选取方法有:方差、相关系数矩阵、OIF指数等。单波段的方差越大,表明波段的离散程度越大,信息量就越丰富;相关系数矩阵反映了不同波段的相关性大小,相关系数越小,表明波段间的冗余性越小;而 OIF指数则综合考虑了方差和相关系数两个因素,波段组合的方差越大,同时波段间的相关性越小的组合即为最佳波段组合。在许多遥感应用研究中,一般只考虑前两个原则,在OIF指数、方差和相关系数 3个指标中,或者只考虑OIF指数,或者只考虑方差和相关系数[6,9-11]。本研究利用波段的方差分析波段的信息含量,再利用相关系数将波段分为 3个组合类,减少 OIF指数的组合量。最后结合其余波段组合后的 OIF指数,分析沙地信息的波谱特征和研究区域的实际情况,选出最优的提取沙地信息的波段组合。
3.1 波段信息含量分析
原始影像的地面分辨率为 30 m,研究区域沙地分布面积大,可以通过目视解译选择具有代表性的沙地样区。经实地验证后,利用 ERDAS进行影像信息统计,得出 7个波段针对沙地的光谱特征(见表 1)。从表 1中可以看出,标准差最大的是 TM7,然后是 TM5和 TM3,均大于 10。排在第 4位的是TM4,标准差也接近于 10,最小的是 TM6波段,标准差仅为 1.785。亮度值范围的大小与标准差一致,最大的为 TM7,依次是 TM5、TM3、TM4、TM2、TM1、TM6,TM6波段的亮度范围仅为 13。尽管 TM6的地面分辨率从 120 m提高到 60 m,但分辨率远低于其他波段,且沙地信息提取过程和后期数据处理中,不涉及热辐射的内容,同时标准差和亮度范围太低,在后期的波段选择中,可以不考虑该波段的信息。
表1 单波段统计特征值
3.2 波段间相关性分析
LANDSAT影像的 ETM的波段中的第 8个波段,分辨率高,与其他波段合成可提高分辨率,但标准差小,沙地信息含量少,所以在目视解译时不予考虑。对于 TM和 ETM两类数据中的其他 6个波段,要选择信息含量大的波段,且波段间的相关性要小。实际操作中,利用遥感数据处理软件 ENVI,直接计算得出相关系数矩阵。将加载了波段 1、2、3、4、5和7波段的影像在 Compute Statistics中计算,得出 6个波段间的相关系数矩阵(见表 2)。
表2 波段间相关系数矩阵
从表 2中可以看出,波段 1、2和 3之间的相关性均大于 0.93,数据间冗余性特别大,三者之间不适合波段组合,归为第一组。而波段 4和波段 1、2、3、5、7之间的相关性很低,均小于 0.68,表明这个波段信息有较大的独立性,可以和任一波段组合,单独归为第二组。波段 5和波段 7之间的相关性大于0.9,二者不能同时出现在最优波段中,归为第三组。经过分析后,三组波段组合分别由三个组中各选一个波段,组成不同的组合(见表 3)。
表3 波段分组与组合方案
经过波段信息含量分析和波段间相关性分析之后,得出 6个波段的 6种组合方案。数据处理之前,对沙地信息提取技术与方法,进行了大量文献查询,这些波段组合均有应用。如王晓慧在“沙化土地信息提取研究”中,用 TM3、TM4和 TM5波段合成影像进行目视判读。1992年,桂东南金银矿成矿区遥感地质综合解译,利用 TM7、TM4、TM2假彩色合成片进行解译,提供了最大的光谱多样性。本研究区域位于毛乌素沙地南缘,气候属于温带半干旱气候,波段的组合方案有待进一步分析。
3.3 波段 OIF指数分析
美国查维茨提出的最佳指数法(OIF),计算方法简单,易于操作。理论依据是:图像数据的标准差越大,所包含的信息量也越多,而波段的相关系数越小,表明各波段的图像数据独立性也就越高,信息的冗余度也就越小[12,13]。它将标准差和相关系数有效地统一起来,进一步提供了判断的依据。数学表达公式为:
式中的 Si为第 i个波段的标准差;Rij为 i、j两个波段的相关系数。OIF指数越大则说明波段间的相关性越小,三个波段所包含的信息量越大。通过 OIF指数公式的计算,表 3中各波段组合的 OIF指数如表4所示。
表4 各方案的 OIF指数值
从表 4中可以看出,6种波段组合中,波段 3、4、7和波段 3、4、5的 OIF指数值相差无几,均大于 18,单从指数分析,3、4、7为最佳波段组合方案,3、4、5稍微次之;波段 1、4、7为第三方案,波段 2、4、7属于第四个方案,两者相差很小,均大于 16;第五个方案为波段 1、4、5,第六个方案为波段 2、4、5,两者均大于 15.2,属于 6个组合中的最差级别。但究其数值来看,单个层次之间的差别不是很大,第一和第二级别之间相差约 2-2.7个数值,第二和第三级别之间相差 1个数值,从指数方面分析,整体效果相差无几。从 OIF指数来看,波段 3、4、7是最优方案,波段3、4、5稍微次之 ,最差的是波段 1、4、5和波段 2、4、5的组合。
3.4 波段赋色
实验证明,红色、绿色和蓝色是加色法中最优的三原色[3]。三者按一定比例混合,可以形成各种色调的颜色。人眼最敏感的颜色是绿色,依次是红色和蓝色[11]。第一方案形成的彩色影像,沙地信息清晰,边界分明。实际应用中,波段颜色的互换有可能凸显一些特殊的信息,还可形成接近于自然色调的影像,利于地物判读。对于第二方案中的 3、4、5和第一方案中的 3、4、7分别赋予红、绿、蓝色,形成的彩色影像,整体色调接近自然色彩,利于目视解译。而不同级别的沙地信息轮廓清晰,纹理细腻,利于沙地信息的提取。
3.5 选取最佳波段组合方案
提取沙地信息的目的是监测沙地变化,能否高精度提取不同等级的沙地信息是后期研究的关键。那么,方案的选择,首先,应该考虑沙地与背景信息能否清晰分离;其次,植被信息是评价沙地变化的主要依据,林地、草地、耕地是否能清晰判别也是考虑的主要方面。结合区域的实际情况,该地区属于温带半干旱气候,土地荒漠化严重,荒漠化信息将干扰沙地信息的提取。波段组合应考虑能否区分荒漠化土地和沙地信息。研究区域属于毛乌素沙地南缘,但是水域多,盐碱地多,波段的组合评价还应考虑水体和其他信息、盐碱地信息和沙地信息的区分判读。
经过 OIF指数分析的不同方案,数值差别不是特别大,根据波段赋色原理分别按方差大小赋色,合成彩色图像,一一比较分析。对于沙地来说,在橙光波段 0.6 um附近有一个强反射峰,因而呈现橙黄色,在波长 0.8 um以上的波长范围,其反射率比雪还强[3]。数据中 2波段的波长范围是 0.52-0.60 um,所以当波段的组合中出现第 2个波段的时候,在研究区的北部风沙区,整个色调偏橙黄色。随着波段波长范围的增加,沙区的色调逐渐偏白亮色调。第五和第六方案形成的彩色影像中,沙区信息和植被信息层次少,道路、水体以及南部丘陵沟壑区形成的地形阴影易混淆。第五个方案中波段 2的出现,由于此波段沙地出现强反射峰,北部沙区色调较亮,目视解译效果较第六方案要好。第三和第四个方案的 OIF指数值属同一个级别,两者形成的彩色图像,沙地边界清晰,土地类型丰富,易于区别弃耕地和荒漠化土地,但是对于植被中的林地和草地不易区分。第四方案中波段 2的出现,影像色调偏暗。对于第一和第二方案,地物信息丰富,层次清晰。一、二两个方案的最大区别是方案一中,沙地信息和盐碱地信息更易区分,沙地呈现淡粉色,盐碱地呈现白色,线条状水体和道路更易区分。方案二比方案一要差一些。
经过目视效果的反复比较,最佳的波段组合是3、4、7。该组合方案形成的图像,颜色丰富,层次清晰,含有较多目标地物特征信息,尤其能突出显示沙地的信息。而且该图像的地物颜色接近于地物的自然色调,易于目视判读和计算机半自动化分类。
4 结论与讨论
本文以毛乌素沙地南缘的定边县为研究区域,以多光谱数据为数据源,以有效提取沙地的变化信息为目的,对波段组合进行分析研究,对不同组合后的影像进行目视解译的比对,得出如下结论:①波段3、4、7的组合为最佳方案,赋色后形成的彩色图像,地物信息丰富,能凸显沙地信息,并能兼顾其他信息的显示;②最佳波段组合,符合文献查询的结果,沙地信息提取的 6个方案中,第一个方案和第二个方案的利用频次较多;③对波段组成的彩色影像,目视解译结果比对 googleearth中的标识,出入很小,尤其是面积较小的居民点和道路的提取,效果很好;④利用最佳波段形成的彩色图像进行监督分类,分类效果好,说明波段的组合适于训练区样本的选择;⑤最佳波段组成的彩色影像,利用 LCD(液晶)显示器(lenovoThinkPad)进行目视解译,信息丰富,层次清晰,但对于 CRT显示器的效果没有进行验证。
[1]孙保平.荒漠化防治工程学[M].北京:中国林业出版社,2003:5-31.
[2]王晓慧,李增元,高志海.沙化土地信息提取研究[J].林业科学,2005,41(3):82-87.
[3]梅安新,彭望禄,秦其明,等.遥感导论[M].北京:高等教育出版社,2001:50-53.
[4]孙家抦,舒 宁,关泽群.遥感原理、方法和应用[M].北京:测绘科学出版社,1997:40-48.
[5]杜新远,戚浩平,孙永军.ETM+影像湿地遥感信息提取的最佳波段选择—以扎陵湖、鄂陵湖地区为例[C].北京:第二届全国国土资源遥感技术应用交流会论文集,2006:99-101.
[6]武文波,刘正纲.一种基于地物波谱特征的最佳波段组合选取方法[J].测绘工程,2007,16(6):22-24.
[7]年 波,杨士剑,王金亮.植被遥感信息提取的最佳波段选择—以云岭中部山区为例[J].云南地理环境研究,2004,16(2):18-21.
[8]戴昌达,姜小光,唐伶俐.遥感图像应用处理与分析[M].北京:清华大学出版社,2004:123-126.
[9]姜小光,王长耀,王 成.成像光谱数据的光谱信息特点及最佳波段选择:以北京顺义区为例[J].干旱区地理研究,2000,23(3):214-220.
[10]冯恩国,李淑香.居民地信息提取的最佳假彩色合成方法—以开封市区为例[J].平顶山学院学报,2006,21(2):91-94.
[11]戴昌达.TM图像的光谱信息特征与最佳波段组合[J].环境遥感,1989,4(4):282-292.
[12]刘建平,赵时英.高光谱遥感数据解译的最佳波段选择方法研究[J].中国科学院研究生院学报,1999,16(2):153-161.
[13]张 韬,吕洪娟,孙美霞.遥感多光谱数据在内蒙古西部湿地监测中最佳波段选取的应用研究[J].干旱区资源与环境,2007,21(4):102-106.