基于TM图像的“增强的指数型建筑用地指数”研究
2012-09-07吴志杰赵书河
吴志杰,赵书河
(1.龙岩学院资源工程系,龙岩 364012;2.福州大学环境与资源学院,福州 350108;3.南京大学地理与海洋科学学院,南京 210093)
基于TM图像的“增强的指数型建筑用地指数”研究
吴志杰1,2,赵书河3
(1.龙岩学院资源工程系,龙岩 364012;2.福州大学环境与资源学院,福州 350108;3.南京大学地理与海洋科学学院,南京 210093)
以Landsat TM/ETM+图像为数据源,研究城镇和农村建筑用地信息的提取方法。首先利用TM 7,4,2波段创建归一化差值裸地与建筑用地指数(normalized difference bareness and built-up index,NDBBI);然后根据裸地在裸土指数(bare doil index,BSI)图像上的亮度值最高、在改进型归一化差值水体指数(modified normalized difference water index,MNDWI)图像的亮度值最低的特征,提出了增强型裸土指数(enhanced bare soil index,EBSI);最后选用NDBBI,EBSI,MNDWI和SAVI(soil adjustment vegetation index,SAVI)4个指数,构建一种新型的建筑用地指数,称为“增强的指数型建筑用地指数”(enhanced index-based built-up index,EIBI),可快速地提取建筑用地信息。实验结果表明,用EIBI提取的建筑用地信息客观,人为干预少,可信度高,提取精度可达90%以上,适合于同时提取城市和农村建筑用地信息。
遥感;Landsat TM;增强的指数型建筑用地指数(EIBI);归一化差值建筑用地指数(NDBI);裸土指数(BSI)
0 引言
地球表面除了覆盖着植被、水体、冰川和建筑物外,还有裸露地(如裸土、裸岩和沙地等)。除严寒地区外,可将地表覆盖归类为水体、植被、建筑用地和裸地4种基本单元。建筑用地包括城市建筑用地和农村建筑用地。城市建筑用地组成较为简单,成片的建筑用地镶嵌着植被、水体和少量裸土;而农村建筑用地组成复杂,具有点多、面广、面积小,空间分布比较分散,且与各种背景地物相互交错等特征。
利用中等空间分辨率卫星图像(如Landsat TM图像)提取建筑用地信息的研究已有较多成果,有的针对城市建筑用地,有的针对农村建筑用地。究其技术方法主要有两类:第一类主要基于典型地物的图像光谱特征或基于谱间关系知识等,用监督分类法、逻辑判别法或决策树法提取建筑用地信息[1-6]。这类方法虽然可去除裸地提取建筑用地信息,但因谱间关系特征在不同区域或不同图像间存在较大差异,制约了建筑用地信息提取的效率和模型的普适性(尤其对农村建筑用地);第二类是建立遥感指数模型自动提取建筑用地信息。Zha等[7]利用城镇用地灰度值在TM4,5两个波段间与其他地类的可分性,提出了归一化差值建筑用地指数(normalized difference built- up index,NDBI);杨存建等[8]利用TM7具有较好的地物光谱分离性,以及植被在TM7与TM4有较强的负相关性,构建了差值建筑用地指数(difference built-up index,DBI);徐涵秋[9-11]则提出压缩数据维的方法,并建立指数型建筑用地指数(index-based built-up index,IBI),开发出城镇建筑用地提取软件模块,提取的效率和精度都较高。然而,上述方法主要针对城市建筑用地信息的提取,不适用于有大量裸土环境的农村建筑用地信息的提取。吴宏安等[12]利用TM1和TM4的波段比值建立比值居民地指数(ratio residentarea index,RRI),试图去除裸地信息、提取建筑用地信息,但因使用了未经辐射校正的TM图像,其蓝光波段受大气散射影响较大,影响了提取精度和模型的适用性。
由于“同物异谱,异物同谱”现象的存在,区分建筑用地和裸地信息一直是遥感专题信息提取的难点之一。减少裸地对建筑用地信息提取精度影响的研究还有待进一步深入。本文旨在寻求建立抑制裸地信息、增强建筑用地信息的指数模型,构建了“增强的指数型建筑用地指数”(enhanced index-based built-up index,EIBI),以达快速、准确地提取城市和农村建筑用地信息的目的。
1 实验区及遥感数据源
选取福建省漳洲市和福州市两个实验区。漳洲实验区面积为360 km2,遥感数据选用1989年3月10日获取的Landat-4 TM图像,像元数为800×500 个,中心坐标为 E 117°41',N 24°31',成像时正值冬季休耕期,存在大面积裸露的休耕地及河滩沙地。福州实验区面积为576 km2,选用2006年11月5日获取的Landsat-5 TM图像,像元数为800×800个,中心坐标为 E 119°17',N 26°00',图像中存在大量的河滩或江心洲。
由于遥感图像成像时会因光照和大气条件不同而出现差异,因此对遥感图像需进行辐射校正[13]。采用日照差异纠正模型(illumination correction model,ICM)对图像进行辐射校正,将图像的灰度值转为传感器处的反射率[14]。本文统一采用ρblue表示蓝光波段(TM1)的反射率,ρgreen表示绿光波段(TM2)的反射率,ρred表示红光波段(TM3)的反射率,ρnir表示近红外波段(TM4)的反射率,ρmir1表示短波红外波段(TM5)的反射率,ρmir2表示短波红外波段(TM7)的反射率。
2 实验方法
2.1 常用建筑用地指数分析
由于建筑用地与裸地的光谱特征相似,建筑用地的反射率介于裸地和水体(或植被)的反射率之间(图1),难以使用单个原始波段或原始波段组合去除裸地信息、直接提取建筑用地信息。因此,有必要创建新的指数波段来实现这一目的。
图1 漳州实验区典型地物反射率曲线Fig.1 Reflectivity curve of Zhangzhou region
目前,NDBI和IBI是最重要的城市建筑用地指数,在城市建筑用地信息提取中都得到了成功的应用。但它们都是针对城市建筑用地开发的模型,不适合于提取有大量裸土和沙地混杂的农村建筑用地信息。究其原因主要为:①NDBI在提取建筑用地信息时,常常受到稀疏植被、缺水植被等因素的影响[15-16],提取的建筑用地信息中常夹杂有植被噪音信息;由于裸地在TM5波段上反射率最高,则在NDBI指数图像上亮度值也最高,用NDBI提取的建筑用地信息中也包含裸地信息;在经辐射校正后的图像上,TM5和TM4波段的建筑用地反射率差值很小(图1),使用NDBI提取建筑用地信息效果也将受到影响。②由于IBI是基于NDBI而创建的城镇建筑用地指数,在其所提取的建筑用地信息中不可避免地也包含裸地信息;而且由于裸地在NDBI指数图像上亮度最高,而在改进型归一化差值水体指数(modified normalized difference waterindex,MNDWI)图像上亮度最小,二者可分别看作是裸地信息最强和最弱的指数波段。显然,以 NDBI、MNDWI和SAVI 3个指数所创建的IBI无法去除裸地信息,甚至有增强裸地信息的趋势。
因此,NDBI和IBI指数均无法区分裸地和建筑用地信息。若要抑制裸地信息、增强建筑用地信息,需重新构建两个次级指数,并选择出合适的植被指数和水体指数,最后才能构建起去除裸地信息而增强建筑用地信息的模型。
2.2 次级指数构建与选择
2.2.1 裸地与建筑用地指数构建
如前所述,NDBI指数难以抑制裸土信息。必须构建出既能增强建筑用地信息又能弱化裸土信息的新指数,为最终增强建筑用地信息奠定基础。
在城区,地表覆盖物主要为建筑物、水体和植被,裸土很少(主要是新开发建筑用地的工程裸土);而在郊区和广大农村地区,地表覆盖物除建筑物、水体和植被外,还有许多农用地上的裸土。从图1中可以发现以下几个典型地物的光谱特征:①农村建筑用地、城市建筑用地和裸地的光谱特征比较相似,从绿光波段到短波红外波段的反射率呈递增的趋势,到TM7波段反射率降低;②裸地的反射率最高,农村建筑用地的反射率次之,城市建筑用地的反射率最低,这为区分建筑用地与裸地提供了遥感光谱特征依据;③植被、水体、建筑用地、裸土和沙的光谱分离性在TM7波段比在TM5波段更好,尤其是植被和水体在TM7波段反射率锐减;④大部分岩石和矿物在 TM7波段(2.08~2.35 μm)具有较强的吸收光谱特征,尤其是由富含羟基基团的粘土类矿物(如高岭石、蒙脱石和伊利石等)和有机质组成的裸土,其反射率在TM7波段会明显降低,而裸地与建筑用地在TM7和TM5波段的反射率则较为接近。因此,可选用TM7波段作为次级指数波段来构建包含裸土的建筑用地指数。
近红外波段是植被的最强反射波段,植被在绿光波段的反射率高于在TM7波段的反射率,因而植被在近红外波段和绿光波段的反射率均值都远高于在TM7波段的反射率;绿光波段是水体的最强反射波段,水体在近红外波段的反射率高于在TM7波段的反射率,因而水体在绿光波段和近红外波段反射率的均值都远高于在TM7波段的反射率。因此,用TM7,4,2波段组合构建一个新的归一化指数,就可以直接剔除水体和植被信息,提取出含裸地的建筑用地信息。该指数称为归一化差值裸地与建筑用地指数(normalized difference bareness and built-up index,NDBBI),其模型表达式为
将式(1)中短波红外波段(TM7)的反射率(ρmir2)按倍数扩大,既可提高建筑物和裸土的反射率,又可增大建筑用地与植被或水体的反射率差值。倍数的确定以水体或植被在TM4和TM2波段反射率均值与在TM7波段反射率的倍数为依据,使水体或植被在TM7波段扩大后的反射率不超过在TM2和TM4反射率的均值。经反复实验证明,TM7波段反射率扩大倍数为1.5时,可使建筑用地指数值呈正值,而水体和植被指数值呈负值。取阈值为0附近时,就可以提取出包含裸地的建筑用地信息。如果在裸地很少的城区范围,使用NDBBI即可直接提取出建筑用地信息;但在郊区或广大农村地区,还需要进一步去除裸地信息。
因此,利用短波红外波段(TM7)来构建NDBBI模型,不仅可以剔除植被和水体信息,还可以削弱裸地信息,显然比NDBI更有优势(图2)。
图2 3种指数图像亮度图Fig.2 DN of the NDBI,NDBBI and BSI indices
在NDBBI指数图像上,裸地的亮度更接近建筑用地,这为进一步抑制裸地信息提供了重要的基础。
2.2.2 植被指数和水体指数的选择
由于引入土壤调节因子,SAVI被认为最适合于研究低植被覆盖区(如城市建成区)[17],其探测植被覆盖率的下限可低至15%(而NDVI只有30%)。农村居民地周边存在各种各样的裸土,房前屋后植被的覆盖率也比较低,因此,选择SAVI作为增强建筑用地信息的植被指数更合适;由于创建MNDWI的初衷就是为了在抑制植被噪音信息的同时也能更好地抑制土壤和建筑用地信息[18],故选择MNDWI作为从反面增强建筑用地信息的水体指数。它们的模型表达式分别为
式中L为土壤调节因子,取0.5时可将土壤亮度差异减到最小。
2.2.3 增强型裸土指数构建
Rikimaru[19]在 1996 年提出了裸土指数(bare soil index,BSI),其模型的表达式为
BSI采用了受大气瑞利散射影响较大的蓝光波段,这也是要求对TM原始图像进行绝对辐射校正的原因之一。图3为3种指数图像亮度图。
图3 3种指数图像亮度图Fig.3 DN of the EBSI、BSI and MNDWI indices
从图3可以看出,在BSI指数图像上裸地亮度最高,其他地物的亮度由高到低依次为建筑用地、水体和植被;而在MNDWI指数图像上水体亮度最高,其他地物的亮度由高到低依次为植被、建筑用地和裸地。在BSI和MNDWI两种指数图像上,裸地(裸土和沙体)的亮度反差最大。因此,为了最大程度地增强裸土信息,利用这两个指数来构建一种新型的裸土指数,称其为增强型的裸土指数(enhanced bare soil index,EBSI),其模型的表达式为
式中:BSI为裸土指数图像的灰度值;MNDWI为修正归一化水体指数图像的灰度值。
2.3 增强的指数型建筑用地指数构建
如前所述,NDBBI具有弱化裸土信息,EBSI具有增强裸土信息的效果,因此,利用裸地在这两个指数波段信息的相对强弱差异来进一步抑制裸地信息。根据IBI模型构建方法,在模型中用NDBBI替换NDBI指数,并引入增强型裸土指数(enhanced bare soil index,EBSI)。用NDBBI,EBSI,MNDWI和SAVI组合来构建新的指数模型,以求达到抑制裸地信息的目的。为了使建筑用地指数的值呈正值,并降低模型的分母值,要计算3个指数图像的平均值。由于EBSI和MNDWI具较强的负相关性,如果简单使用EBSI,MNDWI和SAVI 3者的算术平均值,就会降低EBSI对裸土的抑制作用,达不到抑制裸土信息的目的。为了能更好地抑制裸地信息,需赋予EBSI以更大的权重,再计算3个指数图像的加权平均值,来构建EBSI。经实验验证,确定EBSI的权重为4,MNDWI和SAVI的权重均为1时,可以达到增强建筑用地信息的最好效果。因此,称其为“增强的指数型建筑用地指数”(EIBI),其模型的表达式为
漳州实验区典型地物的EIBI,IBI和NDBI指数均值统计结果如表1所示。
表1 漳州实验区典型地物的指数均值Tab.1Mean values of the indices of Zhangzhou region
从表(1)可以看出,在EIBI指数中,城市建筑用地的指数值最高,农村建筑用地次之,其他地物从高到低依次为裸地、植被和水体。植被和水体的指数值虽然不再是负值,但大大低于裸地的指数值,通过阈值分割可以提取出建筑用地信息;相反地,在IBI和NDBI指数中,建筑用地的指数值低于裸地的指数值。说明EIBI可以显著增强建筑用地信息;采取阈值分割方法可以去除裸地信息,提取建筑用地信息。
3 结果与讨论
3.1 结果验证
本文运用EIBI制作了2个实验区的建筑用地指数图像。验证前先进行了二值化处理(建筑用地用1表示,非建筑用地用0表示),漳州实验区取阈值0.19制作出建筑用地指数专题图(图4(b)),福州实验区取阈值0.16制作建筑用地指数专题图(图4(e)),均未做掩模或低通滤波处理。
图4 TM图像与建筑用地专题图Fig.4TM images and the thematic maps of built-up land
采用建筑用地指数专题图与经辐射校正的TM4(R),3(G),2(B)假彩色合成图像进行精度验证。将EIBI,IBI,TM4,TM3和TM2 5个特征组成的新图像作为验证图像,可以对EIBI和IBI两个图像同时进行验证,提高精度验证结果的可比性。然后,使用ER MAPPER 7.1遥感软件,制作抽样点矢量图层,并形成独立矢量文件,可供多次调用,提高对参考影像的判读精度。
抽样方法采用随机抽样方式。在漳州实验区所抽取的357个验证像元中,EIBI专题图有20个漏提像元,有15个误分像元,总精度达90.20%,Kappa系数为0.786(表2)。
表2 漳州实验区精度验证数据Tab.2 Accuracy validation results of Zhangzhou region
在福州实验区所抽取的464个验证像元中,EIBI专题图有22个漏提像元,18个误分像元,总精度可高达91.38%,Kappa系数为0.810(表3)。
表3 福州实验区精度验证数据Tab.3 Accuracy validation results of Fuzhou region
3.2 分析与讨论
从精度验证结果(表2及表3)对比来看,在含有裸地的区域提取建筑用地时,EIBI比IBI提取建筑用地信息的精度高10% ~20%。EIBI的生产者精度和使用者精度均可达到85%以上,总精度达90%以上,满足遥感分类的精度要求。根据实验结果,对提取精度的影响因素作进一步讨论分析。
从使用者精度来看,影响IBI指数提取精度的因素是存在大量的裸土信息。在漳州实验区存在大量休耕地的裸土,EIBI提取的建筑用地信息仍然可达90.20%,使用者精度达85%以上。然而,IBI提取的总精度仅为71.43%,特别是建筑用地的使用者精度仅有56.28%,这意味着提取的建筑用地信息有近一半是误提的。通过目视判别发现,在IBI指数图中裸地的亮度比建筑用地的亮度高,提取建筑用地时必将同时提取裸地信息,如图4(c)所示。在漳州实验区提取的信息中,裸地信息比建筑用地信息还要多。通过对抽样样本分析也发现IBI误提的像元主要是裸地像元(如漳州的休耕地和福州的沙滩地);EIBI误提的像元只有15个,基本不是裸土像元。说明EIBI实现了抑制裸地信息、增强建筑用地信息的目的。
从使用者精度来看,影响EIBI精度的主要因素是水体。在水体指数值较低的水与裸地交界地带和清澈的深水区,部分水体像元被误提为建筑用地像元。这是由于裸土指数和水体指数有较强的负相关性,构建EIBI模型时为了最大程度地抑制裸地信息,向水体指数分配的权重较小,以至于对水体的抑制作用减弱;反之,如果提高水体指数的权重,虽然可以更好抑制水体信息,却降低对裸土的抑制作用,则得不偿失。可以通过MNDWI提取的水体信息对建筑用地提取结果进行掩模处理,并经低通滤波去除独立的像元,来消除此部分的误提信息、提高建筑用地信息的提取精度。为了验证EIBI模型的有效性,本次实验并没有做掩模和滤波处理。
通过对样本分析发现,EIBI漏提的像元主要是村落边缘的像元,属建筑用地与裸土的混合像元,此类误差为影像空间分辨率不足的原因所致。需要研究如何分解此类混合像元,进一步提高建筑用地信息提取精度;另外,EIBI指数的有效动态变化范围较小,裸地的指数值仅次于建筑用地的指数值,二者比较接近,确定阈值的难度比较大,这也是容易引起误差的因素之一。
通过分析城区范围的抽样样本,还发现IBI和EIBI两个指数漏提的像元极少。
综合分析表明,EIBI不仅适用于提取城市建筑用地信息,也适用于提取农村建筑用地信息,所提取的建筑用地信息中不包括裸土信息。
4 结论与建议
1)本研究共构建了3个与建筑用地有关的新指数,即“增强的指数型建筑用地指数”(EIBI)、归一化差值裸地与建筑用地指数(NDBBI)和增强型裸土指数(EBSI)。其中,EIBI是最终提取城市和农村建筑用地信息的模型。
2)EIBI提取结果客观,人为干预少,仅通过波段间运算来获取结果,提取的建筑用地信息可信度高,提取精度可以达到90%以上。
3)短波红外波段(TM7)的地物光谱具有分离性好而稳定的特点,可为建筑用地信息提取提供新的思路。建议在经ICM辐射校正的图像上,进一步研究用NDBBI提取城市建筑用地信息的方法与效果。
4)在使用 EIBI模型时,需注意以下问题:①TM图像需经过绝对辐射校正,以减少因日照差异和大气条件不同的影响;②制作EIBI指数图像时,需经过0~255的灰度值拉伸,不能直接使用归一化数据参与运算;③构建EIBI模型需要用到TM图像的6个波段(除热红外波段),也适用于有相同波段的Landsat ETM+图像,但不适用于无此6个波段配置的其他遥感数据。
[1]顾 娟,陈 军,张宏伟,等.基于遥感影像的居民地提取研究综述与展望[J].计算机工程与应用,2007,43(30):1 -4.
[2]杨存建,周成虎.TM影像的居民地信息提取方法研究[J].遥感学报,2000,4(2):146 -150.
[3]赵 萍,冯学智,林广发.SPOT卫星影像居民地信息自动提取的决策树方法研究[J].遥感学报,2003,7(4):309 -315.
[4]杨存建,周成虎.基于知识发现的TM图像居民地自动提取研究[J].遥感技术与应用,2001,16(1):1 -6.
[5]高永光,祝民强,朱 骥,等.赣中红壤区TM图像的居民地信息自动提取专家模式研究[J].国土资源遥感,2002(4):67-69.
[6]安 如,赵 萍,王慧麟,等.遥感影像中居民地信息的自动提取与制图[J].地理科学,2005,25(1):74 -80.
[7]Zha Y,Gao J,Ni S.Use of Normalized Difference Built- up Index in Automatically Mapping Urban Areas from TM Imagery[J].International Journal of Remote Sensing,2003,24(3):583 -594.
[8]杨存建,张 果,陈 军,等.基于遥感的成都市及其周边城镇的扩展[J].地理研究,2008,27(1):101 -108.
[9]徐涵秋.基于压缩数据维的城市建筑用地遥感信息提取[J].中国图象图形学报,2005,10(2):223 -229.
[10]Xu H.A New Index for Delineating Built- up Land Features in Satellite Imagery[J].International Journal of Remote Sensing,2008,29(14):4269 -4276.
[11]徐涵秋,杜丽萍.遥感建筑用地信息的快速提取[J].地球信息科学学报,2010,12(4):574 -578.
[12]吴宏安,蒋建军,张海龙,等.比值居民地指数在城镇信息提取中的应用[J].南京师大学报:自然科学版,2006,29(3):118 -121.
[13]徐涵秋.Landsat遥感影像正规化处理的模型比较研究[J].地球信息科学,2008,10(3):294 -301.
[14]徐涵秋.基于影像的Landsat TM/ETM+数据正规化技术[J].武汉大学学报:信息科学版,2007,32(1):62-66.
[15]陈志强,陈健飞.基于NDBI指数法的城镇用地影像识别分析与制图[J].地球信息科学,2006,8(2):137 -140.
[16]杨智翔,何秀凤.基于改进的NDBI指数法的遥感影像城镇用地信息自动提取[J].河海大学学报:自然科学版,2010,38(2):181-184.
[17]Huete A R.A Soil- adjusted Vegetation Index(SAVI)[J].Remote Sensing of Environment,1988,25(3):295 - 309.
[18]徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005,9(5):589 -595.
[19]Rikimaru A.Landsat TM Data Processing Guide for Forest Canopy Density Mapping and Monitoring Model[C]//ITTO Workshop on Utilization of Remote Sensing in Site Assessment and Planning for Rehabilitation of Logged -over Forest,Bangkok,Thailand,1996:1 -8.
A Study of Enhanced Index-based Built-up Index Based on Landsat TM Imagery
WU Zhi- jie1,2,ZHAO Shu - he3
(1.Department of Resources Engineering,Longyan University,Longyan 364012,China;2.College of Environment and Resources,Fuzhou University,Fuzhou 350108,China;3.School of Geographic & Oceanographic Sciences,Nanjing University,Nanjing 210093,China)
A new method for extraction of built-up land information both in suburban area and in urban district by using Landsat TM/ETM+imagery is proposed in this paper.Firstly,to suppress the information of bare soil with the middle-infrared(TM7),near-infrared(TM4)and green band(TM2),it is necessary to build a secondary index,which is called normalized difference bareness and built-up index(NDBBI).At the same time,to enhance the information of bare soil from existing indices of bare soil index(BSI)and modified normalized difference water index(MNDWI),another secondary index is built,which is called enhanced bare soil index(EBSI).Finally,the indices of NDBBI,EBSI,SAVI and MNDWI are applied to constructing a new index for delineating built- up land features in satellite imagery,which is called enhanced index-based built-up index(EIBI).The new index(EIBI)can be employed to extract the built- up land information both in suburban area and in urban district.This approach has been successful in Fuzhou and Zhangzhou experimental regions.Built- up features can be extracted objectively and sufficiently with the accuracy above 90%.
remote sensing;Landsat TM;enhanced index-based built-up index(EIBI);normalized difference built-up index(NDBI);bare soil index(BSI)
TP 751.1
A
1001-070X(2012)02-0050-06
吴志杰(1971-),男,硕士,副教授,主要从事环境与资源遥感的教学与研究。E-mail:wuzhijiefj@163.com。
(责任编辑:李 瑜)
10.6046/gtzyyg.2012.02.10
2011-07-08;
2011-08-05
国家科技支撑计划项目子课题(编号:2011BAK07B02-08)资助。