基于光谱特征分析的城市建设用地信息提取
2019-11-08樊舒迪刘振华胡月明
樊舒迪 ,刘振华 ,胡月明
(1.航天精一(广东)信息科技有限公司,广州 510665;2.华南农业大学资源环境学院,广州 510642;3.国土资源部建设用地再开发重点实验室,广州 510642)
1 研究背景
在社会经济迅速发展的背景之下,土地利用的主要特征为建设用地的扩张和城市空间的蔓延,城市化的推进也成为了人类利用土地的重要方式[1]。从近百年的世界城镇发展来看,经济全球化是推动各城镇走上扩张道路的原动力。从20世纪50年代起(1950-1980),西方世界城镇扩展态势明显,汽车产业的发展拉近了城市内部的时间距离,这使得消费者购房置业的可选择区域扩大,同时带动了城市边界向近郊村域蔓延步伐[2],[3],[4]。在中国,城市扩张阶段与西方世界相对应的是改革开放时期(1978-2010),国内城镇化水平以年均1.048%增速从17.91%增长至45.67%[5],[6],[7]。国家经济发展的整体水平、生产条件、人民的生活质量得到了一定改善。其中,东南沿海地区的城镇化水平高于内陆地区,城镇化速度具有一定优势,城市空间被利用范围更大,在当时缺少有组织的规划(商业圈、中轴线)及相应政策限制的条件下,大城市边缘的扩张呈现出盲目蔓延的趋势,且情况较为严重[8]。除此之外,区域建设用地的开发规模也存在着巨大的差距,建设用地的区域配置并不均衡。因此,研究城市的空间扩展、快速准确地获取城市建设用地信息,对于土地资源的合理利用,对城市扩张与自然资源的关系研究都有着十分重要的意义。
从20世纪70年代开始,传感器技术的革新带动了遥感信息技术的不断发展[9],[10],[11]。将卫星传感器和航空机载传感器对地观测投入城市扩展的城市信息提取和动态监测,逐渐成为城市遥感研究的重要领域。在城市遥感研究中,城市建设用地信息提取是城市遥感重要的方面,在该方面的研究中,学者们主要从非监督/监督分类和光谱特征分析入手,进行建筑信息的提取。在监督分类方面,主要利用科学的采样方式,将地物已知区域的作为样本区,样本点按一定规则排布并置入非监督/监督分类模型中,完成对建设用地信息的分类和提取,MA Reveshty利用多时相卫星数据对地观测方法对伊朗省会德黑兰东南部的赞詹地区进行土地利用变化监测[12]。Q Zhang等学者利用非监督分类对研究区的城市扩展状况进行监测和分析,实验表明该方法可以快速地获取城市变化信息并通过得到城市发展规模随时间变化的空间特点[13],[14],[15]。在光谱特征分析方面,主要通过对地物波谱空间特征,分析不同地物之间的光谱信息差异,并建立模型,对指定的地物信息进行分类提取。其中,有学者利用像元中植被、不透水面和土壤之间的波谱关系,建立线性模型对城市建筑信息进行提取[16],[17],[18];利用差异性分析和逻辑判断对遥感影像中的单一光谱或多光谱数据进行分析,从中提取城市建筑物信息[19],[20],[21],[22];在对多光谱影像的光谱特征进行分析的基础之上,构建归一化指数提取城市建筑物的信息,并分析归一化指数法与监督分类方法的适用范围以及精度差异[23],[24],[25],[26];利用多光谱影像与全色波段融合技术,采用监督分类法对城市扩展过程中,城市边缘进行提取,分析城市扩展动态[27],[28],[29]。总之,利用遥感信息的光谱空间特征提取专题信息已成为该领域的研究热点,本研究以广州市为例,通过分析地物的光谱特征和归一化指数,综合运用归一化差异指数组合快速提取,为土地资源调查提供有效的信息和数据支撑。
2 基本原理
2.1 光谱特征分析
本研究主要涉及被动遥感器,被动式传感器通过接收地表辐射、地表反射的电磁波获取地物信息。电磁波存在多个波段,不同地物由于表面温度、表面粗糙程度、颜色外观的差异,对于不同波段的辐射敏感性不同,从而表现出不同的波谱反射,这个过程被记录在被动传感器,并制成遥感影像。研究者通过对遥感影像中,不同地物的光谱间差异特征进行分析,可以将目标地物区分出来。本研究利用光谱差异性分析这一原理将城市建筑信息从其他地物类型中提取出来。
一般得到的多光谱数据是以灰度值(DN值)来表示,DN是无量纲的值,数值越大表示地表辐射强度越大,温度越高,反之亦然。最简单的应用就是根据图像的DN值来解译地表的相对反射的高低。也可以对多光谱图像进行定标,将DN值转换为反射率(或辐射率),这个强度值是传感器接收到的总的能量值,包括地表辐射、大气辐射等。
Landsat8 OLI多光谱传感器记录观测地物7个波段的信息:海岸线/大气(0.4430μm)、蓝波段(0.4826μm)、绿波段(0.5613μm)、红波段(0.6546μm)、近红外(0.8646μm)、短波红外-1(1.6090μm)和短波红外-2(2.2010μm)。各种地物对应的光谱特征曲线,可以看出个地物在某些特定波段存在着明显的差异。例如:图1中,广州市区主要包括以下几种地物类型:高密度建筑、低密度建筑、裸土地、森林、灌木林和水体。灌木林和森林在近红外波段存在明显的反射峰值,通过这一特点可以将这两类地物从背景中提取出来;水体的光谱呈现单调递减的趋势,可通过短波红外与近红外的差异将其与背景地物区别开来。
2.2 归一化指数分析
归一化差异植被指数在20世纪70年代被引入遥感学领域,后续的研究中,适用于不同地物的模型如:归一化湿度指数(NDMI)、归一化差异雪指数(NDSI)、归一化建筑指数(NDBI)等被引入,用于提取目标地物信息。这些指数都有个共同特点,都采用了归一化运算方法。数值上,归一化指数的值域在[-1,1],构建该模型的原理是,通过光谱分析,寻找地物中反射率差异最大的两个波段,分子中的差值可体现反射率的差异,分母则通过比值的方式将差异放大,而其他地物由于特定波段的差值较小,在指数中会被作为背景值受到抑制,最后得到的结果将是目标地物在亮度上增强,而背景值受到削弱。
本研究主要构建与建设用地信息相关的几种指数。
(1)归一化植被指数:植被中的叶绿素具有在可见光0.4~0.7μm强吸收的特性,在Landsat8影像对应第4波段红色波段反射率较低,而与之相邻的绿色波段(0.55μm)反射相对较高,这也是大部分植被在肉眼中呈绿色或蓝色的原因,同时在近红外波段(0.7~1.3μm),植被的高反射率特点则更加明显,到了中红外范围(1.3~2.5μm),由于植被中水分的吸收作用,该波段范围内的反射率逐渐降低。根据以上的植被光谱特性,可构建相关的植被指数,其中,最具有代表性的归一化差异植被指数构建模型如下:
式中,NDVI代表归一化植被指数;NIR为近红外波段反射率;Red为红色波段反射率。归一化植被指数在土壤属性相同的区域能够达到很好的区分效果,但是,在部分地区土壤属性存在变化,仅仅用归一化植被指数不能很好地将植被和背景像元区分开来,存在一部分植被覆盖稀疏的地区和裸土,二者的红色波段与近红外差值与植被的相似,采用阈值法难以消除土壤背景的干扰,可能出现将植被错分的现象。对于该问题,有学者提出了引入土壤调节因子的方案,并提出了SAVI(Soil Adjusted Vegetation Index),通过该因子将分子分母的值进行优化,优化过程可根据区域植被覆盖度的实际情况进行合理调整,增加了归一化指数在不同土壤背景下使用的弹性,SAVI可通过如下公示表达:
式中,L为土壤调节因子,取值范围(0,1),取0对应植被覆盖度极低的情况,取1对应完全植被覆盖的情况。本研究通过取L=0.3,0.4,0.5…0.8多次实验,确定L=0.6更适用于广州市的植被覆盖区。
(2)归一化水体指数:归一化差异水体指数可用于一般影像的水体信息提取,其表达式如下:
式中,Green为绿色波段(0.5613μm)反射率。从图1的地物光谱特征中可以看出,绿色波段与近红外差值为正的只有水体,水体指数利用这一特点可以将影像中的水体区分出来。但在实际应用中,利用公式(3)来提取有较多建筑物背景的水体,效果不能达到预期,而改进的归一化差异水体指数MNDWI(Modified NDWI)可以很好地突破这一局限性:
式中,SWIR为短波红外波段(0.74~2.5μm)反射率。经过对不同类型的水体进行实验,从实验结果发现,MNDWI比NDWI更能够揭示水体微细特征,如悬浮沉积物的分布、水质的变化。另外,MNDWI可以很容易地区分阴影和水体,解决了水体提取中水体阴影造成的影响。
(3)归一化建筑指数:NDBI同样是利用归一化模型的原理,从建筑物的光谱特征出发,寻找最大差异的波段,并建立模型,其表达式如下:
该指数主要是利用短波红外和近红外之间的差异进行构建的,从图1中可以看出,建筑物的波段5(近红外)到波段6(短波红外)是呈上升趋势,而灌木林、森林对应波段为下降趋势,利用这一光谱特性,可以将一些具有明显建筑物特征的地物提取出来。但需要注意的是,建筑物的近红外与短波红外的差异并没有NDVI或MNDWI中的波段差异(反差)明显,仅仅采用NDBI>a,a∈(-1,1)提取城市建筑物的方法是不可靠的。因此,可以采用NDBI与NDVI做差值的方法剔除植被对建筑信息的干扰。以上内容是对各种归一化指数的基本信息的描述,本研究将综合上述3种指数在信息提取中的作用,并运用于研究区的建筑物信息提取中,需要解决以下问题:一是建设用地的土地利用类型属于人工建筑而天然形成,具有一定的复杂性,单一的NDBI阈值法无法准确提取建筑物信息,需要其他指数作为补充;二是城市地区土地利用被分类基本的几个类型:建筑物、植被和水体,根据归一化指数的阈值,还可以进行分类上的细化。
3 技术方法
3.1 研究区及数据源
广州市是华南地区的政治、经济、文化中心,近年来其城镇规模在不断地扩大,在中国城镇化进程中占有相当重要的地位。本研究选用广州市作为研究区,研究城市建筑信息的快速提取方法。研究区总面积7,434平方千米,建成区面积1,237.11平方千米。
图2 研究区示意图
研究区采用2015年11月29日过境的Landsat8 OLI(陆地成像仪)影像。影象质量良好,云量低于5%,研究区内无云层覆盖,空间参考为WGS1984大地坐标系,原始影像数据均为卫星接收的信号值(DN)需要经过辐射定标,转化为反射率或辐射亮度,图3为经过大气校正(辐射定标和FLAASH模型),并用广州市行政区划矢量数据进行掩膜处理的标准假彩色合成影像(RGB对应5、4、3波段)。
图3 研究区标准假彩色合成影像图
3.2 归一化指数的影像构建
根据目视解译,研究区被分为以下几个类型:高密度建筑物、低密度建筑、拆除建筑、裸土地、森林、灌木林、草地、河流、湖泊,各类型地物在Landsat8 OLI中对应波段的反射率和光谱特征如表1。从光谱的变化趋势来看,高密度建筑物、低密度建筑、拆除建筑和裸土地的光谱反射率变化趋势相同;森林和灌木林的变化趋势相同;河流和湖泊的光谱反射率变化趋势相同。因此,本研究将9类地物简化为3大类:植被、水体和建筑,在此基础上再进行分类的细化,以便提高后续信息提取过程中的数据处理效率。
表1 各类地物对应波段反射率
?
(1)SVAI参数L取值,本研究采用SAVI替代NDVI,原因主要有:一是在部分低植被覆盖地区,NDVI由于受土壤背景影响,容易成噪声,降低判别精度;二是SAVI的动态范围比NDVI更大,更容易检测出同地区内的植被区;三是SAVI的L参数具有可调整性,这使得SAVI的适用性高于NDVI。本研究分别对L=0.3,0.4,…,0.8的SAVI取值范围与NDVI进行比较,发现SVAI的动态范围(极差)在L取值为0.6时(SAVI4)最大,且在L为0.6是SAVI的变化范围比NDVI高出0.594,即88个灰度级(灰度范围是0~256),更多的灰度级意味着在植被区分上,SAVI比NDVI更具有优势。因此,本研究采用SAVI作为区分植被的归一化指数。
表2 SAVI与NDVI的取值范围及参数L取值比较
(2)MNDWI归一化指数:该指数是在NDWI指数的模型基础上,将模型中的近红外用短波红外替换得到的。MNDWI模型构建的原理在于,当水体中的固体颗粒或杂质增加时,反射率与波长的映射关系逐渐发生改变,即相同反射率的位置,对应的波长增加,换言之,在水体中杂质增多的情况下,短波红外比近红外更能够反映归一化指数中的差异。因此,本研究采用Landsat8 OLI的第3波段(Green)和第6波段(SWIR-1)作为参数,根据公式(4)构建MNDWI。
(3)NDBI归一化指数:在上文归一化指数分析中已对NDBI模型的基本信息进行了介绍,并阐述了该指数在建筑信息提取中存在的问题,即受到低值被覆盖背景的影响,反射率差异不明显的建筑物和植被覆盖地区难以区分,从而造成信息提取误差。所以,本研究采用NDBI与NDVI的差值作为组合,用于后续的建筑信息提取。
表3 三种归一化指数及指数
表4 三类地物的指数差值绝对值的对比
根据表3和表4可看出,NDBI-NDVI指数组合能够将建筑物的指数均值由0.15提升至0.21,同时植被覆盖区域的指数值从-0.02降至-0.12(表3),这能够有效地增强建筑物信息在植被覆盖背景下的显示,对建筑信息提取的精度提升有关键作用。从表4三类地物的指数差值绝对值的对比中,可以看出,采用NDBI-NDVI指数组合后,建筑物与植被的指数差值的绝对值由0.17提升至0.33,虽然植被与水体的差值的绝对值有所下降,但是MNDWI已经能够有效地将其区分,所以不会此处差值绝对值下降并不会增加水体分类的误差。同理,建筑物与水体差值的绝对值下降也不会对建筑信息提取造成影响。图4为缩放至栅格分辨率(30m)的影像图,包括a.标准假彩合成、b. MNDWI影像图、c. SAVI影像图和d. NDBI-NDVI影像图,其中b、c、d为灰度图,参照a中的地物可以看出,灰度图b中的水体呈高亮度(呈白色),可明显与周围的地物区分开来,因此,可采用阈值法进行区分,同样地,图c中的植被(参照a中的红色区域)也能够被区分出来,而d中的建筑物有一部分与植被区发生重合,难以区分,需要进行进一步的分析。
图4 缩放至栅格分辨率的多光谱及归一化指数影像图
3.3 建设用地信息分析与提取
针对图4,d中的建设用地与植被在归一化指数的值有交集,导致难以区分的问题,需要进一步的分析。由于建筑物的人工建造特性使其具有一定的光谱复杂性,通过光谱特征分析构造的单一指数影像或两个指数组合,已经不能满足建筑物信息的提取。本研究通过指数影像合成的方法,将MNDWI影像图、SAVI影像图和NDBI-NDVI影像图,从三个通道进行合成并且将其合成为单幅影像进行光谱曲线分析,为了使三个通道不出现信息冗余,需要进行相关性分析。从表5可知,NDBI-NDVI通道与其他通道的相关性较低或不相关,满足指数影像合成的条件,同时也降低了建筑物与背景地物发生混淆的程度。
表5 归一化指数相关性系数
现在需要用不同地物光谱间的差异分析来提取植被背景下的建筑物信息。根据目视解译的地物的像元,将三个指数影像在三大类(植被、水体、建筑物)地物的全色波段(Landsat8 OLI中的Pan波段)反射率进行对比,如图5所示。已知水体和植被之间有明显的划分,现在仅需要针对建筑物进行分析,可以看出,随着横坐标的增加,植被的反射率是单调递增,水体呈单调递减趋势,而建筑物的反射率在NDBI-NDVI处为极大值,随后则递减。因此,若进行栅格计算,判断某处像元是否为建筑物的逻辑表达式(用con函数表示)应该为:con(b2>b1,con(b2>b3,1,2),con(b2>b3,3,4))。式中,1表示建筑物;2表示植被;3表示其他地物;4表示水体;b1表示MNDWI;b2表示植被NDBI-NDVI;b3表示SAVI。分类结果如图6所示,已经通过广州市的行政区划矢量数据对结果进行掩膜处理,由于NDVI较容易区分植被,还可以通过阈值法对植被进行细分(植被分为灌木林和森林),根据目视解译,被分类为“其他”的地物属于介于建筑和稀疏植被之间的裸土地,所以在图6中注记为“裸土地”(用黄色表示)。
图5 三大类地物归一化指数在合成影像的光谱曲线
图6 广州市建筑物信息提取结果
4 精度验证
本研究采用随机抽样法对研究区进行精度验证。由于Landsat8 OLI的全色波段(Pan)的空间分辨率(15m)高于多光谱波段的空间分辨率(30m),可以该波段作为基准,将影像进行二值化后,进行空间配准,然后对每个样点的分类结果进行判断,本研究随机选取了100个样本点,经过异常值剔除,得到84各样点。在抽取的84个样点中,62个分为建筑物,其中,建筑物有56个正确分类,6个被错分类为非建筑,用户精度为90.32%;22个分为非建筑,其中19个正确分类,3个被错分类为建筑物,用户精度为86.36%,实验的总体精度为89.29%。
表6 精度验证
5 结束语
针对稀疏植被背景下,复杂建筑物信息提取困难的问题,本研究通过选取SAVI、MNDWI、NDBI指数,在区分出植被和水体这两大类土地利用类型的基础之上,将三者进行波段组合,得到新的影像,并根据其中三类地物(植被、水体、建筑物)的光谱差异特征,进行进一步分析,并做出基于逻辑判断的栅格计算,得到建筑信息提取结果,总体精度为89.29%,并得到结论:一是基于归一化指数的波谱间差异分析和逻辑判断的栅格计算,可以简化光谱分析过程,并快速、准确地获取建筑物信息,为土地科学的后需研究提供有效的数据支撑和城市信息分析结果;二是利用NDBI与NDVI的差异可以突出稀疏植被背景下的建筑物信息,但仍然需要根据实际情况确定阈值,在无法确定阈值的情况下,还需要构建归一化指数的波段合成影像进行波谱差异分析来进行建筑信息提取。