APP下载

复杂背景下水体提取方法适用性研究

2022-05-18高广旭武永斌卢小平周俊利

北京测绘 2022年4期
关键词:关系法反射率波段

高广旭 武永斌 卢小平 周俊利

(1. 河南理工大学 矿山空间信息技术自然资源部重点实验室, 河南 焦作454003;2. 河南省遥感测绘院, 河南 郑州450003)

0 引言

水是重要的自然资源,准确获取水体分布对国家资源管理和规划发展有重要意义[1]。水利设施作为一项重大工程,其空间分布和覆盖范围能直接影响库区周围生态环境和城市水环境。传统的水体提取以人工勾画边界为主,随着遥感数据的出现,其独特优势成为近年来水体提取的主要数据源,目前常用的遥感数据有Sentinel系列、Landsat系列和国产高分系列等。

目前水体提取研究由大范围水体提取转向小面积水体研究、由单一均匀背景转为复杂环境背景、由人工判定阈值到基于深度学习等算法的阈值自动识别。用于水体提取的遥感手段有很多,基于光学影像的方法主要分为4类:①基于光谱特性的提取方法,比如单波段法[2]、多波段谱间关系法[3]和水体指数法[4-9]。其中,水体指数因其形式简单和易使用的特点得到广泛应用。王小标等[10]结合低反射率地表,构建多波段水体指数(multi-band water index,MBWI),并与其他水体指数方法进行对比,表明新指数在复杂环境下水体提取精度有一定的提高;聂欣然等[11]提出的经验性归一化差异水体指数(empirical normalized difference water index, ENDWI),对建筑物和道路错误的精度提取有一定改善;屈慧慧等[12]结合改进的归一化差异水体指数(modified normalized difference water index,MNDWI)水体指数的提取优势,提出MNDWI+水体追踪识别方法,对湖区水体的提取精度可达97.5%;②基于纹理特征的提取方法,黄春龙等[13]利用影像灰度变化及纹理特征识别出无法通过波谱特征提取的信息,实现水系信息的自动提取;③基于分类的方法,李宇宸[14]提取云南千湖山细小冰湖,证明面向对象方法能有效剔除山体阴影,提取效果更好;④其他方法,陈前等[15]基于深度学习方法开展水体提取对比研究,卷积神经网络的提取精度高且适用性更好。

综上所述,本文以南湾水库为研究区,利用哨兵数据,基于各水体提取方法展开实验研究,通过对比水体提取效果,优选出最适宜的方法,为复杂背景下水体提取研究提供参考。

1 研究区概况及数据源

1.1 研究区概况

南湾水库作为一项大型水利工程,流域面积达1 100 km2,是信阳市区的重要水源。该区域具有复杂的气候环境,旱涝灾害频发。水库空间分布呈南北走向,形状类似树叶状,湾汊众多,因地势和人为开挖水田使水陆边界复杂曲折,周边有山体、水田和茂盛植被覆盖,利于水体提取方法的适用性研究。

1.2 数据来源及预处理

本研究采用Sentinel-2影像,获取时间为2021年3月28日。Sentinel-2是高分辨率多光谱成像卫星,双星飞行使重访周期缩短至5 d,有13个光谱波段,空间分辨率分别为10 m、20 m和60 m,本文以可见光波段、近红外波段和短波红外波段作为实验波段,表1为采用的Sentinel-2影像波段信息。

表1 Sentinel-2波段信息

2 提取原理及方法

河流湖泊一般不是纯水,多由透射入水的光与水中叶绿素、泥沙、水深等相互作用的结果,因此水体一般在遥感影像上呈现为绿色[16]。水体在蓝绿光波段对电磁波具有较强的反射率,在近红外波段的吸收率很高,而植被和土壤的电磁波吸收相对较小,反射率高于水体,因此在遥感手段中常用近红外波段构建水体提取模型。

2.1 单波段方法

单波段方法通常选择水体特征显著而其他地物相对不突出的波段作为水体提取特征波段。查看各波段水陆交界处的地表反射率,密度分割后目视选择并调整最佳的分割阈值,发现在NIR波段水体反射率较低,与其他地物的反射率有显著差异,将NIR波段作为单波段方法中的特征波段。

2.2 多波段谱间关系法

多波段谱间关系法综合多个波段信息来更精确地区分水体和非水体,通过分析统计直方图确定最佳阈值。在汪金花[4]的研究中,利用Landsat TM影像采用式(1)进行水体提取,证明了多波段谱间关系法提取水体效果总体较好,因此本文使用此表达式开展试验

(1)

式中,Green、Red、NIR、SWIR1分别对应Sentinel-2影像的绿光波段、红光波段、近红外波段和短波红外波段。

2.3 水体指数法

水体指数法是通过构建反射率相差大的波段间比值运算式,增强水体灰度值,来抑制非水体地物亮度值。常见的有归一化差异水体指数(normalized difference water index,NDWI)[5]、MNDWI[6]等,考虑研究区内有高层建筑、众多水田、茂盛的森林植被和山体等,选择以下6种水体指数模型:已有研究表明,NDWI能抑制植被信息,从而突出水体;MNDWI能有效抑制建筑物亮度,增大亮度反差来降低混淆程度;增强型水体指数(enhanced water index , EWI)可对植被、土壤、建成区进行较好的反射抑制;归一化差值池指数(Normalized difference pool index,NDPI)不仅可提取小型池塘和低于0.01 hm2的水体,还可区分水体与周围环境的植被信息;而自动水体提取指数(automated water extraction index,AWEIsh)适用于阴影区域的水体提取;阴影水体指数(shadow water index , SWI)能较好地区分水体和阴影,适用于山区水体提取。各水体指数如表2所示。

表2 水体指数模型

2.4 监督分类法

监督分类方法常通过人工勾选基于影像的样本或实地采样,经分析样本点光谱信息,利用分类方法对影像进行分类。本文采用随机森林算法,该算法实现简单,不容易陷入过拟合,目前被公认为一种稳定性好、精度高的机器学习方法。本实验参数采用ENVI 5.3软件随机森林算法默认值,对水体、建筑、植被和阴影进行采样,分类后输出水体作为最终结果。

3 结果与分析

3.1 水体指数图像

水体指数图像反映水体和其他地物的亮度对比程度。由实验结果可知,除SWI外,其余5种指数均有较好的亮度反差:EWI图像上水陆差异最为强烈,研究区内的细小河流和小面积水田均得到体现,其他地物亮度得到有效抑制;MNDWI、NDPI、AWEIsh图像反差程度次之;NDWI图像反差程度较好,但水库湾汊处水陆边界不明显;SWI图像水陆边界反差较好,但城镇亮度与水体相似程度高。其中,以EWI、MNDWI和SWI水体指数图像为例,如图1所示。

(a)EWI (b)MNDWI (c)SWI

3.2 水体指数提取结果

为突出南湾水库主体的提取效果,以水库为中心,选择覆盖水库的矩形边界作为研究范围,通过叠加分析剔除6种指数同时提取到的水田,保留误提区,该范围内地物丰富度与整个浉河区相似。分析提取结果可知,各指数对南湾水库提取的总体范围相似,但误提和漏提区域略有差异:NDWI提取范围小,部分深色水体未识别,少量误提区域集中在右上角城镇范围,水体连续性较差;MNDWI提取结果最好,水体保持有很好的连续性,但城镇内少量高层建筑被误提;EWI提取范围接近MNDWI,但连续性略差;NDPI提取范围略大,湾汊周围的部分陆地和山体植被被误提;AWEIsh提取范围也接近MNDWI,水体完整性和连续性较好,但城镇区误提较多;SWI城镇区误提最多。综合水体指数提取效果来看,以MNDWI提取结果最优,SWI提取结果最差。同样以EWI、MNDWI、SWI提取结果为例,如图2所示。

(a)EWI (b)MNDWI (c)SWI

3.3 方法间提取效果对比

单波段方法、多波段谱间关系法和随机森林算法的水体提取结果如图3所示。单波段阈值方法提取结果接近真实范围,但水体像元完整性较差,少量深色水体有漏提,城镇区域出现部分误提像元;在多波段谱间关系法提取结果中存在大量漏提,无城镇误提现象;而随机森林算法提取结果中不存在高反射率建筑及其阴影的误提,但整体提取面积略小于真实面积。

(a)单波段方法 (b)多波段谱间关系法 (c)随机森林算法

3.4 水体提取方法误差分析

结合GF-2和Sentinel 2影像对漏提和误提区域进行分析。水体漏提集中在水库边缘,该位置水体颜色呈现黑色;城镇区误提主要集中在高反射率的建筑群及水泥道路;山体阴影处也存在误提现象。

单波段方法误提区域集中在高层建筑阴影处,虽然水体在NIR波段的独特光谱特性使该方法提取效果较好,但异物同谱现象使得依靠单一波段信息来确定水体范围的精度降低;多波段谱间关系法存在大量水体漏提现象,虽获取更多波段信息来区分水体和非水体,但关系表达式和阈值需根据数据类型及研究区实际情况确定;水体指数法均存在不同程度误提和漏提现象,该方法对单一均匀区域水体提取简单且精度较高,但通常水体指数的构建考虑阴影、高反射率建筑等单一因素,在复杂的研究区背景下,指数形式和分割阈值的选择难以确定;随机森林算法表现在水库边缘处水体的漏提,而提取精度取决于样本丰富度及样本量,可增加易于区分水体的特征或指数参与随机森林算法的计算。

4 精度分析

将各方法提取结果与高分影像进行对比,最终以MNDWI准确提取结果作为标准结果,统计水体像元面积,若提取面积小于标准面积,则差值记为漏提面积;若提取面积大于标准面积,则差值与植被和城镇误提的面积共记为错提面积。

考虑到随机森林算法提取优势,增加补充实验:基于影像计算NDBI来减少建筑物对提取结果的影响,并与MNDWI和原始Sentinel影像的12个波段结合,共同参与随机森林算法的计算,统计结果如表3所示。就总体提取范围和精度而言,MNDWI水体指数方法以及结合NDBI和MNDWI的随机森林算法提取效果最佳,单波段方法次之,多波段谱间关系法提取效果最差。

表3 各方法提取面积及提取差异 单位:km2

5 结束语

本研究以Sentinel2影像为数据源,提取南湾水库水体面积,研究常规提取方法对复杂水环境的适用性,最终选用MNDWI水体指数方法和结合两种指数的随机森林算法作为最佳方法,分析几种方法的提取效果,整体而言对水库面积的提取结果都较为可靠,但提取精度仍需进一步改进。由于研究区环境复杂,高层建筑、建筑阴影和水库边缘处水体对水体提取结果造成不同程度的影响。在今后的研究中,可叠加高精度DEM数据或计算各地物纹理特征来减少阴影对提取结果的影响;同时针对分割阈值问题可考虑深度学习等方法解决人工选择的不确定性;在水体边缘出现的漏提取现象,可尝试面向对象分割方法,提取水体边界来减少水体漏提面积。

猜你喜欢

关系法反射率波段
春日暖阳
中华人民共和国对外关系法
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
“与台湾关系法”必输给反分裂国家法(社评)
化学腐蚀硅表面结构反射率影响因素的研究*
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
L波段雷达磁控管的使用与维护