基于GF-1 号遥感影像的微小水体信息提取研究
——以岔口流域为例
2021-04-10郑心玥郭青霞
郑心玥,郭青霞
(山西农业大学资源环境学院,山西 太谷 030801)
淤地坝是在水土流失较严重地区修建的以拦泥淤地为目的的建筑物,一条沟内修建多个淤地坝是中国黄土高原水土流失严重地区重要而独特的治沟工程体系。位于黄土高原沟壑区的岔口流域受水力侵蚀、重力侵蚀影响大,水土流失潜在风险大。为改善岔口小流域生态环境,自2003 年以来流域共修建了70 多座淤地坝,虽然淤地坝起到了拦泥淤地的作用,但因部分淤地坝排水设施不完善,积水排出不畅,改变了流域的水环境,也引发了土地盐碱化等生态环境问题,因此为该地区找到水体提取相对理想的方法,成为防范流域水土流失问题、进一步完善维护淤地坝、修复流域生态环境的关键环节。
基于卫星遥感技术,开展快速、准确的水体提取、获取其时空分布特征、直观显示动态变化和发展规律,是水体提取研究的重要方法[1]。国内外学者利用光学遥感技术进行水体信息提取时使用的数据源也多种多样,如MODIS 数据、Landsat 系列数据、Sentinel-2 数据、国产GF-1 数据等。目前依附于光学遥感影像进行水体信息的提取方法也呈现多样化趋势,分为以下两大类:(1)根据地物光谱特征的不同进行水体提取,主要机理是利用水体和其他地物在不同波段吸收、反射率的不同,将影像的不同波段进行组合,不断增强水体与其他地物间的光谱差异,以此突出水体信息,抑制非水体信息[2]。包括单波段阈值法、多波段普间关系法、水体指数法,其中水体指数法应用更为广泛。刘双童等[3]基于GF-2 号卫星影像对单波段阈值法及不同水体指数法提取的水体效果进行了对比分析。Gudina 等[4]在验证自动水体提取指数(Automated Water Extraction Index with no shadow,AWEIsh)的有效性时,发现具有高反射率的地表可能被错分为水。徐涵秋[5]在归一化水体指数(Normalized Difference Water Index,NDWI)的基础上对构成该指数的波长组合进行了修改,提出了改进的水体指数(Modified Normalized Difference Water Index,MNDWI),并取得了较好的水体提取效果。王小标等[6]以秦淮河流域为试验区,在水体、低反射率地表和其他地表纯净像元平均反射率基础上构建MBWI(Multi-Band Water Index)这个新的水体指数,并在不同环境下测试了该指数提取的准确度和适应性。(2)分类法,主要包括支持向量机(Sup⁃port Vector Machine,SVM)法、面向对象法和决策树法;SVM 法是影像中信息分类精度较高的方法,SVM 具有良好的空间维属性,Desheng 等[7]基于SVM构建的单时相迭代分类算法(Iterated Conditional Mode,ICM)可以同时提取分类和变化信息。面向对象的提取方法是通过影像分割技术,按一定尺度将影像分割成许多的图斑对象即影像的基本分析单元,然后利用模型进行水体提取,Herrera-Cruz 等[8]基于面向对象的方法,实现了两个不同区域的洪水淹没范围及快速制图,表明基于面向对象的方法在洪水监测和快速制图方面具有一定的潜力。决策树法是机器学习中的常用算法,它是一个树结构(二叉树或非二叉树),构造决策树的关键步骤是分裂属性,其中最著名的算法是ID3 系列。都金康等[9]利用SPOT 4 影像,采用决策树模型提取了山区水体信息并结合形状指数剔除了提取后的阴影。
尽管水体提取方法种类较多,应用较广,大多数方法也取得了相对理想的提取效果,但由于遥感影像的分辨率、研究区的地面特征等方面存在差异,同一方法也不可能适用于所有的情况,必须根据研究区域的特点、遥感影像特征等多方面进行综合研究探讨[10]。中国是一个多山的国家,这些地区地形起伏或植被覆盖程度较高,遥感影像中不可避免地存在一些阴影,一些地区还存在或多或少的变形,这些因素都会对水体的提取造成困扰[11]。黄土高原地区土地利用类型较为单一,以裸地、农用地为主,地势起伏较大,从遥感影像看,影像中沟壑阴影较多,此外,该地区水体以微小水体为主,微小水体是水系的毛细血管,一般具有汇水面积小、周边空间封闭、水体流动性差、分布零散、管理监督易被忽视的特点。地处黄土高原沟壑区的岔口流域水库面积与坝地汇水面积均较小,呈细条状,由于淤地坝的存在坝地水体并不是大面积连片分布,而是断断续续分布在沟内,同时水中泥沙含量较大,导致水体的光谱信息减弱,水体提取尤其是坝地水体提取难度相比其他地区要大得多。程磊等[12]以Landsat TM 遥感影像为数据源运用单波段阈值法、NDWI、CIW、MND⁃WI 4 种方法对黄土高原固原市周边坝地水体进行了提取研究,结果表明由于黄土高原识别水体具有较大的复杂性,使用的遥感影像分辨率不高,以上4种方法提取精度均不高。因此有必要进一步研究不同遥感影像下黄土高原水体提取的方法,为坝系的完善和生态环境的修复提供合理建议。
随着中国卫星遥感技术的快速发展,卫星遥感影像的分辨率得到了较大提升,将国产高分辨率影像作为基础数据进行小流域微小水体或其他地类信息提取的探讨具有前沿性。本研究选取2016 年9 月1 日GF-1 号国产卫星遥感影像作为数据源,选择位于黄土高原沟壑区的岔口流域作为研究区,分别采用NDWI、SWI 决策树、SVM 支持向量机3 种不同的方法对水体进行提取研究,并对提取效果进行对比探讨,为流域淤地坝水体的提取提供建议,为流域水体动态监测提供技术支持。
1 研究区概况
岔口流域地处山西省西南部黄土丘陵沟壑区,是永和、隰县与石楼三县接壤地带(图1),位于东经110°38'01″—110°50'02″,北纬36°47'26″—36°57'14″。流域总面积131.9 km2。流域汛期为6—9 月。水力侵蚀和重力侵蚀是主要侵蚀形式,水土流失面积达113.0 km2。流域内梁峁起伏,沟壑纵横,地形复杂,具有黄土侵蚀沟道发育的特点,坝系工程是治理流域水土流失的主要方式,2003 年坝系工程建设以来新建淤地坝70 座,形成了较为完整的坝系。流域内水体以坝地水体和水库为主,其主要特点是水体面积小、其他地物阴影干扰严重等。
图1 研究区遥感影像
2 数据来源及预处理
2.1 数据及来源
高分一号(GF-1)卫星是中国高分辨率对地观测系统的第一颗卫星,它搭载了两台2 m 全色、8 m多光谱分辨率相机,四台16 m 分辨率多光谱相机,回归周期4 d,具有高时空分辨率。本研究选用的GF-1 号卫星遥感影像,数据来源于中国资源卫星应用中心,成像时间是2016 年9 月1 日(此时流域处于汛期,水量相对充足),无云覆盖,轨道圈号18061,传感器类型PMS2,传感器参数如表1 所示。
表1 GF-1 卫星PMS2 传感器参数
2.2 数据预处理
为保证水体提取结果的准确度,利用ENVI 5.3对GF-1 号影像数据进行了预处理,主要包括多光谱数据的辐射定标、大气校正、正射校正、研究区裁剪,全色数据的辐射定标、正射校正、研究区裁剪,最后将空间分辨率为2 m 的全色数据与空间分辨率为8 m 的多光谱数据进行影像融合和影像细节信息增强。
3 研究方法
3.1 地物光谱特性分析
对比研究区3 种地物光谱曲线,发现水体的反射率总体较低,并且在近红外波段(B4)与亮色地物反射率形成了较大的反差,因此可利用在近红外波段二者反射率差异区分亮色地物与水体;而水体与阴影反射率差异较小,并在红外波段(B3)两者出现了相交点,容易造成阴影被误提成水体的现象,从而导致提取结果不准确。进一步观察水体和阴影的反射曲线,看出在蓝波段(B1)、绿波段(B2)水体反射率下降较缓慢,而阴影反射率呈现更为明显的下降趋势,两者反射率形成了一定差异(图2),因此可利用该特点进行阴影与水体的区分。
图2 研究区地物光谱曲线
3.2 水体信息提取方法
3.2.1 NDWI 提取 归一化水体指数NDWI 由Mcfeeters[13]在1996 年提出,并基于MODIS 数据,通过分析植被与水体的光谱特征,对影像的绿波段与近红外波段进行一系列运算而构建的一个水体指数模型,该模型最大程度地突出水体信息,抑制植被信息[14]。基于模型的波段运算特征,构建NDWI 计算公式如下。
式中,B2 为GF-1 号影像第2 波段即绿波段反射值,B4 为GF-1 号影像第4 波段即近红外波段反射值。为将流域的水体更准确地提取出来,经多次试验,选取适合流域的最佳阈值0.2,利用Band Math工具进行运算。
3.2.2 SWI 决策树提取 阴影水体指数模型SWI 是陈文倩等[15]在研究水体提取方法时,为将阴影与水体最大程度的区分开构建的模型,该模型运算首先基于决策树分析方法,依据近红外波段阈值将亮色、暗色地物区分开来,避免建筑物对水体提取的影响,再对SWI指数确定一个合适阈值将阴影与水体进行区分。根据该模型建模运行机理,构建的SWI 计算公式如下:
式中,B1 代表GF-1 影像的第1 波段蓝波段反射值,B2 代表GF-1 影像的第2 波段绿波段反射值,B4 代表影像的第4 波段近红外波段反射值。但只靠SWI 模型进行水体提取存在错提现象,常把亮色地物错分为水。为使提取结果更可靠,本研究采用新的SWI 决策树模型[15](图3),首先依据近红外波段阈值将亮色地物与水体区分开来,在近红外波段中,本研究区水体亮度最大值是930,阴影亮度最大值是1 080,为最大程度将水体提取出来本研究将阈值设定为1 080,再对SWI 指数确定一个合适阈值将阴影与水体区分开来。经多次试验并结合其他学者的研究结果,最终确定的适用于岔口流域的区分阴影与水体的最佳阈值C 为700[16]。
图3 SWI决策树水体提取模型
3.2.3 SVM 支持向量机法 支持向量机分类是一种建立在统计学习理论基础上的机器学习方法。SVM 分类通常是运用有限样本进行2 种类型的划分,以寻找现有信息的最优分类。虽然针对高光谱影像使用SVM 对影像信息进行分类已经非常成熟,但是针对高空间分辨率的影像,SVM 分类方法的使用与研究还较少。SVM 性能的优劣,主要取决于核函数类型的选择和核函数参数设置,参照殷秋亚等[17]的研究,手动选择好水体、非水体样本,再选取SVM 分类中的RBF 函数进行水体、非水体的划分。
3.3 精度评价方法
首先,使用定性、定量评价的方法进行提取结果的对比验证。利用高分辨率遥感影像统计的水体面积与3 种方法分别提取得到的水体面积进行对比,并结合视觉效果进行分析评价。其次,利用混淆矩阵计算出制图精度、漏分误差、错分误差来评价不同方法水体提取结果。最后通过实地调研验证了提取结果的可靠性。
4 结果与分析
图4 研究区水体提取结果
图5 具有代表性的研究区
研究区水体提取结果见图4。对比3 个提取结果可以看出,3 种方法都能将流域中的坝地水体进行提取(白色为水体),其中大面积块状水体很少,大部分坝地水体随淤地坝星星点点分布在流域。虽然选择了流域汛期的影像,水量相对较大,但是由于岔口流域沟壑纵横,坝地水体细小,水面浅,水陆交界处常有裸土过渡,提取时容易受混合像元的影响,从整幅图入手对水体提取的漏提、误提现象分析并不精确,因此研究选取流域3 个具有代表性的区域(图5),区域一(坝地水体)、区域二(水库)、区域三(坝地水体)进行了水体提取结果的细节分析,2 个区域中包含了流域水体提取的影响因素亮色地物、裸地、阴影、建筑物。结果表明,区域一是一块较为明显的坝地水体及其周围的地区,从影像中可以看出水体为细长条状,面积较小,水体周围有两块明显的亮色地物,水体界限与陆地界限不清,由于水体位于坝地中,水体边界还存有明显的山体阴影和小部分裸土。区域一3 种方法提取水体的结果见表2,区域一水体面积见表3。从表2 可以看出,3 种方法均能将坝地水体提取出来,但是提取结果存在明显的差异。对比表3 中3 种方法的水体提取面积,提取的面积与高分辨率影像统计的面积分别相差208(NDWI 法)、61(SWI 决策树法)、118 m2(SVM 法),SWI 决策树提取的水体面积更接近从遥感影像中统计的水体面积,说明对该区域来说,SWI 方法提取效果优于其他2 种方法。从影像中可以明显看到区域一中存在两处亮色地物,使用NDWI 进行提取时,两处亮色地物均被当作水体误提出来,SWI 决策树与SVM 方法很好地分辨出了亮色地物与水体。对水体形状进一步观察,水体呈细条状,上窄下宽,对比3 种提取结果,NDWI 提取出的水体上下宽度几乎接近,形状与真实水体差异较大,而后2 种方法提取的水体形状更接近水体真实形状。影像中可以看到水体上半部分的右边与陆地交界处水面较浅存在部分裸土过渡,而且由于淤地坝位于沟内,提取时水体边界易受山体阴影影响,使得水陆界限不清晰,NDWI、SVM 方法均将阴影错提成了水体,不能将阴影与水体区分开,但SWI决策树能更好地区分阴影与水体,水体界限明确。由于受混合像元的影响,不同方法的提取结果和利用遥感影像统计的水体面积存在微小的差别。
表3 区域一水体提取面积
区域二是流域中某个由淤地坝拦截形成的水库及周边地区,水库形状规则,水体分布较为连续,面积也相对较大,影像中包含有阴影、亮色地物(包括建筑物)等影响因素。3 种方法提取结果见表4,提取的水体面积见表5。从影像中可以看到该区域共有大小不等的4 块水域,对比表5 中3 种方法的水体提取面积,与高分辨率影像统计的面积分别相差431(NDWI 法)、71(SWI 决 策 树 法)、186 m2(SVM法),SWI 决策树提取的水体面积更接近从遥感影像中统计的水体面积,其中NDWI 方法提取的水体面积与影像中水体面积相差最大,通过表4 也可以看到NDWI 提取出的水体存在明显的错误,这是因为除了将水库旁边的亮色地物误提,还将影像右下角的大片呈现亮色的建筑物(村落)也提取出来,同时混淆了水体与阴影,部分水体当成阴影从而导致漏提,部分阴影当作水体错提出来,提取的水体形状、大小都与影像中的水体存在明显差异。而SVM、SWI 2 种方法排除了亮色地物的影响,提取后的水体形状、大小更接近于影像中水体的样子,同时SWI决策树也能够将阴影与水体更好地分开,对于边界提取相对准确,提取出的面积与影像中统计得到的水体面积差异最小。
表4 区域二提取结果对比
表5 区域二水体提取面积
区域三是2 块较为明显的坝地水体及其周围的地区,从影像中可以看出水体为细长条状,面积较小,水体东部无规则分布有大面积的裸地。影像提取结果见表6,提取的水体面积见表7。从提取结果可以看出,在区域三影像中可以清晰地看到该区域共有较明显的2 块水域,3 种方法2 块水体均能按其形状被提取出来;但在影像右上方存在一处明显的亮色地物,3 种方法均将其当作水体进行了误提,SWI 决策树提取的亮色地物面积最小,利用NDWI方法进行提取时除了将右上角亮色地物误提成水外还将其他处的亮色地物也提取出来。对比3 种方法下提取的水体面积与高分辨率影像统计的面积差分别为78(NDWI 法)、19(SWI 决策树法)、42 m2(SVM法),SWI 决策树提取的水体面积更接近从遥感影像中统计的水体面积,其中NDWI 方法提取的水体面积与影像中水体面积相差最大。
对以上两个区域在不同方法下的提取结果以混淆矩阵的方式进行精度检验,结果如表8 所示。其中制图精度等于被正确分类的像元数除以总像元数,漏分误差是指本该分到某一类中却没有分到的像元数,错分误差是指本不该分到某一类中却被分到某一类中的像元数。从漏分误差上看,在3 个小区域中,NDWI 的漏分误差都是最高的;在区域一中SVM 方法的漏分误差最小,区域三中SVM 与SWI 决策树的漏分误差几乎接近;3 种方法中SVM 决策树漏分误差相比更小。从错分误差上看,NDWI 方法提取后的错分误差在3 种方法中仍然是最大的,而SWI的错分误差相对最小。从制图精度上看,3 个区域中NDWI 的制图精度都是最低的,SWI 决策树与SVM 近乎持平,SWI 决策树方法精度相对较高。从3 个区域提取效果整体来看,无论是漏分误差、错分误差还是制图精度,区域一的误差都比其他两个区域小,主要原因是区域一中块状水体少,水体面积相对较小,影像中包含的干扰信息相对较少,所以误差相对较小。
表6 区域三提取结果对比
表7 区域三水体提取面积
综合分析各种方法的提取结果,GF-1 号影像空间分辨率较高,因此无论哪种方式进行水体提取精度都较好。3 种方式相比较而言,NDWI 方法制图精度最低,在坝地水体的识别中,常把亮色地物、建筑物与水体混淆,造成错分或漏分。SVM 与SWI 决策树制图精度大致相同,但是SVM 有一个局限性,即它的分类对象是有限个样本,当样本很大时,就不适合使用该方法。淤地坝内常会因积水排出不畅等多种原因导致土地发生盐碱化,盐碱地在影像中多以白色、亮色呈现,进行水体提取时易造成干扰,而SWI 决策树法不仅能将亮色地物、建筑物同水体区分开,还能较好地排除阴影的干扰,这对流域中微小水体的提取是一个不错的选择。
表8 精度检验结果
5 小结
以2016 年9 月1 日高分辨率影像GF-1 PMS2 影像为数据源,选择山西省淤地坝数量较多、水土流失较严重、水体以坝地水体为主,水体微小并且分布不连片的地区岔口流域作为研究对象,运用NDWI、SWI 决策树、SVM 3 种不同的提取方法进行流域水体信息的提取,并对提取结果进行了视觉效果对比与提取精度评价,试图找到适合于该地区水体提取的方法,为流域淤地坝水体监测、淤地坝的完善与管理提供技术支持。所得结论如下。
1)黄土高原地势沟壑纵横,水体微小,与程磊等[12]的研究相比较,中低分辨率的影像已经不适于提取黄土高原地区的水体,高分辨率的遥感影像对于山区微小水体的提取结果更好,精度更高,可运用GF-1 影像进行流域水体的监测,其监测结果可成为日后淤地坝等大型骨干工程管理、维护的重要数据。
2)通过对区域一、区域二、区域三的细节分析可知,影响流域水体提取的主要因素是亮色地物(包括建筑物)、阴影。
3)3 种方法都能够提取水体信息,由于受影像中混合像元的影响,3 种方法提取的水体面积与从高分辨率影像中统计得到的水体面积难免存在微小差别。相比较而言,NDWI 方式提取的水体信息较弱,提取的水体中混杂了亮色地物、阴影等干扰因素,这与王大钊等[18]研究结果一致。SVM 法精度较高,对比其他学者的研究,如殷秋亚等[17]选择SVM法进行水体提取同样得到了较高精度;SWI 决策树法不但消除了建筑物、亮色地物的影响,而且很明显地区分了阴影与水体,这与刘双童等[3]的研究结论一致。总体认为SVM、SWI 决策树都适合提取黄土高原丘陵沟壑区的流域水体,但是SWI 决策树方法提取的水体边界更加准确。