黄河流域内陆地表水体提取方法研究

2017-06-05李文苹王旭红李天文毛文婷

水土保持通报 2017年2期

关键词：黄河流域波段水体

李文苹, 王旭红, 李天文, 毛文婷, 姚磊

(西北大学城市与环境学院, 陕西西安 710127)

黄河流域内陆地表水体提取方法研究

李文苹, 王旭红, 李天文, 毛文婷, 姚磊

(西北大学城市与环境学院, 陕西西安 710127)

[目的] 对黄河流域内陆地表水体提取方法进行对比分析，为有效提取含沙量大的黄河流域水体提供方法指导。 [方法] 采用目前提取水体效果较好的两种方法——改进的水体指数法(MNDWI)和线性光谱混合模型(LSMM)，以Landsat 8 OLI数据为例，选择黄河流域水库、湿地、湖泊和河流作为研究对象，将其划分为2大类，即水体和非水体，利用高分辨率影像进行精度分析，研究两种方法的区域适应性。 [结果] (1) 利用线性光谱混合模型在提取水库、湿地和湖泊比改进的水体指数模型精度更高； (2) 利用这2种方法在提取面积较大、分布集中的水体比提取细长型分布的线状河流效果更好。 [结论] 混合像元在高分辨率的影像中也是存在的，在水体提取的时候，利用线性光谱混合模型考虑了混合像元对水体提取的影响，极大提高了精度，试验证明线性光谱混合模型优于改进的水体指数法。

黄河流域; 提取方法; 水体

文献参数：李文苹, 王旭红, 李天文, 等.黄河流域内陆地表水体提取方法研究[J].水土保持通报，2017,37(2)：158-165.DOI:10.13961/j.cnki.stbctb.2017.02.024； Li Wenping, Wang Xuhong, Li Tianwen, et al. Extraction Method of Spectral Information of Inland Surface Water Body in Yellow River Basin[J]. Bulletin of Soil and Water Conservation, 2017,37(2)：158-165.DOI:10.13961/j.cnki.stbctb.2017.02.024

地表水主要指的是河流、冰川、湖泊、沼泽4种水体，是人类及一切生物赖以生存发展所必须的资源之一，也是地球上淡水水资源的主要组成部分，在维系流域生态平衡、满足生产生活用水等方面起着不可替代的作用[1-2]。水体面积变化可以表征地表水受气候变化和人类活动影响程度，快速准确地提取水体面积，准确把握地表水的空间分布状态，对水文研究、水资源管理研究等等，都具有重要的现实意义[3]。传统的水体提取方法多数是基于大比例尺测绘完成的，这种方法不仅耗时耗力，而且宏观、连续、实时监测水体效果差，很难满足时空方面的要求[4]。遥感技术具有宏观、动态、低成本等特点，利用遥感影像快速准确地提取水体信息，不但可以准确把握黄河流域水体的空间分布状态、变化趋势，而且对水资源调查、流域综合治理、水利规划、洪水监测和灾害评估及水资源管理、保护等都具有重要的意义，已经成为必不可少的手段之一[5-7]。

黄河发源于青藏高原、流经黄土高原和华北平原，该流域属于干旱、半干旱和半湿润气候，水资源量先天不足；同时由于气候逐渐变暖和人类活动的影响，黄河流域水体显示出逐渐减少的趋势，甚至在黄河流域的下游出现了断流现象[8-9]。利用遥感手段提取水体信息，主要是利用水体与其它地物光谱等信息的差异，通过影像不同波段的排列组合，不断的扩大水体与其它地物的差异，增强水体信息，抑制非水体信息[10]。由于黄河流域的水体含沙量大，其光谱反射率与清澈水体略有差别，清澈水体在可见光波段反射率为：Blue>Green>Red，在近红外和短波红外，其反射率几乎为零；但黄河流域水体含有的大量泥沙，其反射率会比清澈水体的反射率略高，易与低反照率，如山体，建筑物和阴影等背景地物相混淆，这影响水体提取的精度。目前，用于提取水体信息的遥感影像主要分为两类：光学遥感和微波遥感。由于光学遥感数据易获取、易处理，在探测和识别地表水水域时得到了广泛的应用，很多学者利用不同的光学遥感影像和水体提取方法进行地表水体信息的提取。如陆家驹等[11]利用Landsat TM影像红外波段识别水体，并指出该方法主要适用于4 000 m2以上的水体区域，但会存在阴影部分。周成虎等[12]发现水体具有DNG+DNB>DNIR+DNSWIR的特点，提出了基于水体光谱知识的AVHRR影像水体自动提取技术，它与单波段阈值法相比，精度有所提高，但易受到裸土、高山阴影区等混合像元信息的干扰。Mcfeeters[13]利用Landsat MSS影像进行水体提取，提出的归一化差异水体指数(NDWI)，可以较好消除山体阴影，但提取的水体容易和建筑物相混淆。徐涵秋[14]为弥补NDWI的不足，提出了修正的归一化差异水体指数(MNDWI)，适用于城镇地区的水体提取。丁凤[15]构建了新型水体指数(NWI)，同时运用了Landsat TM影像的蓝波段、近红外和中红外等波段，可以消除部分由大气和地形带来的影响。上述方法没有考虑到混合像元，混合像元问题无论影像分辨率多高，都是客观存在的，尤其是中低分辨率的影像，它不仅影响地物识别和分类、提取的精度，在定量遥感中是必须解决的关键问题。混合像元分解模型可以在一定程度上解决这一问题，提高分类、提取的精度。张晗等[16]利用混合像元线性分解方法对武汉市湖泊面积变化进行监测，发现此方法比传统的基于像元的方法，精度更高。本研究利用Landsat 8 OLI数据，以含沙量大的黄河流域不同水体类型为对象，以高分辨率遥感影像作为参考依据，将基于像元的水体提取方法(MNDWI)和基于亚像元的水体提取方法(LSMM)进行对比分析，比较两种方法所提取面积之间的差异以及在不同水体类型的区域适应性，为有效提取含沙量大的黄河流域水体提供方法指导。

1 研究区与数据预处理

1.1 研究区概况

研究区选择黄河流域不同类型的水体，主要包括： (1) 位于渭河支流千河下游的陈仓、凤翔、千阳县3县交界处的冯家山水库，它对陕西省关中地区蓄水工作起着不可替代的作用，距千河干流河口25 km，控制流域面积3 232.5 km2，占全流域面积的92.6%，多年平均输沙量4.69×106t，灌区位于渭北高塬，呈矩形状，东西长约80 km，南北宽约18 km，具有调控水量、农业灌溉、预防旱灾等功能。 (2) 红碱淖，属高原性内陆湖，湖泊面积较大，不仅在陕西省排名靠前，也是中国最大的沙漠淡水湖，具有重要的参观与旅游意义，被列入国家重要湿地，评为4 A级景区。湖岸线长43.7 km，湖面大致呈三角形状，目前，红碱淖的水位下降速度较快，20～30 cm/a，水域面积从1996年的67 km2缩小到现在的33.4 km2，同时面临着水质不断恶化的情况。 (3) 龙门区域的河流，位于秦晋大峡谷之中，龙门宽约80 m，形状似闸口，扼黄河咽喉，水流湍急，平均海拔948 m，水域周围含有大量的泥沙； (4) 沙湖，位于贺兰山脚下、黄河边部，总面积为80.10 km2，其中包括22.52 km2的沙漠与45 km2的水域毗邻而居，构成了西部罕有的沙漠湿地特色景观，被列为国家5A级景区。研究区域的具体情况详见表1。

1.2 数据源及预处理

Landsat 8卫星由美国国家航空航天局(NASA)发射于2013年，搭载了陆地成像仪(operational land imager, OLI)和热红外传感器(thermal infrared sensor, TIRS)2种传感器，其中OLI陆地成像仪包括9个波段，空间分辨率为30 m，其中包括一个15 m的全色波段。与Landsat7卫星的ETM+传感器相比，OLI增加了一个蓝色波段(band1,0.433～0.453 μm)和一个短波红外波段(band9,1.360～1.390 μm)，蓝色波段主要用于海岸带观测，短波红外波段包括水汽强吸收特征，可用于云检测。TIRS是有史以来最先进，性能最好的热红外传感器，TIRS将收集地球热量流失，目标是了解所观测地带水分消耗，特别是干旱地区水分消耗。

表1 研究区域的基本情况

本次研究所使用的数据都是经过系统辐射校正和几何校正的Landsat8 OLI的L1T级别数据。4景影像获取时间分别为： (1) 冯家山水库。2014年3月15日(行列号128/36)； (2) 红碱淖。2014年7月30日(行列号127/33)； (3) 龙门区域。2014年5月20日(行列号126/35)； (4) 沙湖。2014年7月28日(行列号129/33)，选用近红外波段Band5，短波红外波段Band6，红波段Band4合成可以增强显示效果，突出水/陆的差异性，以便更好地提取水体。

数据预处理主要包括：影像融合、大气校正、研究区裁剪、几何配准。运用Gram-Schmidt融合法(简称GS变换)将30 m分辨率的多光谱数据和15 m分辨率的全色波段数据进行融合得到15 m分辨率的多光谱数据，提高影像的空间分辨率，增强影像空间细节信息；然后进行FLAASH大气校正，以消除大气传输过程的影响，裁剪研究区域。验证数据使用QuickBird高分辨率影像，利用二次多项式模型，将其与Landsat8融合后数据进行几何配准，配准总的均方根误差小于0.5个像元。

2 水体提取的方法与比较

2.1 MNDWI阈值法

徐涵秋提出了改进的归一化差异水体指数(MNDWI)比归一化水体指数(NDWI)更能够揭示水体微细特征，如悬浮沉积物的分布、水质的变化。另外，MNDWI可以有效识别阴影信息对水体的影响，解决了水体提取中难消除阴影的难题。

改进的归一化差异水体指数公式为[17]：

MNDWI =(Green-SWIR)/(Green+SWIR)

在Landsat 8 OLI中有2个SWIR波段，分别是SWIR1(Band 6)和SWIR2(Band 7)，Zhiqiang Du等[18]基于Landsat 8 OLI影像进行地表水提取，分别比较了NDWI(band 3，5)，MNDWI(band 3，6)，MNDWI(band 3，7)这3种水体指数提取地表水的精度，得出MNDWI(band 3，6)比其他2种水体指数方法精度更高，效果更好。鉴此，选用MNDWI(band 3，6)来对研究区进行地表水提取，为了更好地突出水体信息，抑制其他背景的影响，在此基础上确定一个阈值。阈值根据灰度直方图来确定，水体像元和周围背景像元的灰度值差异较大，因此图像的灰度直方图呈双峰分布，运用大津法(Otsu法)[19]，即最大类间方差法来首先确定最小和最大灰度值这一范围，然后确定水体像元数和背景像元数和各自平均值，再计算两类间的方差，找出方差最大的作为阈值，如图1所示。冯家山水库、沙湖、红碱淖、龙门区域河流确定的阈值分别是0.164 3，0.339 5，0.302 7，0.236 7。这里需要说明的是在龙门样区其直方图呈单峰分布，主要是因为龙门区域河流呈狭窄细长型，流经周围泥沙含水量较大，河流与周围灰度差异较小，而且龙门区域的河流与其周围背景面积相差悬殊，该阈值的选取不能使用Otsu法，应该在直方图的“肩部”确定一个位置，再用循环分解法进行分割，确定最佳阈值。最佳阈值的确定很好地抑制了非水体的影响，便于更好地将水体提取出来。

2.2 基于混合像元分解模型进行水体的提取

混合像元是指不同类型的地物存在一个像元内，主要出现在地类的边界处。由于混合像元的存在使得影像识别分类精度不够精确，特别是对线状地类和细小地物的分类识别影响较为突出。线性光谱混合模型是混合像元分解常用的方法，是指像元在某一波段的反射率由端元组分反射率和其丰度的线性组合。端元是相当于像元中的亚像元，只包含一种地物的光谱信息。丰度是各端元在混合像元中的比例。线性分解模型公式[20]为：

(1)

式中：Rb——像元在波段b的反射率;n——端元的数目;fi——第i端元的丰度;Rib——第i端元在波段b的反射率;eb——残差项。其中，fi须满足如下约束条件：

(2)

评价模型用残差ei或均方根误差(RMSE)来衡量，也可以用混淆矩阵来评价其精度，陈利[21]利用混合像元分解法进行的MODIS森林类型识别研究中，其精度评价采用的是混淆矩阵。

图1 利用Otsu确定研究区的阈值

本文将研究区的基本组分分为2大类： (1) 低反照度的物体，主要指水体； (2) 高反照度的物体，主要指研究区的水泥道路及屋顶等建筑用地还有绿色植被以及裸土地，作为非水体组分。首先对预处理后的研究区影像先进行最小噪声分离，用于判断图像数据维数、分离数据中的噪声，减少后处理中的计算量；再对最小噪声分离的影像计算纯净像元指数，利用优化指数OIF方法[22]计算最佳波段组合Band2，Band4，Band5显示最小噪声分类的影像，然后通过二维散点图选取水体端元和非水体端元，用线性光谱混合模型得到丰度图像，根据丰度图像，设定丰度大于0.5的像元为水体端元，得到水体与非水体的分类图。

3 结果与分析

3.1 水体提取结果

根据图2，可以发现设定阈值〔冯家山水库(0.164 3)，沙湖(0.339 5)，红碱淖(0.302 7)，龙门区域河流(0.236 7)〕提取的水体效果更好，更加明显，更好地抑制了周围其他地物的干扰。

如图3，利用线性光谱混合模型得到丰度图像，根据丰度图像，设定丰度大于0.5的像元为水体端元，得到水体与非水体的分类图(图3)。根据图3可以得出，混合像元分解模型在水体边界和支流部分提取的效果更好。

3.2 不同方法提取结果比较

分别采用定性和定量的方法，比较利用MNDWI和LSMM方法提取水体的面积和高分辨率的影像统计的水体面积进行对比(表2)。再利用混淆矩阵计算出制图精度、用户精度、漏分误差、错分误差和kappa系数[23]来评价提取水体的质量，如表3—4，分别是利用改进的水体指数和线性的混合像元分解的方法，以高分辨率的影像为参照，来分析4个研究区水体提取的精度。

由表2数据可见，通过2种方法提取水体面积和高分辨率影像统计面积进行比较，可以发现利用LSMM提取水体面积比MNDWI更接近高分辨率影像统计的面积，效果更好。在冯家山水库研究区，利用LSMM提取的水体面积是15.31 km2，MNDWI提取的水体面积是15.14 km2，高分辨率影像统计的水体面积是15.37 km2，说明LSMM法所提取的结果更准确一些。在沙湖区，利用LSMM提取的水体面积是78.73 km2，MNDWI提取的水体面积是78.68 km2，高分辨率影像统计的水体面积是79.90 km2，说明LSMM法优于MNDWI，但是由于沙湖周围含有大量的泥沙，边界不是特别明显，存在大量的混合像元，在加上影像的分辨率之间的差异，导致提取的结果和高分辨率影像实际统计的面积有微小差别。在红碱淖研究区，利用LSMM提取的水体面积是31.97 km2，MNDWI提取的水体面积是31.96 km2，高分辨率影像统计的水体面积是32.15 km2，说明LSMM法和MNDWI提取的结果差别不大，且和实际面积也比较接近。在提取龙门区域的河流，LSMM提取的结果是77.06 km2，MNDWI提取的结果是76.98 km2，统计的面积是77.24 km2，说明LSMM提取的结果更接近实际面积，优于MNDWI法。总体而言，由于在黄河流域的水体含沙量较多，存在大量混合像元的问题，MNDWI法没有考虑混合像元的影响，而利用LSMM法可以很好地避免这一问题，LSMM法包含了更多水体信息，其水体识别精度高于MNDWI法。

图2 MNDWI直接提取与MNDWI确定阈值提取水体比较

图3 基于混合像元分解模型提取水体分类结果

表2 不同方法提取的水体面积比较

表3 比较改进的水体指数法和高精度影像的分类精度

表4 比较混合像元分解模型与高精度影像分类精度

通过比较表3和表4，可以发现利用线性光谱混合模型提取的人工水域冯家山水库、含沙量大的沙湖、红碱淖湿地和龙门区域的河流的Kappa系数分别为0.953 4，0.867 2，0.986 8和0.535 5，而利用改进的水体指数的方法提取的冯家山水库、沙湖、红碱淖和龙门区域的Kappa系数分别为0.931 0，0.835 2，0.963 8和0.587 5，说明线性光谱混合模型在提取冯家山水库、沙湖、红碱淖比改进的水体指数模型方法较高，更接近高分辨率影像提取的水体面积，主要是由于这3个研究区水域集中分布，形状比较规则，离散分布的水体几乎没有，再加上与周围非水体区域差异显著，因此，提取精度较高；而在龙门区域相反，主要是由于龙门区域河流呈细长型，比较破碎，周围主要为含水量大的泥沙，二者差异较小，存在复杂的混合像元，混合像元特别是对线状地类和细小地物的分类识别影响较为突出。利用改进的水体指数和混合像元分解模型这两种方法提取的湖泊和水库比细小河流效果较好，但对细小河流提取，改进的水体指数方法优于混合像元分解模型，主要是由于河流本身形状比较破碎，再加上周围地物类型复杂，虽然运用混合像元分解模型可以减少混合像元存在的误差，但是可能出现混合像元分解错误的发生，导致结果没有改进的水体指数法效果更好。

4 讨论与结论

(1) 利用线性光谱混合模型和改进的水体指数法2种方法，一种是基于亚像元的方法，一种是基于像元的一种方法；一种属于软分类，一种属于硬分类，如何将这两种方法进行对比，能不能对比，用什么方法来进行评价，本研究对此做了探讨。分析结果表明，两种方法可以进行比较分析，运用混淆矩阵可以进行精度评价。

(2) 利用线性光谱混合模型在提取黄河流域的水库、湿地和湖泊比利用改进的水体指数模型提取水体的精度更高，效果更好，更接近于高分辨率影像提取水体的面积，而对于细小线状河流，改进的水体指数提取的水体面积更接近实际面积。

(3) 水体提取精度不仅与水体聚集分布有关，与其周围其他地物类型也有很大关系，对于黄河流域的水体，含沙量较大，选用线性光谱混合模型提取水体效果要优于改进的水体指数法。

(4) 无论利用线性光谱混合模型还是利用改进的水体指数法提取黄河流域的水体，面积较大、分布集中的水体比提取细长型分布的线状河流效果更好。

(5) 综合分析发现，2种方法均可以较好地提取主体水体区域，在细小水体提取方面，混合像元分解模型可能会存在分解错误的情况，导致分解结果不理想；改进的水体指数法关键在于确定阈值，而阈值的选择有一定的主观误差。在以后的研究中，应该避免尽量避免主观因素的影响，可以考虑自动提取的方法。

[1] 李景刚,李纪人,黄诗峰,等.Terra/MODIS时间序列数据在湖泊水域面积动态监测中的应用研究：以洞庭湖地区为例[J].自然资源学报,2009,24(5):923-933.

[2] 刘昌明.中国水资源现状评价和供需发展趋势分析[M].北京:中国水利水电出版社,2001.

[3] Huang Shifeng, Li Jinggang, Xu Mei. Water surface variations monitoring and flood hazard analysis in Dongting Lake area using long-term Terra/MODIS data time series[J]. Natural Hazards, 2012,62(1):93-100.

[4] 李景刚,李纪人,黄诗峰,等.近10年来洞庭湖区水面面积变化遥感监测分析[J].中国水利水电科学研究院学报,2010,8(3):201-207.

[5] 傅国斌,刘昌明.遥感技术在水文学中的应用与研究进展[J].水科学进展,2001,12(4):547-559.

[6] 孙敏章,刘作新,吴炳方,等.卫星遥感监测ET方法及其在水管理方面的应用[J].水科学进展,2005,16(3):468-474.

[7] 于欢,张树清,李晓峰,等.基于TM影像的典型内陆淡水湿地水体提取研究[J].遥感技术与应用,2008,23(3):310-315.

[8] 袁丽华,蒋卫国,申文明,等.2000—2010年黄河流域植被覆盖的时空变化[J].生态学报,2013,33(24):7798-7806.

[9] 姚文艺,冉大川,陈江南.黄河流域近期水沙变化及其趋势预测[J].水科学进展,2013,24(5):607-616.

[10] 万建鹏.基于Landsat TM/ETM+影像鄱阳湖地区水体提取研究[D].江西抚州：东华理工大学,2015.

[11] 陆家驹.多种遥感资料河网水体的有效解译[J].水利学报,1993(1):43-47,52.

[12] 杜云艳,周成虎.水体的遥感信息自动提取方法[J].遥感学报,1998,2(4):364-369.

[13] MacFeeters S K. The use of Normalized Difference Water Index(NDWI)in the delineation of open water feature[J]. International Journal of Remote Sensing, 1995,17(7):1425-1432.

[14] 徐涵秋.基于谱间特征和归一化指数分析的城市建筑用地信息提取[J].地理研究,2005,24(2):311-320.

[15] 丁凤.基于新型水体指数(NWI)进行水体信息提取的试验研究[J].测绘科学,2009,34(4):155-157.

[16] 张晗,夏丹宁,张昊成,等.基于混合像元分解的武汉市湖泊面积变化监测[J].长江科学院院报,2011,28(5):67-70.

[17] 徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005,9(5):589-595.

[18] Du Zhiqiang, Li Wenbo, Zhou Dongbo, et al. Analysis of Landsat-8 OLI imagery for land surface water mapping[J]. Remote Sensing Letters, 2014,5(7):672-681.

[19]Nobuyki Otsu. A threshold selection method from gray-level histograms [J]. IEET Transaction Systems. Man, and Cybernetics, 1979,9(1):6266.

[20] 金鑫,柯长青.基于混合像元分解的天山典型地区冰雪变化监测[J].国土资源遥感,2012,24(4):146-151.

[21] 陈利.基于混合像元分解方法的MODIS森林类型识别研究[D].湖南长沙：中南林业科技大学,2014.

[22] Nilanchal P, Brijesh K. Classification of features selected through Optimum Index Factor(OIF)for improving classification accuracy[J]. Journal of Forestry Research, 2011,22(1):99-105.

[23] 许文宁,王鹏新,韩萍,等.Kappa系数在干旱预测模型精度评价中的应用:以关中平原的干旱预测为例[J].自然灾害学报,2011,20(6):81-86.

Extraction Method of Spectral Information of Inland Surface Water Body in Yellow River Basin

LI Wenping, WANG Xuhong, LI Tianwen, MAO Wenting, YAO Lei

(CollegeofUrbanandEnvironmentalScience,NorthwestUniversity,Xi’an，Shaanxi710127,China)

[Objective] Extraction methods of spectral information of inland surface water in the Yellow River basin were elucidated and compared to provide guidance for the extraction of spectral information of water bodies with large sediment concentration in the Yellow River basin. [Methods] Two methods that were thought effective at present were chose to extract the spectral information of water body. They were modified normalized difference water index(MNDWI) and linear spectral mixture model. Landsat 8 OLI imagery of reservoir, wetland, lake and river in the Yellow River basin was exemplified to analyze the accuracies of the two methods, and to discuss the regional applicability. In which, the study area was divided into two categories: water and non-water, and high resolution imagery was referred.[Results] The accuracy of linear spectral mixture model in extracting spectral information of reservoir, wetland and lake was higher than that of the MNDWI. The two methods performed better in the large-area water bodies, such as lakes and reservoirs, than in the linear like body as rivers. [Conclusion] In high resolution image, mixed pixels were also existed. Based on that, the linear spectral mixture model had covered the effect of mixed pixels on the spectral information extraction from water bodies, whereby it remarkably improved the extraction precision. The linear spectral mixture model is superior to the modified normalized difference water index.

the Yellow River basin; extraction methods; water body

2016-09-27

李文苹(1991—),女(汉族),河北省张家口市人,硕士研究生,研究方向为地表水提取方法。E-mail:1126047634@qq.com。

王旭红(1968—),女(汉族),陕西省咸阳市人,博士，教授,硕士生导师,主要从事遥感图像数据分析与应用,环境遥感等方面研究。E-mail:jqy_wxh@163.com。

1000-288X(2017)02-0158-07

X524