APP下载

2000–2020 年丹江口水库(河南部分)水体面积数据集

2024-01-11史志方崔耀平熊广成刘小燕闰亚迪李梦迪赵浩程

关键词:丹江口水库植被指数像素

史志方,崔耀平,熊广成,刘小燕,闰亚迪,李梦迪,赵浩程

1.黄河中下游数字地理技术教育部重点实验室(河南大学),河南开封 475004

2.大别山-淮河流域河南大别山森林生态系统国家野外科学观测研究站,河南信阳 464000

3.河南大学地理与环境学院,河南开封 475004

4.河南省土地整理中心,郑州 450016

5.河南省自然资源科技创新中心(生态产品价值核算),郑州 450016

关键字:丹江口水库;水体边界;Google Earth Engine;水源面积变化

引 言

丹江口水库作为南水北调中线工程源头,通水后有效地缓解了京津冀地区的用水问题,减少了地下水的开采量,改善了受水地区的生态环境[1]。在南水北调通水之后,由于水库主体大坝加高工程等,丹江口水库水位上升,淹没了库周大量土地,将会导致库区土地利用格局发生变化,并引起土壤质量退化、植被覆盖度减少等环境问题[2]。水库通过与陆地生态系统的物质循环和能量流通,可以形成局部小气候,调节区域气候[3]。因此,对丹江口水库的水体变化进行长时间序列的动态变化监测,不仅在保证南水北调水量方面起到重要作用,还对于库区植被恢复、水质监测和改善生态环境有着重要意义。

随着遥感技术的发展,基于遥感卫星影像数据提取的地表水体产品成为目前相关研究的重要数据来源之一。目前主要地表水体产品主要有:GlobeLand30_WTR (Global Land Surface Water Dataset at 30 m Resolution)[4]、GLCF-GIW(Global Land Cover Facility,GLCF;Global Inland Surface Water,GIW)[5]等。其中GlobeLand30_WTR 地表水体产品的时间范围为2000、2010、2020 年,空间分辨率为30 m;GLCF-GIW 水体产品的时间范围为2000 年,空间分辨率为30 m,两者均无法实现对地表水体变化的动态监测。由于使用传统的遥感方法提取水体需要耗费大量的时间[6-7],并且难以对大量影像数据进行处理,通常采用小规模的遥感数据进行研究[8-9]。Google Earth Engine 云平台可以提供大量遥感影像集,同时兼顾快速、批量处理大规模遥感数据的运算能力[10-11]。本研究基于Google Earth Engine 云平台,采用多时相Landsat 遥感影像集,通过利用水体指数和植被指数之间的关系,以获取长时间序列的丹江口水库水体边界数据集,可作为研究南水北调中线源头丹江口水库水文生态变化的基础数据。

1 数据采集和处理方法

1.1 数据来源

本研究采用了2000–2020 年研究区全年所有的Landsat 影像,空间分辨率均为30 m。数据来源于Google Earth Engine 云平台,图1 是在对丹江口水库边界扩张动态变化监测过程中逐年所采用的影像数量,共1631 景。Landsat 采集的1 级图像已经进行了几何和大气校正,以及不同传感器之间的交叉校准[12-13]。对每幅图像都使用掩膜处理的方法去除云、云阴影和山体阴影像素。该方法效果良好,适用于监测Landsat 数据变化[14]。利用陆地卫星图像中的太阳方位角和天顶角以及航天飞机雷达地形任务中的数字高程模型,考虑并消除了地形阴影。所有剩余的像素都被认为是高质量的陆地卫星观测,可用于开放地表水体测绘。最后生成年度无云和无雪水体影像集。

1.2 数据处理方法

利用水和植被指数之间的关系可以探测到开阔地表水体,之前的研究已经基于时间序列陆地卫星图像和基于指数和阈值的水体测绘算法进行了水体变化分析[15-17]。本研究基于Google Earth Engine(GEE)平台利用遥感大数据在水体制图中使用了水和植被指数,包括修正的归一化差异水指数(mNDWI)、增强植被指数(EVI)和归一化差异植被指数(NDVI)。这些水体和植被指数是根据以下光谱波段和方程,利用无云无雪的陆地卫星TM、ETM+和OLI 地表反射图像计算的:

式中ρBlue、ρGreen、ρRed、ρNIR和ρSWIR1是Landsat TM 传感器中蓝色(0.45–0.52 m)、绿色(0.52–0.60 mm)、红色(0.63–0.69 mm)、近红外(NIR)(0.77–0.90 mm)和短波红外(SWIR1)(1.55–1.75 mm)波段的表面反射率值。基于已获取的水体和植被指数,首先通过GEE 平台中的median 函数来获取研究区范围每个像素水体和植被指数的中位数,其次利用moasic 函数将研究区范围内的各景影像拼接起来,根据每年水体和植被指数的中位数将影像进行合成。

采用mNDWI>EVI 或mNDWI>NDVI 作为判别标准,对水信号强于植被信号的像素点进行识别。EVI <0.1 可以保证去除植被像素或水和植被混合像素。因此,只有那些符合标准(mNDWI>EVI 或mNDWI>NDVI)和(EVI <0.1)的像素被分类为水体像素,而其他像素被分类为非水体像素。在获取影像的水体数据分布后,对于一年中的每个水体像素,本研究采用以下公式来获取该处的水体分布频率值,进行年水体频率影像的计算:

式中,F是该像素的水频率,y是指定年份,Ny是该像素在该年的陆地卫星观测总数,wy,i表示该像素的一次观测是否为水,1 表示水,0 表示非水。

在丹江口水库逐年空间分布数据集的制备过程中,首先,通过利用一年中所有的Landsat 数据,采用CFmask 算法在像元尺度上进行了云、云阴影及地形阴影等无效观测的检测与去除,保留所有的有效观测。在此基础上,分别对每一个Landsat 有效观测进行水体和非水体的判别,从而得到每个像元在该年份的水体频率,进而得到该年份丹江口水库的水体频率图。同样地,进而生成了2000–2020 年间逐年的丹江口水库水体频率图。根据之前的研究[18-19],为了区分水体分布的季节性和永久性,去除因数据质量问题而出现的噪声,本研究分别利用0.25 和0.75 作为季节性水体和永久性水体的频率阈值,即地表水频率在0.25–0.75 之间的水体为季节性水体,频域大于或等于0.75 的水体像元为永久性水体。根据此方法对水体进行处理,得到丹江口水库2000–2020 年的水体时空动态变化特征。整体流程图如图2 所示。

图2 水体提取流程图Figure 2 Flow chart of water extraction

2 数据样本描述

2.1 数据组成

2000–2020 年丹江口水库水体边界数据集一共21 期数据,每期数据以相应年份进行命名,数据存储为TIF 栅格数据格式,投影系统为WGS-1984。总数据量为6.92 MB,所有数据保存为1 个压缩文件(2000–2020 年丹江口水库水体边界数据集.rar)。水体数据属性值以1、2 进行表示,其中1 代表季节性水体,2 代表永久性水体。此外,其中2007、2008、2009、2013 年水体影像中存在空白,将空白区域填补后以999 作为属性值进行表示。

2.2 数据样本

本数据集包含了2000–2020 年的丹江口水库水体边界数据,主要说明了丹江口水库水体的分布状况及动态变化(图3)。在2000–2020 年间丹江口水库水域面积先是处于波动变化,后出现了明显上升的趋势。2000–2014 年间丹江口水库面积一直处于波动变化状态,水体边界虽有变化,但水体面积并未出现明显变化特征。2000 年的水体面积为212.62 km2,到2014 年水体面积为227.39 km2,水体面积均值为236.37 km2。2015–2020 年间丹江口水库水域面积一直处于波动上升的过程,2015 年水体面积为309.76 km2,到2020 年水体面积波动上升为386.66 km2,水体面积均值为358.12 km2。主要原因是为了保证南水北调中线工程对京津冀等缺水区域的供水量,丹江口水库大坝加高,使得丹江口水库水位上升,淹没了库周约189.71 km2的土地,使得水体面积快速增加。

图3 2000–2020 年丹江口水库地表水体面积变化图Figure 3 Changes of surface water area of Danjiangkou Reservoir from 2000 to 2020

3 数据质量控制和评估

为了验证丹江口水库水体提取的精度,本研究采用了第三次全国国土调查(三调)数据及Google Earth 影像与水体影像进行比对。将提取得到的2019 年地表水体影像与三调数据以及当年12 月的卫星影像进行对比验证可以发现,地表水体影像在图4 中各典型地区的细节表现程度较好,可以精确展示丹江口水库水体的动态变化情况。本研究同时以第三次全国国土调查的丹江口水库水体数据为准进行叠加分析,发现2019 年提取的地表水体与三调数据的丹江口水库水体数据的重合度达到94.61%。整体而言,本研究所采用的水体提取方法对于丹江口水库的水体提取精度较好,可以满足用户对于数据集的精度要求。

在制备数据集的过程中,由于方法和数据问题会对数据的精度产生一定的影响。首先,Landsat卫星的重访周期为16 天,因此可能会错过一些存在时间较短的地表水体(如洪水等)。同时由于卫星影像的空间分辨率为30 m,一部分地表水体由于面积过小,在水体提取过程中无法被识别。因此,在数据集中,季节性水体的分布面积相较于实际情况可能会被低估。其次,质量保证(QA)波段是Landsat 影像质量的一个重要指标,可能会影响制图效果。一些低质量的观测结果(如云、云阴影)在经过CFmask 算法过滤后可能仍然存在,这就会导致在水体频率分布图中错分出一部分低频率分布的水体像元。因此在数据集中,相较于季节性水体,永久性水体的提取效果更好。在之后的研究中,可以考虑采用多源数据,通过利用其他高空间分辨率的卫星传感器(如Sentinel-1、Sentinel-2 等)提供更加精细的水体数据集。

4 数据价值

丹江口水库作为南水北调中线工程源头,是中国第一大人工淡水湖,其水体面积变化对于区域气候以及库周的生态环境变化都存在着重要影响。受到南水北调中线工程的影响,丹江口水库主体大坝加高,水位上升,淹没了库周大量土地。2015 年以来,丹江口水库水体面积增长显著。

本数据集基于Google Earth Engine 云平台,利用1631 景Landsat TM 影像,通过修正归一化差分水体指数(mNDWI)、增强植被指数(EVI)、归一化差分植被指数(NDVI)等水体和植被指数进行水体信息制图,以丹江口水库作为研究区,制作了2000–2020 年间21 期丹江口水库水体边界数据集。一方面采用了GEE 云平台来实现对丹江口水库水体变化的动态监测,提高了水体提取精度;另一方面作为长时间序列的监测数据,可以为研究丹江口水库水体时空变化提供依据,也可以作为研究该区域气候变化、生态环境变化的基础数据。

5 数据使用方法和建议

2000–2020 年丹江口水库水体边界数据保存格式为TIF,ArcGIS、QGIS、ENVI 等常用的GIS 与遥感软件都支持对本数据集的读取和操作。本数据集描述了淅川县丹江口水库水体边界在2000–2020年的动态变化情况,可用以分析丹江口水库在2000–2020 年扩张过程中对周围地区土地利用格局所造成的影响。本数据集与三调数据和卫星影像数据进行对比,结果显示数据集精度较高,可以用于检验和评价2000–2020 年相同区域的水体数据精度。

数据作者分工职责

史志方(1998—),男,河南南阳市人,博士,研究方向为遥感大数据处理。主要承担工作:数据处理、论文撰写。

崔耀平(1984—),男,河南周口市人,博士,教授,研究方向为遥感大数据和土地利用。主要承担工作:总体方案设计,数据论文修改。

熊广成(1976—),男,河南信阳市人,硕士,高级工程师,研究方向为土地管理。主要承担工作:参与方案设计。

刘小燕(1996—),女,河南登封市人,博士,研究方向为大数据制图综合。主要承担工作:数据制图与分析。

闰亚迪(1995—),女,河南安阳市人,硕士,研究方向为遥感图像解译。主要承担工作:数据预处理。

李梦迪(1995—),女,河南商丘市人,博士,研究方向为土壤环境遥感。主要承担工作:辅助分析。赵浩程(1994—),男,河南开封市人,硕士,研究方向为工程制图。主要承担工作:辅助制图。

猜你喜欢

丹江口水库植被指数像素
赵运哲作品
像素前线之“幻影”2000
“像素”仙人掌
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
丹江口水库的水资源管理与保护概述
水库移民农地流转与生计恢复问题及对策研究
基于ETM+数据的水体信息提取
丹江口水库河南外迁农村移民安置效果研究