APP下载

2013-2017年海南岛陆域水体遥感提取数据集

2019-11-18许芬孟庆岩张琳琳

关键词:海南岛波段分辨率

许芬,孟庆岩,张琳琳

1.福州大学地理空间信息技术国家地方联合工程研究中心,空间数据挖掘与信息共享教育部重点实验室,福州 350002

2.海南省地球观测重点实验室,海南三亚 572029

3.中国科学院遥感与数字地球研究所,北京 100101

数据库(集)基本信息简介

数据库(集)名称 2013-2017年海南岛陆域水体遥感提取数据集数据作者 许芬、孟庆岩、张琳琳数据通信作者 孟庆岩(mengqy@radi.ac.cn)数据时间范围 2013-2017年地理区域 海南岛:北纬18°10′-20°10′,东经108°37′-111°03′空间分辨率 15 m、16 m数据量 11.6 MB数据格式 *.shp数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/673基金项目 海南省重大科技计划项目(ZDKJ2016021);四川省科技计划(2018JZ0054)。数据库(集)组成数据集由6部分数据组成,分别为5个不同年份(2013-2017年)水体分布结果数据与1个验证样本点数据,每部分数据包含*.dbf,*.prj,*.shp,*.shx ,*.jpeg,*.sbx,*.sbn,*.xml 8个文件,示例如下:1.2015.dbf为2015年矢量数据dBASE表文件;2.2015.prj为2015矢量数据坐标投影文件;3.2015.shp为2015矢量数据主文件;

数据库(集)组成4.2015.shx为2015矢量数据索引文件,存储地理数据几何特征的索引;5.2015.jpeg为2015年水体产品分布结果图;6.2015*.sbx为2015年矢量数据索引文件,存储地物特征的索引;7.2015*.sbn为2015年矢量数据索引文件,存储地物特征的索引;8.2015*.xml为对2015年数据的描述,方便实现数据交换。

引 言

水是人类赖以生存和社会发展不可替代的战略资源,是全球水资源安全和管理、气候变化研究、生态环境动态监测[1-3]等不可或缺的重要基础信息。海南岛河流众多,水资源丰富,人均水资源占有量达3 700m3,是全国平均水平的1.76倍[4]。随着自然环境的变化与社会经济的发展,由地表水带来的洪水泛滥和水体污染等问题已成为当前人类社会关注的热点问题[5-6]。因此,及时快速监测地表水体动态变化,掌握地表水体空间变化规律,减少其带来的灾害威胁,需开展地表水体产品研制。

国内外大中尺度地表水体产品生成和制图研究成果,主要依赖低空间分辨率卫星数据[7],如由联合国环境规划署世界保护监测中心(WCMC)提供的Global Lakes and Wetlands Database(GLWD)主要采集包括湖泊、水库和湿地在内的水体,利用多边形矢量的面积、体积来判断水体,其空间分辨率为30弧秒(大约1 km),覆盖范围在60°S至90°N。然而,大多数的内陆水体面积相对较小,低空间分辨率卫星数据难以有效提取出小范围水体信息[8],因此,中高空间分辨率遥感影像对于中尺度区域的水体提取具有重要意义。本文利用高分1号数据与Landsat 8 OLI多光谱与全色波段融合后的15 m空间分辨率数据,采用面向对象的知识规则集对海南岛雨季水体进行自动化提取,最后加以人工修正,得到2013-2017年间陆域地表水体信息,一方面为揭示水体分布和动态变化规律提供有效信息,另一方面为水体水质监测、水环境评估提供准确的水体边界信息,本文基于中高空间分辨率遥感影像提取的覆盖海南岛陆域范围的地表水信息能为水资源和环境变化研究提供数据支撑。

1 数据采集和处理方法

1.1 数据采集

1.1.1 区域范围

海南岛位于北纬 18°10′-20°10′,东经 108°37′-111°03′,属热带季风气候,存在明显的干湿季。每年5-10月份是多雨季,总降水量达1 500mm左右,占全年总降水量的70%~90%;每年11月至翌年4月为少雨季节,降水量仅占全年的10%~30%。地势中部高四周低,河流大都发源于中部山区,组成辐射状水系,河流众多,自然形成的湖泊较少,人工水库居多。

1.1.2 影像数据源

高空间分辨率遥感影像为准确提取陆域水体信息提供了重要的数据源,但随着空间分辨率的提高,影像覆盖范围变小,覆盖全岛所需数据量增大,同时海南岛云雨天气较多,无云或少云的数据难以满足覆盖整体的要求。而中高空间分辨率数据一方面能满足水体信息准确提取的要求,另一方面能满足覆盖整体范围的需求。本文以2013-2017年雨季(5-10月)覆盖整个海南岛陆域范围的高分1号WFV传感器产品及Landsat 8 OLI多光谱与全色波段融合后的数据为数据源,空间分辨率分别为 16 m、15 m,云量均低于 9%,其中高分 1号 WFV影像数据来源于中国资源卫星应用中心(http://www.cresda.com/CN/),Landsat 8 OLI传感器影像来源于地理空间数据云网站(http://www.gscloud.cn/),遥感影像覆盖范围如图1。

图1 研究区遥感影像(假彩色合成)图

1.2 数据处理

本数据集以经过正射校正、大气校正等预处理后的高分1号及Landsat 8 OLI数据为数据源,再通过影像分割,生成能合理表现地物类型,特别是水体信息的影像对象层;选取对象样本进行特征提取,根据最优特征信息构建知识规则集提取水体信息;最后对分类结果进行滤除碎斑、人工修正等后处理,对分类进行精度评价,得到海南岛陆域范围的水体分布产品,具体处理流程如图2。

图2 数据处理流程图

1.2.1 数据预处理

首先结合DEM数据对高分1号数据与Landsat 8数据进行正射校正,消除原本由地势起伏等原因所导致的影像几何畸变[9];再根据数据的定标系数,通过辐射定标消除各种辐射失真[10];同时采用改进的6S大气校正模型进行大气校正,基于查找表逐像元计算的方式,对太阳天顶角、水蒸气、臭氧浓度、气溶胶光学厚度等参数进行敏感性分析,得到每个点的大气校正系数用以修正地表反射率影像,从而消除大气的影响[11]。最终得到研究区域的地表反射率产品。

1.2.2 水体信息的提取

首先基于异质性最小原则的区域合并算法FNEA(Fractal Net Evolution Approach),考虑光谱异质性、形状异质性对影像进行多尺度分割,形成影像对象层,统计影像对象层中对象的特征信息,其次基于最小冗余最大相关特征选择算法mRMR(minimum-redundancy maximum-relevancy)选择众多特征中的最优特征子集,具体包括水体指数、灰度共生矩阵GLCM(Grey Level Concurrence Matrix)信息熵、形状特征中长宽比,构建知识规则集,提取水体。所选的水体指数中包括由 Mcfeeters在1996年提出的归一化水体指数NDWI、徐涵秋[12]提出的改进的归一化水体指数MNDWI及混合水体指数[13](CIWI),其中NDWI是利用绿光波段与近红外波段水体与非水体的波谱差异提取水体信息,MNDWI是针对土壤、建筑物在绿光波段和近红外波段波谱特征与水体几乎一致,易与水体造成混淆的问题提出的基于近中红外(MIR)波段与绿光波段组合提取水体的方法,使水体识别精度得到进一步改善,但是仍有部分城镇信息混合在水体中,同时对于高分1号影像,缺乏参与计算的近中红外波段,存在一定的局限性;而混合水体指数则是在分析NDWI与MNDWI优缺点和各波段光谱特征的基础上,用近红外波段与近红外波段均值的比值构造一个无量纲参数 NIR,再将其与归一化植被指数NDVI求和,增强水体与其他地物的差异,同时也能运用于高分一号影像中,计算公式如下:

式中CIWI为混合水体指数,NIR为遥感影像中的近红外波段,NIRmean为遥感影像中的近红外波段像素均值,R为遥感影像中的红光波段。在进行特征优选过程中发现这3种特征具有较强相关性,为提高计算效率,选取其中对水体信息提取贡献最大的CIWI指数进行分类,具体步骤包括:首先利用CIWI提取出大致水体范围。此范围中除了水体信息,还包含部分云层、山体阴影信息。再通过调节长宽比特征阈值,选取长宽比阈值剔除山体阴影信息。通过调节信息熵阈值,提取出云层信息,结合前后时期的影像信息人工判读云层覆盖范围的地表土地利用类型。最后对提取出的水体信息进行碎斑去除等后处理,整理出水体分布产品,结合验证点对最后分类结果进行精度评价。

2 数据样本描述

数据以年份命名,包括5个年份的海南岛水体分布矢量图。在ArcGIS软件中打开由面向对象规则集分类提取出的结果文件,对图斑进行显示和颜色填充,得到2013-2017年的水体分布图(图3)。

图3 2013-2017年海南岛水体分布图

3 数据质量控制和评估

3.1 数据质量定性评估

为保证数据质量,在进行水体提取都是云量较低的数据,同时对于其中存在的部分云覆盖的地区则是通过临近日期无云影像中所表现的地物类型采用人工判读的方式进行信息填补,减少云覆盖对水体分布的影响;而在季节对水体影响方面,则是考虑到海南岛分为明显的旱雨两季,为避免季节降水变化对水体分布产生影响,选用的数据均为每年5-10月的雨季影像,提取的是雨季的水体分布,一定程度上减少了季节降水差异对水体分布的影响。

数据提取结果在空间分布上,水体信息呈辐射状分布,东多西少,与海南岛中东部丘陵山地迎风坡多雨,西部地区滨海山地背风少雨这一特征相符;同时数据集在数据的形态上,兼顾了整体信息与细节信息,不仅覆盖了大范围河流湖泊等信息,还包括如坑塘等分布零散的水体信息;由于影像空间分辨率较高,地物细节表现较明显,如一些桥梁、河道周边植被等信息与水体的区分造成了水体分布的分段分布(图4),但总体水体特征表现较好。

图4 数据集局部细节示意图

在数据属性上,2013-2017年间雨季水体面积信息表现出与降水量信息的相关性,这符合海南岛水资源变化受降水量变化影响大这一特点。具体表现在5年中2013年水体面积最大,其降雨量均高于其他年份,达到2393.7 mm,比多年平均降水量高36.9%,属于丰水年;2015年水体面积最小,其降水量为1403.5 mm,低于其他年份,同时比平均年份低19.8%,属于枯水年;其他3个年份水体面积也体现出与降水量的正相关关系,总体体现出数据集的合理性。

3.2 数据质量定量评估

利用ArcGIS软件中Create Random Point工具,在研究区域范围随机生成300个验证点(图5),结合不同时期的Google earth影像数据与部分高分1号PMS传感器2 m空间分辨率影像数据确定验证点的属性值,与分类结果构建误差矩阵进行精度评价,如表1-5。混淆矩阵中用户精度是指从分类结果中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率。生产精度指分类中某一类别正确分类的像元数占这一类别所有像元数的比例。总体精度为所有样本中被正确分类的样本比例。Kappa系数则用于反映整体的分类精度,系数越接近1,分类质量越好。

图5 验证样本点分布图

表1 2013年海南岛水体分类精度验证混淆矩阵

表2 2014年海南岛水体分类精度验证混淆矩阵

表3 2015年海南岛水体分类精度验证混淆矩阵

表4 2016年海南岛水体分类精度验证混淆矩阵

表5 2017年海南岛水体分类精度验证混淆矩阵

2013-2017年总体分类结果精度都较高,Kappa系数均大于0.8,其中2017年分类精度最高,Kaapa系数为90.66%;2013年和2014年精度略低于2016年和2017年,与验证样本点的属性部分以近年土地利用属性为依据,与2013年和2014年真实地物属性存在差异,造成的验证误差有关;2015年精度最低,非水体误分为水体的情况较多,主要是由于2015年部分影像中云量较高,云与云层阴影易误分为水体,导致水体提取的生产者精度偏低,但就总体而言,分类效果都较好,漏提率、误提率较低,均能达到水体分布产品制图要求。

4 数据使用方法和建议

本数据集是基于中高空间分辨率遥感数据提取得出的5个年份的水体分布数据产品,可比较好地识别小面积湖泊、河流等水域,且分类精度较高,可为水资源时空分布研究提供数据支持,为区域水质水安全等方面的研究提供基础底图,同时可以服务于水资源变化和环境变化研究。

猜你喜欢

海南岛波段分辨率
基于生成对抗网络的无监督图像超分辨率算法
最佳波段组合的典型地物信息提取
中国游客的海岛旅游需求时空特征分析——以济州岛和海南岛为例
基于气候季节划分的海南岛气候康养特征探析
海南人为什么说福建话
“早春茶”开采
原生VS最大那些混淆视听的“分辨率”概念
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术