基于高分二号数据的自然保护区生态用地遥感分类研究
——以衡水湖国家级自然保护区为例
2021-11-22刘端阳姚云军张晓通
贾 坤 刘端阳 姚云军 张晓通
(北京师范大学地理科学学部,北京 100875)
国家级自然保护区是推进生态文明建设、构建国家生态安全屏障和建设美丽中国的重要载体,其中生态用地对于保持生态平衡、构建和谐的人与自然关系、保护生物多样性具有重要作用,是区域生态环境质量好坏的“晴雨表”[1]。然而,随着我国社会经济的快速发展和城市化进程的加快,我国生态用地尤其是国家级自然保护区生态用地面临诸多问题,如何准确有效、及时地对生态用地状况进行监测对国家级自然保护区的管理和生态保护具有重要的作用。
遥感因具有快速、大面积观测以及具有可追溯性的对地观测优势,已成为生态用地监测和提取的重要手段。目前,利用遥感技术监测生态用地状况已开展了较多研究,如王志涛等[2]基于Landsat-8卫星数据对沽源县水源涵养型、土壤保持型等生态用地类型进行了综合识别并分析了其空间分布状况;张彦敏等[3]基于SPOT-5卫星遥感数据,对天津市生态用地人类活动变化进行遥感监测,发现天津生态用地呈现人工表面增多的趋势;武爱彬等[4]基于长时间序列的Landsat TM和Landsat-8卫星数据开展了河北生态用地解译,并分析其时空格局的地貌分异特征。随着我国高分辨率对地观测重大专项的实施,国产高分卫星数据凭借其高空间分辨率、高时间分辨率和高重访观测的优势,为区域生态用地监测提供了理想的潜在数据源[5]。国内学者也利用高分卫星数据对生态用地遥感监测展开了初步的探索,如孟晋杰等[6]基于GF-1卫星数据,对北京市中心区及以东方向的城市郊区城市生态用地进行监测,取得了很好的效果。
综上所述,遥感技术可为区域生态用地监测提供有力的技术支撑,而高空间分辨率的遥感数据的空间信息更丰富,纹理特征更明显,有望进一步提高区域生态用地遥感分类精度。高分二号(GF-2)卫星是我国高分辨率对地观测系统重大专项中首颗亚米级高空间分辨率民用光学遥感卫星,于2016年8月19日在山西太原卫星发射中心发射升空。该卫星搭载两台1米全色、4米多光谱相机(PMS),多光谱数据包括蓝、绿、红和近红外四个波段,重访周期为5天,是区域生态用地遥感监测的重要数据源[7]。但GF-2卫星数据用于国家级自然保护区生态用地分类的研究较少,其实际应用方法和监测效果有待进一步探索和验证。因此,本文基于GF-2卫星数据,研究河北省衡水湖国家级自然保护区生态用地遥感分类方法,探讨GF-2卫星数据在国家级自然保护区生态用地遥感分类中的应用效果,以期推进国产高分卫星服务于国家级自然保护区生态用地管理和规划。
1 研究区概况
河北衡水湖国家级自然保护区(115°27′50″~115°42′51″E,37°31′40″~37°41′56″N)位于河北省衡水市桃城区、冀州两县区境内,占地面积283 km2。该地区属暖温带大陆季风气候区,四季分明,多年平均气温约为13.0 ℃,年平均降雨量约为518.9 mm。衡水湖自然保护区于2003年晋升为国家级自然保护区[8],具有保持沼泽、水域、滩涂、草甸和森林等完整湿地生态系统的特点,生态用地类型丰富,对于检验GF-2卫星数据的分类能力具有较好的代表性与示范性。保护区内具有丰富的生物多样性,主要以内陆淡水湿地生态系统和国家一、二级鸟类为主要保护对象[8],属于淡水湿地生态系统类型自然保护区,具有蓄洪防涝防旱、调节气候、控制土壤侵蚀、降解环境污染等功能,对调解京津地区的气候、改善生态环境起到重要作用。图1(a)是采用GF-2卫星多光谱遥感数据拼接的研究区真彩色合成影像图,其中红线内区域为衡水湖国家级自然保护区,图1(b)为裁剪后的保护区影像。
图1 衡水湖国家级自然保护区地理位置Fig. 1 Geographical location of Hengshui Lake National Nature Reserve
2 数据来源
2.1 GF-2卫星数据
本研究选用的GF-2卫星数据为PMS传感器采集的多光谱影像,由中国资源卫星应用中心 (http://www.cresda.com/CN/)提供。GF-2卫星数据成像时间为2017年11月18日,数据获取时间段内大气状况良好,因此研究区遥感数据云覆盖比例小于1%、成像质量好,可完整覆盖衡水湖自然保护区。
2.2 地面调查与样本选择
本研究于2017年11月18日在研究区开展地面调查工作,主要调查研究区生态用地类型的空间分布特征。在地面调查期间,调查人员记录了具有代表性的生态用地详细信息,并利用手持GPS接收机进行地理坐标信息采集,GPS型号为天宝Juno SB,空间定位精度约±3 m。根据《土地利用现状分类》(GB/T 21010−2017)和研究区实际的生态用地分布,最终确定研究区生态用地分类系统包括水体、农田、湿地、道路、林地、居民点。在地面调查和GoogleEarth影像辅助GF-2数据目视解译的基础上,随机选取样本用于分类模型构建和检验的训练与检验样本。对于每种生态用地类型均获取了足够的样本点,其中包括水体像元1 579 390个、农田像元623 544个、湿地像元404 390个、道路像元21 716个、林地像元20 714个和居民点像元99 576个。在建立样本数据集后,将样本点随机均分成两部分,分别作为训练样本和检验样本,训练和检验样本互不重叠。
3 研究方法
基于GF-2多光谱数据的自然保护区生态用地遥感分类技术流程图如图2所示。首先,对GF-2多光谱数据进行辐射定标、大气校正以及几何校正处理,进而利用保护区边界对数据进行拼接和裁剪。之后,利用面向对象的多尺度分割方法对遥感数据进行图像分割,并计算每个对象的光谱特征以及纹理特征。进而,利用样本数据集和分类特征进行生态用地遥感分类模型构建以及自然保护区生态用地分类。最后,对分类结果进行分类后处理,包括小斑块去除和分类后统计等,最终得到自然保护区生态用地遥感分类专题图。
图2 生态用地分类流程Fig. 2 Flow chart of ecological land classification
3.1 GF-2卫星数据处理
GF-2多光谱数据的预处理主要包括:辐射定标、大气校正、几何校正。其中,辐射定标是将像元亮度值转换为辐射亮度,定标公式为:
其中,Le代表辐射亮度值,Gain和Offset是从中国资源卫星应用中心获取的GF-2卫星PMS数据辐射定标系数(http://218.247.138.119/CN/Downloads/dbcs/11307.shtml)。
大气校正采用FLAASH大气校正模型[9],该模型基于MODTRAN4的辐射传输计算方法,能精确地补偿大气影响,适用于GF-2卫星多光谱数据的大气校正。FLAASH模型的输入数据主要来源于GF-2卫星PMS多光谱数据的成像时间和数据相关参数。几何校正采用二次多项式纠正法,参考影像采用从美国地质调查局网站(https://earthexplorer.usgs.gov/)获取的Landsat-8卫星OLI传感器采集的高质量数据。其中,几何校正采用的地面控制点从两幅影像中手动选取。最后,将经过大气校正和几何校正后的两景GF-2卫星PMS数据进行拼接裁剪,用于后续衡水湖自然保护区生态用地遥感分类研究。
3.2 面向对象的多尺度影像分割
面向对象的分类模式将遥感影像分割为不同的对象来代替原始的像元作为分类的基本单位,其最重要的步骤是合理的影像分割,使分割对象能够清晰地反映出感兴趣地物的空间分布[10−11]。本研究中选择多尺度分割算法[12]进行遥感影像分割。因为在整幅影像上很难找到一个固定的最佳分割尺度,因此为确定最佳的影像分割尺度,本研究以5为间隔,在10~100之间设置了19组对照实验,将每次实验的分割结果进行对比分析,通过目视观察优选能呈现感兴趣地物目标真实形态的最优分割尺度。最后,本研究选择25作为分割尺度参数。
3.3 分类方法与精度检验
本研究选用了支持向量机分类器[13−15],是一种基于统计学习理论的机器学习算法,其通过在高维特征空间中寻找最优分类超平面解决复杂数据的分类问题[16−17]。支持向量机具有参数设定简单和能得到全局最优结果的优点,尤其适合有限样本问题,在很大程度上解决了传统分类方法中存在的如模型选择、过学习、多维问题、局部极小点等问题[16]。支持向量机的最终求解可转化为一个具有线性约束的二次凸规划问题,不存在局部极小值。现代的支持向量机理论[18]是由Cortes和Vapnik提出的,详细的支持向量机描述可查询Burges[19]发表的文献。
支持向量机分类器的输入特征包括光谱特征和纹理特征,其中光谱特征包括GF-2数据的多光谱波段反射率,及其颜色空间变换得到的HSL空间的色调、饱和度和亮度特征。这些特征对于农田、湿地以及林地等植被覆盖类型具有较好的识别能力,是由于在可见光-近红外波段范围内,植被在蓝光和红光波段存在吸收谷,在绿光和近红外波段存在反射峰,有利于植被和非植被以及不同植被类型之间的区分。纹理特征主要包括Texture Range、Texture Mean、Texture Variance和Texture Entropy等纹理统计特征[20−21],其中Texture Range指卷积核内的平均灰度范围,本研究中卷积核设置为3×3;Texture Mean指卷积核内的平均灰度值,如公式(2);Texture Variance指卷积核内的灰度变化值,如公式(3);Texture Entropy指卷积核内信息熵,如公式(4)。纹理特征主要对水体、道路和居民点等地表类型较为敏感,因这些地物类型往往由不同材质构成,其灰度变化差异相较于自然地物目标更为明显。本研究选取径向基函数(Radial Basis Function,RBF)作为支持向量机分类算法的核函数,核参数γ和惩罚因子C根据先验知识分别设置为0.25和100。
式中,M和N表示卷积核大小,研究中取3×3,f(i,j) 为 (i,j)位置处像元的灰度值, µ为卷积核内灰度均值,P(i,j) 为卷积核内灰度值为f(i,j)的像元概率。
分类后处理采用多数(Majority)分析、聚类处理(Clump)和过滤处理(Sieve)策略去除初步分类结果中的碎小斑块,最终得到衡水湖自然保护区生态用地分类专题图。专题图分类精度验证基于前述检验样本采用分类混淆矩阵衡量[16,22],检验样本包括水体像元789 695个、农田像元311 772个、湿地像元202 195个、道路像元10 858个、林地像元10 357个和居民点像元49 788个,精度指标包括总体分类精度和Kappa系数。
4 结果与分析
衡水湖国家级自然保护区生态用地分类结果如图3所示。进一步利用地面检验样本,计算分类混淆矩阵,得到总体分类精度和Kappa统计指标(表1)。从目视效果来看,采用GF-2卫星多光谱数据可有效识别各种生态用地类型。衡水湖保护区东部主要分布为水体和湿地,西部主要为农田,其中夹杂分布一些居民点。定量精度评价结果表明,基于GF-2卫星多光谱数据的衡水湖自然保护区生态用地遥感分类总体分类精度为92.62%,Kappa系数为0.875,达到了较好的分类效果。在分类混淆方面,水体、农田、林地及居民点分类效果较好,湿地与水体和农田具有一定程度的混分,导致了湿地的制图精度相对于其他用地类别呈现较低的现象。这是由于湿地多由水生植被构成,植被覆盖度的高低差异会造成湿地光谱与水体和农田光谱的混淆。另外,道路与水体、农田、居民点都有少量的分类混淆。这是由于GF-2卫星多光谱数据4 m的空间分辨率在相对较窄的道路识别上空间细节信息呈现不足,造成道路易于周边用地类型形成混合像元,导致了道路分类精度也低于其他用地类别。精细的道路识别可能需更高空间分辨率的遥感数据。总体而言,各生态用地类别均能达到一个较好的分类效果。
图3 衡水湖自然保护区生态用地遥感分类Fig. 3 Remote sensing classification map of ecological land in Hengshui Lake Nature Reserve
表1 衡水湖自然保护区生态用地遥感分类混淆矩阵Table 1 Confusion matrix of remote sensing classification of ecological land in Hengshui Lake Nature Reserve
本研究对衡水湖自然保护区内不同生态用地类型的面积进行了统计,其中水体、农田、湿地、道路、林地和居民点的面积分别为42.77 km2、87.43 km2、10.06 km2、6.47 km2、5.95 km2和10.98 km2。从统计结果可以看出,衡水湖自然保护区农田和水体占据了总共79.5%的比例(图4)。
图4 衡水湖自然保护区生态用地类型统计Fig. 4 Statistical chart of ecological land use types in Hengshui Lake Nature Reserve
5 讨论与结论
本研究以国家高空间分辨率对地观测系统GF-2卫星多光谱数据为主要数据源,采用面向对象的支持向量机分类算法,提出了衡水湖国家级自然保护区生态用地遥感分类技术。总体来说,与中、低空间分辨率遥感数据相比,GF-2卫星多光谱数据在景观结构、形状、纹理和细节等方面均具有较大优势,能在精细的空间尺度上识别地表的细节变化状况。从分类结果可看出,GF-2卫星数据采用面向对象的分类策略适于自然保护区生态用地遥感分类,能取得较好的分类效果。另外,GF-2卫星数据可免费获取,相对于同等空间分辨率商业遥感卫星数据昂贵的数据费用更具经济性,且具有制图便捷与准确的特点,是生态用地遥感分类较好的数据源。
通过本研究可得出如下结论:1)GF-2卫星多光谱数据较高的空间分辨率,能有效解决研究区生态用地中存在的地类细小、破碎、随机性强的问题,能为国家级自然保护区生态用地遥感分类提供有效的数据源。2)采用面向对象分类策略的支持向量机分类方法适用于GF-2卫星多光谱数据生态用地分类,总体分类精度达到92.62%,为国家级自然保护区生态用地遥感监测与业务应用提供技术参考。