APP下载

基于Landsat 8影像的监督分类及后处理方法对比研究

2022-10-20王家福

世界有色金属 2022年16期
关键词:后处理土地利用聚类

王家福

(云南驰宏锌锗股份有限公司,云南 曲靖 655000)

土地开发利用管理是经济社会的1种基本经济管理[1],并且其注重合理利用土地资源,并对土地资源进行开发、整治和保护[2-4]。近年来,我国开展土地利用资源调查的技术手段也在不断发展,遥感和计算机等信息技术被广泛运用[5]。其中,基于卫星遥感影像的土地调查分类方法和应用地理信息系统技术开展土地资源调查、评价的技术体系逐渐发展和成熟起来[6]。基于遥感影像的分类方法因其具有数据获取方便、时效性强的优势,成为了土地利用信息提取的高效方式。而遥感分类方法是影响土地利用覆盖分类精度的关键因素[7-9],因此国内外许多学者研究对比过不同分类方法的效果。成淑艳等[10]以青海湖沙柳河流域为研究区对比研究了几种常见的监督分类方法用于土地覆盖提取时的效果;徐晓桃等[11]比较研究了最大似然法、神经网络法和决策树法在甘肃省土地覆盖分类时的分类精度;周丽红等[12]比较了监督分类中几种常见的分类器和决策树方法在南昌市土地覆盖分类时的精度。但大多数的研究都是对多种监督分类的方法进行对比实验,面向监督分类及分类后处理的对比研究较少,因此,对比研究几种常见的土地利用覆盖遥感分类方法及分类后处理结果很有必要。鉴于此,以昆明地区的滇池流域为研究区,选取Landsat 8影像,分别利用监督分类法中的神经网络和支持向量机2种分类器,分类后处理方法选用Majority/Minority分析和聚类处理,得到2种分类方法和2种分类后处理的研究区土地利用覆盖分类结果,基于混淆矩阵对不同分类结果进行比较分析,以进行对研究区的土地利用覆盖自动分类器及后处理方法的研究。

1 研究区及数据

1.1 研究区

晋宁区,隶属于云南省昆明市,位于云南省中部,是昆明都市核心区的重要组成部分(24°24´~24°28´N,102°13´~102°52´E)[13]。由于晋宁区地处云贵高原,地势南高北低,全区最高处海拔2648 m为南部的大梁子山,最低处海拔1340 m为西部的小石板河。截至2021年10月,晋宁区下辖昆阳街道、宝峰街道、晋城街道、二街镇、上蒜镇、六街镇、双河彝族乡、夕阳彝族乡,行政区域面积1336km²。根据第7次人口普查数据,截至2020年11月1日0时,晋宁区常住人口为346268人。

1.2 数据

考虑遥感影像数据的可获取性和代表性,选取Landsat 8影像作为数据源[14]。Landsat 8于2013年2月11日发射[15-16],包括9个波段,可以组合构成多个RGB方案用于支持自动分类方法的训练区提取和目视解译影像识别。论文选取2017年3月14日Landsat 8 OLI卫星影像为实验数据,轨道号:43(Row),129(Path)。此外,还选取了研究区同期的GF-1卫星影像,主要用于辅助分类训练样本选择、目视解译信息提取的高分辨率影像参考。实验利用ENVI 5.3软件对Landsat 8影像进行数据预处理,主要预处理为影像裁剪和影像融合。通过影像预处理后得到空间分辨率为15m的遥感影像,为后续实验提供了基础数据。

1.3 分类体系

参考国土资源部2007年8月发布的《土地利用现状分类》[17],结合对所选遥感数据的判读分析以及实验研究目的,确定将研究区土地利用覆盖信息分为5类,分别是耕地、绿地、城镇用地、水体和裸地。

2 研究方法

2.1 分类方法

论文将基于监督分类的方法对研究区影像进行土地利用覆盖的计算机自动分类提取。监督分类总体上一般可分为3个过程:选择训练样本、执行监督分类和分类结果评价[18]。在进行分类信息提取时,一般会根据分类的复杂度和所需精度等因素,选择多种分类器来辅助完成监督分类,本文所选用的分类器为神经网络和支持向量机[19]。

2.2 分类后处理方法

通常情况下,监督分类得到的初步分类结果中会存在一些面积较小且细碎的图斑。对于专题制图或实际应用,均考虑剔除这些较为细碎的图斑,或对细碎图斑进行重新分类。因此,对监督分类的结果实现进一步的处理操作是很有必要的。只有通过分类后处理,才能得到更为理想的分类结果[19]。本文所选用的分类后处理方法为聚类处理(Clump)和Majority/Minority分析[20]。

2.3 精度评价方法

本文将基于混淆矩阵[21]对分类结果进行精度评价。混淆矩阵通过计算可以得到如下4个参数,分别为总体精度P、生产精度Pij、用户精度Pij和Kappa系数,其计算公式如下:

式中,r为类别数量,Pii为第i行i列的被正确分类的对象,Pi+为第i+行的样本总数,P+j为第+j列被分为该类型的样本总数,N为样本总数。

3 结果

运用神经网络的分类器进行计算机自动解译,并结合聚类处理和Majority/Minority分析进行分类后处理,得到的结果如图1所示。

图1 神经网络分类结果图

通过神经网络分类结果图1a可以发现,神经网络的水体提取效果很好,且可以区分城镇用地和耕地。在近水体处,绿地提取效果较好,但裸地和绿地的区分效果一般。经过聚类处理后的分类结果(图1b)中的细碎图斑有所减少,道路也相对更加清晰了,绿地错分现象减少。经过Majority/Minority处理后的分类结果(图1c)中仍存在一些明显的细碎图斑。

运用支持向量机的分类器进行计算机自动解译,并结合聚类处理和Majority/Minority分析进行分类后处理,得到的结果如图2所示。

图2 支持向量机分类结果图

通过支持向量机分类结果图2a可以发现,支持向量机的分类结果较神经网络的分类结果更佳,各地类提取斑块中的细碎图斑明显减少,绿地错分现象得到一定改善。尤其,经过聚类处理后(图2b)的城镇用地分类较为清晰,而Majority/Minority处理后(图2c)的城镇用地分类仍存在细碎图斑。根据分类结果图2可以看出经过聚类处理后的分类影像效果最好。

以Landsat 8影像为底图,借助GF-1高分辨率影像为参考,利用ArcGIS 10.7软件,通过目视解译的方式绘制土地利用覆盖分类,并以此作为精度评价的验证数据。运用神经网络法进行分类,计算并统计分类结果的混淆矩阵,得到如表1所示的基于神经网络的土地利用覆盖分类精度评价表。

表1 基于神经网络的土地利用覆盖分类精度评价表

读表1可知:神经网络法分类的总精度为68.55%,Kappa系数为0.5973,研究区整体分类质量好。其中,水体的分类效果最佳,用户精度为96.53%,生产精度为94.56%;绿地和耕地的分类效果次之,用户精度分别为84.89%和83.38%,生产精度分别为67.18%和46.20%;而裸地的分类效果较差,用户精度和生产精度分别为21.00%和62.90%。

对神经网络分类结果进行聚类后处理,并计算分类后处理结果的混淆矩阵,得到如表2所示的基于神经网络聚类后处理的土地利用覆盖分类精度评价表。

表2 基于神经网络聚类后处理的土地利用覆盖分类精度评价表

读表2可知:对神经网络分类结果进行聚类后处理的分类总精度为69.27%,Kappa系数为0.6053,研究区的整体分类质量较未进行后处理的分类结果有所提升。其中,水体、绿地、裸地和耕地的用户精度均有所提升,而城镇用地的用户精度反而有所降低。绿地和城镇用地的用户精度均有所提升,而水体、裸地和耕地的用户精度反而有所降低。

对神经网络分类结果进行Majority/Minority后处理,并计算分类后处理结果的混淆矩阵,得到如表3所示的基于神经网络Majority/Minority后处理的土地利用覆盖分类精度评价表。

表3 基于神经网络Majority/Minority后处理的土地利用覆盖分类精度评价表

读表3可知:对神经网络分类结果进行Majority/Minority后处理的分类总精度为69.25%,Kappa系数为0.6061,研究区的整体分类质量较未进行后处理的分类结果有所提升。其中,水体、绿地、裸地和耕地的用户精度均有所提升,而城镇用地的用户精度反而有所降低。水体、绿地、裸地、耕地和城镇用地的用户精度均有所提升。相比之下,神经网络聚类后处理的土地利用覆盖分类总精度更高。

运用支持向量机法进行分类,计算并统计分类结果的混淆矩阵,得到如表4所示的基于支持向量机的土地利用覆盖分类精度评价表。

表4 基于支持向量机的土地利用覆盖分类精度评价表

读表4可知:支持向量机法分类的总精度为68.89%,Kappa系数为0.6008,研究区整体分类质量较好。其中,水体的分类效果最佳,用户精度为91.86%,生产精度为95.87%;绿地和耕地的分类效果次之,用户精度分别为85.73%和84.74%,生产精度分别为69.38%和43.58%;而裸地的分类效果较差,用户精度和生产精度分别为21.32%和61.96%。

对支持向量机分类结果进行聚类后处理,并计算分类后处理结果的混淆矩阵,得到如表5所示的基于支持向量机聚类后处理的土地利用覆盖分类精度评价表。

表5 基于支持向量机聚类后处理的土地利用覆盖分类精度评价表

读表5可知:对支持向量机分类结果进行聚类后处理的分类总精度为71.41%,Kappa系数为0.6302,研究区的整体分类质量较未进行后处理的分类结果有所提升。其中,水体、绿地、裸地和耕地的用户精度均有所提升,而城镇用地的用户精度反而有所降低。绿地、耕地和城镇用地的用户精度均有所提升,而水体和裸地的用户精度反而有所降低。

对支持向量机分类结果进行Majority/Minority后处理,并计算分类后处理结果的混淆矩阵,得到如表6所示的基于支持向量机Majority/Minority后处理的土地利用覆盖分类精度评价表。

表6 基于支持向量机Majority/Minority后处理的土地利用覆盖分类精度评价表

读表6可知:对支持向量机分类结果进行Majority/Minority后处理的分类总精度为71.47%,Kappa系数为0.6322,研究区的整体分类质量较未进行后处理的分类结果有所提升。其中,水体、绿地、裸地、耕地和城镇用地的用户精度均有所提升。绿地、耕地和城镇用地的用户精度均有所提升,而水体和裸地的用户精度反而有所降低。相比之下,支持向量机Majority/Minority后处理的土地利用覆盖分类总精度更高。

综上,对研究区的Landsat8遥感影像的监督分类及后处理方法对比研究可知,基于支持向量机Majority/Minority后处理的土地利用覆盖分类总精度最高,为71.47%。并且对神经网络和支持向量机的分类结果进行后处理,均可以有效提升分类精度。

4 结论

通过本文实验研究可知:支持向量机的分类结果较神经网络的分类结果更佳;经过后处理的分类结果较未进行后处理的分类结果更佳;基于神经网络的分类结果中,聚类后处理的效果最好,总体精度为69.27%,Kappa系数为0.6053;基于支持向量机的分类结果中,Majority/Minority后处理效果最好,总体精度为71.47%,Kappa系数为0.6322。其中,支持向量机Majority/Minority后处理效果最好,因此大面积快速提取土地利用覆盖分类,可针对金属矿山项目建设、采矿权矿权登记用地类型以及矿山开发阶段土地复垦类型,可做到一次性快速分类。但由于监督分类是以像元为单位,基于训练样本进行计算机自动解译分类,导致分类结果存在部分“椒盐”现象,未来还应不断优化提取技术、丰富数据源等方式,提高分类精度。

猜你喜欢

后处理土地利用聚类
一种傅里叶域海量数据高速谱聚类方法
车身接附点动刚度后处理方法对比
土地利用变化与大气污染物的相关性研究
基于GIS⁃Logistic回归模型的土地利用变化及驱动机制研究
土地利用规划的环境影响评价分析
果树防冻措施及冻后处理
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
基于柴油机排气后处理的排放控制技术应用研究