基于Landsat8数据和监督分类方法的土地利用分类研究
2020-05-18肖凡郭俊军张梦杰
肖凡 郭俊军 张梦杰
摘 要:该研究以Landsat8数据为基础,采用ENVI软件对数据进行预处理,以《土地利用现状分类》(GB/T21010-2017)为标准,将研究区的土地利用分为农用地、林地、水域、建筑用地和未利用地5种类型,分别采用平行六面体法、马氏距离法、最小距离法、最大似然法、神经网络法、支持向量机等6种监督分类方法进行分类,并对土地分类结果和精度进行评价,以分类精度和制图精度最高的支持向量机分类结果为对象,用其他5种分类方法与其进行结果差异对比分析。通过多种监督分类方法结果对比,以期为后期土地利用分类提供指导和借鉴。
关键词:Landsat8;监督分类方法;土地利用分类
中图分类号 TP79文献标识码 A文章编号 1007-7731(2020)08-0110-04
土地利用/覆盖变化(LUCC)是全球环境变化人文因素计划(IHDP)与国际地圈生物圈计划(IGBP)的核心研究内容之一,也是全球变化研究的重要因素之一[1]。开展土地利用分类研究有助于及时掌握区域土地覆盖变化,合理制定土地利用规划,节约土地资源,提升土地利用效率。20世纪以来,打造新型卫星的传感器相继发射,針对不同问题,不同传感器有不同的参数特点[2]。Landsat8由于波段信息丰富、空间分辨率高、易获取等优点成为广大学者研究的重要数据来源。而随着国内遥感技术的发展,高分辨率遥感影像凭借地物内部分异明显、纹理清晰、细节丰富等优点也被应用到土地利用分类中。
本研究通过获取Landsat8 OLI遥感影像数据,以长沙市望城区为研究区域,对其遥感影像进行辐射校正、大气校正、融合、裁剪等预处理后,采用目视解译选取具有代表性的土地利用分类训练样本,分别采取平行六面体法、马氏距离法、最大似然法、最小距离法、神经网络法和支持向量机等监督分类方法对研究区域进行分类,并对分类结果进行对比分析。
1 研究区概况
望城区位于湖南省长沙市,地处湘中东北部,湘江下游,属中亚热带季风湿润气候。全区整体地形由南向北倾斜,呈不规则的长方形,东北部最高峰黑麋峰,海拔590.5m;西南部嵇珈山海拔474.2m;西北部为滨湖冲击平原区,土地平旷;内有湘江、沩水河流过,且有团头湖等湖泊分布。望城区共有5个镇、10个街道,总面积951km2,总人口58.9万人(不含雷峰街道,2018年)。
2 数据来源及分类
2.1 数据来源 本研究所使用的Landsat8影像数据来源于地理空间数据云(http://www.gscloud.cn/),时间为2018年2月3日,云量2.12%,研究区内无云,多光谱波段空间分辨率为30m,全色波段空间分辨率为15m。选择与Landsat8同期的2m分辨率遥感影像1张,利用高分影像选取训练样本,作为土地利用分类后的验证样本,以此评价土地利用分类精度。
2.2 分类
2.2.1 数据预处理 下载的Landsat8数据为L1T级产品,已经进行相关几何校正,此次处理过程中不再进行几何校正。利用ENVI软件进行辐射校正和大气校正,同时根据望城区行政区界线对遥感影像进行裁剪,提取出研究区的遥感影像。同时将多光谱波段(Band1-Band7)和全色波段(Band8)进行融合,从而得到15m分辨率的多光谱融合影像。
2.2.2 分类方法 监督分类方法[3],首先从研究区域选取有代表性的训练场地作为样本。根据已知训练区提供的样本,通过选择特征参数(如像素亮度均值、方差等),建立判别函数,据此对样本像元进行分类,依据样本类别的特征来识别非样本像元的归属类别。常用的监督分类方法有以下几种:
(1)平行六面体法 平行六面体法(Parallelpiped)是指以地物光谱特征曲线为参照,假定同类地物的光谱特征曲线相似作为判决的规则。其尺度由训练样本学习产生的类别均值求出的标准差阈值确定[3]。对于某一类别i,当像元X的灰度值满足:
(5)神经网络法 神经网络法(Neural Net)是一种应用类似于大脑神经突触链接结构进行信息处理的数学模型。这个方法将人工神经网络中的处理单元类比为人类大脑神经元模式,通过计算机模拟人脑的结构。用模型中一系列小的处理单元模拟人类大脑的神经元,再通过算法来实现人脑的认知、识别、思考的过程,最终将其应用于影像分类中。神经网络法适应性强、抗干扰能力高。但存在效率低,处理过程需要设置较多的参数等问题[6]。
(6)支持向量机 支持向量机分类法(Support Vector Machine)是由VapniK提出的,主要应用于模式识别领域,是一种建立在统计学习理论基础上的机器学习方法。支持向量机的基本思想是在样本空间或特征空间构造出最有超平面,使超平面与不同类别样本集之间的距离最大,从而达到最大的泛化能力。支持向量机分类方法可以支持高维数据;其次,它具有抗躁性强、训练样本较小、分类速度较快以及稳定性较强的特点。但是该方法也有不足,就是其需要大量的合适特征参数保证分类精度[7-8]。
2.3 样本选择 土地利用分类被广泛应用到国土、水利、环保等各行业,近些年也被应用到全国性水土流失动态监测中,本研究以《土地利用现状分类》(GB/T21010-2017)[9]为基础,结合Landsat8数据属性和分类对象的分布特点,将地类分为5类,每种土地利用类型确定200个训练样本。具体分类包括:(1)农用地:包含种植物农作物的耕地,种植果、叶、汁等多年生木本和草本作物的园地,以及草本植被的草地。(2)林地:包含种植生产乔木、竹类、灌木的土地。(3)水域:包含河流、湖泊、坑塘等天然水域。(4)建筑用地:包含城镇、农村以及交通建设的土地。(5)未利用地:包含空闲地、裸地等地类。
训练样本的建立需要具有良好的可分离性,常用的判断方法包括Jeffries-Matusita和Tranesformed-Divergence2种,数值在0~2之间,越接近于2,说明分离性越好;<1.8时,需要重新选择样本;<1时需考虑将2类样本进行合并。此次采用Jeffries-Matusita系数来对训练样本进行判别,结果发现各类样本均在1.8~2.0之间,样本的可分离性良好。具体系数值表1所示。
3 结果与分析
3.1 分类结果 根据监督分类方法及原理,利用ENVI软件对望城区Landsat8遥感影像数据进行分类,结果如图2所示。根据此次分类结果,对研究区内各地类进行数据统计,其各分类方法所得到的结果如图3所示
从图2可以看出,6种分类方法所得到的建筑用地主要位于望城区中部地区,也是望城区的主城区,东南部金星北地区、北部沿江右岸铜官窑附近以及中东部与开福区交界处附近也是建筑用地相对集中的区域;望城区西北部团头湖、中部湘江水域对应各分类方法中的白色区域,分类结果相对准确;结合图3可以看出,6种分类方法所得到的地类中,农用地和林地占比最高,整体分布符合望城区的实际情况,但占研究区国土总面积的比例与实际情况略有差异;对未利用地的分类各方法之间有较大差异,存在误分的可能,这可能与分类方法和训练样本的选择有关。
3.2 分类精度评价 对于土地分类精度的评价包括整体分类精度评价和制图精度評价。
3.2.1 整体分类精度 土地利用整体分类精度的评价是对分类结果的检验,常用的方法有2种,一是将分类结果与实际土地利用现状分类数据进行比较;二是采用高分辨率遥感影像选取一定比例的训练样本来检验Landsat8分类数据的准确性。最常用的评价系数就是总体精度系数(Overall Accuracy)和Kappa系数[10]。本研究利用2m分辨率遥感影像,针对农用地、建筑用地、林地、水域和未利用地各选取200个训练样本,利用ENVI软件对分类结果进行评价,其结果如表3所示。从表3和图4可以看出,土地利用分类总体精度和Kappa值的总体趋势相同,由高到低的监督分类方法依次是支持向量机、最大似然法、神经网络法、马氏距离法、平行六面体法、最小距离法。
3.2.2 制图精度 制图精度指分类器将整个图像的像元正确分为第m类的像元数(对角线值)与该类真实参考总数(混淆矩阵中第m类列的总和)的比率。
从图5可以看出,农用地的制图精度中支持向量机、神经网络法、马氏距离法和最大似然法相近,集中在98%附近,而平行六面体和最小距离法与其他4种方法差异较大,最小距离法制图精度为61.51%,在所有方法中最低;建筑用地的制图精度中,6种分类方法均有差异,精度由高到低依次是支持向量机、最大似然法、神经网络法、马氏距离法、最小距离法、平行六面体法;对于林地的制图精度除最小距离法略有差异外,其余,5种分类方法精度相当;6种分类方法对于水域的区分表现相同,制图精度差异较小;未利用地的制图精度中最大似然法精度最高,其余5种方法紧随其后,精度均在70%以上。整体趋势看出,支持向量机在不同地类制图精度中相比其余5种方法较高,且不同地类所表现的趋势相对稳定,精度差异较小。
4 结语
本研究根据6种不同监督分类方法原理,以ENVI软件为支撑,以望城区为研究对象,对比分析了平行六面体法、马氏距离法、最小距离法、最大似然法、神经网络法和支持向量机6种方法的分类结果和精度,结果发现:(1)6种分类方法在分类中得到的5种地类空间分布相近,但相同地类的面积存在差异;(2)支持向量机法和最大似然法得到的分类总体精度较其余4种分类精度高;(3)在制图精度分析中,支持向量机法得到的6种地类整体精度较高,在建筑用地分类中各方法差异较大,后期可以根据不同方法对于不同地类的分类精度进行敏感性分类。
参考文献
[1]王敏,高新华,陈思宇,等.基于Landsat8遥感影像的土地利用分类研究——以四川省红原县安曲示范区为例[J].草业科学,2015,32(5):694-701.
[2]宋军伟,张友静,李鑫川,等.基于GF-1与Landsat8影像的土地利用覆盖分类比较[J].地理科学进展,2016,35(2):255-263.
[3]梅安新,彭望琭.遥感导论[M].北京:高等教育出版社,2001.
[4]张明,黄双燕.基于Landsat-8的遥感影像分类研究[J].测绘与空间地理信息,2019,42(1):177-180;
[5]杨鑫.浅谈遥感图像监督分类与非监督分类[J].四川地质学报,2008,28(3):251-254.
[6]白宇兴.基于Landsat8的土地利用分类方法对比研究——以西安市未央区为例[J].西部大开发(土地开发工程研究),2019,4(11):1-7.
[7]李平,吴曼乔,曾联明.支持向量机技术在土地利用监测的应用研究[J].测绘通报,2010(8):28-30.
[8]杨长坤,王崇,张鼎凯,等.基于SVM的高分一号卫星影像分类[J].测绘与空间地理信息,2015,38(9):142-146.
[9]GB/T201010-2017.土地利用现状分类[S].2017.
[10]许伟,奚砚涛.基于Landsat8遥感影像的合肥市土地利用分类[J].湖北农业科学,2015,54(15):3625-3637.
(责编:张 丽)