基于LANDSAT8 OLI影像的唐山市路南区建设用地信息提取
2020-12-26董元方良义董梦张令涛魏月茹
董元,方良义,董梦,张令涛,魏月茹
(1.华北理工大学 矿业工程学院,河北 唐山063210;2.中交四航局珠海工程有限公司,广东 珠海 519085;3. 北京化工大学 文法学院,北京 100029)
0引言
城市建设用地信息对城市开发利用和环境变化监测具有重要意义,为城市的规划管理工作提供重要参考。近年来我国城镇化速度加快,城市建设用地也呈现出飞速变化的特点, 而landsat等多光谱遥感数据具有成本低、范围广、时效性好等特点,使遥感技术在建设用地提取方面具有广泛应用。国内对此已有大量相关研究,梁珊等选用了3个时相的遥感影像,采用OSTU算法结合不同的提取指数,根据实际情况确定提取地物信息,并对建设用地进行提取[1]。王苏芸等基于面向对象和区域增长的方法,通过计算纹理特征,进行多尺度分割,对东营市城乡建设用地提取[2]。黄滢冰等通过构建谱间阈值指数模型和混合像元分解模型实现较高精度地自动提取建设用地模型[3]。许莹等利用TM遥感影像,结合不同的提取指数对城区建筑用地信息进行提取和分析,结果表明NBI指数效果最好[4]。饶萍等提出一种决策树分类法,将支持向量机结果、4种归一化指数等作为特征节点对建设用地进行提取,总体精度达到98%[5]。梁书维等选取吉林省2个村庄作为研究区进行建设用地提取,证明支持向量机的监督分类法和基于NDVI并辅以NBRI的间接提取法最优[6]。马亚飞等使用BP神经网络对高分辨遥感影像进行分类,精度相对于最大似然法有明显提高[7],但是使用神经网络进行建设用地提取的研究较少,该项目采用神经网络的监督分类和面向对象分类方法对唐山市路南区的建设用地进行提取。
1建设用地提取方法
建设用地是指建造建筑物、构筑物的土地,是城乡住宅和公共设施用地,有工矿、公用设施、公共建筑、住宅、交通运输、水利设施用地以及军事、宗教等特殊用地。建设用地按照大、中、小可细分为如表1所示几种类型。
表1 建设用地类型
建设用地因地物分布较为破碎、同物异谱现象比较普遍,导致建设用地提取较为困难,目前建设用地遥感信息提取方法主要有:马氏距离法、面向对象法和神经网络法等。
马氏距离法是利用输入遥感图像到训练样本(见公式1),根据公式统计的马氏距离,将最小的马氏距离判断为此类别。
(1)
式中,μ为样本分布均值,S为样本分布的协方差矩阵。
马氏距离法的优点为原理相对简单,分类的速度比较快,缺点为精度较低,分类结果受目视解译影响较大。
面向对象的分类方法是对分割以后的图像进行分类,充分利用隐藏在客观存在实物中丰富的空间信息,相对于传统的基于像元分类方法仅利用光谱信息,面向对象分类方法在这方面有所改善,面向对象分类方法分析的是由若干像素组成的对象,而不是单一像素,目标对象更具有实际意义。通过分割得到的影像对象继承了原始影像上的光谱特性,不同对象之间的几何特征、纹理特征、空间特征等还存在着较大差异,这些特征表达了不同对象之间的差异,面向对象的影像信息提取方法一方面确实能提高影像的分类和提取的精度,另一方面也会产生误差问题,因此该项研究引入神经网络算法进行建设用地提取。
随着深度学习的研究不断深入,神经网络算法应用越来越广泛。神经网络算法是一种智能化的算法模型,通过不断训练的过程,学习特定规则,使输入值经过计算最接近期望的输出值。应用于遥感影像监督分类是以反向传播算法为模型的神经网络。神经网络一般由输入层、隐藏层和输入层组成,每个网络层都包含有多个神经元,每个神经元都会跟相邻的前一层的神经元有连接,这些连接其实也是该神经元的输入。在初始阶段,所有权重都是随机分配的。对于训练集的每个输入值,经过神经网络的前向传播后,得到的输出值将会与期望的输出值进行比较,然后得到的误差会传回给前面的网络层。这个误差会被记录来下,然后权重会随之进行相应的调整。这个过程会不断重复,直到输出的误差低于一个设定好的阈值。在实际应用中,当误差低于设定阈值时,神经网络训练过程结束。神经网络算法具有非线性拟合能力,可以解决复杂的非线性问题,而且学习规则简单,便于编程实现,因此应用广泛。
2数据来源与预处理
唐山市路南区是唐山市中心城区之一,位于中心区南半部。路南区地处华北平原东北部,北纬39°34',东经118°14',区域面积为117.53 km2,南部与丰南区相连,北接路北区。唐山市路南区属暖温带半湿润季风型大陆性气候。春季风多雨少,较干旱;夏季高温多雨;秋季温差大,较清爽;冬季寒冷少雨[8]。
本实验采用地理空间数据云网站下载的landsat8 OLI遥感影像,OLI 共包含9个成像波段,其中第 8 波段全色波段分辨率为 15 m,其他波段为30 m,选择遥感图像时应该尽量避免云量较多的图像,该项研究采用云量为0.18,成像时间为2018年3月16日的唐山市路南区landsat8 OLI遥感影像。
实验采用ENVI5.1进行原始图像的预处理,使用radiometric calibration工具对原始图像的多光谱、全色波段进行辐射定标,辐射定标后的多光谱波段进行FLAASH大气校正,大气校正后的多光谱波段与辐射定标后的全色波段进行GS图像融合,将分辨率提高到15 m,使用路南区的矢量文件进行图像裁剪,研究区图像如图1所示。
图1 研究区位置
路南区的建设用地北部较为集中,南部较为分散,根据实际情况,将路南区建设用地分为城乡居民建设用地、工矿用地和交通设施用地,建设用地遥感图像特征如表2。
表2 建设用地遥感图像特征
3信息提取
3.1 面向对象分类方法
影像分割对于面向对象分类方法十分重要。分割尺度选择过大会造成不同地物类型的像元不能分割,造成不同地类的混淆,而分割尺度过小会造成地类分割过于精细,经过多次实验选择最佳的目视效果。合并尺度选择过大会造成不同地物像元的合并,合并尺度选择过小会造成相同地物类型不能合并。
图2 不同分割尺度效果图
从图2可看出,分割尺度为50时,分割尺度较小,不同地物类型不能分离,尤其是交通设施用地;可看出,分割尺度为40,分割效果有所改善,但是仍然存在不同地物分割不清的现象。分割尺度为35时,地物分离比较合理,能够满足分类要求。
通过对比图3发现,合并尺度为80时,合并尺度较少,地物较破碎,因此合并尺度为90比较合适。
经过实验对比,最后确定分割尺度为35时能够将建设用地较好地分割,合并尺度为90能够更好地表现地物的特征。
确定最佳的分割尺度和合并尺度后,进行样本的选取,样本的选择要具有代表性和典型性,样本在遥感图像中的选择应该尽量均匀分布,样本选择完成后利用ENVI面向对象分类模块进行分类。样本分类统计结果如表3所示,针对本实验采用面向对象分类法分类结果如图4所示。
图3 不同合并尺度效果图
表3 样本分类统计表
图4 面向对象分类法分类结果图
从图4中可以看出,面向对象分类法提取的建设用地充分利用了实物中丰富的空间信息,提取的地物比较连续,利用高分一号分辨率影像,结合谷歌地球选取地表真实感兴趣区,利用ENVI提供的混淆矩阵工具进行精度评定,面向对象分类法的总体精度为82.259 1%,同时该分类方法的kappa系数为0.717 0,提取精度达到了较高的水平。
3.2 神经网络监督分类方法
训练样本的选取是神经网络训练的重要前提,神经网络训练样本选择的好坏直接关系到最后分类的精度。训练样本的代表性和典型性是训练样本的重要标准,同时又要保证神经网络训练能够快速收敛。使用ENVI平台上选取训练样本,样本选取如表4所示。
表4 样本分类统计
利用ENVI监督分类中的神经网络模块建设用地进行提取,选择ENVI提供的激活函数对数(Logistic)函数,学习率设置为0.05,参数值越大相应训练速度越快,但也可能会导致误差震荡或者使训练结果不收敛。训练初始权重设为0.075,该参数用于调节节点内部权重的变化。将该参数设置为0,内部权重将是固定值,内部权重调节要适中,如果设置的权重太大,对分类结果也会产生不良影响。期望误差最小值设置为0.001,误差值在训练过程中会在图像中显示,当该值小于阈值时,即使还未达到迭代次数,训练也会停止,软件开始进行分类。隐含层层数设置为1,训练次数设置为1 000。
从图5中可以看出,神经网络监督分类方法提取建设用地更加精细,利用高分一号分辨率影像,结合谷歌地球选取地表真实感兴趣区,利用ENVI提供的混淆矩阵工具进行精度评定,神经网络监督分类法总体精度为85.769 0%,同时该方法kappa系数为0.775 0,提取的精度进一步提高。
4建设用地提取精度评定
精度评定是评价实验质量的重要环节,该项研究利用高分一号分辨率影像,结合谷歌地球选取地表真实感兴趣区,利用ENVI提供的混淆矩阵工具进行精度评定,结果如表5和表6所示。
表6 神经网络监督分类法精度评定表
从表5、表6中可以看出,面向对象分类法的总体精度为82.259 1%,对应的kappa系数为0.717 0,而神经网络监督分类法的总体精度达到85.769 0%,对应的kappa系数为0.775 0,相对于面向对象方法,神经网络监督分类方法总体精度提高了3.509 9%,其中城乡居民建设用地和工矿用地方面,神经网络监督分类方法用户精度相对于面向对象分类法有明显的提高。
5结论
(1)神经网络监督分类方法和面向对象分类方法提取建设用地的精度都达到80%以上,精度满足一般要求。
(2)神经网络监督分类方法精度更高,相对于面向对象分类法的提高了3.509 9%,为建设用地的提取提供了新的方法。