深度学习方法在松山湖地区地物分类中的应用
2020-03-16贺丹张静
贺丹 张静
摘 要:高分一号(GF-1)遥感影像具有分辨率高、光谱信息丰富、纹理清晰等特征,利用GF-1影像研究地物識别具有重要的现实意义。本文以东莞市松山湖地区为研究区域,基于GF-1遥感影像数据,分别采用最大似然法、支持向量机、深度学习(随机森林)等方法对研究区的地物进行识别。实验结果表明:采用深度学习方法对地物分类的总精度为92.24%,Kappa系数为0.91,与最大似然法和支持向量机相比,基于深度学习方法的分类精度更高,分类结果更能体现土地实际利用情况。
关键词:深度学习 松山湖 地物分类 遥感 高分一号
中图分类号:TN957.52;TP391.41 文献标识码:A 文章编号:1674-098X(2020)11(c)-0021-05
The Application of Deep Learning Method in the Feature Classification of Songshan Lake Area
HE Dan* ZHANG Jing
(School of Computer and Information, City College of DongGuan University of Technology, Dongguan, Guangdong Province, 523000 China)
Abstract: GF-1 remote sensing image is characterized by high resolution, rich spectral information and clear texture, etc. Therefore, it is of great practical significance to use GF-1 image to study ground object recognition. Based on GF-1 remote sensing image data, this paper takes Songshan Lake area of Dongguan city as the research area, and adopts maximum likelihood method, support vector machine, deep learning(Random Forest, RF) and other methods to identify ground objects in the research area. The experimental results show that the total accuracy of ground objects classification using deep learning method is 90.24%, and the Kappa coefficient is 0.91. Compared with the maximum likelihood method and support vector machine, the classification based on deep learning method has a higher accuracy, and the classification results can better reflect the actual land use.
Key Words: Deep learning; Songshan lake; Feature classification; Remote sensing; GF-1
在城市化的发展进程中,城市土地利用情况可以为城市化的下一步规划提供指导意见,因此掌握城市地物的分布情况对一个城市的长远发展具有重要意义[1]。遥感影像作为检测地物情况最直接的途径,在地物分布情况的研究过程中发挥了重要作用,遥感影像在土地覆盖检测、森林覆盖检测、草地覆盖检测、湿地覆盖检测等领域已经得到广泛的应用[2]。
随着高分遥感技术的不断进步和发展,中国航天事业也迎来了发展的新阶段,国产高分辨率遥感卫星技术迅速提升,一系列国产高分遥感卫星陆续发射并投入使用,国产高分卫星的发射推动了我国遥感行业的蓬勃发展。自从2013年发射国产高分一号卫星以来,我国相继发射了高分二号、高分三号等高分系列卫星。其中,国产高分一号卫星(GF-1)是中国高分辨率对地观测系统的首发星,突破了高空间分辨率、多光谱与宽覆盖相结合的光学遥感等关键技术[3]。目前,高分一号遥感数据被广泛应用于城市土地应用[4]、城市发展[5]、地物提取[6-7]等领域。本文以东莞市松山湖地区为主要研究区域,重点研究深度学习方法在高分遥感影像地物分类中的应用。
1 研究区域及影像数据
1.1 研究区域
东莞市位于中国华南地区,广东省中南部,地处珠江口东岸,介于东经113°31′~114°15′,北纬22°39′`23°09′之间,东北与惠州市接壤,南接深圳市,西北与广州市相邻。东莞市既是珠三角中心城市之一,又是粤港澳大湾区重点城市之一。
松山湖地区是东莞市政府将大岭山镇、寮步镇、大朗镇三镇靠近松山湖的部分边缘地带划分出来与湖泊区域重新组合形成新的国家级高新技术产业开发区。东莞市松山湖地区地处东莞市的几何中心,区域面积72km2,包括8km2的淡水湖和14km2的生态绿地,生态环境保持良好,研究松山湖地区的地物分布情况对松山湖区域未来发展具有重要意义。本文选取松山湖地区极具代表性的矩形区域作为研究对象,松山湖地区的位置信息如图1所示,该区域为亚热带季风气候,主要土地类型包括林地、耕地、水体、建设用地等,地物类型丰富。
1.2 影像数据
遥感技术是一种非接触远距离的探测技术,一般是通过利用传感器对物体的电磁波的辐射和反射特性进行探测,通过物体表面反射、辐射或散射的电磁波信息对物体信息进行提取、判定、分析和应用。2013年4月,国产高分一号卫星(GF-1)发射成功之后,为国土资源管理部门提供了高精度、多光谱的遥感影像,从而在城市规划和土地利用情况中发挥了重要作用。
本研究的GF-1影像数据从遥感集市数据中心(http://www.rscloudmart.com/dataProduct/)获取,该影像数据采集于2017年9月16日,研究区域所选影像云量为0%。使用ENVI5.2软件对GF-1遥感影像数据进行处理,主要包括正射校正、影像融合、大气校正、裁剪等影像预处理操作。预处理之后,研究区域的地理状况和GF-1遥感影像如图2所示。
2 地物分类研究方法
2.1 地物分类方法总览
遥感影像通过亮度值或像元值的高低差异(反映地物的光谱信息)及空间变化(反映地物的空间信息)来表示不同地物的差异,这是区分不同图像地物的物理基础[8]。遥感图像分类技术就是依据遥感影像中各类地物的光谱信息和空间信息对地物情况进行分析,通常地物分类方法包括监督分类和非监督分类,在ENVI5.2中,监督分类器包括平行六面体、最小距离、马氏距离、最大似然法、神经网络、支持向量机等方法,非监督分类器包括ISODATA和K-ean两种。本文选取监督分类中的最大似然法和支持向量机,并运用深度学习方法,实现松山湖地区的地物分类研究。
2.2 最大似然法
最大似然法(Maximum Likelihood Classification)是通过使用一个概率模型,根据遥感影像中像元的归属概率对地物类型进行分类。假设每一个波段的每一类统计都呈正太分布,计算给定像元属于某一训练样本的似然度,像元最终被归到似然度最大的一类中[8]。在使用最大似然法对地物进行分类时,一开始便假定各地物分类呈正太分布,但是实际情况往往与假定有一定差距,因此在采用最大然法时,对实验选取的训练样本有较高要求。
2.3 支持向量机
支持向量机(Support Vector Machine, SVM)是一种建立在统计学习理论基础上的机器学习方法,使用了铰链损失函数来计算经验风险,同时加入了正则化项来优化结构风险,具有稀疏性和稳健性的特点。SVM可以自动化寻找那些对分类有较大区分能力的支持向量,并构造出相应的分类器,可以将类与类之间的间隔最大化,从而有较好的推广性和较高的分类准确率[8]。通常情况下,使用SVM进行地物分类时,能取得较好的分类效果,但是对某些数据集而言,损失函数中相关参数的设置、核函数参数的设置对SVM分类器的分类效果影响较大,这种情形下需要通过多次交叉验证试验才能找到最佳的参数设置,实验代价较大。
2.4 深度学习之随机森林
深度学习方法(Deep Learning, DL)是机器学习(Machine Learning, ML)中的新分支,深度学习方法被广泛的应用于自然语言处理、语音识别、人脸识别等领域。随着深度学习方法研究的不断深入,深度学习方法在遥感影像处理领域的应用也取得了较好的效果。深度学习方法常用的算法包括:卷积神经网络(Convolutional Neural Networks, CNN)、长短时记忆网络(Long Short Term Memory Network, LSTM)、随机森林(Random Forest, RF)等。
本文选取深度学习方法中的随机森林进行地物分类研究,与传统的监督学习分类方法不同,随机森林是一种包含多个决策树的分类器,其输出的地物类别是由个别树输出的地物类别的众数而决定。在随机森林中采用CART決策树为基本分类器,构造一个集成学习模型,不仅克服了决策树中较常出现的过拟合问题,而且对噪声数据和异常数据有较好的容忍性,对较高维数据有可扩展性,既能处理离散数据也能处理连续数据。随机森林结构如图3所示。
3 研究过程
3.1 地物分类流程
采用监督分类方法对地物进行分类时,一般的流程包括4个步骤:定义训练样本集、执行监督分类、评价分类结果和分类后处理[8]。针对本文的研究重点,结合ENVI5.2中遥感影像处理的一般步骤和流程,将地物分类的流程主要分成如下4个步骤:遥感影像数据预处理、执行遥感影像地物分类、地物分类结果汇总与评价、地物分类结果后处理。在遥感影像数据预处理时,主要执行GF-1遥感影像获取、遥感影像预处理(包括正射校正、影像融合、大气校正、裁剪等操作)、地物类型确定、训练样本集定义等操作。在执行遥感影像地物分类时,分别采用最大似然法、支持向量机、随机森林三种方式对松山湖地区遥感影像执行地物分类,并记录分类结果。在地物分类结果汇总与评价阶段,分别从制图精度、用户精度、总体分类精度、Kappa系数等角度对3种方式地物分类结果进行算法评价,并对比这3种方式的地物分类结果。在分类后处理阶段,将通过Majority/Minority分析、聚类处理、分类统计等操作对分类结果进行处理。
3.2 遥感影像数据预处理
在获取GF-1遥感影像之后,借助ENVI5.2软件对松山湖地区遥感影像执行正射校正、影像融合、大气校正、裁剪等一系列操作,在执行研究区域选取时,尽量选取地物类型丰富、地物特征分明的区域。
根据2017年11月1日由国土资源部组织修订的国家标准《土地利用现状分类》(GB/T 21010-2017)[9],结合东莞市松山湖地区的土地利用情况,将地物分为林地、水体、建设用地、道路、其他用地,在本文的研究中,将重点研究上述五种地物类型的分布情况。
在ENVI5.2软件中借助ROI工具选取出各个类型地物的样本点[10],其中林地样本点为320个,水体样本点为410个,建设用地样本点为380个,道路样本点为260个,其他用地样本点为105个,5种地物样本数据数量均在100个以上,满足实验要求。同时,通过ENVI软件为每一个感兴趣区域组合计算Jeffries-Matusita距离和转换分离度,五类地物的可分离性值均在1.9以上,样本之间的可分离性良好。此外,随机选取各类样本点中的80%为训练样本集,剩下的20%样本点为测试样本集。
3.3 执行遥感影像地物分类实验
ENVI5.2中的Toolbox工具箱中提供了分类器选择功能,为遥感影像分别选用最大似然法、支持向量机两种方法执行地物分类。
采用深度学习方法中的随机森林方法执行地物分类步骤为:首先,将ENVI5.2软件中选取的ROI区域按照地物类型分别保存为CSV格式的文件;接着,使用Python语言实现CSV文件的读取,借助Google推出的Tensorflow框架实现随机森林算法模型,并利用训练样本集对模型进行训练,通过测试样本集对随机森林算法的分类精度进行评估。
4 实验结果
4.1 松山湖地区地物分类结果汇总与评价(3种方法对比)
在完成遥感影像数据预处理、执行遥感影像地物分类两个步骤之后,分别使用最大似然法、支持向量机、随机森林3种算法对遥感影像数据进行地物分类实验,并在实验之后统计出分类结果,将这些实验数据汇总如表1所示。
从表1中松山湖地区地物分类结果汇总情况可知,基于最大似然法的地物分类方法道路的用户精度为78.58%,林地的用户精度为78.46%,地物分类过程中错分和漏分的比例较高。支持向量机的分类方法比基于最大似然法的分类方法在总体分类精度上有所提高,提高了4.06%,Kappa系数提高了0.06。但是支持向量机的分类方法在道路、其他用地上的用户精度分别为83.55%、78.16%,分类精度仍有待提高。
表1中基于随机森林的地物分类方法在地物分类中体现了较高的分类精度,其中水体、林地的用户精度分别高达97.25%、95.25%,且总体分类精度为92.24%,Kappa系数为0.91。与最大似然法、支持向量机相比,基于随机森林的方法地物分类总体精度分别提高了:7.74%、3.68%,Kappa系数分别提高:0.13、0.07。
从分类结果可知,深度学习方法更适用于松山湖地区地物分类研究,其中随机森林方法在地物分类中体现出明显的分类精度优势。同时,深度学习的方法发展速度较快,应用场景广泛,更适合用于遥感地物分类。
4.2 地物分类结果后处理
在通过最大似然法、支持向量机、随机森林等方法执行GF-1遥感影像地物分类实验后,得到的是地物分类的初步结果,初步结果一般情况下还不能达到最终的应用目的,因此,在得到初步分类结果之后,需要进行一系列的地物分类结果后处理操作。在本文中,通过Majority/Minority分析、聚类处理、分类统计等操作对分类结果进行处理。
5 结语
本文以东莞市松山湖地区为研究区域,利用GF-1高分遥感影像,分别基于最大似然法、支持向量机、深度学习之随机森林三种算法对遥感影像数据进行地物分类,其中随机森林算法总体分类精度为92.24%,Kappa系数为0.91,比最大似然法的分类精度提高了7.74%,比支持向量机的分类精度提高了3.68%。深度学习方法能更好的利用训练数据集训练模型,并清楚地记录不同地物的特征,从而展现出更好的地物分类效果。因而,深度学习方法在松山湖地区地物分类中发挥了较好的作用,为松山湖地区的城市规划和建设提供了参考依据。
城市地物分布情况对城市的未来发展提供了重要依据,而高分遥感影像为地物提取提供了数据支撑,在今后的研究中需要在地物分类算法的精度上不断加强。同时随着城市化进程的加快,在实际应用中,一方面城市地物類型的分布情况是十分复杂的,另一方面对城市地物分类精度的要求也在不断提高,因此,基于高分遥感影像的影像预处理、地物分类、地物识别等算法还有待加强,在今后的研究过程中将研究出更高效的地物分类算法,构建更高精度的地物分类模型。
参考文献
[1] 袁静文,武辰,杜博,等.高分五号高光谱遥感影像的城市土地利用景观格局分析[J].遥感学报,2020,24(4):465-478.
[2] 遥感影像[DB/OL].[2020-02-07]https://baike.baidu.com/item/遥感影像/9861856?fr=aladdin.
[3] 高分一号卫星[DB/OL].[2020-05-24]https://baike.baidu.com/item/高分一号卫星/1669034?fr=aladdin.
[4] 高晨.基于高分一号影像和POI数据的土地功能分类方法研究[D].阜新:辽宁工程技术大学,2017.
[5] 马建如,裴亮.基于高分一号卫星的城市扩张变化监测研究[J].测绘与空间地理信息,2017,40(6):61-64.
[6] 孙嘉悦.基于集成学习的高分辨率遥感影像地表水体信息提取[D].长春:吉林大学,2020.
[7] 胡建青.面向对象的高分辨率遥感影像道路信息提取[D].北京:北京交通大学,2019.
[8] 邓书斌,陈秋锦,杜会建,等.ENVI遥感图像处理方法[M].2版.北京:高等教育出版社,2014.
[9] 土地利用现状分类(GB/T 21010-2017)[DB/OL].[2017-11-1] https://m.wang1314.com/doc/webapp/topic/20936079.html.
[10] 王义慧,宋磊.基于Landsat8的济南市土地利用分类及变化监测[J].科技创新导报,2020,17(14):52,54.