新巴尔虎右旗沼泽和草甸信息提取
2018-11-06刘志涛苏根成
刘志涛 苏根成
摘要:运用监督分类和决策树两种方法,以2014-8-25的Landsat8-OLI遥感影像为基础数据源,提取新巴尔虎右旗的沼泽和草甸信息。方法一:在ENVI中进行监督分类,将研究区分为沼泽和草甸、草地、森林、农用地、水体、居民地、沙地和其他等八类,采用最大似然法对研究区遥感影像进行沼泽和草甸信息的提取工作。方法二:求取研究区的归一化植被指数NDVI,将NDVI值和坡度值作为限制条件,进行求取研究区域的沼泽和草甸信息。将两种方法获得的沼泽和草甸分类图与验证样本进行混合矩阵分析,分别对两种分类结果进行精度评价,比较监督分类和决策树分类在沼泽和草甸信息提取的精度。结果表明:Landsat8-OLI影像采用监督分类的精度为89.40%,利用决策树分类的精度达到了91.05%,精度较高。这两种方法均能够很好地进行沼泽和草甸信息提取,同时验证了基于Landsat8遥感影像在湿地覆被分类的可行性。
关键词:新巴尔虎右旗;沼泽;草甸;监督分类;决策树
1.引言
1.1研究背景
本文所研究的湿地,包括研究区内的河流湿地、湖泊湿地、沼泽湿地以及草甸湿地等。近年来由于人类经济的不断发展,在比较偏远的湿地也得到了开发利用,同时也遭到严重破坏,湿地污染,面积也不断减少,功能日趋退化。因此,保护湿地已经引起了人们的广泛关注。湿地多处于偏远地区,采用传统的手段来监测,费时、费力、耗费高,调查范围小,对湿地有破坏性,而且其周期性较长,往往需要几个月甚至几年,时效性很差。及时、准确地获取湿地变化信息已成为湿地保护的重要手段之一。卫星遥感技术具有观测范围广、信息量大、获取速度快、动态性和实时性等优点,被广泛应用于湿地动态监测。
本文以内蒙古自治区呼伦贝尔市新巴尔虎右旗为例,通过选取不同方法进行沼泽和草甸信息提取,得到该湿地空间分布图,为新巴尔虎右旗湿地保护提供参考信息,以期为OLI影像更广泛和更有效地应用于湿地信息提取提供参考依据。
1.2研究区概括
新巴尔虎右旗是内蒙古自治区的19个边境旗市和23个牧业旗之一,是自治区唯一一个与两个毗邻国家接壤的旗县,即中俄蒙三国交界处。地理位置在中国东北边陲(东经111°31′~117°43′,北纬47°36′-49°50′),在举世闻名的呼伦贝尔大草原西南部。东部以乌尔逊河为界与新巴尔虎左旗隔河相望,东北部与全国最大的陆路口岸城市满洲里毗邻。总面积25194km2,其中水域面积2217.4km2。新右旗境內水资源丰富,有克鲁伦河和乌尔逊河2条河流和呼伦湖、贝尔湖、乌兰诺尔3个较大湖泊、湿地,属于黑龙江流域额尔古纳河水系,年径流总量为8.072亿立方米。
2.研究方法
2.1监督分类方法
监督分类(Supervised Classification)又称训练分类法,是用已经确认类别的样本像元来识别未知类别像元的过程。当对研究区域比较了解的时候,或掌握了更多的先验知识,为了使这些有用的辅助信息参与到遥感分类中,需要使用监督分类方法。监督分类主要是根据分类的复杂程度、精度要求等来选择分类器。常用的分类器有最小距离、最大似然、平行六面体、马氏距离、神经网络、支持向量机等。本文主要选取最大似然法对研究区的不同影像数据进行分类比较。
2.2最大似然法
最大似然判别法,也称为bayes分类,它是建立在贝叶斯准则的基础上,偏重于集群分布的统计特性,分类原理是假定训练样本数据在光谱空间的分布是服从高斯正态分布规律的,通过对感兴趣区域的统计和计算求出样本均值、方差和协方差等统计特征参数,从而求出总体的先验概率密度函数,然后通过计算给定像元属于某训练样本的概率,将像元归人概率最大的一类中,从而达到分类的效果。具体分为3步:首先确定各类的训练样本;再根据训练样本计算各类的统计特征值,建立分类判别函数;最后逐点扫描影像各像元,将像元特征向量代人判别函数,求出其属于各类的概率,将待判断像元归属于最大判别函数值的一组。
2.3决策树
决策树分类算法的基本思想是:按照一定的规则把遥感数据集逐级往下细分以得到具有不同属性的各个类别。分类决策树由一个根节点(Root nodes)、一系列内部节点(Internal nodes)(分支)和终极节点(Terminalnodes)(叶)组成,每个内部节点只有一个父节点和两个多个子节点。在每一个内部节点(包括根节点)处根据一系列规则将该节点处的数据集划分为两个子集,如此往复直至所有的数据被分为预期设定的各个子集为止。这里的规则可以是根据经验和目视解译人为设定,也可以按照一定的算法自动获取。决策树能够处理的数据集不仅包含光谱信息,还可以是纹理信息、空间特征和高程信息等多元数据。图1为本次分类的决策树的基本模型。
3.数据处理
3.1前期处理
从权威地理信息数据网站http://www.gscloud.cn/下载研究区的遥感影像,选取Landsat8-OLI的2014-8-25遥感影像为基础数据进行处理。数据必须利用专业软件打开和处理,数据预处理步骤如下:①辐射校正。Landsat-8得到的数据为Levell T级别,该数据产品是使用地面控制点和数字高程模型数据进行几何精校正处理后得到的数据产品,因此,实验用的Landsat-8数据可以直接使用而不需要做几何校正。本文主要对研究数据直接进行辐射校正处理。辐射校正的目的是消除或修正辐射误差而引起的影像畸变,主要包括辐射定标和大气校正。本文采用ENVI中的FLAASH工具进行大气校正,具有较高的辐射校正精度,更适合用于湿地植被信息的提取。大气校正后自动剔除卷云波段9,应用于数据分类的是1~7共7个波段。②影像镶嵌。由于单幅的Landsat-8影像无法完全覆盖整个研究区域,所以对两幅互为邻接的Landsat-8影像进行几何镶嵌、色调调整、去重叠等处理,拼接为统一的影像。③影像裁剪。根据已有的研究区矢量化边界,结合新巴尔虎右旗行政区划图,进行影像裁剪,裁剪后的结果影像作为研究区的基础数据,且影像质量满足研究需求。
3.2监督分类提取沼泽和草甸
利用监督分类方法,将研究区的覆被信息分为沼泽和草甸、草地、森林、农用地、水体、居民地、沙地和其他等八类。利用经验和已有资料选取有代表性训练区,绘制成多边形,对每一种选取的训练区都均匀地分布在整个研究区中,湿地感兴趣区选择为181个,将提取好的训练区用最大似然法分类,得到初步分类效果图,如图2所示。由于遥感影像图的分类过程是按照影像光谱特征进行的聚类分析,都带有一定的盲目性,分类得到结果图成块的地类图会出现小块的异类图斑。本实验对分类图进行了聚类分析(Clump),过滤处理(sieve),得到的监督分类影像图(见图3)。由于克鲁伦河这一主要水系在监督分类过程中没有与沼泽草甸分离,为此计算了归一化差异水体指数(NDWI),提取出水体信息,然后进行了波段差值运算,从监督分类结果图中去除了水体信息,得到新巴尔虎右旗的最终监督分类结果图,沼泽草甸与河流明确地分离开,而且沼泽草甸斑块比较完整(如图4)。
3.3决策树方法提取沼泽草甸信息
决策树分类算法的基本思想是:按照一定的规则通过构建决策树模型,把遥感数据集逐级往下细分以得到具有不同屙性的各个类别,在本文的决策树模型是通过两个分支提取的研究区的两类沼泽草甸信息。
在决策树模型中,ndvi为归一化植被指数;p(nir)为近红外波段的反射率;slope为由DEM求得的坡度图。
如图1所示,该决策树模型是以研究区的NDVI为基础,在反映新巴尔虎右旗土地覆盖植被状况优势明显。在构建模型时,通过反复试错获得沼泽草甸区域在决策树各节点的分割阈值为0.3时,能够较精确的提取出大量沼泽草甸信息,同时也包含了研究区北部的森林地貌信息,此时利用沼泽草甸的坡度较小的特点,以slope<0.8为条件能够剔除其他干扰信息,而提取出大部分沼泽草甸信息;其次在呼伦湖南岸有大片盐碱地的ndvi值较低,通过反复试错以nd-vi<0.15和p(nir)>1400为条件,可以做到精确区分。
4.分类结果评价
对于遥感图像的分类结果,可以采用混淆矩阵和分类精度指标进行评价,分类精度指标主要有用户精度、生产者精度、总体精度、错分误差、漏分误差和Kappa系数。本文主要采用总体分类精度(Overall Accuracy)和Kappa系数来进行分类精度评估,验证样本为通过已有资料选取的80个样点,分别建立混淆矩阵。
LandsatS-OLI影像采用监督分类的精度为89.40%,Kappa系数为0.54;决策树分类的精度达到了91.05%,Kappa系数为0.63。两种方法均可用,后者能够更好地进行沼泽草甸信息提取分类,精度更高。表明基于Landsat8遥感影像在沼泽草甸覆被分类的可行性,从而能够及时合理地保护湿地资源。
5.结果分析
监督分类结果如图5所示,经过统计,沼泽草甸面积约为916.46km2。决策树模型得到的结果如图6所示,沼泽草甸面积约为885.59km2。
由圖可知,新巴尔虎右旗的沼泽草甸植被比较丰富,主要分布在克鲁伦河流域以及呼伦湖、贝尔湖周边,在研究区的南北内陆草原地区受星罗棋布的湖泊影响,也有一定小面积的湿地存在。
6.结论
本文利用landsat-8的影像应用监督分类和决策树两种方法提取了沼泽和草甸信息,并将分类结果与已有分类数据进行混淆矩阵验证,结果表明决策树的分类精度更高,比监督分类结果高出1.65%。可见在湿地覆被分类研究中有一定的分类精度优势。
此外就遥感影像分类提取信息而言,在选择不同时期的影像图对提取的精度影响也很大。在北方地区提取沼泽草甸信息时,选取八九月份的影像效果较佳,其他草本植物的叶绿素比湿生植物降解的早,此时的沼泽草甸信息在标准假彩色影像的颜色纹理更清晰,提取精度可能更高。