毛乌素沙漠植被的神经网络提取方法研究∗
2024-04-17熊文豪张晓倩刘天琦高贤君
孟 健 熊文豪 周 寒 张晓倩 刘天琦 高贤君
(1.中国矿业大学(北京)地球科学与测绘工程学院 北京 100083)(2.长江大学地球科学学院 武汉 430100)(3.内蒙古自治区测绘地理信息中心 呼和浩特 010050)(4.新疆大学地质与矿业工程学院 乌鲁木齐 830047)
1 引言
一直以来,沙漠治理和土地荒漠化治理都是环境治理关注的重点。为了更好地开展沙漠和土地荒漠化治理工程,需要对沙漠地区或荒漠化较为严重的地区进行必要的信息提取[1]。地表植被作为人类自然生态系统的一个重要组成部分,其生长状态常常受某一地区的许多自然环境因素的影响,另外植被的变化情况也常被人们用来当作准确评价当地生态环境气候变化的一个重要科学指标。近年来,随着遥感技术的不断发展,其已经能够实时提供大量的多时相数据,在植被信息提取方面被广泛的应用,目前已有研究探索沙漠地区的遥感植被提取方法,这对监测沙漠区域的植被动态变化具有重要意义[2~3]。
为了更好地改善沙漠植被治理,需要对其植被生长信息进行精确分类提取[4]。在提取靠近沙漠或者其他荒漠化地区土地的生物植被状态信息时,常用的分类方法主要包括目视信息解译、监督信息分类、非人工监督信息分类、决策树层和分层信息分类、神经网络自动信息提取等多种方法[5~6]。在当前的研究和实际应用中,通常采用其中的一种或多种方法结合进行分类提取[7]。吕利利等采用基于分类与回归树(Classification And Regression Tree,CART)决策树分类的方法对民勤县沙漠化信息进行提取[8]。魏艳辉等采用迭加替代自定义组织模式数据的采集分析算法(Iterative Selforganizing Data Analysis Techniques Algorithm,ISODATA)方法提取乌兰布和沙漠白刺沙丘边缘的地物信息[9]。刘勇采用决策树分类对乌兰布沙漠进行信息提取并辅以纹理分析[10]。王让会等建立线性光谱混合分析模型,并计算归一化植被指数(Normalized Differential Vegetation Index,NDVI)以提取古尔班通古特沙漠西缘的植被遥感信息[11]。目前利用遥感技术进行沙漠植被信息提取,多利用NDVI植被指数来区分研究区的地表状态是否为植被[12]。但遥感影像中时常出现同谱异物或者异物同谱的现象,且分类过程中易受到人为主观因素的影响,导致沙漠信息提取精度不高[13]。而且仅使用NDVI植被指数识别和检测植被,精度有所限制,误差也相对较大。针对此类问题,本文以榆林市毛乌素沙漠地区为例,将NDVI 指数和众多监督分类方法组合来提取研究区多个年份的植被生长变化状况,通过对遥感图像中的地物类别进行识别,将植被的谱识别问题转变为图识别问题,并辅以多个年份实现研究区域植被信息的动态监测。
2 方法
监督分类方法主要是通过划分类别样本,并对这些已知样本进行训练,根据已知样本对其它未知类进行分类的过程。分类时,在确定了类别定义和特征判别后,需要对训练区进行样本确认,然后选择合适的分类方法进行分类[14]。
ENVI 软件提供了众多监督分类方法,包括最大似然法、神经网络法在内的12 种[15]。其中,最大似然法利用了正态分布假设的基本原理,对每个像素所属的似然估计值进行分类,从而得到最有可能的分类。平行六面体方法根据训练样本的亮度值形成n 维数据空间,并根据像元的光谱参数值,动态地划分到相应的类别中。最小距离法主要原理是通过计算待分类像元与各个已知训练样本特征类空间中心的距离,选择距离最小的样本,将待分类像元进行归类。马氏距离分类是基于计算机在输入速度图像时得到各速度训练样本的马氏距离,最终比较马氏速度距离最小的,即为此值的类别。神经网络方法泛指现代计算机已经模拟出了人脑的网络结构,使用很多小的信息处理单元来模拟人脑神经元,能够基本模拟出人脑的信息识别、记忆、思考的整个过程,然后对像元进行影像分类[16]。支持向量机分类是一种建立在分类统计学基础理论上的一种机器学习的方法,为了将不同类之间的信息间隔距离最大化,并同时保持较高的支分类识别准确率,SVM可自动的准确识别类并寻找对不同类具有较大信息区别处理能力的各种支持分类向量,自动构造分类器,对像元进行图像分类。
基于以上监督分类方法的了解,本文以榆林市毛乌素沙漠为研究对象,将多种监督分类方法应用在该地并进行精度分析,以探索出提取沙漠植被表现最优的精度指标方法。
2.1 BP神经网络分类原理
反向传播(BP)是一种神经网络分析方法,利用最大误差反向信息传播算法。它采用最大误差逆向传播算法,通过采集仿真过程中的系统误差,将其反馈给输出,然后利用该误差对神经元权值进行调节,使其“偏差”尽量减小,从而使神经网络模型与数据集达到最好的拟合效果[17]。前向传输和后向传输是BP神经网络的两部分。神经网络结构包括输入层、隐含层、输出第一层。在正向样本传播的整个过程中,输入层首先传入一个输入层的样本,由一个隐含层进行处理后,再将其传向一个输出样本层。若信号输出处理层的实际信号输出与系统期望值输出不符,则信号会自动转向具有误差的反向信号传播下一阶段。在反向快递传播的运行过程中,反向快递传播把预期误差大的信号按原来正向快递传播的信号通路反向广播传回,进行多次预期修改,通过迭级换代的重复过程,对比各传播节点的预期权重和误差阈值,逐渐增大减小预期误差,直到节点达到新的预期误差要求。当输入误差参数小于某一参数相当小的输入正数或迭代输出误差不再继续减少时,即已经完成了基于BP 模型网络的误差训练、输入与迭代输出的误差映射的基本确定。在误差计算过程中,为使得误差值达到最小,采用梯度下降法。
用户在ENVI的用户中可以采用一个优化训练函数(例如对数(Logistic)和双曲线(Hyperbolic))以及针对输入端的训练函数贡献一个阈定的值(0-1),用于对每个节点内部权重的大小变化进行调节。训练中的算法交互式地通过调整两个节点间的响应权重和误差阈值,从而可以让节点输出响应层和输入响应层的误差可以达到最小。还可以输入所用隐藏层数来进行训练调整。在迭代过程中,直至误差达到最小,即可输出正确分类(如图1所示)。
图1 神经网络原理图
2.2 ENVI提取操作流程
本文主要使用ENVI5.1 软件进行图像监督分类(Classification),该模块下的监督图像分类(Supervised Classification)工具可完成研究区的分类。监督分类一般可以大致分为4 个基本过程:集中选取分类训练样本、执行训练分类、分类后处理和综合评价分类结果。
分类前首先在研究区域的遥感影像上对3 种主要的类型土地资源选取每套训练样本中最感兴趣的小区域(Region of Interest,ROI),进行训练样本的分类选取时,要选择两套训练样本,一套用于监督分类的初始训练样本,另一套用作监督分类后结果的样本精度评价。选取观测出一些具有最大典型性和最具代表性的规定训练样本,不仅能对其进行准确的分类,也能在一定量的程度上准确反映观测出其与同类相对地物体的光谱物理特性的长期波动变化情况,训练样区的样本数量也必须满足一定的训练要求,以确保能够代表该类别的光谱特征。
样本分离度评价:样本分离度的大小可用来检测选取的不同类别样本之间是否具有一定的可区分性。该评价工具主要是通过ROI 可分工具条来计算,各样本之间的分离度情况可以判断各类别之间的差别程度,参数在1.8~2.0 之间说明样本之间的分离性良好。通过分离度评价也可以绘制出样本类别的平均光谱响应曲线。
执行监督分类:监督分类方法众多,本文选取了神经网络、最大似然、平行六面体、最小距离、马氏距离和支持向量机在内的6 种分类方法,通过这6 种方法的评价分类结果比较,选出精度最高的监督分类方法。
评价分类结果:由于在前面实验选取训练样本时,我们制作了了两套训练样本,将另一套样本采用混淆矩阵(Confusion Matrix)的方式对识别结果进行精度监测,实现分类结果与实际样本信息的对比。对这6 种结果进行精度评估,选择在总体分类准确率、Kappa 系数等维度上表现最好的分类方法。
分类后处理:分类后处理是必要的步骤,因为监督分类得到的初步结果往往难以满足最终的应用需求。为了获得符合要求的最终分类结果,需要对初始分类结果进行一系列的处理,包括更改分类颜色、合并类别、主次要分析和聚类分析等常见操作。
3 实验分析
3.1 研究区域概况
本文以陕西省榆林市定边县、靖边县、横山区三地所代表毛乌素沙漠为研究区域。榆林市总面积43578 km2,界于东经107°28′~111°15′,北纬36°57′~934′之间,接壤于陕甘宁蒙晋五省(区)交界地带[18]。
榆林市范围内的毛乌素沙漠海拔高度大约在1200m~1500m,其总面积18424.42km2,占榆林市总面积的五分之二。受其地理位置影响,该地区具有独特的自然地理景观、丰富的生物多样性和典型的高原生态环境[19~20]。毛乌素沙漠不只有沙漠,草原地区分布有开阔草原、黄土地和丘陵,甚至有外水灌溉系统和内陆大运河。除此之外,毛乌素沙漠中还分布有许多大型湖泊和天然湿地,这在中国的主要草原沙漠中可说是独一无二的。榆林市由于毛乌素沙漠的存在,曾史上分布着最高达800 多个海子,还因此拥有一片大面积的天然绿洲、湿地、草原、牧场、农田和鱼塘。毛乌素沙漠地区是榆林市主要的农、林、牧、渔业综合发展示范基地,同时也认为是榆林市最重要的自然生态环境屏障[21~24]。
随着全球气候的不断变暖,气候灾害的频率和强度增加,以及人类活动的不断增强,毛乌素沙漠的生态环境遭到了破坏和恶化,湖泊、湿地面积大幅减少,由此引起生物多样性也急剧下降,严重影响了沙漠当地农、林、牧、渔业和可持续发展战略的实施。
3.2 不同分类方法的对比分析
为了监测毛乌素沙漠近些年来的植被变化情况,本文选取2013 年~2020 年长时间序列上的Landsat8 OLI遥感图像进行研究。由于研究区四季变化情况明显,不同季节植被覆盖状况可能有所不同,为了在长时间序列上来对比研究区的植被变化情况,本文仅选取2013年9月13日和2020年9月7日的遥感影像进行实验。
针对不同年份年的遥感影像分别采用多种不同的监督分类方法进行结果分类,并将分类处理得到的不同年份的结果与毛乌素沙漠原始真彩色影像进行对比,目视判断植被信息提取效果最好的六类监督分类方法展示如下。
观察图2、图3 的分类结果,可以知道,自2013年~2020 年的变化过程中,不同的分类方法均表现出地表植被范围增加的趋势。只有最小距离法可能识别的沙漠区域较多,看起来存在一定误差,经调研发现,最小距离法在进行监督分类时存在一定的缺陷,该方法不会考虑不同类别内部方差的差异,导致一些类别在边界上出现过度检测,从而引发分类误差,沙漠地区的植被覆盖情况较草原绿地本就略显稀疏,因此利用该方法进行沙漠地区的植被信息提取会进一步放大分类误差;另外图中平行六面体方法和马氏距离方法的分类结果又过于显著,与实际情况可能会有些偏差,这是由于马氏距离会夸大了小变量的影响,并且受到协方差矩阵不稳定性的显著影响。而平行六面体法考虑到n 维影响,对于很多沙漠地区像元本身都无法识别。
图2 2013年不同监督分类方法结果图
图4 监督分类精度对比分析图
单纯从目视解译来分析不同分类方法的优劣存在一些不确定性,因此接下来对6 种监督分类方法进行精度评价的对比分析。
通过精度评定对比分析表(如表1 所示)可以看出,神经网络方法在应用植被提取方面的精度非常高,其2013年总体精度约为90.48%,2020年总体精度更是达到了99.66%。
表1 监督分类精度对比分析表
通过6 种分类方法的精度对比,神经网络方法在长时间序列上表现的分类精度较其他方法更高,这是因为该方法具备一定的非线性映射能力、自学习和自适应能力,在应用沙漠地区植被信息提取方面具有很大的优势。另外结合分类后的图像效果以及其他像元内部结构或人为因素的影响,选择神经网络方法作为毛乌素沙漠地区的植被提取方法是更加具有参考价值的。
4 结语
本文以毛乌素沙漠为研究对象,在大量野外数据的基础上,采用多种监督分类方法方法对毛乌素沙漠的植被和非植被信息进行提取。经目视解译和精度评价,发现神经网络方法是毛乌素沙漠地区长时间序列植被信息提取表现效果最好的方法,它能够对图像进行深层特征的自动提取和分类,实现了机器的自动提取特征,对植被信息提取的时空变化研究,以及进一步实现植被遥感信息的高精度提取具有重要意义。
据中国林业局等相关报道,在经过长时间的治理之后,毛乌素沙漠植被覆盖率已经达到了33%,治理率达到93.24%,境内860万亩流沙已经全部实现了固定或者半固定的状态。因此在长时间序列上表现的植被变化状况是向好趋势发展的,这也与本文研究结果相一致。故在后续监测沙漠地区植被变化情况时,可借鉴本文神经网络方法来实现植被信息的遥感动态提取。