面向对象的DOM 影像地类信息提取
2021-12-14谭秋焰朱新婷
谭秋焰 朱新婷
(西南科技大学环境与资源学院,四川绵阳 621010)
土地利用是人类在利用开发土地资源时,与土地直接相关的活动,可以表现当地的人文环境和自然环境间的相互影响[1]。我国利用遥感数据提取地类信息的发展进程迅速,由最初的人工薄膜勾绘,到陆地卫星TM 图像作为基本信息源目视解译地类,再到如今主要以以分辨率更高的遥感影像,结合GIS 技术,人机交互提取土地利用信息。在地类信息调查的发展过程中,在地类提取精度和面积计算数字化等有了很大提高,但基本还是依靠人力判绘,工作量大且对人员的判读技术、身体状态都有一定要求。找到科学的高分辨率遥感影像信息自动提取方法是如今的重要课题。
面向对象分类方法可广泛应用于调查海岸线、地质灾害、土地利用、区域变化等方向,分类精度高,不同地类的影像特征易提取总结,矢量化后易于统计,适合应用于高分辨率的遥感影像的地类信息提取。本文主要使用面向对象的方法对影像进行分割,建立样本库并选择样本对象,提取样本对象的光谱、纹理特征和植被指数,构建隶属度空间进行最邻近分类得到结果。与最大似然分类法和目视解译方法提取的分类结果进行对比,最后使用基于样本的误差矩阵精度评价方法对面向对象分类结果进行评价。
1 地类信息提取流程
获取数据后对影像进行面向对象分割,依据提取地类建立样本库,选择特征值并优化,对实验区待分类对象分配最邻近特征值进行分类得到结果。
1.1 数据来源
影像来自国家下发的梓潼县部分地区,分辨率为1 米的数字正射影像图(Digital Orthophoto Map,DOM)影像。该影像参照《第三次全国土地调查技术规程》的要求制作,通过镶嵌经比例尺匹配、几何纠正、重采样等步骤处理后的航空或航天影像,得到少云、无明显噪声、清晰、光谱均匀的优质DOM 影像。本文对该县实验区的耕地、林地、建筑、道路、水域共五个地类进行信息提取。
1.2 影像分割
面向对象地类信息提取的基本单位是多尺度分割后的对象,分割后需提取样本对象的特征信息用于分类。影像分割是指将全部影像区域基于设定的分割准则和尺度,分割为内部特征同质性较强的复数对象[2]。将对象作为分析单元,可以克服单个栅格分析时的分类噪声,增强不同类别之间的差异性和相同类别之间的同质性,提高类别的可分性。多尺度分割有两个标准需要遵循:①在能区分不同地物的前提下,使用尽量大的分割尺度;②在地物形状满足标准的前提下,尽量多参考光谱特征。
多尺度影像分割采用区域合并算法,也称基于分形网络演化方法(FNEA,Fractal Net Evolution Approach)。基本原理是由影像中任意一个像元开始,与旁边的像元合并后保持内部异质性最小形成较小的影像对象,再将这些较小的对象在同样的标准下,逐渐合并成达到分割设置要求的多边形对象。
多尺度影像分割需要设置几项分割参数,包括各波段权重、分割尺度和均质因子。其中,尺度参数决定了影像分割能提取的最小对象的尺寸大小,一般基于像素等级,直接决定了对象提取的精度,若尺度过小容易让区域过于破碎,过大则会让不同地物对象出现凝块。
均质因子包括形状参数和紧致度参数,形状参数主要是为了保持分割结果中对象的完整性,紧致度参数主要是为了让具有类似特征的对象具有可分性。经过多次调试后,得到使对象间内部异质性尽可能小,对象之间异质性尽可能大的分割参数。表征异质性的指标异质度f 包含光谱异质性和形状异质性,计算公式为[3]:
式中ω1为设置的形状权重,b1为基于设置的紧致度权重得出的形状异质性,b2为基于波段性质得出的光谱异质性。
经多次实验后本文选择分割尺度为50,RGB 各波段权重为1,形状因子0.3,紧致度0.5 的设置对影像进行分割。
1.3 建立样本库
1.3.1 样本选择
根据分类要求,结合地区资料,在分割的影像上选择各类地物的典型对象,尽量选出具有代表性和特征比较均匀的地段。训练区必须具有代表性和典型性,应尽量选择地物中心部的对象,避免选择地物交界或边缘区域,确保样本的典型性。
训练区确定后可以通过特征直方图来确定样本的规律性和可分性,接近正态分布则可分性较好。对于有“同物异谱”现象的地物需将其设为多个类别进行训练区的样本选择。本次实验中,耕地因农作物的种类、密度、生长高度、土地灌溉程度不同,光谱特征和纹理特征差异都较大,容易被划分为不同的地物,故采取先细分后归并的对策,据颜色分为三种:耕地绿、耕地深绿、耕地棕,在最后导出时都作为同一地类,之间的误分忽略不计。选择好样本后对其进行筛选,剔除不好或偏差过大的样本,得到准确度较高的训练区。
1.3.2 特征值选择
1.3.2.1 光谱特征
光谱特征是基于遥感影像进行地类分类的主要参考信息,本次主要选择光谱的均值、标准差和亮度。
1.3.2.2 纹理特征
高分辨率的遥感影像可以获取丰富的纹理信息,基于对象的纹理特征提取的方是对特征进行定量化的描述,相对基于像素更准确合理。
灰度共生矩阵(GLCM)是对图像上有一定距离的两像素分别具有的灰度状况进行统计的矩阵。原理是将矩阵中一点的灰度值设为固定值,统计该值出现的次数,组成概率方阵并归一化得出。矢量化后得到归一化灰度矢量(GLDV)。一般可从0°,45°,90°,135°四个方向进行设置,在本次实验中发现角度大小的纹理提取差距不大,故使用综合数据,主要使用纹理特征参数为均值、熵和对比度。其中均值可以表现图像纹理变化信息;熵可以表示图像纹理的复杂程度,纹理均一则熵值小;对比度越大,纹理的沟纹越深,效果越清晰。
1.3.2.3 植被指数
以计算RGB 三个波段的方式来强化植被。计算公式为[4]:
式中G'=G/(R+G+B),R'=R/(R+G+B),B'=B/(R+G+B)。
对象特征的描述很多,而用尽量少的特征,减少计算量和冗余,提高地类提取精度就是优化的目的。eCognition 软件提供的特征选择优化空间,原理是对选择的复数特征在选择的样本对象的基础上进行分析,最终计算出本次实验最佳特征维数为12,最低分离度为0.284。通过查看对象间的分离度列表,确认各种分样地类已符合最低分离度。
1.4 最邻近分类
基于像元的最邻近分类法也称最小距离分类法,是利用训练样本的数据主要参考光谱特征计算类别均值,将该均值设置为特征空间的中心,计算影像中每个待测像元到各类中心的欧氏距离,然后把像元归属为距离最近的类别中。
面向对象的最近邻分类法根本原理是在特征空间中计算样本的各项特征值,得出不同类别的特征值范围,再计算待分类影像对象的特征值,将其归属于最符合的类别中。最邻近分类的计算原理是对训练样本的对象构建特征空间,在特征空间中计算待分类对象到分类类别的最小距离,计算公式为[5]:
式中i 表示第i 个特征,j 表示分类类别第j 个样本;vij表示训练样本j 的特征i 的特征值,voj表示待分类影像对象o 的特征i 的特征值,σi为特征空间中所有影像对象的特征i 的标准差。
然后将计算得出的最小距离转化为隶属度,转换公式为:
隶属度大于设置的阈值时就可以将待分类影像对象归属于该样本的类别。
经多次实验后本文选择使用函数斜率0.25,阈值0.15 的设置进行分类。
2 分类结果
通过对面向对象分类、基于像元的最大似然分类、目视解译三种分类方法的结果对比,最后对面向对象的分类结果进行基于样本的精度评价得出结论。
2.1 面向对象分类结果
本文使用eCognition 软件,基于面向对象方法,对DOM 影像进行多尺度分割,建立样本库,进行最邻近分类结果如图1。
图1 基于面向对象分类的地类信息图
2.2 分类结果对比
从中、低分辨率影像应用到高分辨率遥感影像应用的发展进程中,面向对象分类方法被作为一种优于传统基于像元的分类方法被提出。面向对象分类方法不仅利用了地物的光谱特征,还充分利用了影像对象的形状特征、纹理特征和地物间的拓扑关系等,能抑制杂斑和噪声产生,提高精度。
本文使用ENVI 软件基于像元进行监督分类,采用该类型中分类效果最好的最大似然法,结果如图2。最大似然参考光谱特征,计算待分类像元属于某训练样本的似然度,最后归入似然度最大的类别中。主要流程为建立兴趣区,选择样本,最大似然分类,后处理。另使用ArcGIS 软件进行目视解译,结果如图3。主要按照《土地利用现状分类》(GB/T 21010-2017)标准执行解译工作。
图2 基于像元分类的地类信息图
图3 基于目视解译的地类信息图
几种分类方法的差异:
(1)地类类别和范围
可以发现目视解译与面向对象、基于像素解译的居民区范围大小差异十分明显,这是因为依据规范进行目视解译会相对将居民区的范围扩大。目视解译按规范会对各种类别有最小上图面积的限制,基于像元分类将影像分得过细会产生噪点,而面向对象分类地物面积会受分割尺度影响。
(2)地类边界提取
计算机解译提取的地物边线不及目视解译的地物边线光滑,这是由于面向对象的影像分割和基于像元的分类方法都是在像元单位上进行的边界划分。因此也会将在耕地中的较明显的田坎和间种树木提取出来,而人工解译往往会将这部分一起并入耕地。
(3)分类参考
目视解译依靠解译员的识别能力。基于像元的最大似然分类法主要参考影像的光谱特征,由于林地阴影与水域光谱特征相近,误分情况较多,即使经后处理减少了椒盐现象,仍存在较大噪点。面向对象分类方法充分利用了影像对象的综合特征,克服了噪点问题,减少了因阴影造成的误分情况。
面向对象提取比基于像素提取边界更准确,且误分情况大幅减少。面向对象方法提取较小的地物如建筑和农村道路时,被遗漏的比较多,没有目视解译的精度高,但对林地和耕地等大块面积的地类提取效果好,精度高。对于植被、水体和规范道路的地类信息提取,面向对象分类已经可以派上用场。
2.3 精度评价
使用基于样本的精度评价方法,选择与分类依据不同的样本区作为评价依据。结果包括混淆矩阵,单一类别的精度分类结果和总体类别精度分析。
混淆矩阵如表1,可以直观的表现出每种类别的样本总数、错分和漏分的总数。
表1 混淆矩阵
整体精度计算公式为:
最后得出整体的分类总体精度为85.6%,Kappa 系数为0.766,大块的地类如林地、耕地、水域的分类效果好,建筑和道路这类较小的地类分类较不准确。
3 结论与讨论
地类信息调查是确认土地资源情况的重要手段,也是规划土地利用及决定社会经济发展决策的基本依据。本文主要对面向对象分类的方法和流程进行了讨论。面向对象的分类方法相较传统基于像素的分类方法,影像分割后在对象的基础上进行分类可以克服椒盐现象,提高精度;相较人工目视解译方法,可以减少人工,避免个人因素造成的误差,提高效率。建立样本区的分类方式相较非监督分类,需要有先验知识,对可以清晰辨识地物纹理、光谱特征的高分辨率影像来说更为适合;从训练样本对象构建出的特征空间可用于该地其他区域的地类信息提取,为以后的工作提供更多参考,减少不必要的重复工作。
面向对象分类的结果图可以为绘制土地利用现状图提供参考。但由于分类结果没有与实地调查结合比较,还是存在一些误分的情况。在今后的研究中可以通过解决以下问题提高分类精度:使用波段更全的高分辨率遥感影像,结合一些算法增强不同地类对象的可分离度;减少或克服遥感影像拍摄角度、天气造成的阴影引起的误分情况;进行野外实地调查对不确定的地类情况进行确认。