基于光谱和纹理特征的速生桉信息提取方法研究
2016-11-10蔡耀君史茹倩
华 璀 廖 政 蔡耀君 史茹倩
(1.广西师范学院地理科学与规划学院,广西 南宁 530001;2.北部湾环境演变与资源利用教育部重点实验室,广西 南宁 530001)
基于光谱和纹理特征的速生桉信息提取方法研究
华璀1,2廖政1,2蔡耀君1,2史茹倩1,2
(1.广西师范学院地理科学与规划学院,广西 南宁 530001;2.北部湾环境演变与资源利用教育部重点实验室,广西 南宁 530001)
桉树生长速度快、用途广,具有良好的经济效益、社会效益和生态效益。但桉树的种植、砍伐与促长之间周期交替过于频繁,传统的林业调查不仅会受各种主客观因素的影响,而且获取信息的可信度较低。文章以RapiEye影像为数据源,结合GPS调查手段,运用eCognition平台,以光谱和纹理相结合的面向对象的分析方法,并创建知识规则集,对桉树林信息进行提取。实验表明,传统基于像素的监督分类方法总体精度为68.83%,Kappa系数为0.67。而基于以光谱纹理、创建知识规则集相结合的面向对象分析方法,桉树信息提取的总体精度达到82.12%,Kappa系数为0.80,该提取方法可获得更好的分类质量、效率与精度。
光谱特征;纹理特征;桉树林;遥感信息;提取方法
1 引言
速生桉作为广西的主要经济林之一,不仅具有生长最快、用途最广泛的特点,还具有很强的环境适应性能力和抗病虫害能力等许多优良的生物学特性,并且具有很好的经济效益、社会效益和生态效益。然而速生桉的快速生长同时伴随着地方生态环境的恶化,其生长过程中需要大量的水资源,大面积种植会导致当地地下水位下降、土壤保水能力降低,长此以往会导致土地板结甚至土壤沙化。速生桉对于土壤中的肥料需求量巨大,凡是种植过桉树的地区,土地肥力都会有不同程度的下降乃至枯竭。它的种植、砍伐与促长之间周期交替过于频繁,当规模达到一定数量级则会对当地土壤肥力,地下水资源等生态环境产生负面影响。通过抽样调查和逐级汇总方式的传统的林业调查和跟踪,不仅耗时费力,而且会受到各种主客观因素的影响使得获取信息的可信度较低,很大程度上影响了对桉树林发展的准确、及时监测。
而国外对桉树的研究多侧重于桉树生物物理反演的比较多,而国内的多集中在桉树的育种、经济价值和对生态环境的影响比较多。基于桉树林种植的遥感信息快速调查、监测、跟踪的研究却很少。在遥感对象的遥感信息提取方面,国外针对面向对象的应用和研究的成果很多,却在面对对象的桉树林遥感信息提取中出现的文献很少;国内应用面向对象的图像分析方法在土地利用、道路、农作物信息、森林信息等遥感信息的提取研究很多,但由于桉树在空间上分布显得较分散,并且林场中往往是树种混杂、以及树龄、生长密度等会影像到遥感信息的监测,以面向对象的图像分析方法,应用在桉树林遥感信息的快速调查、监测、跟踪的具体且详细研究的则相对很少。
因此,在一定空间、时间内,采用面向对象的遥感影像分析方法,及时、准确掌握桉树种植生产情况,了解、跟踪、调查桉树种植的数量、质量及其消长动态信息的技术应用研究,具有很大的科研价值。
2 面向对象分类方案
建立对象知识库。对象知识库是多种特征的集合,选取地物多种特征,建立分类规则,能够得到很好的分类结果。对象知识库支持包括分割算法、分类算法、统计算法、优化算法、导出算法等百余种常用算法。eCognition要一款源自德国的遥感影像分析软件,它突破了传统影像分类方法的局限性,提出了革命性的分类技术-面向对象分类。它强大的对象知识库对对象分类不再是传统意义上的对象像素,充分利用了对象信息(色调,形状,纹理,层次),类间信息(与邻近对象,子对象,父对象的相关特征)。因此算法建立对象知识库可借鉴eCognition平台,如图1所示。
图1 对象特征知识库平台
根据对象特征知识库平台,分别建立桉树与其它树种之间特征阈值范围的差别,找出阈值的上下限,如图2所示。
图2 桉树与其它树种特征阈值比较
3 面向对象的桉树林信息提取
本文以南宁市高峰林场作为研究区,地理位置为:22°48′48″~23°3′34″N,108°7′55″~108°32′53″E。林场所在区域属大明山余脉,属低山丘陵地貌,地势东北高、西南低,呈东北-西南走向,海拔高度70~500m,坡度20°~35°,地形比较封闭。高峰林场经营土地面积89万亩,其中场内面积48万亩,域跨武鸣、宾阳、上林三县以及南宁市兴宁、青秀、西乡塘三城区;场外造林面积41万亩,分布在全区37个市(县、区),森林蓄积量265万立方米,森林覆盖率83.7%。林场目前有人造板,速丰林,经济林和第三产业这几大支柱产业,并由传统的林业向现代林业迈进。
在本次研究中,考虑到研究内容、研究对象和工作量等因素,高峰林场取条带分布区域,不包括外包林场,如图3所示:
图3 研究区域地理位置
在遥感影像上提取桉树林的信息,采用类似于决策树的构思方法,先简单后复杂,剔除无关信息筛选有用的地物类别,然后再实现目标地物信息的提取。桉树林信息提取主要根据次分类方案进行:
(1)水域是较简单的地类,先从影像中剔除水域对象,得到非水域图层L1;
(2)在非水域对象层L1中分出植被对象层L2与非植被对象层L3;
(3)在植被层L3中提取林地地类对象层L4;
(4)在林地对象层L4中提取出桉树林对象层L5;
(5)再在桉树对象层L5中分出桉树幼林、中林和成林。
3.1非水域信息提取
近红外比率(Ratio_Nir)通常用于区别和提取水体和阴影,结合影像蓝波段、近红外比率、归一化水体植被指数(NDWI)和归一化植被指数(NDVI)[1],提取水域对象信息。其指数计算的表达公式为:
(1)近红外比率:
Ratio_Nir=Nir/(Blue+Green+red+Rededge+Nir)
(2)归一化水体植被指数:
NDWI=(Green-Nir)/(Green+Nir)
(3)归一化植被指数:
NDVI=(Nir-Red)/(Nir+Red)
设置Ration_nir阈值为<0.926能较好突出水体在影像上的信息表现,NDWI阈值为<0.13能较好的区分水体和植被,Ratio_Nir阈值为<0.429能较好的进一步区分水域与非水域地类。研究区水域信息分布情况,如图4所示。
图4 水域信息分布情况
3.2林地信息提取
本文主要使用的桉树RapiEye影像,其光谱波段在440 nm-850 nm蓝、绿、红、红外、近红外有五个波段。地面采样间隔为6.5m,正射影像的像素大小为5m,幅宽77km重访周期为每天,影像获取能力为400万平方公里/天。桉树影像的特点比较真实的反映了研究区的概况。
由于桉树种植土壤中的肥料需求量巨大,凡是种植过桉树的地区,土地肥力都会有不同程度的下降乃至枯竭是对象层中剔除水域对象后,还需从影像对象层中提取出林地信息,然后再从林地信息提取桉树林的对象,再进行树龄识别。
研究区地形比较复杂,可适当引入数字高程模型数据(DEM)作为专题辅助数据,结合DEM数据,筛选一些位于高程较低的农作物。在区分植被与非植被信息时,可应用NDVI植被指数,如农作物、林地的NDVI值大于0,非植被的NDVI值小于0(如居民点及建筑用地)。在提取出植被对象的基础上,再进一步分析农作物、林地特征,提取林地信息。经提取水体后,把影像对象划分为林地、居民点及建筑物、耕地和其它地类四种,经分析发现其在影像上各波段的部分特征如表1所示:
表1 不同地物的统计特征表
根据RapidEye影像中地物的特征值表,可发现不同目标地物,其光谱特征统计值有较大的差异,可作出特征统计图进行比较分析,如图5。
图5 不同地物特征波段特征曲线
综上知,在红波段(B3),林地等四类地物的亮度值差异较大,根据不同的特征值范围可将其区别。但各波段之间存在“同物异谱,同谱异物”,单靠一个红波段很难把互相混淆的地物对象给予划分,还需要结合其他特征信息,将其对象进行提取。
结合eCognition平台特征库,自定义林地信息提取需要的指数特征,编辑相关算法法则等。自定义的指数如:
①归一化植被指数NDVI;
②土壤调整植被指数SAVI;
③差值植被指数DVI;
④土壤植被指数SOIL。
根据林地、耕地、居民点集建筑用地对象的特征,建立对应的知识规则集,把林地对象进行提取,如表2。
表2 林地提取的规则集
综上,规则集创建以自上至下、从简到繁的方法,从影像对象层中提取耕地、居民点及建筑用地信息,然后再剔除耕地、居民点及建筑用地对象的基础上,提取出林地信息,剩余的对象由于地形比较复杂难以划分,将未分类的对象合并为其它地类。
由于研究区域地形复杂,不能高精度实现地物信息的分类,必然存在错分和漏分现象,同时,地物对象间总存在“同物异谱、同谱异物”现象[2],需对提取出来的耕地地类、居民点及建筑地类和其它地类中逐一检查,并结合Google地球判断错分、漏分的地物,以人工编辑将其合并入林地地类,提高分类精度,避免误差的传递。最终得到林地信息的提取结果,如图6所示。
图6 以规则集阈值分类提出的林地分布效果图
桉树是林地对象层中的其中一类树种,除此之外还有杉木、马尾松、相思树、竹林等树种。山沟有少量灌木,且地形破碎,森林分布极为破碎,表现为斑块小、不同树种呈无规律交叉分布。在林区提取出桉树林信息相对难度较大,因此需要结合其他目标地物作为辅助地类,以桉树林信息提取为重点,旨在使桉树林信息的提取精度更高。因此,把研究区内的林地,继续划分为桉树林、杉木林、松树林、竹林、灌木林等各种树种信息。
3.3各林种的影像光谱特征
植被是地球自然系统最典型的地物类型之一,在遥感影像中具有独特的特征,不同的植被其特征信息存在明显的差异。从RapidEye影像上分析,森林的反射性特性相差很大,造成相同树种各对象间的图像特征变动很大。林地中各种树种类型的均值(Mean)、标准差(Standard)有着较大的差异,其统计值如表3。
表3 林地各种树种类型的统计特征
综上知,桉树在各波段中的统计特征与其它树种之间存在着较大的差异,通过这些差异可将桉树对象信息给予准确的提取。同时,桉树的光谱特征也存在其它树种特征互相混淆的情况,如图7中光谱曲线所示。
图7 各树种植被光谱曲线
据上图可知,林地中的各树种光谱特征值比较难区分,如果单靠光谱特征阈值,要提取各树种信息很难,还需要结合纹理特征,进一步分析。
3.4各树种影像纹理特征
纹理特征通常被认为是纹理基元按照某种确定性的或者统计性的规则,进行重复排列而形成的一种物理现象,纹理特征的基本特征是平移不变性的,其视觉感知基本上与其在图像中的位置无关[3]。为了分析研究区内桉树林与其它树种的纹理特征,以5m分辨率的RapidEye遥感影像为数据源,计算研究区不同植被类型的植被纹理参数。经对比分析发现,桉树与其它植被相比,具有强烈的空间异质性。
纹理特征通常是用图层中的8个纹理量共同表达的,如果纹理量过多,会增加相当多的纹理量,不仅使得计算结果复杂化,大大增加了工作量,而且也会使得各纬图像信息之间,信息的重复率较高,不利于地物信息提取。
本文采用降维的方法,对研究区RapidEye数据进行主成分分析,找出纹理特征值贡献率最大的图层,从而便于下文对纹理特征的分析,结果如表4。
表4 RapidEye卫星影像主成分分析结果
上表表明,RapidEye影像中各个波段的主成分分析结果,第一主成分(PC1)的百分比信息占全部信息量的比例为99.34%,基本保存了原影像的全部信息。因此,可针对第一主成分PC1波段层进行纹理特征分析。
在对纹理特征分析时,计算灰度共生矩的特征值,要求图像的灰度级远要小于256,主要因为图像灰度值一般为256,如果矩阵维数太大而窗口的尺寸较小,则灰度共生矩阵就不能够很好的表示;如果能够很好表示纹理则要求窗口尺度较大,这样会使计算量大大增加,而且当窗口尺寸较大时,对于每类边界区域误识率较大[4]。而且在不同方向,纹理表现的信息量也不同,纹理有方向上通常通过0°,45°,90°,135°,RapidEye数据已经过正射校正,因此采用GLCM(all dir)视角进行分析。
本文应用8个基于二阶矩阵的纹理滤波,其包括均值、方差、同质性、反差、异质性、信息熵、角二阶矩和相关性等。分别以PC1图像按照33、55、77、99的窗口,步长为(1,1),(2,2),(3,3),将图像灰度值压缩为64级,进行纹理分析。当步长为(1,1)是,各窗口纹理特征值向量,如图8。
图8 各窗口提取的Mean纹理量图
综上知,当选择不同的窗口或步长时,产生的纹理特征也不相同;当窗口或步长选择不合理,在一定程度上会引发纹理偏差,会影响纹理的视觉效果以及质量,进而影响到影像的分类效果。研究发现,本文选用窗口(3,3),步长(1,1)时,提取出来的纹理特征比较清晰,质量和视觉效果都较好。
对研究区的林地对象层继续细分,提取桉树、杉木、松树、灌木、竹林和其它地类信息,并统计这6类纹理特征值,如表5。
表5 PC1波段各树种纹理统计特征值
从表5可知,各树种之间提取出来的纹理特征,存在着较大的差异性,可根据此特征差异阈值,建立相应的规则集,对林地各树种进行分类。
3.5创建语义知识规则集与分类
对研究区林地对象做光谱和纹理分析,发现桉树(桉树为主要提取的目标对象)、杉树、松树、灌木、竹林之间的光谱特征和纹理特征有较大的差异,可结合这些不同的特征阈值,创建语义知识规则集,实现树种的分类。经多次试验,构建的知识规则集,如表6。
表6 林地各树种分类规则集
3.6林种分类后人工编辑处理
由于影像对象特征间有一部分因子存在多重相关性,并互相影响,甚至出现“同物异谱”和“异物同谱”的现象[5],在规则集的自动分类会存在错分、漏分等问题,所以在分类结束后,需要对分类结果进行优化处理。优化分类结果可以通过人工编辑工具修改,选择需要归并的地类,然后点击错误的地类进行地类错误修正。而对于某些地类边缘不准确的对象,可以利用软件提供的切割、合并工具进行相应操作。
3.7各树类图斑合并
正确归类后,同种相邻的类别被切割成多个对象,但实际的结果需要得到一个整体的类别结果,因此,要对分割的类别进行合并。在规则集自定义中,可通过在Processtree里利用Merge算法实现对每个类别进行合并[5]。
3.8归并小图斑和输出
在林业树种分类系统中,对于小面积的地类并不能体现其分类的意义,通常情况下,为了减小数据存储的难度和冗余度,会把小面积的图版归类到相邻的地类中。本文将把小于200平方米的地类,归类到相邻的地类中,得到图9所示。基于面向对象技术的桉树林遥感信息提取研究,桉树作为主要提取的数据对象,而其他树种仅作为参考和辅助作用,桉树的提取精度较其他树种的精度较高。因此,将桉树林的对象信息进行整合归并,得到桉树林的整体分布图,如图9所示。
图9 研究区林地树种分类分布图
4 结果分析与精度评价
4.1面向对象与最大似然分类结果对比分析
本文针对研究区的桉树林等树种的种植信息进行提取,采用基于面向对象技术和基于传统像素分类的最大似然分类的两种不同分类方法,得到精度不同的两个分类结果,如图10所示。
图10 面向对象技术的图像分类和基于像素的最大似然方法的图像分类
综上图比较分析可知,研究区各树种分类总体情况,面向对象技术的图像分类结果比基于像素的最大似然分类结果更加理想。面向对象技术的图像分类能更好的保持地物对象的完整性和统一性,且能够很好的描述各树种的边界特征,更接近于实地地物的边界相吻合;而基于像素的最大似然方法的图像分类,在各树种之间存在着较多的噪音,在研究区域内都有分布,造成一定程度的图斑信息缺失甚至影响到分类的精度。
提取研究区各数种种植信息的目的是要调查其分布范围以及种植面积,对各树种的分类结果进行面积统计,得到两个面积的统计值,如表7。
表7 两种分类方法中各树种的统计面积 单位:公顷
从表7可知,基于面向对象技术的分类结果和基于像元的最大似然分类结果在面积统计上有很大的差异。最大似然分类方法的图斑数目整体上要比面向对象技术的数目多。在面积总和上,各树种之间的统计都不尽相同,存在很大的差异,因此,最终确定采用那种分类方法提取的结果更理想,更接近实地面积,这需要进一步的精度验证。
4.2野外实地调查数据验证
图像精度指的是经面向对象技术提取的结果分类图,与一幅假设标准的参考图像之间的吻合度,两幅图的地类以及位置吻合度越高,其结果分类图的精度就越高。
结合已经建立起来的解译标志数据,以及通过野外实地GPS采集的坐标点,对遥感影像提取出来的桉树、杉木、松树等树种信息进行精度验证。在研究区内选择具有代表性的458个作为检验精度的样本点,对桉树林等树种信息的解译精度进行分析。
表8 野外实地采集的各树种样本点树目
图11 研究区野外验证点空间分布图
4.3精度评价结果与分析
研究区内地形复杂,树种多样,如桉树,杉木、松树等,要实现整体所有树种实行精度评价,难以实现。本文针对按树等分类提取的树种作为精度评价的主要对象,将没有分类的树种或地类类别统归于其它地类,然后做一个掩膜文件将其不参与精度[6]。此次,参与精度评价的树种主要有桉树、杉木、松树、灌木和竹林,精度评价主要采用混淆矩阵的评价方法。
在eCognition 平台将458个树种样本对分类结果进行精度评价,在对其它林地掩膜不参与评价的基础上,利用Assuracy Assessment Tool工具,得到表9的评价结果。
表9 基于规则集遥感信息提取精度评价表
由上表知,基于面向对象技术的分类结果比基于像元的最大似然方法的分类结果精度要高。基于面向对象分类的总体精度达到82.12%,Kappa系数达到0.8,且桉树林的单类精度达到88.69%;而基于像素的最大似然分类的总体精度为68.83%,Kappa系数为0.67,桉树林的单类精度为75.84%。
5 结论
本文研究表明,以速生桉为例,用文中在方法可提高面向对象的信息提取精度,究其原因主要有三个方面:一是充分应用高分辨影像丰富的光谱、纹理、属性等空间特征,有效挖掘高分辨数据海量信息并应用在实际分析上;二是采用面向对象而非像素的分析方法,适当控制过度关注局部信息而忽略重要信息特征的误区,并采用类与层相互继承的方法,分类层次更明确,目的和针对性更强;三是将图像分割、特征提取与分析、规则集建立等技术手段应用在信息提取上,可有效提高对遥感图像的理解、地物识别以及地物空间信息,提高了信息提取的精度。而基于像素的最大似然分类方法,属于监督分类中常用的方法之一,由于图像空间分辨率高,同类地物内部光谱差异逐渐增大,基于像素的分析方法则会过度关注地物细节而忽略高分辨数据的丰富的光谱、纹理等空间信息,这种局限性必然使得其分类精度偏低。
[1] 曹宝,秦其明. 面向对象方法在SPOTS遥感图像分类中的应用—以北京市海定区为例[J].地理与地理信息科学,2006,32(2):44-49.
[2] 邓书斌.ENVI遥感图像处理方法[M].北京:科学出版社,2010.
[3] 熊轶群,吴健平.面向对象的城市绿地信息提取方法研究[J].华东师范大学学报自然科学版,2006(4):84-90.
[4] 叶传奇,苗启广,王宝树.基于区域分割和Counterlet变换的图像融合算法[J].光学学报,2008,28(3):447- 453.
[5] 杨海涛,常义林,霍俊彦,等.应用于多视点视频编码的基于深度特征的图像区域分割与区域视差估计[J].光学学报,2008,28(6):1073-1078.
[6] 刘直芳,王运琼,游志胜.简单有效的运动汽车投影阴影分割算法[J].光学学报,2007,27(5):835-840.
Based on the spectrum and texture combination of eucalyptus forest remote sensing information extraction
Eucalyptus growth speed, wide application, has the good economic benefit, social benefit and ecological benefit. But the eucalyptus trees planting, cutting and growth cycle, alternating between too frequently, the traditional forestry investigation will not only influenced by various subjective and objective factors, the credibility of and access to information is low. RapiEye images as data source,this paper combined with GPS survey method, combining with spectrum and texture object oriented analysis method, rule set and create knowledge, to extract eucalyptus forest information. Experiments show that the traditional supervised classification method based on pixel's overall accuracy is 68.83%, the Kappa coefficient is 0.67. And based on texture spectrum, create knowledge rule sets the object-oriented analysis method of combining the overall precision of eucalyptus information extraction of 82.12%, Kappa coefficient is 0.80, the extraction method can get better classification quality, efficiency and accuracy.
Spectral characteristics; texture feature; eucalyptus forest; remote sensing information; extraction method
S3-3
A
1008-1151(2016)04-0016-08
2016-03-10
广西自然科学基金项目 (2014GXNSFAA118293)。
华璀(1962-),女,云南昆明人,广西师范学院硕士研究生导师,从事广西师范学院遥感与GIS教学与研究工作,研究方向为资源环境遥感。