基于面向对象分类的延庆区公益林变化检测
2019-01-04张沁雨彭道黎
张沁雨,胡 曼,彭道黎
(1.北京林业大学 林学院,北京 100083;2.University of Helsinki, FIN-00014, Finland)
森林是陆地生态系统的主体[1],在生态文明建设中发挥着举足轻重的作用。其中,公益林在维护和改善生态环境方面至关重要,了解公益林的资源状况是保证其发挥生态效益的重要基础条件,也是林业可持续发展的重要保障。早先在公益林监测方面,人为监测评价占主要方式,如利用二类调查小班数据库建立生态公益林的监测评价体系,分析资源结构的变化[2],但在这种人为调查监测的方式中,工作人员任务艰巨且缺乏宏观性,只能关注到局部小班,因此如何利用有限的人力物力对大范围的公益林进行动态变化监测是一个重要研究领域。随着变化检测算法不断发展,逐渐成为了监测公益林资源的主要方法,其中分类后比较变化检测算法在森林变化检测中优势更为突出[3]。早期分类多为人工目视解译,后随着计算机算法的逐渐成熟,计算机自动解译逐渐占领了分类领域。基于像元的分类方法目前已在各个领域广泛使用,技术已相对成熟,但往往未考虑到纹理信息,而在对高分辨遥感数据分类时,其纹理细节表现突出,使用该方法分类会因太细碎而导致结果有大量的数据冗余[4]。于是近年来出现了面向对象的分类方法,它能利用多尺度分割对影像进行分类,是一种对象级分类[5],与之前的像素级分类方法有所不同,这样分类的优点是使分类的基本单元不再是单独的像素而是通过分割得到的“同质”对象,具有更丰富的特征信息[6]。面向对象的信息提取突破了基于像元信息提取结果破碎化程度高、“椒盐现象”严重的问题,近年来广泛应用于土地、农林、交通等领域。虽然已有学者基于遥感数据对公益林的监测做了相关研究,但因对于公益林变化范围的探讨一般是大尺度范围,使用的遥感数据多为低分辨率影像[7-9],而国内基于面向对象的大尺度范围的公益林监测研究几乎没有。本研究采用基于面向对象分类的变化检测方法,先对Spot-5和GF-1两期高分辨率影像进行林地地块划分后,再进行公益林变化检测,实现获取10年间延庆区公益林发生变化的森林类型及空间分布,确定变化范围和重点变化区域,同时具体精确到地类之间的面积变化,旨在分析造成延庆区公益林变化的多种驱动因素,同时争取为国家实施京津风沙治理等重点林业项目提供技术积累和方法参考。
1 材料与方法
1.1 研究区概况
本次研究覆盖整个延庆区(见图1)。延庆区位于北京市西北部,地处东经 115°44′~ 116°34′,北纬40°16′~40°47′,东邻怀柔区,南接昌平区,平均海拔500 m以上,气候独特,冬冷夏凉,素有北京”夏都”之称。该区域作为重点林业工程监测技术推广应用示范区,森林资源丰富,物种多样,根据2014年二类森林资源清查数据,延庆区公益林覆盖面积约14.6万hm2,约占延庆区总面积的73%。
1.2 地类划分
图1 研究区位置Fig.1 Location of the study area
本文中借鉴“国家级土地利用/覆盖分类系统”及“全国遥感监测土地利用/覆盖分类体系”,以2004年和2015年延庆区森林资源规划设计调查(简称二类调查)中公益林区划结果为依据,确定主要变化地类。将研究区地类分为6类:水域、农田、其他土地(包括草地、苗圃、未利用地)、有林地、灌木地、其他林地(包括其他宜林地、未成林造林地、采伐迹地、其他无林地)。研究区中公益林包括的地类主要是有林地和其他林地。
1.3 数据源及预处理
本文选取了2004年5月Spot-5影像(下文简称Spot-5)、2015年5月GF-1影像(下文简称GF-1)为主要影像数据,研究区1∶10 000地形图及DEM数据为辅助数据,同时以2004年、2014年二类调查数据以及2015年7月外业调查数据作为分类精度验证依据。预处理过程包括辐射定标与大气校正、正射校正、几何校正、图像的镶嵌与裁剪和图像融合,另外还对GF-1云区进行了处理,校正后两期影像的偏移未超过0.5个像元[10]。
1.4 面向对象的分类法
近年来基于面向对象的分类方法应用已十分普及,它是先对影像进行多尺度分割得到对象,然后利用每个对象的纹理特征、空间特征等参考因素进行分类,从而提取目标信息[11]。
1.4.1 最优尺度的选择
研究中最优分割尺度的定义是针对整幅影像而言的,不合理的分割尺度值会导致影像出现“欠分割”、“过分割”现象[12]。目前研究中最优分割尺度选择的方法主要包括有面向对象的RMAS法(Ratio of Mean Difference to Neighbor (ABS) to Stand Deviation, RMAS)[13]、目标函数法[14]、均值方差法[15-16]、最大面积法[17]等,每种方法都各有优缺点。本研究将进行面向对象的“RMAS”指标和均值方差法两种最优分割尺度选择方法的试验,确定最优分割尺度。
1.4.2 规则集的建立
在影像多尺度分割的基础上,利用eCognition软件的特征集模块,建立规则集进行面向对象遥感影像信息的提取,规则集的建立以不同地物对应的光谱、纹理及形状等空间特征信息为基础,本研究主要使用的特征值除了常见的NDVI值和NDWI值外,还加入了FC特征值[18]。该特征值一般用于影像基于像元的分析,本研究中结合面向对象信息提取方法,将像元二分模型引入到对象层次,表达式为:
式中:NDVI值均为分割对象的信息值,其中NDVIsoil理论为裸土对应的NDVI值,NDVIveg理论为纯植被对应的NDVI值。式中的NDVIsoil和NDVIveg是固定值,理论上分别接近于0和1,但根据实际情况会有一定的变化。在本研究中,结合延庆的实际情以及影像数据,选取所有对象内累积频率为0.5%的NDVI值为NDVIsoil,累积频率为99.5%的NDVI值为NDVIveg。
不同数据源的影像在特征值的体现上不完全相同,基于分割后的影像,建立6种地类分层体系和分类规则,进行逐级提取分类(见表1)。同时为验证FC特征值能否提高影像分类精度,将以GF-1影像为例分别使用和未使用FC特征值。
1.4.3 面向对象分类的实现
按照三层分割尺度,在eCognition软件中逐步实现各地类的提取过程。第一步主要利用NDWI值提取水域,第二步在提取有林地时,构建FC特征值,过程如下(以Spot-5为例)。
计算所有对象的NDVI值,取所有对象内累积频率为0.5%的NDVI值为NDVIsoil,计算得出Spot-5影像取值0.26;取所有对象内累积频率为99.5%的NDVI值为NDVIveg,计算得出Spot-5影像取值0.68(见表2)。那么Spot-5影像的FC特征值构建公式为:
表1 基于不同分割尺度的各地类分类规则描述Table 1 Rule sets for describing classification rules in different land types based on different segmentation scales
表2 Spot-5各分割对象NDVI值及所占百分比及累计百分比Table 2 NDVI and cumulative percentage of segmentation objects (Spot-5)
同样地,计算GF-1影像的FC特征值,最后得到公式如下:
第三步利用特征值的阈值范围提取其他土地,第四步利用影像特征(光谱、空间、NDVI、NDWI)结合样本点分类提取灌木、农田和其他林地。
1.5 变化检测
在ArcGIS10.2软件中,对两期影像的分类结果进行联合分析,最后可得到2004ü2015年间延庆区公益林地类面积转移矩阵以及地块转移图。
2 结果与分析
2.1 最优尺度分割
本研究范围为公益林,确定分割范围是根据两期二类资源清查数据中公益林范围取的并集,所以进行分割试验内大部分为有林地,其他5种地类比例较小,仅使用面向对象的RMAS最佳尺度选择方法不好确定林地、其他土地和其他林地的分割尺度。经试验,本研究将使用结合面向对象的RMAS法和均值方差法确定GF-1影像最佳分割尺度,最优分割尺度为650、560和480;根据均值方差法确定Spot-5影像的最优分割尺度分别为560、500和450,图2为第三层分割尺度下的影像分割情况,左为Spot-5,右为GF-1。
图2 基于最优分割尺度下的影像分割结果Fig.2 Image segmentation results based on optimal segmentation scales
2.2 分类结果
两期影像的面向对象分类的结果如图3所示。对比两期分类结果可以看出,2004年延庆区公益林区的灌木地面积明显大于2015年,而有林地面积则明显少于2015年。
图3 Spot-5影像和GF-1影像面向对象分类结果Fig.3 Object-oriented classification results of Spot-5 and GF-1
2.3 精度验证
本研究基于eCognition软件,采用基于样本的混淆矩阵对分类结果进行精度评价,选取的每个地类的训练样本是根据二类调查数据以及外业调查数据确定。同时也比较了基于GF-1影像规则集建立时是否加入FC特征值的结果(见表3),发现加入特征值后总体精度以及有林地、其他林地等地类的分类精度高于未加入特征值的精度。
2.4 变化检测结果
延庆区2004ü2015年间土地利用类型转移矩阵如表4所示,各地类面积变化如表5所示,公益林地块变化分布如图4所示。2004ü2015年间,公益林面积呈上升趋势,且主要集中在有林地面积的增加,农田、灌木、水域及其他土地减少;主要变化区域分布在延庆区的东北部和南部。
表3 基于样本的混淆矩阵精度的Spot5、GF-1分类结果Table 3 Classification results based on sample confusion matrix evaluation precision (Spot-5, GF-1)
表4 2004年/2015年延庆区土地利用类型转移矩阵Table 4 2004/2015 transition matrix of land use type in Yanqing hm2
表5 2004ü2015年间延庆区地类面积变化Table 5 Area type changes of non-commercial forest during 2004-2015 in Yanqing hm2
图4 2004ü2015年延庆区公益林地块变化分布Fig.4 Plot change distribution in Yanqing non-commercial forest from 2004 to 2015
2.5 变化检测精度评价
本研究在研究区内随机布设1 000个样点作为真实验证数据,统计是否发生地类变化,以此建立误差矩阵,使用两期二类调查数据作为真值对基于面向对象分类方法的变化检测结果进行精度验证(见表6),精度评价指标包括总体精度(P1)、漏判率(P2)和错判率(P3)[19]。从精度评价指标来看,本次变化检测整体精度达到87.4%,检测效果较好。
表6 2004ü2015年变化信息误差矩阵Table 6 Confusion matrix of plots information change detection between 2004 and 2015
2.6 公益林变化分析
延庆区公益林区的公益林(有林地和其他林地)与非公益林(水域、农田、灌木和其他土地)之间的面积变化可反映研究区2004ü2015年间公益林变化总体态势,并能以此来分析公益林变化的驱动因素和人为活动影响。
1)2004ü2015年间,延庆区公益林区内的耕地面积有所减少,公益林面积大大增加,主要集中在千家店、永宁、大榆树等乡镇。其中主要原因是延庆区是北京市实施退耕还林的主要地区之一,也是天然林保护工程、京津风沙治理工程、三北长防及沿海防护林工程等多个国家重点林业工程的试点区,且在实施退耕还林工程后,推出了《北京市巩固退耕还林成果专项规划(2008ü 2015年)》,其中包括补植、补造,进一步增加了其他林地和有林地的面积。此外,八达岭林场范围内的有林地面积也大大增加,因八达岭林场作为重点保护的天然森林公园,林场内的树木不允许采伐补造,因此林场内的地类变化只有灌木变为有林地一种类型。
2)本次研究的公益林区内,2004ü2015年间水域面积减少了12.75 hm2,可能的主要影响因素有自然因素和人为活动因素:首先,气候对水域面积的影响,主要体现在温度与降水上,温度升高时水的蒸发量增加,而北京地区严重缺水,降水量并不能满足水域的补给,于是造成水域面积减少,其中妫水河的水位也下降严重;其次,由于北京近年来城市化扩张严重,人口逐渐增加,生活和工业对水资源的需求量连年增加,也使其供应量紧张。
3)其他土地在本研究的分类体系中主要包括草地、空地、未利用地,在2004ü2015年间面积大幅度减少,可能是由于延庆区处于与河北交接处,是京津冀一体化发展的重点区域,先后出台的《北京城市总体规划(1994ü2010)》、《北京城市总体规划(2004ü2020)》等规划使空地、未利用地得到了充分的利用,从变化结果来看,其他土地大多变成有林地和灌木,表明在城镇化建设中,绿化建设显得尤为突出,国家越来越重视开发城市森林。
3 结论与讨论
公益林在生态文明建设中至关重要,掌握公益林资源状态及变化趋势对于林业可持续发展具有重要意义。本文中采用基于面向对象分类的变化检测算法,以延庆区2004年Spot-5和2015年GF-1为数据源,提取了延庆区10年间公益林的变化地块。经研究,从影像分类角度来看,两期影像的分类精度分别为87.1%和89.1%。此外,还对未加入FC特征值规则的GF-1影像进行分类,精度为84.8%,说明加入FC特征值能提高影像分类精度;从变化检测精度来看,建立公益林变化信息的误差矩阵,结果显示变化检测精度达到了87.3%,漏判率、错判率都在20%以内,检测结果较佳;从变化检测结果来看,2004ü2015年间,公益林面积呈上升趋势,主要集中在有林地面积的增加,经过对变化结果的探索分析发现,延庆区公益林面积能大幅度增加主要原因是国家对林业及公益林的重视度逐渐增强。延庆区作为北京市公益林重点分布区,是各种国家级工程及项目的重要试点区域,另外国家出台的城市规划政策也将绿化建设摆在重要位置,这些驱动因素直接造成了延庆区公益林的大大增加。
本次研究虽利用面向对象分类后比较的变化检测算法较准确地得到了公益林变化地块,但对于区县范围的信息变化提取,高分辨影像往往难以覆盖整个研究区,这也是较少有利用高分辨率影像作为大尺度范围变化检测数据源的原因。因此本次研究选用了两种数据源,但不同数据源的影像分割尺度的设置、规则集建立的各种参数都会有所差异,这也许会对最终结果造成一定的影响。所以对于大尺度范围的变化检测,在数据源的选取、参数设置的推广和自动化提取变化信息等方面仍需做进一步研究。