基于GF-2影像对恰西国家森林公园的遥感分类
2020-09-10师玉霞王振锡杨勇强高亚利
师玉霞,王振锡,杨勇强,连 玲,高亚利
(新疆农业大学林学与园艺学院,乌鲁木齐 830052)
0 引 言
【研究意义】森林是人类生活与发展的重要物质根底,也是经济发展不可或缺的自然资源[1]。森林资源调查是了解森林植被覆盖现状、指导和评价森林管理活动的重要手段。传统调查方式调查难度大,周期长。应用高分辨率遥感影像为森林调查带来了便利。选用的GF-2数据信息丰富,真实反映了地物现状,有利于图像的多尺度分割和地物信息分类。确定每种地物最优尺度是进行地物分类的基础,其结果的好坏与地物分类的准确度息息相关[2]。由于基于像素的高分辨率遥感影像进行地物分类时经常会出现较为严重的“椒盐”现象[3],以若干同质像素集合为对象的面向对象分类法得到了广泛应用,并取得了较好的分类结果。选取一种分类效果最佳的方法,为恰西国家森林公园天山云杉林进行遥感分类,对该区域的林地资源调查、动态监测平价有重要意义。【前人研究进展】路春燕等[4]应用面向对象的分类方法,获得了泉州湾河口湿地分布数据;林祥国等[5]应用面向对象法,对高分辨率影像中建筑物的进行提取,并取得了不错的分类结果。近年来,应用面向对象分类法对地物信息分类的研究很多,其中简单又经典的最邻近法和决策树法较为普遍。苏簪铀等[6]用最邻近分类法,逐级分割提取了植被分布信息;高闪闪等[7]结合光谱信息和纹理信息,对市区植被进行最邻近分类研究;吕利利等[8]使用决策树的方法提取研究区的沙化信息并进行模型构建,分类结果较好;韩婷婷等[9]对研究区的植被分类选用2种方法进行对比,表明决策树法取得的结果更优。【本研究切入点】有研究表明阈值分类是一种分类精度较高的方法[10]。研究基于GF-2影像对新疆伊犁恰西国家森林公园进行遥感分类。【拟解决的关键问题】以 GF-2 遥感影像为数据源,以新疆天山西部国有林管理局巩留分局恰西天山云杉(PiceaSchrenkiana)林为研究对象,确定各种地物的最优尺度分割,并在此基础上建立不同地物类型的分类规则集,采用3种不同的分类法,对该区域的天山云杉林进行遥感分类,选取一种适合的分类方法,为林地分类研究提供技术参考。
1 材料与方法
1.1 材 料
1.1.1 遥感数据
研究区位于伊犁巩留县恰西国家森林公园,属于新疆天山西部国有林管理局巩留分局管辖,地理坐标为42°56′~43°22′ N,82°23′~82°53′ E,平均海拔约为1 500 m,面积约10 km2,山谷全长13 km。公园内有植物1 000多余种,野生中药材200多余种,森林覆盖率达17%。恰西地貌独特,气候适宜,自然条件优越,是国家级自然保护区,主要乔木为天山云杉,主要草本有新疆阿魏(Ferulasinkiangensis)、直立老鹳草(Geraniumrectum)、新疆远志(Polygalahybrida)、新疆枸杞(Lyciumdasystemum)等。
遥感数据来自于新疆卫星应用工程中心,选取2018年9月新疆天山西部国有林管理局巩留分局恰西国家森林公园天山云杉林的GF-2(分辨率1 m)遥感影像为数据源。GF-2影像数据是我国研制的分辨率优于1 m的首颗光学遥感卫星[11]。在遥感数据获取时,会受到大气、地形、传感器本身等因素的影响,为影像分类识别精细准确,需对遥感数据进行预处理。用ENVI5.1进行辐射定标、大气校正、几何校正,意在消除地物变形、大气影响、地形干扰等因素对后期影像分类的影响,其次对分辨率为1 m全色数据和分辨率为4 m多光谱数据进行图像融合,最后对研究区域进行裁剪。
1.1.2 野外数据
外业试验数据由2018年6月下旬~8月下旬调查的120个30 m×30 m的标准样地数据组成。每个样地的主要调查内容包括样地类型、海拔、坡度、坡向和郁闭度,高于1.3 m的所有乔木树种的树高和胸径。矢量数据是在ArcGIS软件中将标定的矢量点所在的分割对象根据实地调查的类别赋予相对应的分类名称,并将其转变成样本得过程。研究中矢量数据的选取采用野外实地调查样本点和根据影像目视解译选取样本点2种方法相结合,根据分类类别在 ArcGIS 中逐一选取样本点80个。
图1 矢量样本点选取Fig.1 Selection of Vector Sample Points
1.1.3 特征值
对于分层分类来说,特征值的选取将会影响到最后分类结果的优良差。通过对研究区数据的特征因子进行试验分析,确定每一层分类的对象特征值。采用主要特征因子包括光谱特征和HIS变换值。光谱特征包括每个波段的均值、方差和亮度等,主要由组成地物的成分和影像成像结果所决定的;HIS分别代表色调(H)、亮度(I)以及饱和度(S),H用于分辨色彩差别较为明显的区域,I用于辨别较为明亮的地物,S用于区别纯洁度较高的彩色影像地物。用HIS主要区别颜色差异较为明显的地物类别。水体和其他地物可以用H、I较好的区分。
1.2 方 法
1.2.1 最优尺度分割
多尺度分割(Multiresolution Segmentation)是用来不断地兼并像元或现有的影像对象,在保证每一个分割对象之间平均异质性最小、同质性最大的前提下,对相邻的或小的对象进行兼并[12-14]。其中最优尺度的确定是用ESP尺度评价工具,该方法是2010年由Dragut L.等[15]提出的分割尺度计算法。其原理是根据每种地物的异质性建立局部方差,对影像在多尺度范围中实行各层的局部方差,局部方差与分割尺度呈现正相关的关系。局部方差的阈值变化率(Rate of Change,ROC)是对每一层地物根据影像数据的属性进行计算,确定最优的分割尺度参数,计算公式为:
式中:Li+1为第i+1层对象的平均标准差,Li为第i层中对象的平均标准差。当ROC在峰值时,此时的分割尺度是最优分割尺度[16]。
1.2.2 分类
最邻近分类方法(Nearest Neighbor Classification)是较为普遍使用的方法,其操作方便易学,且目前的使用范围最广。主要通过计算未分类对象与已经确定类别的对象之间的距离进行分类,将距离最近的样本定义为同一种类别。但当分类信息过多时,会出现分类效率低且精度不高的情况。
结合矢量数据的分类是研究中采用的第2种分类方法。它是以面向对象分类为基础,对影像实行自动分类法,其分类自动化程度高,可以有效的减少人为因素所造成的主观性误差,也可以提高各种地物分类的精度[17-18]。结合矢量数据分类是根据矢量数据具备的类别属性,利用一定算法进行分类。该方法最重要的为矢量样本点选择,其选择和建立的精确程度直接决定了分类的精度。
阈值法分类是根据影像的光谱信息,分析每一种地物在不同波段的阈值范围,是目前分类研究中精度评价较高,且结果更接近于研究地物的一种方法。分层分类主要是根据目标对象特点的统计分析确定每一种地物在各个波段的特征值,并建立分类规则集,达到每种地物分类效果最优的状态。研究中使用的对象特征值主要包括光谱特征和HIS变换值进行多层分类。
最邻近分类和结合矢量数据分类法,分别按照每种地物的最优尺度进行分割,每一层分类结合对象特征因子光谱特征和HIS变换值对其进行分类,阈值分类是在最优尺度的基础上,通过每种地物的特点和特征值来描述目标对象,并根据每种地物的特征来建立规则集,最终达到不同层次的最优分类结果的目的。其中水体和道路的颜色与其他分类对象不同,HIS变换值是体现颜色差异的特征,可以用H、I将水体和道路提取出来;其他用地包括裸地和建筑物,具有较高的反射率,异质性较强,颜色均一,可用Brightness和Mean_layer将其提取出来;林地和草地的影像颜色存在差异,用Mean_layer并结合I和S将两者区分。
1.2.3 精度评价
精度评估分为4种,研究采用的是较为常用的基于样本的误差矩阵的方法。该评价方法是以分割对象为基础选择样本,并比较指定样本类别和分类后的对象面积以获得误差矩阵[19]。根据每种地物的最优分割尺度,对影像进行分层次的3种不同分类方法进行试验,并对结果实行精度评价,研究中的精度评价样本点有40个。分类后的精度评价结果分3部分,混淆矩阵结果反映每一类别样本数量情况;单一类别精度反映应每一类别的评价结果;总体精度反映的是裁剪的整个遥感数据对研究区的分类精度进行评估。其公式为:
公式中:N是总数;pij是分类正确的数量;ppi和pli分别为其中一类所在列和行的总数。有研究认为[20-21]。表1
表1 Kappa统计值与分类质量关系Table 1 The relationship between Kappa coefficient and classification quality
1.2.4 分类系统
根据遥感影像的数据特点和研究区域所包含的土地类型,并根据文献[22],将研究区域的土地类型总共分为5大类:林地、草地、道路交通、水体、其他用地。由于研究区域内的主要树种天山云杉占整个研究区的90%以上,对林地不作细分,研究区域内的住宅、裸地的光谱信息相近,都归为其他用地。
2 结果与分析
2.1 最优分割尺度
研究表明,最优尺度的范围在200~400 ,采用目视判别和实地调查相结合的方法,当尺度参数小于200时,各类地物对象过于破碎,且生成的分类对象与实体相似的程度较小;当尺度参数大于400 时,生成的对象面积过大。采用ESP尺度评价工具首先将 GF-2 多光谱数据导入ESP 算法中,设定形状权值为0.1,紧致度权值为0.5,得到研究区目标地物的最优分割尺度,最优分割尺度可能为216、230、246、274、296、316、330、346、358、372、386和390。图2
图2 ESP尺度分割评价Fig.2 ESP scale segmentation evaluation chart
将可能为最优尺度的值进行试验,结合目视解译的方法和通过设定形状权值和紧致度权值确定出每一种地物的最优尺度。研究表明,由于水体和道路的形状为条形,受形状因素较多,因此,设定水体和道路的形状权值较高。水体、道路、其他、林地和草地的最优分割尺度分别为390(0.7,0.5)、372(0.8,0.6)、316(0.3,0.6)、296(0.5,0.6)和246(0.6,0.4),其中由于水体和道路的形状为条形,受形状因素较多,因此设定水体和道路的形状权值较高;草地在研究区内分布较为零散,其紧致度权值较低。表2
表2 多层次分割参数Table 2 Scale parameters of the multi-level segmentation
2.2 分类
研究表明,在进行最邻近法分类时需要选择不同地物的样本对象,再利用一定算法进行分类。在最邻近分类中,由于其他用地和草地的光谱信息相似,易将两者混淆,导致大多数其他用地被分为草地;在结合矢量数据的方法中,由于林地中的阴影部分以及道路的光谱信息相近,使林地与道路的分类精度较低。图3,图4
图3 最邻近分类效果Fig.3 The nearest classification map
图4 结合矢量数据分类Fig.4 Cart classifier classification chart combined with vector data
研究表明,阈值分类是根据每种地物的特征因子设置不同的对象特征值,有效提高了分类精度。相较于最邻近分类和结合矢量数据分类结果显示,该方法结果精度较其更高,且分类效果更符合真实地物,有效避免了漏分错分的状况。表3,图5
表3 阈值分类的分类规则Table 3 Classification rules of threshold classification
图5 多层次分类Fig.5 The result of multi-level classification
2.3 分类精度
研究表明,研究选取的3种分类方法的 Kappa 系数和总体精度的值分别为0.760 7、0.782 0、0.840 6和0.814 8、0.830 5、0.876 5。
3种分类方法的值均在0.6~1.0,其分类质量显示为“较好”。3种方法都能达到较好的效果,最后1种分类法的结果最好。表4
表4 3种分类方法总体精度对比Table 4 Comparison of overall accuracy for three classification methods
3 讨 论
3.1 对于最优尺度的确定,是研究中进行地物分类的基础。在影像进行分割试验时,经过反复的试验虽然能得到较好的效果,但在设定分割尺度的差距较小时,其效率不高,较耗时[23]。使用ESP 尺度评价工具进行研究,并取得了很好的分割结果。这与任金刚等[24]获取最优分割尺度的效果一致,在分类中也得到了理想的分类结果。研究提出的最优尺度分割方法是可行的,对于该文中提出的3种分类方法的研究有很大的意义。
3.2 对于地物分类选取的方法,目前对地物信息分类的研究已取得了很大的成功[25-26]。利用矢量数据来选取样本,矢量数据是通过人工实地调查样本和目视解译相结合选取的样本,相较于仅仅只用目视解译的方法选取样本,具有客观可靠性,更值得信赖。研究中地物分类的方法主要是最邻近法、结合矢量数据法以及阈值分类法,经过研究表明,第3种方法优于其他2种。此结论与马浩然等[27]选择的分类方法结论一致,阈值分类方法实用性、可靠性更强。
3.3 对于精度评估,是判别每一种地物分类结果优良差的标准。研究中采用的是较常用的基于样本的误差矩阵的方法。其中最能体现分类效果的2个值是Kappa系数和总体分类精度,可以较好地反映整个影像的分类精度结果,最终得到的评价结果具有代表性。有研究者也使用了该种精度评价方法,并得到了很理想的结果[28-30],研究得到的结论与之相似。但在研究过程中发现林地与道路的光谱信息相似,可能是天然林结构复杂,种类繁多,光谱信息多变,因此,在今后的研究中,可加入更多对象特征因子的遥感影像进行探讨。
4 结 论
利用ESP 尺度评价工具进行尺度分割,最终确定了水体、道路、其他用地、林地和草地最优分割尺度分别为:390、372、316、296、246。选取阈值分类法的Kappa系数(0.840 6)和总体精度(0.876 2)最高,选用该分类法能够有效地提高地物分类精度,且分类结果更接近真实地物,国产GF-2遥感数据在林业行业具有应用前景。