APP下载

联合GF-5与GF-6卫星数据的多分类器组合亚热带树种识别*

2020-11-27栗旭升陈冬花刘玉锋刘赛赛刘聪芳胡国庆

林业科学 2020年10期
关键词:分类器树种光谱

栗旭升 李 虎 陈冬花, 刘玉锋 刘赛赛 刘聪芳 胡国庆

(1.安徽师范大学地理与旅游学院 芜湖 241002;2.核工业北京地质研究院遥感信息与图像分析技术国家级重点实验室 北京 100029;3.滁州学院计算机与信息工程学院 滁州 239000;4.新疆师范大学地理科学与旅游学院 乌鲁木齐 830054)

遥感技术因其周期短、成本低、探测范围大、数据可综合对比等优点,逐渐成为森林树种分类识别及森林资源调查和监测的重要手段,也是国家森林资源保护和管理的重要决策技术支持(Tangetal.,2015;陈尔学等,2007;滕文秀等,2019;任冲等,2016;刘帆等,2018;Kamaletal.,2011)。近年来,国内外众多专家学者对利用遥感数据进行森林树种识别开展了大量研究,主要有如下特点:第一,受“同物异谱”和“同谱异物”现象的影响,研究多集中在森林冠层结构相对简单、林分密度较小、季节变化明显的温带森林或城市稀疏林地。如于丽柯等(2016)使用HIS光谱数据对大兴安岭地区树种进行基于线性波谱分离方法的识别,总体精度达72.0%;Yu等(2017)采用机载多光谱、激光雷达数据结合随机森林(random forest,RF)算法对芬兰南部北方森林进行树种分类,精度达90%;Alonzo等(2014)基于高光谱数据提供的光谱信息和激光雷达数据提供的冠型信息对美国圣巴巴拉市29种树木进行识别,单木分类精度达83.4%。但对热带、亚热带天然林研究较少。第二,可见光、多光谱、高光谱、中红外和激光雷达等数据均有研究应用,多源数据融合成为主流,使用最多的是机载高光谱数据与激光雷达数据融合。如刘怡君等(2016)利用机载高光谱数据与激光雷达数据融合并结合支持向量机对普洱市王掌山试验区的主要树种进行分类,取得了良好效果;Lucas等(2008)基于机载高光谱影像对澳大利亚南部森林进行分类识别,17种树种的分类精度达86%;刘丽娟等(2013)使用机载激光雷达和CASI高光谱数据结合分层掩膜和光谱微分技术对伊春市凉水国家级自然保护区内5种主要树种进行识别,总体精度达83.88%。但受制于数据来源,对覆盖范围更大、成本更低、应用难度更小的星载高光谱数据研究较少。第三,在识别算法中,使用最多且表现较好的是支持向量机和随机森林算法,但受研究对象、研究地点、分类系统等因素影响,即使是同一种算法,在不同研究中的表现也存在较大差异;同时,深度学习算法和多分类器融合算法成为研究热点。如Koukal等(2014)、Yang等(2014)分别利用多光谱数据和激光雷达数据结合随机森林算法对阿尔卑斯山附近的森林和北方森林进行分类识别,总体精度一个高达92%,另一个仅为66%;王怀警等(2019)采用多分类器组合策略将支持向量机与随机森林算法进行组合,进一步提高了森林类型识别精度;冯海林等(2019)基于树木整体图像构建4种深度学习模型,通过相对多数投票法和加权平均法建立集成模型,树种图像识别准确率达99.15%。

综上所述不难发现,在基于遥感的树种识别领域,依然存在热带和亚热带地区研究较少、星载高光谱数据研究基础薄弱以及识别算法表现不稳定等问题。鉴于此,本研究以皇甫山国家森林公园为研究区(以亚热带天然次生林为主),以GF-6 PMS数据(以下简称GF-6数据)和GF-5 AHSI数据(以下简称GF-5数据)为主要遥感数据源,基于JM(Jeffreys-Matusita)距离和线性判别分析对各类特征进行筛选降维(邢丽玮等,2018),利用面向对象多尺度分割算法将分类特征在对象层面进行融合,结合光谱特征(SF)、纹理特征(TEF)、植被指数特征(VIF)和地形特征(TRF)构建10种分类方案,使用近邻分类(KNN)、支持向量机(SVM)、贝叶斯分类(Bayesian)、随机森林(RF)和分类回归树(CART)建立基于面向对象的分类精度权重自适应组合分类器(WACC),探究不同特征因子作用下多分类器组合算法在亚热带天然次生林树种识别中的表现,以期为国产高分系列数据,特别是GF-5数据在森林资源调查和监测领域的应用提供可参考的案例,促进国产高分系列数据在林业生产经营中的应用。

1 研究区概况与数据来源

1.1 研究区概况

皇甫山国家森林公园(32°17′—32°22′N,117°58′—118°01′E)位于江淮丘陵东部滁州市境内,总面积35.87 km2,最高海拔399.2 m,为皖东地区最高峰,属淮阳山脉余脉。该区属北亚热带湿润性季风气候区,年日照时长1 984.4 h,无霜期210天,年均气温15 ℃。土壤以黄棕壤、黄壤和石灰性土壤为主。森林覆盖率达96.1%,以北亚热带落叶阔叶林为主,是江淮地区保存最完好、面积最大的天然次生林,也是国家级北亚热带阔叶林保护区。从优势树种看,阔叶林以朴树(Celtissinensis)、麻栎(Quercusacutissima)和黄檀(Dalbergiahupeana)为主,以及榉树(Zelkovaserrata)、榆(Ulmuspumila)、乌桕(Sapiumsebiferum)等;针叶林以马尾松(Pinusmassoniana)、湿地松(Pinuselliottii)和杉木(Cunninghamialanceolata)为主,以及黑松(Pinusthunbergii)、云杉(Piceaasperata)等。

1.2 遥感影像

研究使用GF-5数据和GF-6数据各1景,成像时间分别为2019年5月22日和2019年5月1日,以保证时相一致性和数据可比性。GF-5数据单景幅宽60 km,空间分辨率30 m,光谱分辨率可见光及近红外短波谱段为5 nm,近红外长波谱段为10 nm,在400~2 500 nm光谱范围内有330个连续谱段,其中可见光及近红外短波谱段150个,近红外长波谱段130个(刘银年,2018)。GF-6数据单景幅宽90 km,全色波段空间分辨率2 m,4个多光谱波段空间分辨率8 m。2景影像均能实现对研究区的全覆盖,详细参数见表1。

表1 影像基本信息Tab.1 Image basic information

1.3 辅助数据

辅助数据主要包括森林资源连续清查数据(简称一类清查数据)、森林资源规划设计调查数据(简称二类调查数据)、地形数据和外业调查数据。一类清查数据是林场管护人员在2016年第八次清查数据基础上根据每年森林抚育更新情况制作,更新日期截至2018年底;二类调查数据是在2014年二类调查数据基础上进行更新,更新日期截至2017年。考虑到亚热带地区植被更新速度快,为保证数据时效性,本研究使用的森林资源数据主要为2018年一类清查数据。地形数据主要收集了1∶5万地形图,并对其进行矢量化,生成分辨率为25 m的DEM数据,用于后期地形特征提取和影像校正。外业调查数据主要是对森林树种空间位置和属性的实地调查数据,用于训练和检验样本选择。2019年8月15—20日,结合皇甫山林场森林清查数据,对皇甫山国家森林公园树种分布情况进行实地调查。综合考虑各树种的空间分布、聚集情况、面积占比和可及性等因素,重点对朴树、麻栎、黄檀、马尾松、湿地松和杉木6类树种样本进行测定。因选取的样本不是直接用于训练和验证,而是用于辅助尺度分割后的样本选择,故调查时主要通过查看森林资源分布图并询问护林员,选取面积大于900 m×900 m的纯林采用GPS在样方中心进行定位,记录样方内的树种、平均龄组等因子,并拍照存档。共获取样本479个,其中朴树样本72个、麻栎样本64个、黄檀样本66个、马尾松样本70个、湿地松样本77个、杉木样本78个、其他树种样本52个。样本选取在排除可及性差、GPS信号强度不足的区域后,尽可能做到均匀分布,具有良好的代表性和典型性,样点分布如图1所示。

图1 样点分布Fig.1 Sample distribution of the study area

1.4 数据预处理

原始数据DN(digital number)是一个无量纲的值,为了精准识别树种,需对影像进行辐射定标、大气校正、正射校正、融合、空间配准、裁切等一系列处理。对GF-5和GF-6数据进行辐射定标和大气校正,使地物波谱曲线趋于正常。去除GF-5数据中受水汽影响的26个坏波段,再结合制作的25 m分辨率DEM进行正射校正和地形辐射校正,以消除地形和传感器姿态造成的误差。需要注意的是,在进行重采样输出时选择最近邻法,以减少重采样对高光谱数值的影响。将GF-6数据全色波段与多光谱波段进行匹配融合,以提高影像质量,然后进行正射校正和地形辐射校正。校正后GF-6数据重采样至30 m,寻找与GF-5数据配准的同名点,用同名点对未重采样的融合校正后GF-6数据和校正后GF-5数据进行配准。最后,利用皇甫山国家森林公园界线,对处理后的GF-5和GF-6数据进行裁切。

2 研究方法

2.1 分类系统

综合考虑遥感和外业调查数据特点以及树种精细识别能力,结合研究区内树种分布和面积占比情况,建立科学的三级分类系统。将林地划分为可识别林地和其他林地,其中,其他林地指在整个研究区分布较少且不集中、或树高过低、或受其他树种冠层遮盖无法精细识别树种的林地,如乌桕、黑松、榉树和一些低矮的半乔木等;可识别林地为朴树、麻栎、黄檀、马尾松、湿地松和杉木6类,详见表2。

表2 分类系统Tab.2 Classification system

2.2 面向对象多尺度分割

传统基于像元的分类计算效率较低,且易出现“椒盐现象”,特别是在综合不同空间分辨率的特征因子分类时,需要进行重采样以统一特征因子分辨率,这就难免会造成信息丢失或计算力浪费,而对象层面的分类能够很好地解决类似问题(田甜等,2015)。本研究基于对象对不同尺度特征进行融合和树种识别,采用图割算法(GC)对预处理后GF-6数据进行面向对象多尺度分割。GC算法通过统计区域光谱和局部二进制纹理特征,根据光谱、纹理和形状特征计算相邻区域间的异质性,在此基础上构建区域邻接图,采用逐步迭代优化算法以光谱、纹理和形状间的异质性为准则进行区域合并,获取最终分类结果。为了保证分割对象内像元的纯净度,本研究使用过分割方式,以实测数据和一类清查数据为参考,在保证单一分割对象内不存在多种树种的基础上,将分割尺度再调小5,形状因子增加0.1,最终确定分割尺度为45、形状因子为0.5、紧致度为0.3。由图2可见,使用过分割方式,分割结果能够较好表征数据的纹理和颜色差异。

图2 多尺度分割结果Fig.2 Multiscale segmentation result

2.3 特征提取和降维

2.3.1 特征因子提取 由于树种的多样性和光谱信息获取的局限性,“同物异谱”和“同谱异物”现象难以避免。为了提高识别精度,对树种的光谱特征、纹理特征、植被指数特征和分布的地形特征进行提取整合。将GF-5数据去除水汽吸收和噪音干扰过大波段后的304个波段作为光谱特征,并基于这些波段提取26种植被指数作为植被指数特征;基于融合后2 m空间分辨率的GF-6数据,利用灰度共生矩阵(gray-level co-occurrence matrix,GLCM)提取9×9个像元窗口大小的4个波段4个方向(0°、45°、90°和135°)共128个纹理特征;将DEM和基于DEM计算出的坡度和坡向作为地形特征(表3)。需要说明的是,9×9纹理特征提取窗口的确定,是对比3×3至15×15窗口提取的纹理特征对各树种样本平均可分离性后得出的,各树种在特征窗口3~15时取得的平均可分离性分别是1.827、1.889、1.962、1.987、1.974、1.917和1.899,9×9窗口提取的纹理特征对树种的可分离性最好。这是因为9×9窗口对2 m分辨率数据进行纹理特征提取,能够在兼顾特征精度的同时有效避免林分冠层和阴影的影响(徐凯健等,2018)。

表3 特征因子①Tab.3 Feature factor

2.3.2 分类特征选择 丰富的特征因子能够提供多种多样的识别信息,但特征因子间存在相关性,也会不可避免地造成信息冗余。对光谱特征、纹理特征和植被指数特征进行相关矩阵分析发现,相关系数绝对值大于0.5的强相关波段分别占总波段的84.1%、42.7%和32.0%(图3)。强相关性造成的大量冗余不仅会耗费大量存储和计算成本,而且在分类时也可能导致“维度灾害”,降低分类精度,所以需要对特征因子进行降维。

图3 特征因子相关矩阵Fig.3 Correlation matrix of feature factors

特征提取和特征选择是2种主要的降维方法。特征提取主要利用线性或非线性变换改变数据特征空间,从而达到信号表达上的最优;但是此类方法改变了特征原有的物理意义,且信号表达角度上的最优并不代表类间可分性上的最优。据此,本研究先结合外业树种样方对各类树种的光谱特征、纹理特征和植被指数特征进行提取;然后,以提取到的各类树种特征因子为样本,使用前向搜索策略基于JM距离对3类因子进行特征选择;最后,构建线性判别分析(linear stepwise discriminant analysis,LDA),将选择出的特征因子分类逐次增加到构建的判别分析模型中,以探究不同类型不同数量特征因子对树种识别精度的影响,确定最佳分类特征。如图4所示,在线性判别分析模型中,3类特征因子数量对分类精度的影响呈大致相同的趋势,随着特征因子数量增加,判别精度先快速增加,随后增加速度放缓,最后趋于稳定。这表明特征因子增加可以提高分类精度,但是随着因子数量不断增加,信息出现冗余,对分类精度的提高逐渐降低,甚至拉低分类精度。

图4 特征因子分析Fig.4 Analysis of features由于图幅原因,仅将特征数量为奇数的判别精度在图上进行显示。Due to the size of the map,only the discriminant accuracy with odd number of features is displayed on the map.

3类特征因子中,光谱特征判别精度最高(63.03%),其次是植被指数特征(50.60%),最后是纹理特征(44.70%)。本研究以增长率小于0.9%为界线,在304个光谱特征中提取出28个,主要集中在红光和近红外波段,分别是VNIR5、VNIR17、VNIR20、VNIR33、VNIR48、VNIR88、VNIR121、VNIR122、VNIR125、VNIR129、VNIR136、VNIR140、VNIR144、SWIR12、SWIR21、SWIR28、SWIR37、SWIR41、SWIR60、SWIR65、SWIR84、SWIR86、SWIR92、SWIR94、SWIR101、SWIR105、SWIR139和SWIR149。在128个纹理特征中提取出12个,其中均值、熵和角二阶矩对树种识别的贡献较大,分别是MEA2-0、MEA3-0、MEA4-0、MEA1-45、ASM1-90、ASM2-90、ASM1-45、ENT3-45、ENT1-90、ENT1-135、HOM2-0和COR1-90。在26个植被指数特征中提取出10个,表征窄带绿度的是改进红边归一化比值指数(mSR705)和Voglemann红边指数3(VOG3),表征光利用率的是红绿比值指数(RG),表征碳衰减的是纤维素吸收指数(CAI),表征叶绿素含量的是类胡萝卜反射指数(CRI1、CRI2)和花青素反射指数(ARI2),表征冠层含水量的是水波段指数(WBI)、归一化水指数(NDWI)和归一化红外指数(NDII)。

2.4 树种识别方案

为了提高分类精度,减少其他地物对树种识别的影响,本研究按照构建的分类系统进行二级分类。首先,在影像分割结果基础上,结合二类调查数据进行样本选择,选择林地、耕地、水域、建筑用地和未利用地各200个样本,采用随机抽取方式从各地物提取120个样本用于训练分类,剩余样本用于精度验证,进行一级分类,将林地单独提取出来。然后,利用外业调查数据和一类清查数据对分割结果进行树种对象样本选择,提取朴树样本53个、麻栎样本42个、黄檀样本60个、马尾松样本49个、湿地松样本71个、杉木样本69个、其他树种样本47个。受限于地形和工作量,外业调查数据的样本数量有限,为保证分类精度,需对样本进行扩展(王怀警等,2018)。将上述提取的光谱特征、纹理特征和植被指数特征在对象层面进行融合,结合已有对象样本提取特征曲线,并与未确定属性的分割对象进行光谱曲线匹配。采用光谱特征拟合、二进制编码和光谱角分类3种方法进行评价,将3种方法评分均大于0.8的对象拓展为样本。同时,为了保证训练和验证结果的一致性和可比性,将6类树种样本都拓展至100个,其他树种样本扩展至60个,同样随机分为2份,60%用于训练,40%用于验证,进行二级分类(表4)。

表4 样地Tab.4 Sample points

为了有针对性地分析光谱、纹理、植被指数和地形特征在树种识别中的作用,按照光谱特征、纹理特征性、植被指数特征和地形特征构建10种分类方案(表5)。单一特征因子参与分类(方案8、9和10)用于寻找树种分类精度最高的单特征因子;光谱属性是遥感分类中的常用属性,将光谱属性分别与纹理特征、植被指数特征结合(方案5、6和2)用于研究多特征因子组合对树种识别精度的贡献;地形数据参与分类(方案1、3、4和7)用于探究地形因素对研究区内树种识别的影响。

表5 分类方案Tab.5 Classification scheme

在林地提取基础上,基于面向对象方法,结合支持向量机(陈向宇等,2019)、随机森林(傅锋等,2019)、近邻分类(王二丽等,2017)、贝叶斯分类(李想等,2018)和分类回归树(Puetal.,2012)5种算法分别对研究区林地树种分布进行提取。支持向量机使用径向基核函数,γ设置为150,惩罚因子C设置为1 500;随机森林算法使用模型算法为C4.5,基础分类决策树数量设置为2 100,数据属性个数为lgN(N为属性总量),树的最大深度设置为完全生长;近邻分类算法距离度量选择欧式距离,K设置为2;分类回归树特征选择使用基尼系数,修剪使用预修剪算法,将决策树最大深度设置为20,最小样本量默认为0。对上述5种算法的分类结果进行精度验证,取用户精度与制图精度的均值作为算法a对树种b的识别精度,将其作为算法a对树种b的识别权重。每种算法对某一树种的识别归属拥有1乘以该算法对这一树种识别权重分的投票权,结合5种识别算法结果采用并行方式对研究区树种分布进行组合投票以确定研究区树种识别最后结果。组合方法与投票组合规则公式如下:

(1)

(2)

式(1)为投票组合方法,对于输入的X分类,分类器ek输出的投票分数为Pk,即用户精度与制图精度的平均数,Cj表示影像内是j的对象;式(2)为改进后的投票组合规则,TK(X∈Cj)表示类别Cj经分类器ek输出后得到的分数,M为类别总数,M+1表示分类器拒绝识别X。

3 结果与分析

本研究主要探究树种识别,故不对一级分类结果作过多分析,一级分类后林地分类精度达98.22%,将林地提取出来进行二级分类。利用混淆矩阵的用户精度(UA)、生产精度(PA)、总体精度(OA)和Kappa系数4个指标对10种分类方案6种分类算法得出的60种结果进行精度评价,分析不同特征因子对树种识别的影响,以探究树种识别的最优特征组合与分类模式。

3.1 各分类算法和方案总体精度

利用验证样本对各算法和方案分类结果进行精度验证,总体精度如图5所示。对比各分类算法可以看出,权重自适应组合分类器算法(WACC)除方案6(SF + VIF)总体精度略低于随机森林算法0.88%外,在其他9种分类方案上均得到最高分类精度,总体精度高出表现次好的分类算法0.22%~4.03%。除权重自适应组合分类器算法外,随机森林和支持向量机算法对树种也具有较好的识别精度,在特征因子较少时(方案3、6、7、8和10),随机森林算法表现优于支持向量机算法;反之,在特征因子较多时(方案1、2、4、5和9)时,支持向量机算法有着更优秀的表现。

图5 各分类方案和算法总体精度Fig.5 The overall accuracy of each scheme and algorithm

对比各分类方案可以看出,当使用单一特征因子进行树种识别时,光谱特征(方案8)表现最好,其次是植被指数特征(方案10),纹理特征最差(方案9)。这主要是因为GF-5数据具有丰富的光谱特征,且能够计算出多样的植被指数特征,而研究区林分密度大,冠层结构复杂,使得纹理特征对树种的区分度有所降低。当使用多特征因子组合进行树种识别时,方案2(SF+VIF+TEF)除近邻分类算法总体精度略低于方案1(SF+VIF+TEF+TRF)0.12%外,在其他5种分类算法上均取得最高总体精度,且实际上近邻分类算法在各方案中均是6种识别算法中最差的,可以将方案2看作树种识别的最优特征组合。通过各分类方案平均总体精度(Mean),对比方案7和8、方案3和5、方案4和6以及方案1和2可以看出,地形特征加入对总体精度提高的贡献分别为-1.74%、0.92%、-0.27%和-0.42%,地形特征对树种识别精度提高的作用极小,甚至会降低总体精度。这主要归因于研究区山峰较少,平均海拔较低,植被分布的垂直地带性无法充分体现,且皇甫山国家森林公园近年来成为重要景点,在可及性较好的平坦地区林场抚育更新力度较大,树种的坡度和坡向分布规律在一定程度上受到影响。对比方案8、6、5和2可以看出,随着特征因子增加,树种识别的平均总体精度不断提高,植被指数和纹理特征对提高树种识别总体精度能够起到较好作用,且植被指数特征对树种识别总体精度提高的贡献略高于纹理特征。

3.2 最优分类方案各树种识别精度

由上述分析可知,去除分类表现较差的近邻分类算法后,方案2在各分类算法上均能取得最好总体精度(图6)。去除近邻分类后各算法在方案2下的各树种分类精度见表6。可以看出,麻栎识别最高制图精度和用户精度分别为97.50%(WACC)和94.59%(SVM);朴树识别最高制图精度和用户精度分别为87.50%和89.74%(CART);黄檀识别最高制图精度和用户精度分别为95.00%(RF)和94.87%(SVM);马尾松识别最高制图精度和用户精度分别为95.00%(SVM)和91.89%(WACC);湿地松识别最高用户精度和制图精度均为92.50%(WACC);杉木识别最高制图精度和用户精度分别由RF和WACC取得,为85.00%和88.89%;对其他树种识别,最高用户精度和制图精度均由RF得到,分别为88.46%和95.83%。各树种识别的总体精度和Kappa系数均由本研究方法得到,分别为87.51%和0.854。

从各树种识别精度来看,麻栎、马尾松、黄檀用户精度和制图精度均超过90%,识别准确率较高,而朴树和杉木识别精度相对较低,均低于90%。朴树识别精度低有2方面原因:一是算法自身缺陷,分类器组合方法在朴树识别上取得的精度低于支持向量机、随机森林和分类回归树,原因是分类错误的投票分数累计超过了正确的投票,致使多分类器组合精度不如单一分类器;二是其他类别中有大量亚热带落叶阔叶树种,如榉树、榆树等,这些树种样本较少,分类规则模糊,与同为落叶阔叶林的朴树发生较多错分。杉木识别精度较低则主要是因为与马尾松以及少量分布的云杉发生错分所致。对比各分类算法对湿地松的识别精度,不难发现湿地松在多分类器组合算法上取得较好精度与多分类器组合能够集成各算法互补信息有着密不可分的关系。黄檀能够取得较高识别精度除了算法优势外,还有一个较为重要的原因是黄檀分布较为集中,混交现象较少。从各分类算法的表现来看,对树种精细识别具有较好表现的算法依然是权重自适应分类器组合算法和支持向量机算法。如表6所示,6类树种的用户精度和制图精度加上算法的总体精度和Kappa系数共14个评价指标中,权重自适应分类器组合算法在麻栎、湿地松的制图精度,马尾松、湿地松和杉木的用户精度,算法总体精度和Kappa系数7个指标上取得最高分,表现显著优于其他算法。

4 结论

本研究采用多特征因子组合,结合支持向量机、随机森林、近邻分类、分类回归树和贝叶斯分类算法构建权重自适应组合分类器,该方法可有效提高树种间的可分性,能满足复杂冠层结构和高林分密度下亚热带天然次生林树种识别提取的应用需求。

基于GF-5和GF-6数据提取各类特征因子,利用JM距离和线性判别分析模型提取出的树种识别最优特征因子能够有效降低分类特征间的冗余,避免“维数灾难”出现,从而增强树种类间可分性,提高树种识别精度;同时,也可为其他利用国产高分数据进行信息提取与分类的研究提供参考依据。

多源数据结合、多特征因子组合以及多分类器联合在树种识别方面具有单一数据源、单一特征因子和单一分类算法难以比拟的优势,将GF-5数据提取出的植被指数特征和光谱特征与GF-6数据提取出的纹理特征结合,在GF-6数据分割的对象层面上利用多分类器组合算法进行树种识别取得了60种分类方案和算法中最优的结果。GF-5和GF-6数据在树种识别领域具有显著优势,在森林清查、林地监测、森林抚育更新等林业生产经营活动中具有极大应用前景。

随着遥感技术不断发展,卫星数据获取途径日益增多,多数据多特征融合已成为树种识别研究的热点;得益于计算机技术的升级进步,计算力不再是制约分类算法的主要因素,识别精度较高但计算复杂耗时的深度学习和多分类器组合算法也将成为树种识别领域的应用趋势。本研究对多源数据多特征因子结合多分类器组合算法展开探索,但因特征因子间存在复杂的相关作用,对特征因子与树种识别精度的响应关系研究仅停留在定性化描述上,未进行定量化评价。另外,本研究采用的多分类组合算法基于各分类器识别精度分类权重进行投票以获取树种识别结果,这种方法虽然在大多数情况下能取得较好识别精度,但因并未对单一分类器分类结果的可靠性进行评判,也会出现多个分类错误权重较小的分类器累计投票得分高于分类正确分类器的情况,导致组合分类识别精度低于单一分类器。后续将尝试在分类投票前对单一分类器精度进行评价,以剥夺精度较低分类器投票权的方式来提高组合分类器识别精度。

猜你喜欢

分类器树种光谱
基于三维Saab变换的高光谱图像压缩方法
高光谱遥感成像技术的发展与展望
基于GC-MS流苏树种子挥发性成分分析
树种的志向
树种的志向
常绿树种在新疆的应用现状
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
星载近红外高光谱CO2遥感进展
基于层次化分类器的遥感图像飞机目标检测