APP下载

无人机高光谱影像在树种分类识别中的应用研究

2022-07-20

南方农机 2022年14期
关键词:榆树波段分类器

吕 翔

(三和数码测绘地理信息技术有限公司,甘肃 天水 741000)

相比常规的实地勘测,无人机高光谱影像能够有效提升林业生态系统监测效率。近年来,部分学者尝试在森林树种分类中使用高光谱数据和激光雷达,取得了较为理想的效果,但是在研究中需要投入较高的成本,一定程度上限制了其应用前景[1]。而高光谱影像不但能够完成植被信息的有效挖掘,还拥有低成本、高效率、高空间分辨率、操作方便等优点[2-4]。

1 研究区数据及预处理

1.1 研究区概述

研究区种植的主要是防风固沙林,结合当地的适生植物类型和地理条件,在当地采取了乔木、灌木和草类相结合的林分形式。出于保护耕地和固定沙地的目的,在道路两旁种植了混合阔叶林和榆树林,其拥有草本层、灌木层、乔木层的垂直结构,研究区总面积约451 km2。研究区属于暖温带大陆性干旱荒漠气候,拥有300 m~500 m的海拔以及平坦的地势,乔木树种主要为梭梭、胡杨、沙枣、新疆杨、榆树等,林下植被主要为杂灌。在本次研究中笔者将以沙枣、胡杨、新疆杨、榆树作为研究对象。

1.2 无人机概况

在本次研究中将使用Matrice600型六旋翼无人机作为工具,这种无人机可以在8 m/s的风速下正常飞行,最大可以达到18 m/s的飞行速度,能够做到约20 min的连续飞行,拥有5 km的最大航程,与RONIN-MX型多功能云台适配。使用Rikola型高光谱成像仪(芬兰SENOP公司)作为高光谱传感器,其利用了框幅式成像方式。这种成像光谱仪拥有较小的体积和质量,能够同时满足手持和无人机搭载测量的需求,其拥有500 nm~900 nm的默认光谱范围,波段最多可以达到380个,研究人员可以与数据采集要求相结合对波段数和光谱范围进行合理调整。

1.3 获取高光谱数据

在2021年10月23日获取影像,设置200 m的无人机飞行高度。为了使相机参数需求、飞行高度需求以及影像高分辨率需求得到有效满足,在本次研究中将进行42个波段的设置,这些波段拥有10 nm左右的间隔,设置82%的航向重叠率、80%的旁向重叠率以及0.12 m的空间分辨率,同时完成4块地面辐射标靶的设置,分别拥有3%、22%、48%、64%的反射率,从而为后期校正影像辐射提供便利。

1.4 调查地面数据

要想使高光谱影像更加准确地标注样本数据,就需要调查研究区的实际情况,与研究区林分的实际情况相结合。本次研究中在研究区内选取了3个典型区域作为研究样本。调查时间为获取影像的两天前,在开展采样工作时采样点的位置信息是通过便携式GPS设备完成记录的,在各个样地中完成单棵树木树种情况的记录。在完成调查工作后,在Excel中记录和整理原始数据,在采样工作中共完成40个样本点树种类型数据的获取[5]。树种主要为胡杨、榆树、沙枣、新疆杨等。

2 研究方法

首先,有效地处理高光谱影像,并且建立分类特征集,利用SVM-RFE算法完成原始波段最佳组合的选取,再与数理统计特征、纹理特征、植被指数相结合完成新影像分类特征的构建。其次,合理利用RF算法分析各个特征的重要性,在充分考虑分类精度的基础上,将重要性靠后的特征排除。最后,完成4种分类方案的构建,并且评价影像分类的精度,完成不同分类器分类效果的对比。

2.1 原始最佳波段组合选择

当存在不同的树种样本数量和较少的训练样本时,分类器的精确性会降低。要想有效避免这种问题,需要深入挖掘高光谱影像的特征。在这个过程中最佳指数因子选择法(OIF)得到了较为广泛的应用,这种算法能够对各波段间的相关性和单波段影像信息量进行综合考虑,与波段选择原则相贴合,能够取得较为准确的计算效果[6]。但是在本次研究中笔者将尝试使用SVM-RFE算法完成原始最佳波段组合选择,其主要原理就是通过同一模型完成多次训练,并且在每次训练中将权重较低的特征移除,再与新的特征相结合完成后续训练,直至对选择的特征足够满意为止。

2.2 构建植被指数特征

高光谱影像除了包括连续的地物光谱信息外,其中的地物空间分布信息也非常丰富,若是在树种分类时只以光谱信息作为特征,很难准确地分析高光谱图像。在本次研究中笔者将通过构建灰度共生矩阵,在空间信息中融入纹理特征,从而使高光谱影像的空间特征得到准确体现[7]。

2.3 优化分类特征

优化分类特征就是选择拥有较高重要性的特征变量。在训练过程中从未使用过的样本被称为带外(OOB)数据,有效利用这类数据能够准确计算特征变量的重要性,评价分类结果的精度。在本次研究中笔者将通过树数量的改变开展反复实验,在实验中完成特征重要性得分的记录,然后根据分类总体精度将冗余的特征变量去除。

3 研究结果

3.1 原始最佳波段组合

这一阶段的研究对象为研究区内的优势树种,分别使用上文提到的SVM-RFE算法和OIF法选择原始最佳波段组合。

在完成预处理后,无人机拥有42个波段的高光谱数据,完成所有波段组合OIF指数的计算,选择指数较大的波段组合20个,具体情况如表1所示。在本研究的原始波段组合中选取OIF值在前20的波段组合,分别选择了1、2、3、4、5、6、35、36、37、38、42序号的波段共11个。在选择原始最佳波段组合时利用OIF算法需要较长的计算时间并且拥有较高的计算难度。通过分析表1可知,有两极分化的情况存在于选择波段中,具体在近红外波段和蓝光波段较为集中,并未选择红色波段和绿色波段,导致大量原始信息丢失。

表1 OIF指数排名

而利用SVM-RFE算法能够选择17个原始波段,有效地组合所选的波段,分别选择了1、2、3、8、11、13、17、20、21、23、26、28、31、35、36、40、42序号的波段。这种方法能够在整个范围内有效地选择波段,不但拥有更加均匀的波段选择,并且还拥有相对较小的计算量[8]。对比原始42个波段榆树光谱响应曲线和上述两种方法选择的榆树光谱响应曲线,得到如图1所示的结果。

通过分析图1可以发现,在榆树光谱响应曲线方面,与原始42波段相比,SVM-RFE算法选择的波段特征组合只存在较小的差异,拥有较好的曲线拟合情况,使原始光谱特征得到了较大程度的保留。结合两种方法选取的最佳波段组合,得出了如表2所示的分类结果,与原始全波段相比,OIF法选取的原始波段组合明显拥有更低的Kappa系数和总体分类精度;与原始全波段相比,SVM-RFE算法几乎拥有相同的Kappa系数和总体分类精度。所以在选择高光谱数据原始最佳波段组合时应该使用SVM-RFE算法。

表2 对比原始阶段选择分类结果

图1 榆树光谱响应曲线对比

3.2 分析特征变量重要性和选择特征

通过分析随机森林的OOB误差可以明确分布特征变量重要性的情况,具体情况如图2所示,得分越高证明这一特征越重要,这一变量就能在越大程度上帮助和影响分类结果。通过决策树数量的改变可以发现当拥有2 000决策树数量时,基本不会改变特征变量的重要性排序。所以,以2 000RF决策树数量的结果作为分析特征重要性的结果。由图2可知,数理统计特征和植被指数特征都拥有较高的重要性得分,其中重要性排名第一的是绿色比值植被指数,这是因为研究区大部分树种都是榆树,同时树木拥有良好的生长情况,包含较高的叶绿素含量,所以在近红外波段拥有较高的反射率[9]。其他数理统计特征和植被指数特征均排在前20%,说明在树种分类中使用笔者构建的植被指数特征能够获得非常准确的分类结果。因为在本次研究中使用独立主成分分析的前3个主成分作为数理统计特征,其信息量达到了原数据的95%以上,所以拥有较高的重要性得分。

图2 特征变量重要性得分

纹理特征普遍拥有较低的重要性,出现这种现象可能是由于在分析主成分后,对于排名较低的纹理特征来说,其只包含较少的原始数据信息。在RF分类器中由高到低分别输入特征的重要性排序和数量,并且完成混淆矩阵的建立,分析与评价分类结果,以Kappa系数和总体分类精度为评价指标。结果证明,在1~11特征变量数中分类精度得到了明显提升,Kappa系数为0.93,分类总体精度为94.73%。在11特征变量数以后正在缓慢提升分类精度,但是提升幅度较小。在28个波段时其拥有最高的分类精度,Kappa系数为0.947 5,分类总体精度为95.53%。在融入纹理特征后,会缓慢降低分类精度,证明在拥有过多的特征变量后,可能导致数据中出现过拟合和冗余的现象,最终决定在分类器中输入重要性排名前85%的特征变量。

3.3 对比不同分类器分类效果

本次研究使用的优选特征为28个,在训练样本相同的情况下,树种分类分别利用RF、SVM以及MLC分类器。通过分析分类结果可以发现,3种分类器在树种分类的过程中都存在一定程度的错分和混分问题。其中,拥有最低分类精度的树种为沙枣,特别是在SVM和MLC中存在比较多的沙枣和榆树混分现象。可能是由于研究区内只存在较少数量的沙枣,其拥有较多的侧斜枝和较大的树冠,导致其在图像中拥有较强的光谱信息。当与榆树混合种植时,二者将拥有相似的光谱特征,导致分类难度提升,进而出现较多的榆树与沙枣混分现象。

在纹理、光谱特征方面,长势旺盛的胡杨和新疆杨之间的差异较小,分辨难度较高,所以有轻微的混分现象在两者之间存在。研究区被低矮的棉花田包围,其在图像中只拥有较弱的光谱信息,与研究区中灌木的差异较小,所以也存在少量的灌木和棉花田混分现象。

出于对研究区总体效应的考虑,在种植过程中会混合种植灌木与特定的树木,所以在研究区中有大量的灌木,导致树种精细分类的难度进一步提升。另外,本次研究是在深秋季节采集高光谱影像,很多植被已经存在枯萎的情况,在高光谱影像中并没有识别出所有已经死亡或枯萎的沙枣和胡杨,对制图精度产生了不良影响。在3种算法中都有椒盐噪声存在,只是其程度存在差异,这种现象存在是由于本次研究中使用的传感器拥有较高的空间分辨率。

本次研究结果表明,RF分类器拥有最高的分类精度,可以达到95.93%的总体分类精度;MLC分类器拥有最低的分类精度,只能够达到88.70%的总体分类精度。相比于SVM分类器,RF分类器提高了1.32%的总体精度,0.024 1的Kappa系数;相比于MLC分类器,RF分类器提高了6.83%的总体精度,0.096 7的Kappa系数。研究区内大部分树种都能够达到80%以上的UA和PA。对单个树种的分类精度进行分析,相比于MLC分类器,RF分类器能够使榆树和白杨错分和漏分的概率得到有效降低;相比于SVM分类器,RF分类器能够使沙枣和胡杨错分和漏分的概率得到有效降低,较高的UA和PA使这一结论得到证实。

本次研究结果表明,与仅利用光谱特征分类相比,在分类特征中融入数理统计特征、植被指数特征以及纹理特征,能够使单个树种的分类精度得到极大程度的提升[10]。优化特征后,能够提升0.39%的分类总体精度和0.065的Kappa系数,虽然没有大幅度提升分类精度,但是却明显提升了数据处理的效率,并且明确了研究区树种分类特征。相比于SVM和MLC分类器,RF分类器拥有更好的分类效果和更高的分类精度,能够有效地适用于研究区树种分类。

3.4 影像分类后处理

最终本次研究在训练样本相同的情况下,利用28个优选特征和RF分类器开展树种分类。进行图像分类后处理,对于较小的图斑和椒盐噪声使用中值滤波器进行处理,取得了较好的效果;对于图像中存在的虚假像元问题使用过滤处理、聚类处理等方法解决,发挥了较好的效果。研究结果表明,在经过有效处理后,能够提升0.012的Kappa系数和1.01%的分类总体精度,能够有效增强分类效果。

4 结束语

综上所述,在树种分类识别中应用无人机高光谱影像能够取得非常准确的分类识别结果,但是在应用过程中相关人员需要注意合理地利用各种设备和技术,能够在一定程度上提升分类的准确度。

猜你喜欢

榆树波段分类器
最佳波段组合的典型地物信息提取
学贯中西(6):阐述ML分类器的工作流程
榆树皮妙用可治畜病
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
勘探老工人胡老六
老榆树下的等待
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
基于差异性测度的遥感自适应分类器选择