基于无人机多光谱影像的亚热带阔叶林分类
2022-08-09刘雨真高海力方陆明周辰琴郑辛煜
刘雨真,高海力,方陆明,周辰琴,郑辛煜
(1.浙江农林大学 数学与计算机科学学院,杭州 311300;2.浙江省林业智能监测与信息技术研究重点实验室,杭州 311300;3.浙江省公益林和国有林场管理总站,杭州 310020)
我国亚热带森林分布面积约占全国总面积的1/5,亚热带阔叶林生长演进速度更快、树种组成更复杂[1],对亚热带阔叶林进行精准分类管理具有现实意义。近年来无人机平台迅速发展,通过无人机平台搭载可见光相机获取树种影像数据,具有数据获取便捷、成本低等特点,从而被大量应用于树种分类领域[2]。Onishi等[3]使用无人机可见光影像研究日本森林,对7个树种的分类精度达到89%;林志伟[4]利用福建省东南沿海区域的3个优势树种的可见光影像,分类平均正确率达到75.67%;戴鹏钦等[5]以杭州市临安区潜川镇林场的可见光影像作为数据源,进行树种分类的总精度为97.8%。这些研究集中于树种组成单一、郁闭度较低的林分。孔嘉鑫[6]获取了天目山国家级自然保护区中亚热带常绿落叶针阔混交林在落叶期的可见光影像进行分类,识别精度达到83.13%。在非落叶期亚热带阔叶林中,各树种的叶片没有常绿、变红、落叶等不同的变化,在无人机影像上较难区分,为满足生产实践需要,需要进一步获取非落叶期亚热带阔叶林的可见光影像进行研究。
研究发现,短波红外、近红外这些不可见光波段能更有效地提取树种特征,是森林树种识别的重要波段,而包含这些不可见光波段的多光谱相机因此也被广泛用于遥感监测中。如,张大力[7]基于无人机多光谱影像对东北林业大学帽儿山实验林场中的针阔混交林进行分类,精度达到80.11%;Yu等[8]通过研究芬兰南部北方森林发现,机载多光谱使用随机森林算法进行分类处理精度达90%。而多光谱影像在亚热带阔叶林等复杂林分的应用较少。本研究以非落叶期的亚热带阔叶林为研究对象,以可见光影像、多光谱影像及添加多光谱影像的可见光影像3种不同影像分别作为数据源,使用4种常见分类算法进行分类,探究多光谱影像在提升亚热带阔叶林分类精度上的效果,以寻求一种亚热带阔叶林的高精度分类组合。
1 研究区概况
研究区位于浙江省杭州市临安区浙江农林大学东湖校区内(30°15′19″~30°15′22″N,119°43′23″~119°43′27″E),处于中亚热带季风气候区南缘,属季风型气候,温暖湿润、光照充足、雨量充沛、四季分明。该区内地势平坦,树种组成复杂,由望春玉兰(Magnoliabiondii)、黄山栾树(HuangshanKoelreuteria)、樟树(Camphortree)等树种组成,为典型的亚热带阔叶林。实验地树种信息如表1所示。
表1 实验地树种信息
2 研究方法
2.1 数据收集
1)机载多光谱与可见光数据。使用的无人机为六旋翼无人机DJI经纬m210,无人机所搭载的多光谱相机型号为Sequoia,集成1个RGB相机和3个窄通道成像器,通道光谱范围如表2所示。光谱通道分辨率为120万像素,RGB相机分辨率为1 600万像素,镜头焦距15mm,等效焦距30mm。研究选择天气晴朗、无风的条件下进行无人机影像的采集。经过前期实验,选择60m作为飞行高度,航向重叠率和旁向重叠率设置为90%。
表2 光谱范围
2)野外调查。2021年6月开展地面样地数据调查,以样地调查数据作为真实值,验证树种分类的准确性,使用手持GPS记录树种树木经纬度信息,结合目视解译确定影像中树种树木位置。结合实地调查情况及本研究目的,选取其中优势树种望春玉兰、樟树和黄山栾树作为实验树种。树种训练样本、验证样本数量如表3所示。为确保样本选择的合理性,需要计算样本的可分离度,可分离度表示2个样本色谱的区分程度,值越大,表明相邻2组区分程度越高。一般认为可分离度在1.8以上即为良好,可分离度在1.8以下需要考虑重新选取样本,数值越大代表2个树种越容易被区分[9]。计算结果如表4所示,所有样本间的分离度均大于1.8,样本间的分离度良好。
表3 样本数量
表4 样本可分离性
2.2 数据预处理
使用三维建模软件PIX4D对获取的影像进行处理。首先,基于运动恢复结构算法(SfM,Structure from Motion)提取图像中的特征并依据这些特征匹配图像,然后根据匹配的特征和像机位置重建对象,分别生成可见光正射影像图与红光、红边及近红外3幅单波段正射影像图。将3幅单波段图进行波段合成,得到多光谱正射影像(图1)。然后将可见光正射影像图与多光谱正射影像图进行波段合成,得到添加多光谱信息的可见光影像。波段合成是通过位置信息将不同图片中同一位置的特征信息进行匹配,能够汇聚不同波段中的有效信息,提高地物信息提取的精度。
图1 样地影像
2.3 树种信息提取
基于对象的分类方法因能有效减少“同物异谱”和“同谱异物”带来的错分问题,提升分类精度,在遥感分类中被广泛使用。然而,基于对象的分类方法分类前要先将图像分割为一个个对象,导致分类精度极大依赖于分割精度,提高了分类操作难度,而基于像元的分类方法以每个像元作为基本单元进行分类,不需要对图像进行分割。有研究表明,基于对象的分类方法与基于像元的分类方法整体分类精度相差不大,而基于像元的分类方法能够得到形状复杂度更高的分类斑块[10]。因此,选择基于像元的分类方法进行树种的信息提取,从光谱纬度和空间上下文关系分别获取树种的光谱信息和空间几何信息。
2.4 分类器选择
使用文献研究法确定最大似然法[11]、马氏距离[12]、神经网络[13]、支持向量机[14]等4种算法作为分类算法。最大似然法(Maximum Likelihood,ML)假设每一个波段的每一类统计都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中。马氏距离(Mahalanobis Distance,MD)是一种基于统计分析学的方法,计算输入图像到各训练样本的协方差距离,最终技术协方差距离最小的,即为此类别。支持向量机(Support Vector Machine,SVM)是一种常用的非参数方法,所需训练数据相对较少且无需分布假设,在样本数量较少时,依然有较好的泛化能力。人工神经网络(Artificial Neural Networks,ANNs)几乎可以实现任意复杂的分类边界,无误差地实现训练集上的分类。分类步骤如下:
1)创建样本集。根据各树种的经纬度信息制作树种样本集,按照7∶3的比例随机将树种样本集划分为训练样本集和验证样本集。
2)提取特征与训练模型。从光谱纬度和空间上下文关系分别获取训练样本的光谱信息和空间几何信息,分别输入4种算法模型中设置训练参数对模型进行训练,并根据结果调整训练参数。
3)执行分类。使用训练好的模型分别对影像进行分类,以划分的验证样本集对分类结果进行评价。
2.5 精度评价
为更细致研究树种分类的效果,在评价总体分类精度的同时,还可对各树种分类精度进行评价。总体分类结果使用总体精度(Overall Accuracy,OA)与Kappa系数进行评价。总体精度指对每一个样本,所分类结果与实际类型一致的概率。Kappa系数是反应提取准确性的指标。各树种分类结果一般使用生产者精度(Producer Accuracy,PA)和用户精度(User Accuracy,UA)进行评价[15]。生产者精度是指任选1个样本,其与分类结果相同的概率,用来表示树种误分情况。用户精度是指分类结果中任选取1个样本,其与实际类型一致的概率,用来表示树种漏分情况。
3 结果与分析
3.1 不同影像光谱分析
分别计算可见光影像、多光谱影像中实验树种的153个树木林冠的像元平均光谱,以波段为横坐标、树种平均光谱指数为纵坐标,绘制不同影像树种平均波谱曲线(图2)。由图2(a)可知,在可见光影像中,望春玉兰和樟树平均光谱指数相近,黄山栾树和草地平均光谱指数相近。由图2(b)可知,在多光谱影像中,3个树种平均光谱指数差异较大,且2个影像中同一树种的光谱指数分别在不同区间,通过波段合成能扩大树种的光谱信息量。
图2 树种影像光谱分析
3.2 整体分类精度评价
在单独可见光影像的分类结果中,算法分类精度偏低,整体精度在60%左右。表现最好的支持向量机分类精度也仅为62.97%。由图3(a)—图3(d)可知,望春玉兰的分类占比过大,可能有大量樟树和黄山栾树被误分成了望春玉兰。在单独多光谱影像的分类结果中,相较于单独可见光影像的分类,最高精度的支持向量机的分类精度提升到了84.62%,如表5所示,其他算法的分类精度也均有不同程度的提升。图3(e)—图3(h)也可看出,望春玉兰的误分过多的情况得到一定程度的缓解。而添加多光谱信息的可见光组合影像中,最高精度仍然为应用支持向量机的分类,分类精度提升到了90.64%,误分情况大大减少,如图3(i)—图3(l) 所示。综合确定添加多光谱信息的可见光组合影像与支持向量机算法为最佳分类组合。
图3 分类结果图
表5 分类结果
3.4 分类精度评价
不同树种在不同波段下体现出的区分度可能存在差异,因此选取最优算法-支持向量机下各树种的分类精度来分析3种影像对于不同树种精度的变化。如表6所示,使用望春玉兰与黄山栾树的信息利用可见光影像很难被精确提取出来,而在多光谱影像中识别精度均大大提升,在组合影像中精度达到最高。而樟树利用可见光影像即有不错的精度,在多光谱影像中精度得到进一步提升,而组合影像的精度与多光谱影像的精度相比仍有提升,但提升不大。
表6 树种分类结果
4 讨论与结论
4.1 讨论
1)除多光谱外,其他研究者曾尝试将高光谱数据和激光雷达数据运用到数据分类中,但因数据获取成本过高限制了使用范围,后期可以尝试将高光谱数据与激光雷达数据运用到亚热带阔叶林分类中。
2)除光谱信息、空间信息外,影像信息还包括纹理指数、植被指数,下一步可尝试将多种影像信息融合进来,以期进一步提高分类精度。
4.2 结论
1)由于亚热带阔叶林一般郁闭度较高、树种颜色和形状比较接近,使用可见光影像数据分类时,容易将树枝相交树种误认为同一树种,导致整体效果较差,而樟树由于其枝叶紧密、树干较大,在小范围内不存在其他树种,所有分类表现较好。
2)在不同影像波段下亚热带阔叶林树种的光谱特征表现出了不同的区分度,单独使用多光谱影像和加入多光谱进行组合,望春玉兰和黄山栾树在4种分类算法下,分类精度均有较大提升。樟树的精度也有了一定程度的提升。表明添加多光谱数据能有效提高亚热带森林分类的精度,利用可见光与多光谱数据组合进行树种分类有着广阔的应用前景。
3)支持向量机在应用3种影像分类时,分类表现均最佳,说明支持向量机处理复杂数据的能力,可能相较于其他分类算法更适用于复杂林分分类。