APP下载

基于极限学习机的单木枝叶点云分类

2019-03-18章又文邢艳秋

安徽农业科学 2019年5期
关键词:单木学习机训练样本

章又文,邢艳秋

(东北林业大学森林作业与环境研究中心,黑龙江哈尔滨 150040)

在林业测量中,三维激光雷达能够准确、快速地提取树木表面三维信息,因此被广泛运用在林木的垂直结构[1-2]、叶面积指数提取[3-4]以及单木三维建模可视化[5-6]中。林木枝叶分类识别的研究是林木参数提取及三维重建的重要内容。Li等[7]利用单木树叶与枝干点云的法向分布特征的不同,采用法线差分算子进行单木枝叶点云的分类识别,以达到分割树叶点云的目的,从而减小了枝干点云对叶面积密度提取精度的影响。LU等[8]直接利用林木样方点云数据,作径向半球点云切片计算有效叶面积指数。王洪蜀等[9]将激光雷达设备与CCD相机同步采集林木样方数据,利用监督学习将CCD相机拍摄的彩色影像中的枝叶分类,再将枝叶中的像素信息赋给点云数据,从而达到枝叶点云分类识别的效果。上述文献中,在冠层部分的叶面积信息提取上,没有综合利用局部枝叶点云的形状、法向分布、反射强度等特征研究枝叶点云的分类识别。喻垚慎等[10]利用点云的局部切平面分布特征,融合多种空间结构特征分离枝干与树叶点云,然而细小的枝干与树叶点云数据冗杂在一起,空间特征不突出。颜色是区分枝干与树叶的重要自然属性,在枝干与树叶的空间结构特征的基础上,增加色彩特征进行研究,能够使分类更为准确。

三维点云数据信息量大,因此在分类算法的选择上,笔者采用极限学习机(extreme learning machine,ELM)来进行枝叶点云的分类识别。2004年有研究人员提出,ELM算法主要应用于回归以及分类问题当中。程东生等[11]将ELM算法应用在中文文本分类中,证明ELM能够有效的平衡学习效率以及分类精度。王明常等[12]运用ELM进行GF-2高光谱遥感影像的分类,并将其与SVM、最大似然法的分类结果进行比较,法线ELM比其他2种算法分类准确度高、算法运行时间快,因此具有一定的推广价值。ELM具有良好的泛化性能,能够搜索全局最优解,不需要重复的迭代运算,因此缩短了分类时间,提高了分类效率。单木枝叶点云分类是冠层叶面积参数提取前提,能否准确地进行枝叶点云分类、提取树叶点云数据是亟待解决的关键问题,笔者采用机器学习算法进行枝叶点云分类研究,为准确高效提取叶面积指数提供了参考依据。

1 数据采集及预处理

1.1数据采集试验在东北林业大学城市林业示范基地进行。利用法如X330激光扫描设备,获取1株高6.14 m的生长期胡桃楸的三维点云数据。扫描时,以胡桃楸为中心,每隔120°设置1个站点,扫描水平视场120°,垂直视场0~90°,共扫描得到3站数据,数据采集现场示意图如图1所示。

图1 数据采集现场示意图Fig.1 The diagrammatic sketch of data acquisition scene

1.2数据预处理将扫描得到的3站数据,利用法如配套的软件SCENE将数据格式转换为通用PCD格式后,利用CloudCompare软件进行3站数据的配准融合,再进行点云抽稀、去噪。得到完整的待分类单木点云数据如图2所示。

图2 单木点云数据Fig.2 Point cloud data of single tree

采用的点云分类算法为监督学习,因此需要提前选取一定数量的树叶和枝干点云作为训练样本数据,并加上标签作为标记,树叶点云标记为“2”,枝干点云标记为“1”。选取的训练样本数据如图3所示。

图3 训练样本数据Fig.3 Training sample of single tree

2 点云特征提取

局部区域的枝干与树叶点云在空间结构上存在差异,树木的枝干点云聚集呈现近似圆柱状,法线方向向四周分散,而树叶点云在邻域范围内呈现近似平面或曲率较小曲面的分布,法线方向较集中、差别不大,因此笔者通过K均值聚类法,设置固定的k值50,寻找离当前点xi=(x,y,z)T∈R3(i=1,2,3…)距离最近的50个点作为一个邻域Nk(xi)。

2.1三维形状特征为进一步求得点云的三维形状特征,先求取各个邻域内的点集的协方差矩阵,当前点xi的协方差矩阵为

(1)

(2)

邻域内的三维形状特征表示为

(3)

2.2法向分布特征

根据稳健平面拟合方法[13],当前点xi的邻域Nk(xi)的拟合平面函数为

z=f(x,y)=ax+by+c

(4)

则根据最小二乘法,求下式最小值

(5)

由上式,分别对系数求导联立方程可得到系数的值,则当前点的法向量即可表示为

n=[a,b,c]

(6)

同样,领域内其他点的法向量也可求得,则邻域内各点法向量集合的协方差矩阵对应的特征值为λn=[λn1,λn2,λn3],邻域散点的法向分布特征为

Fnormal=[n,λn]

(7)

2.3局部曲率特征同样,对于邻域Nk(xi)内的点集拟合曲面方程,通过最小二乘法求解曲面方程系数[14],根据曲面方程系数求解曲面法向量nc,以及高斯曲率K和平均曲率H。则邻域散点的曲率特征为

Fcurve=[nc,K,H]

(8)

2.4基于随机森林的特征降维将以上步骤得到的特征(6)、(7)、(8)以及Fcolor=[r,g,b]和Fintensity=I进行多维特征融合,得到总的用来分类的局部点云特征Forigin,[r,g,b]分别为红、绿、蓝3个通道的颜色值,Fintensity=I为激光反射强度信息。

采用随机森林算法[15]进行特征降维处理。将随机森林算法得到的特征重要指标由大到小进行排序,筛选出前7个对分类贡献率较大的分类指标,组成新的分类特征Fnew

(10)

3 基于极限学习机的点云分类

采用极限学习机(ELM)[16]进行单木点云枝叶分类识别研究。ELM是一种单隐含层前馈神经网络算法,与传统的BP神经网络算法相比,不需要迭代重新计算连接层的权值与隐含层的阈值,可以快速、准确地进行全局优化,找到全局最优解,因此被广泛应用于分类、回归分析中。

极限学习机的原理:

设训练样本为xi=[x1i,x2i,x3i,…,xni]T∈Rn,yi={1,2}∈Rn,其中i=1,2,3,…,q,q为样本个数,xi为训练样本特征,即为输入矩阵值,yi为训练样本分类标签值,即为输出矩阵值,1表示该训练样本点为枝干类,2表示该训练点为树叶类。

设置神经网络的隐含层个数为l,则输入权值矩阵为

(11)

隐含层与输出层的连接权值矩阵为

(12)

其中m为输出层神经元个数。

隐含层神经元的阈值为

(13)

该研究中隐含层神经元的激活函数G(x)为Sigmoid函数,则由式(11)、(12)、(13)可得,神经网络的输出值为

O=[t1,t2,…,tq]m×q

(14)

则单个样本值的网络输出值为

(15)

其中,wi1=[wi1,wi2,…,win]T,xj=[x1j,x2j,…,xnj]T

由式(15)可知,网络输出可以表示为

Gβ=OT

(16)

其中,网络输出矩阵G即为

(17)

由式(16)和(17)可得到隐含层与输出层的连接权值矩阵为

β=G-OT

(18)

其中,G-为网络输出G矩阵的广义逆矩阵,训练样本中的网络期望输出为yi,目标为使网络输出值oj无限接近于yi。则可根据最小二乘法,求解出β的值,带入式(16)中,从而得到网络输出值oj。

根据算法思路,分类步骤如下:

①ELM网络学习训练前,先确定隐含层神经元数目,该研究设置为50,隐含层激活函数为Sigmoid函数。同时随机产生上述过程中的连接权值矩阵w以及阈值b。

②输入手动提取的训练样本数据,xi=[x1i,x2i,x3i,…,xni]T∈Rn,数据中包含了式(10)中的分类特征信息,根据式(17)计算出网络输出矩阵G。

③将步骤②计算出的输出矩阵G以及训练样本数据中的分类类别,带入式(18)中,计算出隐含层与输出层的连接权值矩阵β,则ELM网络训练结束。

④将待分类的测试数据集输入步骤③中训练好的ELM网络中,计算得到分类结果。

则单木枝干与树叶点云分类识别的流程如图4所示。

图4 点云分类识别算法流程Fig.4 The process of cloud point recognition

4 结果与分析

为了更好的评价极限学习机的分类效果,将其与BP神经网络、LVQ神经网络、决策树、支持向量机以及朴素贝叶斯算法进行比较,图5为这6种算法的分类正确率。从图5可以看出,极限学习机、BP神经网络、LVQ神经网络、决策树、支持向量机以及朴素贝叶斯算法的分类正确率分别为98.99%、94.30%、91.26%、96.95%、98.16%、85.67%。在试验条件下,极限学习机的单木点云树叶和枝干分类识别效果较好。表1为这6种算法的训练和分类的耗时。从表1可以看出,朴素贝叶斯方法的分类时间最短,但分类正确率最低,极限学习机的训练时间最短,测试时间耗时较少,正确率最高。

由图6可知,6种算法的分类效果图更直观地显示了树叶点云与整株单木点云的识别效果。与图1中的原始单木点云数据比较,图6a极限学习机算法的分类效果较好,基本把枝干分离出去,其次是支持向量机,分类效果最差的为图7f朴素贝叶斯算法,不仅没有把枝干完整分割开,而且部分树叶也被错分类为枝干数据分割出去。

图5 6种算法的分类正确率Fig.5 Classification accuracy using six algorithms

序号Code算法Algorithm训练时间Training time∥s测试时间Detection time∥s1极限学习机0.652.132BP神经网络8.577.383LVQ神经网络266.62206.734决策树2.612.275支持向量机54.85376.816朴素贝叶斯0.900.46

图7 6种算法的分类效果图Fig.7 Classification effects of six algorithms

5 结论与展望

单木点云枝叶分类识别,对于单木三维重建以及叶面积指数提取具有重要意义。该研究结果表明,结合点云的局部特征,如点云的形状、曲面曲率、法向分布、反射强度以及色彩特征能够有效提高树叶与枝干分类识别效果。利用极限学习机能够快速、准确的进行分类。在点云数据量较大的情况下,支持向量机、BP神经网络等算法、隐含层阈值以及输入权重矩阵的选取需要梯度下降法等优化算法进行多次迭代,学习率的选取对于迭代效果影响较大,容易陷入局部最小值,造成分类结果的不准确。与BP神经网络、LVQ神经网络等算法比较,极限学习机不需要梯度下降法等优化算法进行多次迭代,能够提高分类效率,具有良好的泛化性能,算法稳定性好。

在点云的分类识别中采用监督分类方法,训练样本的选择对于分类结果的准确性有较大的影响,因此如何在训练样本的选取上实现自动选取具有代表性的样本是进一步研究的方向。在此基础上减少人工干预,实现全自动枝叶分离,也是后续研究方向之一。

猜你喜欢

单木学习机训练样本
地基与无人机激光雷达结合提取单木参数
融合LiDAR点云与高分影像的单木检测方法研究
人工智能
无人机影像匹配点云单木识别算法
极限学习机综述
基于双尺度体元覆盖密度的TLS点云数据单木识别算法
基于极限学习机参数迁移的域适应算法
分层极限学习机在滚动轴承故障诊断中的应用
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法