APP下载

基于小波和可变局部边缘模式的植物物种识别

2018-09-26陈肖蒙邢素霞

计算机应用与软件 2018年9期
关键词:分块识别率算子

陈肖蒙 王 瑜 邢素霞

(北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室 北京 100048)

0 引 言

植物具有净化空气、涵养水源、食用、药用、观赏等一系列重要价值,为人类的生存与发展做出了极大贡献。植物种类极多,对不同植物物尽其用的前提是对植物进行正确的分类鉴别,不同植物间肉眼可见的区别主要存在于植物的根、茎、叶、花、果、种子等外观特征。传统的分类方法需要人工对植物的外观特征进行观测、判断,十分依赖观测人员的专业知识,因此具有一定主观性且效率较低。由于植物外观特征能以数字图片方式获得,因此借助计算机进行植物自动识别成为植物分类学的发展趋势。

在植物的诸多外部形态特征中,叶片更易于采集,且不同植物的叶片颜色、形状和纹理都不尽相同,具备较强的区分性,同时叶片处于平面状态,适合二维图像处理,因此是最常用来进行植物分类的依据。大多数研究倾向于对从植株上分离出来的单个叶片进行识别[1-4],其主要思路是提取叶片的形状特征进行区分。此类方法对图像要求极高,不容许有背景干扰、叶片破损等情况,仍需耗费较多人工。为了进一步提高植物识别的效率,研究自然背景下植物整体图像的识别是十分必要的。人工在野外采集的植物图像通常背景复杂,且植物枝叶分布具有随机性,存在叶片重叠现象,难以获取叶片的完整形状。由于叶片包含丰富的纹理信息,且叶片纹理的提取不易受叶片重叠的影响,选用纹理特征进行复杂背景下整体植物的识别是可行的。

纹理可以定义为物体视觉或触觉的表面特征与表观[5],是高水平解释和理解自然物体的有力信息。纹理特征在基于单个叶片的植物识别上已有诸多应用[6],并取得较好的效果。常用的纹理特征提取方法有灰度共生矩阵法[7]、分形模型[8]、局部二值模式[9]LBP(Local binary pattern)等。由于复杂植物图像存在背景干扰等不利因素,叶片区域在图像上尺度较小也会导致纹理信息不够清晰,因此上述传统的纹理特征方法对复杂植物图像的识别效果并不理想。为了提高识别率,本文针对复杂植物图像的特点,提出一种基于小波变换和可变局部边缘模式[10]VLEP的绿色植物图像识别方法,同时结合分块融合和多分辨率融合的思想,使得所提取的图像纹理特征更加准确、丰富。

1 算法思想

1.1 小波变换

人工采集植物图像时,拍摄距离等因素会影响叶片区域在图像上的尺度大小,导致叶片纹理信息不够清晰,小波变换可以增强纹理基元的有效信息。小波变换能进行时、频域的局部转换,有利于提取和分析局部信息。二维小波分解算法[11]的小波函数和尺度函数都是由一维小波函数和尺度函数经过向量积变换得来的,是把尺度j的低频部分cAj分解成如图1所示的四部分,包括一个低频成分和水平、垂直、斜线三个方向的高频成分。

图1 一级小波分解后的绿色植物图像

尺度会随着j值增加而加倍,但分辨率却随之变为原来的一半,每个层次的变换中,图像都变成4个原图像1/4大小的子图像,具体分解公式如下:

{cAj+1,cHj+1,cVj+1,cDj+1}

(1)

式中:cAj+1表示分解后的低频分量;cHj+1表示分解后水平方向的高频分量;cVj+1表示分解后垂直方向的高频分量;cDj+1表示分解后斜线方向的高频分量。

1.2 VLEP算法提取边缘特征

(2)

(3)

(4)

(5)

式中:φk代表VLEP的方向角,φk∈θ(1≤k≤m)。m是所有边缘模式的数目。

为了获得更紧凑的特征向量,特征空间可以细分,每种类型的边缘和非边缘可以更详细的分类,每种类型的边缘和非边缘的细分阈值Vth使用下面的方法计算:

(6)

细分阈值Vth被确定后,每种类型的边缘或非边缘可根据阈值Vth进一步分为B种类别。因此,每一个纹理图像的特征向量的维数λ可以被描述为:

(7)

式中:边缘VLEP算子是P/2类,非边缘VLEP算子是P/4类。A是非边缘VLEP操作方式的数目,具体信息可以查阅文献[10]。如果在每一个纹理图像中的同一类型的细分边缘或非边缘使用式(4)进行统计,可以获得如下所示更紧凑的特征向量:

(8)

1.3 分块融合思想

自然状态下采集的植物图像通常背景复杂,存在许多干扰,如:建筑物、路面等,能有效用于识别的叶片信息分散在局部。对图像进行均匀分块处理能使较大面积的干扰区域细分到各个子块中,且能获得若干只包含叶片信息的子块。利用分块后所有子块或部分子块识别,结果会优于未分块植物图像。

分块思想[12]可以应用于任何一种利用直方图谱特征描述图像纹理信息的方法。识别前,将图像均匀分割成若干子块,每个子块用行向量表示,所有子块按一定顺序贮存成一个行向量,作为表达原始图像的特征向量,可以用下式表示:

S=[s1,s2,…,sN]

(9)

式中:N表示子块的个数,si(i=1,2,…,N)为行向量,表示第i个子块的直方图谱特征。

1.4 多分辨率融合思想

通常,图像中既包含一些大结构特征,也蕴含一些微小的细节特征。对于同一幅图像,支持不同空间范围(P和R都不同)的纹理算子所涵盖的信息并不一致,小尺度的纹理算子不足以准确地表达图像的大结构特征,大尺度的纹理算子容易忽略细节信息。为了更加完整地描述图像信息,本文提出融合不同尺度纹理算子的多分辨率思想。VLEP算子采用圆形结构,通过设置不同半径和近邻点数目,能获得不同方向、不同尺度的纹理特征,通过融合不同尺度算子的多分辨率描述子表达图像的纹理特征,会使所描述的图像信息更准确、完备。

1.5 分类器

最近邻是一种简单有效的分类准则,它通过计算两个直方图之间的距离,如欧氏距离、马氏距离等,来度量二者的相似性和差异性。本文实验选用欧氏距离作为衡量准则,如下式所示:

(10)

1.6 算法流程

本文算法的主要流程是:先根据式(1)将植物图像分解成4幅子图像,再将每幅子图像分成两块,并使用不同分辨率的VLEP算子对每个子块图像进行特征提取,然后将不同图像块、不同分辨率的特征向量进行融合,利用融合特征向量进行分类,算法流程如图2所示。

图2 算法流程图

本文算法的部分核心程序如下:

(a) 小波分解核心程序

[c,l]=wavedec2(I,1,′db1′);

%对图像I用db1小波基函数进行一层分解

A{1}=wcodemat(appcoef2(c,l,′db1′,1),255);

%对低频系数进行伪彩色编码

A{2}=wcodemat(detcoef2(′h′,c,l,1),255);

%对高频系数进行伪彩色编码

A{3}=wcodemat(detcoef2(′v′,c,l,1),255);

A{4}=wcodemat(detcoef2(′d′,c,l,1),255);

(b) 图像分块核心程序

for x=1∶4

I=uint8(A{x});

L=size(I);

height=166;

%设置分块后图片高度

width=125;

%设置分块后图片宽度

max_row=floor(L(1)/height);

max_col=floor(L(2)/width);

%待分块图片为166*250,因此max_row=1,max_col=2

seg=cell(max_row,max_col);

data=[];

for row=1:max_row

for col=1:max_col

seg(row,col)={I((row-1)*height+1:row*height,(col-1)*width+1:col*width,:)};

%对图像进行分块,并保存

end

end

(c) VLEP算子核心程序

if (neighbors==8)

%近邻点为8的VLEP算子设置

LEP_circle =[0 1 1 1 0 -1 -1 -1];

%边缘VLEP算子

LEP_circle_noedge=[0 -1 0 1 0 -1 0 1];

%非边缘VLEP算子

b=4;

c=2;

end

if (neighbors==16)

%近邻点为16的VLEP算子设置

LEP_circle=[0 1 1 1 1 1 1 1 0 -1 -1 -1 -1 -1 -1 -1];

%LEP

LEP_circle_noedge =[0 -1 -1 -1 0 1 1 1 0 -1 -1 -1 0 1 1 1];

b=8;

c=4;

end

2 实验结果与分析

本文实验中所使用的绿色植物图像来自北京工商大学计算成像实验室的绿色植物数据库,共80类植物,每类植物包含15幅图像,像素为500×331,9幅图像作为训练样本,其余6幅作为测试样本,故训练集为720幅植物图像,测试集为480幅植物图像。该图像库复杂度较高,光照强度、植株数量(多株与单株),以及拍摄的背景、角度、距离等都不相同,这些因素均会增加物种识别的难度,但却最大限度地接近了物种识别的真实情况,更具实际意义。图3展示了数据库中几幅在不同条件下采集的木槿植物的典型图例。

(a) 单叶片与多叶片

(b) 强光照与弱光照

(c) 大视角与小视角图3 绿色植物物种数据库图例

为了验证本文算法的有效性,使用绿色植物数据库并精心设计了一系列的实验。实验的编译环境为Matlab2013b,硬件环境PC机:处理器:Intel(R) Core(TM) i7-4790,CPU@3.60 GHz,内存4.00 GB。

2.1 阈值细分的作用

为了验证阈值细分的作用,选用(P=8,R=1),(P=8,R=2)和(P=8,R=3)三种VLEP算子,并选择不同阈值数进行了一系列实验,实验结果见表1所示。

表1 不同阈值下VLEP算子的识别结果 %

由表1可知,阈值数的选取要适当,阈值数过少或过多都会影响识别率,当阈值数为16时识别率最高。因此,后续实验都在阈值数为16的情况下进行。

2.2 小波和分块的作用

为了验证小波的作用,先对原始图像进行一级小波分解,生成4个子图像,然后用VLEP算子提取每个子图像的纹理特征,最后将4个特征向量串联为一个特征向量,并用于识别。为了验证分块的作用,将小波分解后生成的4个子图像分别均分成2块,如图4所示,然后用VLEP算子提取每个图像子块的纹理特征,最后将8个特征向量串联为一个特征向量,并用于识别,识别结果如表2所示 (16细分阈值)。

图4 绿色植物图像的分块图

识别率(P=8,R=1)(P=8,R=2)(P=8,R=3)小波28.0632.0832.70小波+分块28.3332.7132.92

将表2与表1对比可知,小波变换能有效提高VLEP算子对复杂植物图像的识别率。因为小波变换能将图像纹理信息刻画得更为清晰,有助于VLEP算子对纹理特征的提取。另外,在小波的基础上再进行分块,能进一步提高识别率。

2.3 不同尺度的识别结果

为了验证不同分辨率VLEP算子对实验结果的影响,通过设置不同近邻点P和半径R,得到不同尺度的识别结果,如表3所示(16细分阈值,一级小波分解,每个子图像分为2块)。

表3 不同尺度的识别结果 %

由实验结果可知:(1) 近邻点P一定时,R增大,识别率升高,但是当增大到一定程度时,识别率反而会下降。这主要是因为半径增大,可以获得更大尺度支持空间内的完整特征信息,但是半径过大,同时也会增加大尺度错误特征信息的概率,以及误判多种小特征为一种大特征的概率。(2) 半径R一定时,P=16的识别结果相对较高。因为近邻点P越大,提取纹理信息的方向越多,细节信息越丰富,因此可得到更高的识别效果。(3)P、R的取值具有最优组合,当P=16,R=5时识别率达到最高,为34.38%。

2.4 多分辨率融合的作用

为了验证多分辨率融合思想的有效性,对不同尺度的VLEP算子进行加权融合,识别结果如表4所示(16细分阈值,一级小波分解,每个子图像分为2块)。

表4 多分辨率融合结果 %

将表4与表3对比可知,不同尺度的VLEP算子融合后,识别率相对于单一尺度算子而言均有不同程度的提高。这主要是因为不同尺度,不同分辨率的算子可以提取不同尺度支持空间和不同方向的特征信息,使特征信息提取更加丰富和完备。值得注意的是,多分辨率融合也有最优组合,(P=8,R=1)和(P=16,R=3)两种VLEP算子融合后的识别率最高,达到了35.83%。

2.5 不同算法对比实验结果

为了验证本文算法的有效性,相同条件下,在绿色植物数据库上,使用目前图像分类效果较好的纹理特征提取算法进行对比实验,表5列出了方差法[9](Rotation invariant variance)VAR、复合局部二值模式法[13]CLBP(Compound local binary pattern)、局部二值模式傅里叶变换法[14]LBPHF(Local binary pattern histogram fourier)、自适应局部二值模式法[15]ALBP(Adaptive local binary pattern)和本文算法的实验结果。

表5 对比算法识别率 %

根据表5可知,以上4种对比算法中,当P为16,R为5时,VAR16,5、CLBP16,5、LBPHF16,5、ALBP16,5识别率最高,分别为24.79%、29.58%、29.79%、33.13%。但是,利用本文提出的算法(当加入小波分解和图像分块,阈值为16,(P=8,R=1)的算子与(P=16,R=3)算子融合后),识别率可以达到35.83%,证明本文算法的优越性。

需要说明的是,现有的植物识别方法大多基于单个叶片的识别,而本文进行复杂背景下植物的识别,属于细粒度分类的范畴,难度较大,因此,识别率的小幅度提升也非常不容易。实验结果表明,本文方法与传统的纹理算子相比,对复杂植物图像的识别具有一定效果。

3 结 语

本文提出一种基于小波变换和可变局部边缘模式的绿色植物识别方法。该方法先将图像利用小波变换进行分解,然后利用可变局部边缘模式提取图像纹理特征,并结合分块和多分辨率思想,进一步改善识别效果。由于可变局部边缘模式具有多尺度和多方向(多分辨率)属性,因此可以刻画纹理的不同局部空间尺度与方向信息,小波变换可以增强纹理基元的有效信息,防止混叠现象,并降低噪声所带来的干扰。实验结果表明,本文提出的方法可以用来快速识别绿色植物物种。未来工作是改进纹理特征提取算法,进一步提升识别的准确率。

猜你喜欢

分块识别率算子
面向量化分块压缩感知的区域层次化预测编码
钢结构工程分块滑移安装施工方法探讨
有界线性算子及其函数的(R)性质
一种面向不等尺寸分块海量数据集的并行体绘制算法
Domestication or Foreignization:A Cultural Choice
分块矩阵初等变换的妙用
QK空间上的叠加算子
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别