基于局部金字塔描述算子的杂草种子识别
2019-12-11刘彩玲岳荷荷
刘彩玲 岳荷荷
摘 要:基于P-SIFT和P-SURF描述算子来研究杂草种子图像的自动识别性能,其中每个图像分片均使用多层次的描述算子细节表示,这些层次依据局部空间合并分辨率定义。在特征提取部分采用三种编码技术,即BOW模型,Locality-Constrained Linear Coding算法和Fisher Vector模型来提高分类性能;在分类部分采用Sparse Representation Classifier (SRC),Label Consistent K-SVD (LC-KSVD)和SVM分类器,其中SVM使用RBF和Histogram Intersection Kernel核函数。P-SIFT和P-SURF描述算子在使用三层空间金字塔和三层特征金字塔时取得了最高89.7%和86.2%的识别率,与SIFT和SURF描述算子相比较识别率有了很大提高。实验结果表明,在传统的局部描述算子基础上,基于特征金字塔描述算子来提取特征和基于空间金字塔来合并特征可以提高分类性能。
关键词:种子识别;分类;多分辨率金字塔;编码技术;描述算子;识别率
中图分类号:TP391文献标识码:A文章编号:2095-1302(2019)11-00-03
0 引 言
由计算机代替专业人员对杂草种子进行识别现在已经成为热门课题,这样可以加快识别速率并减少人工识别中的主观性。自动识别系统基于种子图像,从图像中提取全局特征和局部特征作为分类特征进行识别。
对于杂草种子的自动识别,前人已经做了很多工作。Chtioui等人提出了从彩色种子图像中提取大小、形状以及纹理特征进行识别,其中将三种参数相结合的识别率达到99%,但是该研究仅对4类种子进行了识别[1]。Granitto等人提出了基于机器视觉的大样本集的杂草种子识别方法,并且提取了6个形态特征参数、4个颜色特征参数和2个纹理特征参数进行识别[2]。Color PCA方法在传统PCA方法上增加了颜色参数,采用3D颜色张量特征形成向量空间,而Color PCA方法用于将高维空间向低维空间映射和特征提取[3]。Wafy等人从与小麦籽粒样本混合的臭荠、黑麦草和土荆芥样本图片中提取SIFT特征用于种子分类,该方法虽然获得了较好的识别率,但是使用的样本种类较少[4]。Scale-Invariant Feature Transform(SIFT)[5],Speed Up Robust Feature (SURF)[6]和Fast Retina Keypoint (FREAK)[7]均采用单一水平的描述算子细节表示图像。本文的数据集包含9 192幅图片,属于211个不同类别,基于P-SIFT和P-SURF描述算子提取分类特征来进行杂草种子的识别。
杂草种子图像如图1所示。
1 分类特征
1.1 图像标准化
本文的数据集包含9 192幅图片,属于211个不同类别,每张图片的大小为150×100像素,图1所示为该数据集中部分杂草种子的图像。在该数据集中,属于同一类别的原始种子大小和方向不同,这些不同会增加种子分类的困难。本文首先采用PCA方法将图像进行标准化,以提高分类性能,使用PCA方法找出图像前两个主成分方向,并且将原始图像沿着第一主成分方向和y轴方向的夹角旋转。图像标准化后調整图像使其大小保持一致。
1.2 金字塔特征
在规则采样的图像I中,对于大小为S×S的图像分片,将N2大小合并区域中心的相对中心使用笛卡尔积R=C×C定义,其中:
对于特征点s,局部合并中心点Rs={s+c|c∈R},使用特征点位置s和公式(1)中定义的偏移量计算。
金字塔描述算子通过改变合并分辨率N构造,N定义了用于计算直方图的每个子区域的大小[8]。图2表示3个不同分辨率的描述算子:N=2(图2(a))时,无法识别圆形边缘;N=4(图2(b))时,圆形结构开始显现;N=6(图2(c))时,圆形结构明显。
假设图像I由局部特征X表示:
式中每个局部特征是由L个不同分辨率下金字塔描述算子提取的特征组成:
式中xil是在第l∈{1, 2, ..., L}个分辨率下提取的特征。
由SPM算法[9]得出,不同分辨率下提取到的特征区分力不同,为了提高分类的性能,需对不同分辨率下的特征进行加权。假设L个描述算子根据分辨率的升序排列,将分辨率l下的描述算子加权wl=2l-L,则每个局部特征可以表示为:
2 编码技术
2.1 BOW模型
假设V={v1, v2, ..., vD}是BOW模型的视觉词汇,在BOW模型中,每个特征被量化为一个|D|的二进制向量μ(x)=[μ1(x), μ2(x), ..., μD(x)]T[10-11]。BOW模型认为特征x与其最相近的视觉词汇vi关联,因此在二进制向量中,如果特征x与视觉词汇vi关联,则μi(x)=1,否则μi(x)=0。
本文为不同描述算子提取到的特征分别定义视觉字典项,分辨率水平为l,如果特征xl与视觉词汇vil关联,则μil(xl)=1,否则μil(xl)=0。为了提高分类性能,对不同描述算子下提取的特征进行加权,最终BOW模型用于表示图像的二进制向量为μ(x)=[w1μ1(x1), w2μ2(x2), ..., wLμL(xL)]T,其中对于不同的分辨率层次l,μl(x)=[μ1l(x), μ2l(x), ..., μlDl(x)]T。
2.2 金字塔特征的局部约束编码
Locality-constrained Linear Coding(LLC)使用完备的字典项对局部特征进行稀疏编码,并使用最大值合并方法来提高分类性能[12]。LLC算法约束每个特征仅仅使用与该特征相关的k个字典项构建。LLC编码为下列表达式的最优解:
式中Bx,k是由字典V中與特征x最相关的k个视觉词汇构成的。假设特征x从图像X中提取:
LLC算法对不同分辨率下的特征进行分别编码和加权,因此对图像的最终编码结果为c(X)=[w1c(X1), w2c(X2), ..., wLc(XL)],其中对任意分辨率l有c(Xl)=max(c(x1l), c(x2l), ..., c(xil), ...)。
2.3 金字塔特征的Fisher Vector
Fisher Vector(FV)将每个图像表示为特征属于每个概率模型的梯度向量[13]。FV使用概率密度函数μλ对图像特征的生成过程模型化,将图像X和Y之间的Fisher核定义如下:
式中:Fλ为μλ的Fisher信息矩阵;GλX是X的对数似然函数的梯度;λ是梯度模型的参数。
定义gλX=LλGλX和分解式Fλ-1=LλTLλ,因此式(7)可以改写为内积的形式:
图像X在分辨率l的FV结果是每个描述算子xl的标准梯度核,其中xl∈Xl,λl是梯度模型的参数:
3 分类结果
本文采用SRC,LC-KSVD和SVM分类器对杂草种子分类。SRC将分类问题转换为以所有训练样本为基向量的稀疏编码过程[14]。LC-KSVD为使用完备字典稀疏编码的过程[15]。SVM分类器是寻找将样本分离的最佳分类平面过程,该平面与样本类有最大间距[16],SVM共采用了两种核函数,即径向基函数和直方图相交核[17]对训练样本映射。
本文在每类中随机选择80%的种子作为训练集,其余20%作为测试集,每个结果都是10次独立实验的平均值。本文基于三种分辨率2×2,4×4和6×6提取特征,在不同的分辨率下,P-SIFT提取的特征分别为32,128和288维,视觉词汇为400,500和550个;P-SURF分别为16,64和144维,视觉词汇为300,400和450个,分辨率4×4对应于SIFT和SURF。本文采用金字塔1×1,2×2和4×4分割图像,SP0表示不分割图像;SP1表示使用前两层的金字塔分割图像;SP2表示使用了所有的金字塔。
表1列出了基于P-SIFT和三种空间金字塔在杂草种子中提取特征和LLC编码方法在LC-KSVD分类器下的分类性能,结果表明中等分辨率下的特征分类性能最好,而较粗和较细分辨率的性能较弱,因为较粗分辨率下的特征区分力不够,而较细分辨率下的特征区分力太强。表2和表3列出了基于P-SIFT,P-SURF和空间金字塔SP0,SP2,将局部特征与编码技术BOW,LLC和FV相结合在不同分类器下的分类结果。表2和表3列出的结果表明金字塔描述算子和空间金字塔可以提高分类性能。
4 结 语
本文基于P-SIFT和P-SURF提取分类特征来研究杂草种子的分类性能,并且分类性能最高分别达到89.7%和86.%。与Granitto和Verdes等人提出在彩色杂草种子图像上的识别率相比,本文的识别率低4%,但与SIFT和SURF相比,分类性能有较大提高。下一步可以提取更多的局部特征,并加入空间和特征金字塔,或将局部特征和全局特征相结合来提高分类性能。本文使用的对局部特征进行编码的编码方法中的字典项是固定的,我们也可以通过不断更新编码过程中使用的字典来提高杂草种子的识别率。
参 考 文 献
[1] CHTIOUI Y,BERTRAND D.Identification of seeds by colour imaging: comparison of discriminant analysis and artificial neural network [J]. Journal of the science of food and agriculture,1996,71(4):433-441.
[2] GRANITTO PM,VERDES PF,CECCATTO HA.Large-scale investigation of weed seed identification by machine vision [J]. Computers and electronics in agriculture,2005,47(1):15-24.
[3] ZHAO F,CAI C,ZHU J.Weed seeds recognition using color PCA [J]. International symposium on knowledge acquisition and modeling,2009(1):375-378.
[4] WAFY M,IBRAHIM H,KAMEL E.Identification of weed seeds species in mixed sample with wheat grains using SIFT algorithm [C]// International Computer Engineering Conference,2013:11-14.
[5] LOWE DG. Distinctive image features from scale-Invariant keypoints [J]. International journal of computer vision,2004,60(2):91-110.
[6] BAY H,ESS A.Surf:speeded-up robust features [J]. Computer vision and image understanding,2006(1):404-417.
[7] ALAHI A,ORTIZ R,VANDERGHEYNST P.FREAK:fast retina keypoint [C]// IEEE Conference on Computer Vision and pattern recognition,2012:570-517.
[8] SEIDENARI L,SERRA G,BAGDANOV AD. Local pyramidal descriptors for image recognition [J]. IEEE transactions on pattern analysis and machine intelligence,2014,36(5):1033-1040.
[9] LAZEBNIK S,SCHMID C,PONCE J.Beyond bags of features: Spatial pyramid matching for recognition natural scene categories [C]// IEEE Conference on Computer Vision and pattern recognition,2006:2169-2178.
[10] SIVIC JS,ZISSERMAN A.Video google: a text retrieval approach to object matching in videos [C]// IEEE International Conference on Computer Vision,2003,2:1470-1477.
[11] CSURKA G,DANCE C,FAN L.Visual categorization with bags ofkeypoints [C]// Europeon Conference on Computer Vision Workshop on Statistical Learning for Computer Vision,2004.
[12] WANG J,YANG J,YU K.Locality-constrained linear coding for image classification [C]// IEEE Conference on Computer Vision and Pattern Recognition,2010:3360-3367.
[13] CSURKA G,PERRONNIN F.Fisher vectors: beyond bag-of-visual-words image representations [J]. Communications in computer and information science,2011,229:28-42.
[14] WRIGHT J,YANG AY,GANESH A.Robust face recognition via sparse representation [J]. IEEE transactions on pattern analysis and machine intelligence,2009,31(2):210-217.
[15] JIANG Z,LIN Z,DAVIS LS.Label consistent K-SVD:learning a discriminative dictionary for recognition [J]. IEEE transactions on pattern analysis and machine intelligence,2013,35(11):2651-2664.
[16] CHEN J,JIAO L.Classification mechanism of support vector machines [C]// International Conference On Signal Processing Proceedings,2000:1556-1559.
[17] MAJI S,BERG AC,MALIK J.Classification using intersection kernel support vector machines is efficient [C]// IEEE Conference on Computer Vision and Pattern Recognition,2008:1-8.