APP下载

基于Adaboost的动物二分类识别方法*

2017-04-24张公伯谷昱良朱和贵

计算机与数字工程 2017年4期
关键词:矩形分类器形状

张公伯 谷昱良 朱和贵

(东北大学理学院数学系 沈阳 110004)

基于Adaboost的动物二分类识别方法*

张公伯 谷昱良 朱和贵

(东北大学理学院数学系 沈阳 110004)

针对动物图像的分类识别问题,提出了一种基于Adaboost分类器的动物二分类识别方法。首先对样本图片进行边缘特征提取,选取八种具有显著形状不变性的特征描绘子,并对其合理性和优越性进行验证。后用Adaboost分类器对所得特征矩阵进行训练,得到最有效的分类特征,并对从Shape Database形状图片库中选取三组动物图像进行十折交叉验证实验。狗和牛、牛和象、青蛙和牛的正确分类识别率分别达到85%、90%和92.5%。实验表明该分类识别方法能较准确进行二分类识别,是一种较有效的动物图像二分类识别方法。

动物分类识别; Adaboost分类器; 特征描绘子; 十折交叉验证; 二分类

1 引言

随着特征分类识别技术的兴起,近年来,动物分类识别成为模式识别领域的重要课题。市场对动物识别技术需求的不断激增,促使动物分类识别技术研究的不断深入。国内外学者在动物分类识别领域做了很多研究工作。在国外,B Thomas利用简单矩形特征训练Adaboost分类器实现对视频中狮子面部的检测和跟踪[1~2];D Ramanan等对视频中的长颈鹿采取几何特征拼接的方法,建立树形结构运动学模型,再加入纹理特征进行分类识别[3~4]。在国内,W Zhang等利用纹理和形状特征训练级联分类器,对静态类猫图像进行识别[5]。自Freund和RobertE.Schapire在1995年提出一种名为Adaboost的机器学习方法以来[6],近年出现了基于Adaboost的动物分类识别算法。谢素仪基于Haar-like特征的Adaboost学习算法训练一个粗级的猫脸检测器[7],刘威将形状和运动特征相结合,利用Adaboost分类器进行模式训练,实现对运动动物目标的分类检测[8]。

综上,动物分类检测具有普遍、现实的研究意义。本文在综合目前动物分类识别研究成果的基础上,提出了基于Adaboost的动物分类识别方法。提取经预处理后的动物图像的具有形状不变性的特征,实现了一个由粗到精的Adaboost动物二分类器。在Shape database形状图片库中[9](http://visionlab.uta.edu/shape_data.htm)收集的测试集(含1400张二值化图片,每种形状类别有20张图片)上进行三组不同类别动物图像的十折交叉验证实验,平均正确分类识别率达到89.2%。理论和实验表明,该分类方法可将两类动物进行区分,具有较高的准确性。

2 基于Adaboost的动物分类识别方法

动物分类识别包括分类器构造和图片识别过程。分类器构造过程需要对样本图片进行预处理、提取图片特征、构成特征矩阵并将特征矩阵输入到Adaboost分类器中,完成分类器参数的确定和分类器精度的检验。图片识别过程是用训练好的分类器对待测图片进行识别。具体步骤如图1所示。

图1 分类器识别流程图

2.1 初始形状特征

对所获图片进行高斯卷积模糊和平滑噪声点处理。采用Canny算子和双阈值检测法进行边缘检测,得到边缘提取的图像如图2所示,抽样获取得到的离散边缘点坐标记为{(x1,y1),(x2,y2),…,(xM,yM)}。

图像的特征包括形状特征、颜色特征和纹理特征等。光照变化是动物识别的一个难题,而动物的形状特征不会随着外界环境(如光照)变化而变化,具有很强的鲁棒性。形状特征还蕴含了目标物体最基础的语义信息,是比颜色和纹理特征更高一层的特征[10]。

(a)牛的边缘图像

(b)狗的边缘图像

此外,同一类动物具有类内差异,同一类动物的不同类型大小有很大差别;动物的形态、姿势也会随着图像的改变而变化;动物在图像中的位置也会随着图像的不同而不同;图像本身也会被放大、缩小或旋转。因此,找到动物某些具有旋转、放大、缩小、平移不变性的特征是至关重要的。本文提取了八个具有旋转、放大、缩小和平移不变性的特征,下面从形状具备的属性出发介绍该八种不变性特征,并验证其合理和优越性。

2.1.1 区域的矩形度

区域的矩形度反映了物体对其外接矩形的充满程度,即物体相似于矩形的程度,如图3所示。

图3 矩形度特征示意图

区域的矩形度定义为区域的面积与区域外接矩形的面积之比,记为μ1和μ2。

(1)

(2)

其中,T1为边缘所包围区域面积;T2为外接矩形的面积。A(XA,YA),B(XB,YB),C(XC,YC),D(XD,YD),分别为外接矩形的四个顶点坐标。选取狗和牛图像各20张提取矩形度的两个特征,验证选取特征的有效性,所得特征数据绘制散点图如图4所示。

图4 特征数据绘制散点图

从图4中可以看出,狗图像的矩形度比牛图像的矩形度大,μ1特征中狗图像特征数据大于0.3的较多,μ2特征中狗图像特征数据大于0.025的较多。说明特征选取具有区分度,特征选取有效。

2.1.2 区域的圆形性

区域的圆形性是用目标区域所有离散边界点所定义的特征量,它描述了区域边界点距离区域质心的分布情况。圆形性μ3具体定义如下:

(3)

其中

(4)

(5)

为区域质心到边界点距离的均方差。当动物区域趋近于圆形时,圆形性μ3趋于无穷。

验证圆形性特征选取的有效性,同样选取狗和牛图像各20张,提取圆形性特征,得到结果绘制如图5所示。

(a)目标物圆形性特征

(b)圆形性特征合理性验证

从图5(b)中可以看出,狗图像的圆形性比牛图像的圆形性大,特征数据值小于0.045的主要为牛图像,说明该特征选取具有一定的区分度。

2.1.3 区域的不变矩

图像区域的不变矩是对图像的一种统计描述,运用统计的观点来刻画区域的特征,利用区域的低阶矩,通过非线性组合的方式,可以得到许多具有旋转、放大、缩小、平移不变性的图像特征——不变矩[11]。

动物区域的(p+q)阶原点矩:

(6)

动物区域的(p+q)阶中心矩:

(p,q=0,1,2…)

(7)

lpq具有平移不变性,但不具有比例变换不变性。对中心矩进行归一化,得到θpq,其具有平移和缩放不变性。

(8)

定义两个对于平移、旋转和尺度变化都不变的不变矩特征:

μ4= (θ20-θ02)[(θ30+θ12)2-(θ21+θ03)2]

+4θ11(θ30+θ12)(θ21+θ03)

(9)

μ5= (3θ21-θ03)(θ30+θ12)[(θ30+θ12)2-3(θ21+θ03)2]

+3(θ12+θ30)(θ21+θ03)[3(θ30+θ12)2-(θ21+θ03)2]

(10)

选取青蛙和牛的图像各20张提取两组不变矩特征,验证特征选取的有效性,得到结果如图6所示。

(a)μ4特征合理性验证

(b)μ5特征合理性验证

从图6中可以看出,青蛙图像的不变矩均比牛图像的小,牛图像的μ4特征数据值大于2的较多,μ5特征数据值大于3.25的较多,说明该两种特征的选取具有一定的区分度。

2.1.4 区域的偏心率

与区域具有相同二阶矩的椭圆的偏心率,是用来描述区域二阶矩的统计量:

(11)

(12)

(13)

其中a为与区域具有相同二阶矩的椭圆长轴,b为与区域具有相同二阶矩的椭圆短轴。

选取牛和象的图像各20张提取区域椭圆偏心率特征,验证特征选取的有效性,得到结果如图7所示。

从图7中可以看出,牛图像的椭圆偏心率比象图像的大,特征数据值大于0.8的主要为牛图像,说明该特征选取具有一定的区分度。

边缘的偏心率μ7为边缘所包围区域的短轴与长轴之比,它描述了目标区域的扁平程度,可以很好地刻画目标区域扁平特征。

图7 区域椭圆偏心率特征合理性验证

(14)

选取牛和象的图像各20张提取区域偏心率特征,验证特征的有效性,得到结果如图8所示。

(a)图像区域边缘偏心率特征

(b)偏心率特征合理性验证

从图8(b)所得特征数据结果绘制的离散图可以看出,象图像的偏心率比牛图像的大,特征数据值小于0.6的主要为牛图像,说明该特征的选取具有一定的区分度。

2.1.5 区域的凸凹性

图9 凸凹性特征合理性验证

区域的凸凹性μ8为包含区域的最小凸多边形的面积比上区域的面积,它是对区域凸凹性的一种近似性刻画:

(15)

其中,包围区域最小凸多边形的面积,记为T3。

选取狗和牛的图像各20张提取凸凹性特征,得到结果如图9所示。

从所获数据绘制的离散图9中可以看出,牛图像的凸凹性特征数据值比狗图像的大,牛图像的特征数据值大于0.82的较多,说明该特征选取具有一定的区分度。

经验证,所选取的特征均可将两类动物有效分类,具有一定的区分度。将选取的μ1,μ2,…,μ8八个特征作为分类特征构造特征矩阵。设第一类样本图片共m张,记为S1到Sm,设第二类样本图片共n张,记为Sm+1到Sm+n。处理所有样本图片并获取每张图片的上述八个特征数值,第i个样本的第j个特征数值记为aij。以μ1到μ8作为特征矩阵的列,S1到Sm+n作为特征矩阵的行,得到样本特征矩阵。

2.2 Adaboost分类器的形状特征选择

构造Adaboost分类器包括训练分类器和检验分类器的精度的过程。由于所获数据库图片数量有限,为更好的获得分类器的精度,本文采用十次十折交叉验证[12](10-fold cross validation)的方式检验分类器的精度。交叉验证是一种统计学上将数据样本切割成较小子集的实用方法,可以先在一个子集上作分析,而其他子集用来做后续对此分析的确认及验证。本文将样本分为九份训练样本和一份测试样本,训练过程全部在训练样本中完成。

设Li为第i个样本类别的标记,若Li属于第一类样本,记为Li=1,否则,记为Li=-1。令训练样本占总体样本的比例为α(实验中α=0.9),样本Si的权重为Di(t)(t为训练的轮数),初始化样本Si的权重为Di(0)。当Si属于第一类样本时,Di(0)=1/m;属于第二类样本时,Di(0)=1/n。设定训练总轮数为T。

在第一轮训练中,Adaboost分类器根据参数α随机在第一类样本中抽取αm个样本,在第二类样本中抽取αn个样本,作为训练样本。利用特征μi,生成弱分类器fi:

(16)

其中ani为样本Sn的μi特征的数值,pi(pi∈(-1,1))是分类符号,κi为特征分类器fi的分类阈值。

构造出八个弱分类器,记第i个弱分类器分类错误率为εi;分类错误率最小的弱分类器记为F1(其错误率为ε′)。若ε′>0.5,则实验结束;否则,F1为第一轮得到的弱分类器。计算弱分类器F1的权重系数τ1:

(17)

(18)

3 实验仿真

为测试本文提出的动物识别方法的有效性,实验选取Shape database图片库中的图片,该图片库中含有1400张二值化的形状图片,每种形状类别有20张,适合本文实验所需环境。由于狗和牛、牛和象、青蛙和牛几种动物在几何形状上有着明显的差别,便于多种特征的提取,实验选取图片库中的狗和牛、牛和象、青蛙和牛三组动物图片进行实验。

将所得特征数据构造特征矩阵进行对分类器的训练。评价分类器有效性最重要的指标是分类准确率,实验由于图片库中图片数量有限,采取十折交叉验证的方法。在一组实验过程中,40张实验图片被随机分成10个子集,每个子集中含有4张,任取其中一个子集作为测试集,其余的36张图片作为训练集,依次进行10次实验。其中,狗和牛的实验组中,1~20编号为狗的图像;牛和象的实验组中,1~20编号为牛的图像;青蛙和牛的实验组中,1~20编号为青蛙的图像。实验所得结果如表1所示。

表1 交叉实验过程及结果

按分类错误的图片数量占10倍测试集中图片数的百分比作为准确率,以此来说明识别方法的性能。最终得到,分类器对狗和牛图片的分类正确率为85%;对牛和象图片的分类正确率为90%;对青蛙和牛图片的分类正确率为92.5%。三组平均正确率为89.2%,分类效果较好。

为直观显示分类识别结果,构建GUI界面。GUIDE是一个界面设计工具集,提供了界面的外观、属性和回调函数等,是Matlab为图形用户界面开发提供的集成开发环境。

图10(a)所示为识别系统的主页面,在界面窗口顶端设置“图片获取、特征提取、分类识别”三个按钮。当单击“图片获取”按钮时,程序会弹出窗口供用户选取待识别的图像,并将图像在主界面的中央位置显示出来。当在主界面上单击“特征提取”按钮后,界面右端会依次输出提取到的图片八种特征的数据值,如图10(b)所示。当单击“分类识别”按钮后,系统界面下侧会输出识别结果,如图10(c)所示。该程序实现了对两种动物图像的分类。

图10 分类识别系统GUI界面

输入动物测试图像,进行分类识别,如图11中分别展示了狗和牛、牛和象、青蛙和牛三组分类识别系统GUI界面的识别结果。

图11 动物图像分类识别结果

实验验证表明,所选取的八种特征能较好地进行二分类动物的分类检测,符合图像检测评价的标准。分类器设计具有识别精度较高,时间短的特点。可见,该动物二分类识别方法是一种较合适的分类识别方式。

4 结语

本文提出了一种基于Adaboost分类器的二分类动物识别检测方法。方法的创新点在于根据动物图像的特点,有效地选取了八种具有形状不变性的特征进行分类。对经Canny算子和局部阈值处理预处理后的二值图像离散边界进行特征提取,选取八种具有形状不变性的特征对图像特征进行描述,并说明了特征选取的合理性。然后对Adaboost分类器进行样本训练,采用十折交叉验证方法计算识别率,并构建动物图像分类的GUI界面显示识别结果。实验分析和误检率验证表明,该动物分类方法是一种较合适的动物二分类识别方式。

[1] Burghardt T, Calic J, Thomas B T. Tracking Animals in Wildlife Videos Using Face Detection[C]//Knowledge-Based Media Analysis for Self-Adaptive and Agile Multi-Media, Proceedings of the European Workshop for the Integration of Knowledge, Semantics and Digital Media Technology, EWIMT 2004, November 25-26, 2004, London, UK,2004:478-485.

[2] Lienhart R, Maydt J. An extended set of Haar-like features for rapid object detection[J]. 2002, 1:I-900-I-903 vol.1.

[3] Ramanan D, Forsyth D A, Barnard K. Detecting, Localizing and Recovering Kinematics of Textured Animals[C]//IEEE Computer Society Conference on Computer Vision & Pattern Recognition,2005:635-642.

[4] Lazebnik S, Schmid C, Ponce J. Affine-invariant local descriptors and neighborhood statistics for texture recognition[C]//IEEE International Conference on Computer Vision, 2003. Proceedings. IEEE,2003:649-655.

[5] Zhang W, Sun J, Tang X. Cat Head Detection — How to Effectively Exploit Shape and Texture Features[C]//Computer Vision — ECCV 2008, European Conference on Computer Vision, Marseille, France, October 12-18, 2008, Proceedings,2008:802-816.

[6] Freund Y, Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting[C]//European Conference on Computational Learning Theory. Springer-Verlag,1995:119-139.

[7] 谢素仪.宠物猫脸检测的方法研究[D].上海:上海交通大学,2010. XIE Suvi. Research on Pet-Cat Face Detection Algorithm[D]. Shanghai: Shanghai Jiaotong University,2010.

[8] 刘威.输电线路杆塔人员及动物入侵识别方法研究[D].北京:华北电力大学(北京),2013. LIU Wei. Study on human or large animal invasion identification for safety of transmission line and tower[D]. Beijing: North China Electric Power University(Beijing),2013.

[9] Song H G, Koo H S. A Geometric Centroid Contour Distance for Scale/Rotation Robustness Using Shape Alignment and Feature Based Normalization[M]//Convergence and Hybrid Information Technology. Springer Berlin Heidelberg,2012:323-330.

[10] 刘秀朋.轮廓曲线的形状描述与匹配算法研究[D].南昌:南昌航空大学,2012. LIU Xiupeng. Research on Shape Description and Matching Algorithm Based on Counter Curve[D]. Nanchang: Nanchang Hangkong University,2012.

[11] 束鑫.形状分析新方法及其在图像检索中的应用研究[D].无锡:江南大学,2012. SHU Xin. Research on Novel Shape Analysis Techniques and Their Applications in Image Retrieval[D]. Wuxi: Jiangnan University,2012.

[12] 郭立力,赵春江.十折交叉检验的支持向量机参数优化算法[J].计算机工程与应用,2009,45(8):55-57. GUO Lili, ZHAO Chunjiang. Optimizing parameters of support vector machine’s model based on genetic algorithm[J]. Computer Engineering and Applications,2009,45(8):55-57.

Method of Animals’ Dichotomous Recognition Based on Adaboost

ZHANG Gongbo GU Yuliang ZHU Hegui

(Institutions of Mathematic, Northeastern University, Shenyang 110004)

To solve the classified problems of animal’s images, a classified method based on Adaboost is designed for dichotomic recognition. First, edge features of sample images are extracted. Then, eight characteristic descriptors having significant shape invariances are selected and their rationalities and superiorities are tested. Adaboost classifier to train the matrix of characteristics, aiming to get the most effective classifying feature. Experiment on the three groups of animals’ images selected from the photo gallery called Shape Database through 10-fold cross-validation. The identified rates of classification of dogs and cattles, cattles and elephants, frogs and cattles reach 85 percent, 90 percent and 92.5 percent respectively. The experiment shows the classified method can classify images comparatively accurate into two sorts and it is rather definitely an effective way to classify animals’ images into two categories.

animal classification, Adaboost classifier, characteristic descriptors, 10-fold cross-validation, dichotomic Class Number TP391.41

2016年10月3日,

2016年11月27日

国家级大学生创新创业训练计划资助项目(编号:201610145014);中国博士后科学基金资助项目(编号:2016M591446);中央高校基本科研业务费(编号:N140503004);国家自然科学基金青年科学基金资助项目(编号:61402097)资助。

张公伯,男,研究方向:图像处理。谷昱良,男,研究方向:图像处理。朱和贵,男,博士,副教授,研究方向:机器学习、多媒体信息安全。

TP391.41

10.3969/j.issn.1672-9722.2017.04.027

猜你喜欢

矩形分类器形状
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
矩形面积的特殊求法
基于特征选择的SVM选择性集成学习方法
基于差异性测度的遥感自适应分类器选择
从矩形内一点说起
火眼金睛
巧用矩形一性质,妙解一类题
分一半
心的形状