APP下载

基于颜色特征的动物图像分类识别仿真系统设计∗

2017-05-24张公伯谷昱良朱和贵东北大学理学院数学系沈阳110004

舰船电子工程 2017年5期
关键词:直方图分类颜色

张公伯 谷昱良 朱和贵(东北大学理学院数学系沈阳110004)

基于颜色特征的动物图像分类识别仿真系统设计∗

张公伯 谷昱良 朱和贵
(东北大学理学院数学系沈阳110004)

为解决动物图像分类识别问题,提出了一种基于颜色特征的动物图像分类识别方法。该方法很好地利用了颜色直方图和低阶统计矩的属性。首先确定选择HSV颜色空间,依据图像的颜色直方图特性调整低阶统计矩数值作为特征描述量,再通过K近邻方法判断图像所属类别,并构建仿真系统。实验另外对比了组合类与单一类特征在识别准确率上的差异。实验表明,该方法能较有效地识别出不同种类的动物,平均正确识别率可达89%。仿真系统具有实用性,组合类特征可在一定程度上提高识别准确率并降低识别时间。

动物分类识别;颜色特征;颜色直方图;颜色统计矩;K近邻方法

ClassNumber TP391.41

1 引言

用[2~3];在畜牧业领域,根据监控图像的形体信息获取动物生长发育及健康状况[7]。基于颜色特征进行图像识别、检索,模式匹配的方法近年来广泛应用于各领域。张志斌等采用RGB颜色系统,基于统计分析提出一种绿色作物图像分割方法[8];王卫等利用车牌颜色相对固定的特点,提出一种基于颜色特征的车牌快速定位算法[9];杨斌等根据森林火灾中烟的光谱特性,提出基于颜色特征的无人机遥

特征识别技术是计算机科学和机器视觉领域一个热门的课题。近年来特征识别技术逐渐推广应用到对动物种类的识别上。在动物保护领域,通过动物图像识别的跟踪技术可以有效地对濒危物种进行统计分析[1];在医学领域,对动物图像的分析在生命科学与临床医学研究中起着重大的作感图像识别[7]。

基于颜色特征具有稳定性和动物图像分类识别具有重要研究意义的特点,本文在综合颜色特征描绘子在图像特征提取应用理论的基础上,提出了基于颜色特征的动物图像分类识别方法。提取经预处理后的动物图片的颜色特征进行直方图数学形态分析,并基于Matlab的GUI界面设计分类识别仿真系统。选取在百度图片库(http://image.baidu. com)中收集到的动物图片400张(共5种动物,每种动物图片80张)进行测试,添加形状特征中的偏心率特征组合成综合特征与单一颜色特征识别效果进行对比。理论和实验表明,基于颜色特征的识别是动物图像分类识别的一种有效方法,特征的组合能提高分类准确率和速度。

2 基于颜色特征的动物分类识别方法

动物图像识别的主要难点在于图像光照亮度和复杂背景下动物位置的确定,这些因素导致识别难度增大,精度降低。分类识别系统在对所获图像进行预处理后,需要对动物图像进行特征提取,即提取二维图像高层语义信息,为后续的分类识别提供依据。而获取有效的图像的低层特征是提取图像高层语义信息的关键环节[8]。

2.1 颜色特征识别原理

颜色是描述一幅图像最简便而有效的特征。在自然界中,同种动物通常具有相同或相近的颜色特征,不同种的动物则可能表现为不同的颜色特征,因此颜色可以作为区分不同种类动物最为简单有效的一种手段。相对于几何特征而言,颜色特征具有对图像本身尺寸、方向和视角不敏感且有较高鲁棒性的特点。

根据颜色与空间属性的关系,颜色特征的表达主要集中在全局颜色特征和空间颜色特征两个方面,包括颜色矩、颜色直方图和颜色相关图等几种方法。

2.1.1 颜色空间

RGB颜色空间是一种根据人眼对不同波长的红、绿、蓝光做出锥状体细胞的敏感度描述的基础色彩模式,通过混合RGB三刺激值来产生其它颜色[9]。模型以单位立方体互相垂直的三条棱作为R、G、B的值,每幅彩色图像包括3个独立的基色平面。该模型空间颜色不均匀,两种颜色间的知觉差异不能用两像素点A(r1,g1,b1)和B(r2,g2,b2)的间距表示。各分量常用简便计算式为

HSV颜色空间是一种面向视觉感知的颜色模型,包含色度H、饱和度S和亮度V三个要素。模型以三维空间倒立的纺锤体的长轴为V值,离开长轴的距离为S值,围绕轴的角度为H值。该模型亮度分量与图像的彩色信息无关,与人感受颜色的方式紧密相连,空间两种颜色间的知觉差异可用两像素点A(s1,h1,v1)和B(s2,h2,v2)的间距表示[10]:

RGB颜色空间与HSV颜色空间可进行可逆转换,通常数字图像采用RGB颜色模型来显示,在数字图像处理时,将RGB颜色空间转换到HSV颜色空间的情形更常见,记a=max(R,G,B),b=m in(R,G,B)。一种快速转换的公式为

其中HÎ[0°,360°],S、VÎ[0,1]。比较两颜色空间在动物图像处理中的适应性,得到的R、G、B分量的灰度图如图1所示。

得到的H、S、V分量的灰度图如图2所示。

从图1和图2的比较中可以看出,由HSV颜色空间模型得到的图片在人类视觉上更加直观,是与人类对颜色的视觉感受最接近的颜色系统,故实验采用HSV模型对HSV空间进行量化后再计算其直方图,以减少计算量。

2.1.2 基于颜色矩的直方图描述

颜色直方图作为基于颜色特征进行识别广泛采用的方法,描述了不同颜色在整幅图像所占的比例,直观反映了图像颜色分布的统计特性,具有特征提取计算简便和图像尺度旋转不变性的特点,适用于难以自动分割和不需要考虑物体空间位置的图像[11],且存在由于特征维数和相似度过高造成的误检现象。图像的均衡化颜色直方图可表示为

其中,hij为点(i,j)的颜色值,M´N为总像素数,L为颜色空间中包含的颜色总数,α为权系数。由图2中的图像绘制的直方图如图3所示。

由于图像中任何颜色的分布均可由统计矩来表示,Stricker和Orengo提出了颜色矩的特征描述法[12]。颜色低阶矩描述的图像信息更充分,表达式为:

一阶矩(mean):

三阶矩(skewness):

其中,Pij为第j个像素的第i个分量出现的概率,n为像素数量。三种低阶矩分别描述了图像的色彩平均强度、颜色不均匀性和颜色偏斜度。因此,彩色图像的颜色矩共有9个分量。得到图1(a)的颜色低阶矩值如表1所示。

表1 图1(a)的颜色低阶矩值

由表1的颜色特征值分析可得到,颜色一阶矩显示图2(c)较亮些;颜色二阶矩显示图2(b)灰度分布不均匀;颜色三阶矩显示图2(b)灰度偏亮,与图2(a)和(c)的灰度值偏斜方向相反。直方图的横轴表示亮度,从左至右由暗到亮,共256级;纵轴代表图像中处于该亮度范围的像素的相对数量。当各图像的颜色直方图具有相同概率分布特征时,颜色低阶矩值会相同,给图像特征区分造成困难,如下基于直方图特征对统计矩值进行修订。

若直方图中各分量对应的像素数量不同,则直方图所对应的离散面积也不同。定义直方图离散面积,并构造加权函数λ1(p)=1+(其中m为实验比较的直方图个数),该加权函数整体考虑了直方图各分量所对应的像素数量值。由于像素数量值的顺序统计量所对应的分量顺序在全体图像分量中可以采用冒泡排序方法构造出一个排列,不同直方图的排列可能不同。由颜色矩特性可得排列前后不改变颜色矩,记构造排列各分量移动总次数为Ci,由此构造加权函数λ(p)=1+,该加权函数考虑了直方图各分量2得到位置。不同直方图的峰值个数可能会有所差异,记满足pi-1

其中,β1、β2、β3Î[0,1]为权系数,且β1+β2+ β3=1,β1<β2<β3。改进的图像颜色矩可表示为:′=λ(p)μ,σ′=λ(p)σ,s′=λ(p)s。

2.2 分类识别系统的程序设计

图像预处理:图像预处理质量的优劣对特征的提取有着重要的作用,其过程包括背景分割、图像二值化、去除杂点、图像填补、腐蚀膨胀、图像分割等,是识别系统初级阶段的重要组成部分。系统部分图像处理结果如图4所示。

特征提取:系统以提取颜色特征为主要识别特征,为保证提高系统识别精度,使系统具有较强的通用性,另提取形状特征中的偏心率特征进行识别。由图4(a)得到的颜色直方图如图5所示。

系统识别结果:K近邻分类器识别。

为解决不同种动物毛色间存在相似度导致的类别特征阈值范围存在交叉和重叠的问题,并提高分类的准确率,选取K最近邻识别方法。该方法无需训练过程,简单可靠。将样本集图片计算得到的每幅图像的特征数值表示成向量形式,并标记所属类别,记为Sample={(x1,y1),(x2,y2),…,(xm,ym)},其中,xi为向量,xj为标记类别。使用欧氏距离判断相似程度,即

取K值为5,根据距离度量在训练集Sample中找出与测试样本t距离最近的5个点,记为集合O5(s),判断t所属类别y:

其中,I(yi=cj)为示性函数,括号内等式成立其值为1,否则值为0。即判断在集合O5(s)中哪种类别占的最多,则判定测试样本属于哪一类。

3 实验仿真结果

实验在MatlabR2014a的实验环境下,选取5种动物图片,分别为大象、狗、马、猫、青蛙,每种80幅,共400幅。每种动物的40幅图像作为样本集进行特征提取的计算,另40幅图像进行识别实验。采用了HSV颜色空间,求取颜色直方图,并分别以改进的颜色低阶矩和结合图像偏心率的综合特征为特征值构造特征矩阵,以欧氏距离的K近邻识别方法对测试图像进行分类和识别。模拟仿真得到分类结果,验证基于颜色特征识别动物图片算法的有效性,比较组合特征与单一特征识别结果准确率的差异。定义分类准确率为:A=C/T,其中C为正确分类的动物图像的个数,T为测试动物图像的总数。识别结果如表2所示。

表2 仿真实验结果

实验结果分析表明,基于颜色特征的动物图像识别平均正确识别率可达89%,平均识别时间为0.2692s;综合几何特征后,正确识别率可达91.5%,识别时间为0.2588s。即颜色特征对动物图像分类识别是有效的特征,将多种特征结合的分类识别可提高分类准确率并减少识别所需时间。对于形状差异明显的动物种类,综合特征后对检测效果提升的有效性更大。由于实验选取样本数量不够完备,训练结果有一定的局限性。如图6构建GUI界面直观地展示仿真系统识别效果。

4 结语

随着数字影像技术和生态文明的发展,依据动物数字图像识别出动物种类的方法具有实用与推广价值。本文提出了一种利用动物图像的颜色特征对其进行分类识别的方法。该文章的创新点在于巧妙地根据颜色直方图的特点调整了颜色统计矩,使图像间的差异描绘更加明显,并比较了增加其他类别特征时,识别算法效率的改变。通过对颜色空间的选择、颜色特征得提取,运用K近邻方法并结合图像处理技术构建了仿真系统。实验结果分析表明,该识别方法可用于不同种类的动物图片的分类识别,特征组合能提高识别和分类准确率。

[1]曾陈颖.面向珍稀野生动物保护的图像监测与识别技术研究[D].北京:北京林业大学,2015.[2]SPINK A J,TEGELENBOSCH R A,BUMA M O,et al.The EthoVision video tracking system--a tool for be⁃havioral phenotyping of transgenic mice.[J].Physiology& Behavior,2001,73(5):731-744.

[3]CRAWLEY JN.Exploratory behaviormodelsofanxiety in m ice.[J].Neuroscience&Biobehavioral Reviews,1985,9(1):37-44.

[4]张国学,车立忱,尹成美,等.动物防疫监督管理远程监控系统设计[J].现代畜牧兽医,2005(9):28-30.

[5]张志斌,罗锡文,臧英,等.基于颜色特征的绿色作物图像分割算法[J].农业工程学报,2011,27(7):183-189.

[6]王卫,陈继荣,徐璟业.基于颜色特征的车牌快速定位[J].计算机工程与应用,2006,42(1):226-229.

[7]杨斌,马瑞升,何立,等.基于颜色特征的遥感图像中烟的识别方法[J].计算机工程,2009,35(7):168-169.

[8]孙君顶.图像特征提取与检索技术[M].北京:电子工业出版社,2015.

[9]吴富宁,杨子彪,朱虹,等.基于颜色特征进行农作物图像分类识别的应用研究综述[J].中国农业科技导报,2003,5(2):76-80.

[10]SMITH JR,CHANG SF.Local colorand texture extrac⁃tion and spatial query[C]//International Conference on Image Processing,1996.Proceedings.IEEE,1996:1011-1014 vol.3.

[11]杨丹.MATLAB图像处理实例详解[M].北京:清华大学出版社,2013.

[12]STRICKER A M A,ORENGOM.Similarity of Color Im⁃ages[J].ProceedingsofSPIE,1970,2420:381-392.

Design of Anim als’Recognition and Sim u lation System Based on Color Feature

ZHANG Gongbo GU Yu liang ZHU Hegui
(InstitutionsofMathematic,Northeastern University,Shenyang 110004)

To solve the problem of animals’images recognition,a kind of classified method based on their color features is put forward.Themethod takes the advantage ofnature of color histogram and lower statisticalmoment.First,the HSV color space is chosen and the lower statisticalmoment value ismodified based on the nature of color histogram as the characteristic statistic vari⁃ables.Then the images category is judged through k-nn searchmethod and a simulation system is built.The experiment also com⁃pares the classified accuracy of combined classwith that of single class.The experiment shows that themethod can classify the ani⁃mals effectively and averaged class recognition rate reaches 89%.The simulation system is practical and combined class features can improve recognition accuracy and reduce its time to some extent.

animal classification,color feature,colorhistogram,colorstatisticalmoment,K-nnmethod

TP391.41

10.3969/j.issn.1672-9730.2017.05.020

2016年11月7日,

2016年12月20日

国家级大学生创新创业训练计划资助项目(编号:201610145014);中国博士后科学基金资助项目(编号:2016M 591446);中央高校基本科研业务费(编号:N140503004);国家自然科学基金青年科学基金资助项目(编号:61402097)资助。作者简介:张公伯,男,研究方向:应用统计、图像处理。谷昱良,男,研究方向:图像处理。朱和贵,男,博士,副教授,研究方向:机器学习、统计建模、图像处理、多媒体信息安全。

猜你喜欢

直方图分类颜色
符合差分隐私的流数据统计直方图发布
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于差分隐私的高精度直方图发布方法
按需分类
教你一招:数的分类
说说分类那些事
中考频数分布直方图题型展示
特殊颜色的水
给塑料分分类吧