APP下载

基于机器视觉的枸杞分级方法

2013-07-20王履程谭筠梅王小鹏雷涛

计算机工程与应用 2013年24期
关键词:枸杞分类器灰度

王履程,谭筠梅,王小鹏,雷涛

兰州交通大学电子与信息工程学院,兰州 730070

基于机器视觉的枸杞分级方法

王履程,谭筠梅,王小鹏,雷涛

兰州交通大学电子与信息工程学院,兰州 730070

WANG Lvcheng,TAN Junmei,WANG Xiaopeng,et al.Wolfberry classification method based on machine vision.Computer Engineering and Applications,2013,49(24):16-18.

枸杞自古以来就是深受欢迎的中药材,主要产地在我国的西北地区。由于枸杞的采摘时间跨度大,在晾晒过程中易受环境的影响和限制,并且由于枸杞内部条件不同,导致枸杞成品色泽混杂,严重影响了枸杞的品质等级。在加工过程中依据枸杞的色泽和大小进行有效的自动分级可以极大地提高枸杞生产企业的经济效益。传统的枸杞分级主要采用人工分拣的方法,既花费大量人力,同时分选质量和效率也不能适应日益发展的工厂化加工要求和商品市场需求[1-2]。目前,已开始研制枸杞色选机来代替传统的人工分拣方法[3],其研发的关键是机器视觉部分[4],利用机器视觉技术实现对枸杞准确、快速的自动分类。

基于机器视觉的枸杞分级算法主要包括图像预处理、图像分割、色彩分量提取、特征提取与分类标识等步骤[5-6]。图像分割精确度会直接影响特征提取的可靠性和分类的准确度。目前常用的图像分割方法有基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等,其中阈值分割方法对于背景单一,直方图呈双峰的图像能进行快速有效的分割。最小距离分类器是一种简单而有效的分类方法,在分类前需要各类的中心向量,本文采用聚类分析获取枸杞各类别的聚类中心作为最小距离分类器的中心向量,从而实现机器视觉部分的高度智能化。图1为基于机器视觉的枸杞分级方法流程。

图1 基于机器视觉的枸杞分级流程图

1 枸杞图像预处理及特征提取

由于光照、灰尘等因素的影响,在枸杞图像的采集和传输过程中会产生噪声,因此先要对采集的枸杞图像进行噪声移除等预处理[6-7];其后进行图像分割。

1.1 图像预处理

为了加快分级的速度,同时便于去除噪声和分割,对CCD采集的枸杞图像进行灰度化处理。

其中IR,IG和IB分别为枸杞彩色图像的RGB分量,Igray为灰度化之后的图像。

中值滤波方法是一种经典的非线性平滑噪声的方法,可以有效去除数字图像中常见的随机噪声,并且可以较好地保护图像的边缘信息。本文采用3×3窗口的中值滤波法[8]对枸杞图像进行平滑处理。枸杞图像、灰度化和中值滤波的结果如图2(a)~(c)所示。

图2 枸杞图像及预处理结果

1.2 图像分割

枸杞图像的分割对后续处理至关重要。阈值分割是一种简单实用的图像分割方法,它以图像直方图信息为主导,具备原理清晰、表述简单、运算快捷、效果良好等优点[7]。枸杞图像采集中成像背景稳定,而且图像具有背景像素灰度级和枸杞像素灰度级对比度大且其直方图呈双峰等特点。枸杞灰度图像的直方图如图3所示。因此采用阈值分割方法可以快速有效地分割枸杞灰度图像。

本文使用分割阈值自动选取的最优方法Otsu阈值法[9]来分割枸杞图像,通过对图像的一维直方图进行统计,把图像分为背景与目标两个部分,分别计算两个类别的方差值,当两个类别之间的方差最大时,就可以动态确定出背景与目标分割的最优阈值。

假设灰度图像的像素总数为N,灰度级为L,灰度为i像素个数为ni,则其出现的概率为pi=ni/N(i=0,1,…,L-1)。假定图像背景与目标的分割阈值是T,此时图像像素按照灰度可以分为两类,分别表示背景和目标。L1=[0,1,…,T-1],L2=[T,T+1,…,L-1]分别为背景和目标的灰度级,则背景和目标的类间方差为:

图3 枸杞灰度图像的归一化直方图

枸杞图像分割的结果如图2(d)所示。

1.3 枸杞图像的特征选择与提取

色泽、大小和形状是枸杞品质分级的主要依据[10]。由于枸杞本身的颜色特点,实验测试表明,使用RGB彩色空间中的红色分量来进行特征提取效果就非常理想。对于分割后的枸杞图像,采用分割区域红色分量的均值和标准差作为枸杞色泽的特征参数。考虑到枸杞本身形状特点,通过实验分析和枸杞样本形状的计算与描述,将分割区域的面积和偏心率分别作为枸杞的大小和形状特征参数。

枸杞红色分量的均值、方差按如下方法计算:

2 枸杞聚类分析及分类

2.1 最小距离分类器

最小距离分类器[7,11]是一种简单而有效的分类方法,其基本思想是根据训练集按照算术平均生成一个代表该类的中心向量m1,m2,…,mK,K为类别的数目。对于每一个待分类样本x,计算其与类中心向量之间的距离,最后判定x属于与之距离最近的类。距离计算采用欧式距离:

其中x为样本的特征向量,mi为第i类的中心向量。

表1 部分枸杞样本特征数据

2.2 K-Means算法

K-Means算法是一种动态聚类的方法,即在欧几里德空间将N个样本数据对象划分为K个聚类,使得每个聚类内的数据相似度高,而不同聚类的数据相似度低。其核心思想是找出K个聚类中心m1,m2,…,mk,使得每一个数据点x和与其最近的聚类中心的平方距离和最小化(该平方距离和被称为偏差Je)。该算法的基础是误差平方和准则[12-13]。

若Ni是第i个聚类ci中的样本数目,mi是这些样本的均值向量,即

把ci中的各样本x与均值向量mi的误差平方和对所有类相加后为:

Je是误差准则和聚类准则,Je度量了用K个聚类中心m1,m2,…,mk代表K个样本子集c1,c2,…,ck时所产生的总的误差平方。对于不同的聚类结果,Je的值是不同的,使Je极小的聚类是误差平方和准则下的最优结果。

K-Means聚类算法的步骤可描述如下[6]:

(1)初始分类:依据一定规则指定K个初始聚类中心m1,m2,…,mk。

(2)指派样本:对每一个样本x,找到离它最近的聚类中心mi,并将其分配到mi所对应的聚类ci中。

(3)更新mi:重新计算加入新样本后的聚类的中心。

(4)计算偏差:重新计算Je。

(5)连续迭代计算Je,如果Je值收敛则算法结束,否则转(2)。

2.3 枸杞分类

枸杞分类通常采用多级分类方式,一般采用两级分类。本文第一级根据色泽分为2类;第二级根据大小分为3类。第一级采用2维特征向量,分别是枸杞红色分量的均值和方差,第二级采用一维特征即枸杞分割的面积。两级分类均采用无监督的K-Means算法训练得到枸杞分级的基准,在分类阶段采用最小距离分类器分类。

3 实验结果和分析

本文采用MATLAB 7.0仿真基于聚类分析的枸杞分级方法,部分枸杞样本的色泽特征向量和大小特征数据见表1。针对170个枸杞样本进行训练得到的分级基准见表2。针对680个枸杞样本进行分类测试,色泽分类准确性达到99.76%,大小分类准确性达到100%。目前色选机处理要求为每天处理2.16吨,每秒处理25 g枸杞(约100粒)。针对170个枸杞样本进行训练的耗时为2.923 s,针对680个枸杞样本进行分类的耗时为0.001 4 s。实验表明该方法能快速准确地对枸杞进行分级。

表2 170个样本训练得到的分级基准

4 结论

本文研究了采用机器视觉技术对枸杞进行自动分级的方法,根据目前枸杞加工行业的实际情况,采用了色泽和大小两级分类。考虑到实时性和准确性的要求,在根据色泽分类时选取了枸杞图像红色分量的均值和方差作为特征向量,在根据大小分类时使用分割面积作为特征向量。分类方法采用了最小距离分类器,使用K-Means聚类分析获取聚类中心替换了最小距离分类器中的算术平均中心作为分类的基准,实现了分类的完全自动化。实验表明该方法能快速准确对枸杞进行自动分级,对其他类似农产品的快速分级提供了理论框架。

[1]崔萍,汪泽鹏.宁夏枸杞产业发展现状及对策[J].北方果树,2008(5):36-37.

[2]丁润锁,尚立新,宁书臣,等.农产品色选技术的发展分析[J].农业工程,2012(S1):54-56.

[3]王建宏.宁夏枸杞干果告别人工拣选[N].宁夏日报,2006-10-04(001).

[4]张诚彬,陆锡华.色选机及其在粮食工业中的应用[J].粮食与饲料工业,1995(1):1-4.

[5]高瑞,王安福,朱荣.基于机器视觉的光电色选机控制系统的研究[J].郧阳师范高等专科学校学报,2010,30(6):30-32.

[6]边肇祺,张学工.模式识别[M].2版.北京:清华大学出版社,2001.

[7]Jain A K,Duin R P W,Jianchang M.Statistical pattern recognition:areview[J].IEEETransactionsonPatternAnalysis and Machine Intelligence,2000,22(1):4-37.

[8]冈萨雷斯,伍兹.数字图像处理[M].阮秋琦,译.3版.北京:电子工业出版社,2011.

[9]Otsu N.A threshold selection method from gray-level histograms[J].IEEE Transactions on Systems,Man,and Cybernetics,1979,SMC-9(1):62-66.

[10]张晓煜,刘静,王连喜.枸杞品质综合评价体系构建[J].中国农业科学,2004,37(3):416-421.

[11]任靖,李春平.最小距离分类器的改进算法——加权最小距离分类器[J].计算机应用,2005(5):992-994.

[12]Mohd Rijal O,Noor N M.Some remarks on selected image analysis problems using multivariate statistical methods[C]// 2011 IEEE International Conference on Computer Applications and Industrial Electronics(ICCAIE),2011.

[13]Kanungo T.An efficient k-means clustering algorithm:analysisandimplementation[J].IEEETransactionsonPattern Analysis and Machine Intelligence,2002,24(7):881-892.

WANG Lvcheng,TAN Junmei,WANG Xiaopeng,LEI Tao

Traditional wolfberry sorting primarily uses artificial method.It has time-consuming and inefficient shortcomings.An automatic wolfberry classification method based on machine vision is proposed.This paper uses digital image processing technology for wolfberry image pre-processing,segmentation and extraction of characteristic parameters of color,size and shape;it uses theK-means clustering feature to get the baseline of wolfberry appropriate level;it grades wolfberry by minimum distance classifier based on the trained benchmark.The experimental results show that this method can classify different colors and sizes of wolfberry more accurately and quickly.

wolfberry classification;image segmentation;feature extraction;cluster analysis;minimum distance classifier

针对目前传统的枸杞分级主要采用人工方法,费时费力且效率不高的缺点,提出了一种基于机器视觉技术对枸杞进行自动分类的方法。采用数字图像处理技术对枸杞图像进行了预处理、分割,从而提取枸杞的色泽、大小及形状等特征参数;用K-means算法对特征进行聚类,得到枸杞相应等级的基准;根据聚类分析得到的基准采用最小距离分类器对枸杞进行分级。实验结果表明,该方法能够准确快速地对不同色泽和大小的枸杞进行分类。

枸杞分级;图像分割;特征提取;聚类分析;最小距离分类器

A

TP391.4

10.3778/j.issn.1002-8331.1305-0379

School of Electronic&Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China

国家自然科学基金(No.61261029,No.61202314);兰州交通大学青年科学基金项目(No.2011003)。

王履程(1978—),男,博士研究生,讲师,研究领域为模式识别,图像分析;谭筠梅(1977—),女,博士研究生,讲师,研究领域为视频分析,模式识别;王小鹏(1969—),男,博士,教授,研究领域为数字图像分析;雷涛(1981—),男,博士,副教授,研究领域为数学形态学,图像处理。E-mail:wanglc@mail.lzjtu.cn

2013-05-28

2013-07-26

1002-8331(2013)24-0016-03

CNKI出版日期:2013-09-26http://www.cnki.net/kcms/detail/11.2127.TP.20130926.1644.009.html

猜你喜欢

枸杞分类器灰度
采用改进导重法的拓扑结构灰度单元过滤技术
是酸是碱?黑枸杞知道
基于灰度拉伸的图像水位识别方法研究
宁夏六月枸杞红
枸杞到底是怎么养生的?
BP-GA光照分类器在车道线识别中的应用
基于最大加权投影求解的彩色图像灰度化对比度保留算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于灰度线性建模的亚像素图像抖动量计算