APP下载

基于图像识别技术的南疆红枣品种识别研究

2014-03-26吴明清李传峰弋晓康

塔里木大学学报 2014年4期
关键词:红枣轮廓灰度

吴明清 李传峰 弋晓康

(塔里木大学机械电气化工程学院,新疆阿拉尔,843300)

枣(Ziziphus jujbbe Mill)属鼠李科(Rhamnus)枣属(ZiziPHus Mill)植物,原产于中国是我国古老的果树和我国古代著名的“五果之一[1]”。红枣具有极高的营养保健价值及药用价值,素有“木本粮食,滋补佳品”的美誉,是集药、食、补三大功能为一体的保健果品[2]。

自20世纪60年代,新疆喀什地区,阿拉尔垦区从河北、河南、山西等地方引进灰枣,壶瓶枣、园脆枣等进行栽培。21世纪前后新疆南部又大量引进其他一些品种。如:骏枣,冬枣。为了收集不同用途,不同成熟期的优良品种,在新疆温宿县建立一个红枣资源库[2]。由于红枣资源非常丰富,样本多,给鉴评带来很大的困难,本文采用特征识别和神经网络结合的方法进行图像识别系统研究,具有快速、及时、无破坏性多指标同时鉴定等优点,可提高测定的效率,降低鉴别成本,消除任务造作误差,测定信息更为客观和真实,为红枣的品质鉴别提供了理论和技术依据。

1 材料与方法

1.1 材料

试验红枣采集于新疆阿拉尔农垦十团某红枣基地。采集红枣果实品种有灰枣图1(a)、鸡心枣图1(b)、金昌枣图1(c)、骏枣图1(d)、圆脆枣图1(e),做为计算机识别目标。样品采摘时间为2013年11月15日,密封后放入冰箱冷藏备用。

图1 红枣品种

2 图像处理方法

采集时选择颜色鲜艳,表面光滑,含水充足的5种红枣果实的150个有代表性红枣作为试验样本放置于OK-AC1300型的摄像头下图像采集制成分辨率为3 000*4 000的jpg格式的数字图像。如图2(a)为红枣的一个图像样本;对图像进行处理,主要包括图像的灰度化,滤波,阀值分割,枣果图像形态学处理和轮廓提取5个环节。本文以灰枣图像为例,演示红枣图像的预处理过程。图像处理和特征提取和均采用Matlab 7. 0软件实现。

2.1 灰度化图像

采集获取的红枣图像为RGB彩色图像,需要对该图像进行灰度化处理。彩色图像转化为灰度图像的公式为Y=R×0. 298 9+ G×0. 587 0+ B×0. 114 1其中,R, G, B别为彩色图像中像素的红,绿,蓝3个分量,Y是该像素在灰度图像中的灰度值。因此在图像去除噪音。采用3X3均值滤波对灰度图去噪。如图2(c)所示。

2.2 阀值分割

阀值分割就是把灰度图像转化为二值图像时,需要设定一个阀值,方便对轮廓特征的形状特征的提取。本试验采用最大类间方差法(0stu)获得一个合适的阈值(threshold)把红枣的灰度图像转化为二值图像[3]。

2.3 形态学处理

在二值化分割工作,发现红枣表面可能遭受虫子的侵蚀和失去水分后的褶皱,从而在分割后的红枣图像内部存在小的空洞,影响轮廓的提取,因此这部分图像在二值化后需要进一步处理。为了保护红枣图像的形态特征以及边缘的清晰,采用了数学形态学里的闭运算,即先进行膨胀运算,然后腐蚀运算,这样就消除了红枣内部的小孔洞。如图3所示。

图2 灰枣俯视图像预处理

2.4 轮廓的提取

由于红枣的轮廓是红枣自身的一个图像象素子集,而且红枣轮廓中含有丰富的形态学信息,通过轮廓来计算形态特征计算比较简单,计算量小。为了红枣轮廓进行分析,需要对轮廓进行跟踪,分割后的图像轮廓像素由0和1组成,1代表轮廓点的像素,对1像素点跟踪其8个方向的领域,同时采用链码跟踪轮廓点并进行编码[4]。 具体跟踪算法步骤如下:

2.4.1 按照从上到下和从左到右的顺序逐次扫描图像,以第一个像素值1的点定位起始点,如果找不到起始点算为结束。

图3 金昌枣俯视图像形态学处理

2.4.2 按逆时针顺序从当前点右边开始搜寻器8个方向上的领域点,如果发现未曾搜索过的像素点1,并且该点8个方向的领域点含有0值像素点,则讲1值像素点值为当前点,同时记录下相应的链码值。重复该过程指导找到起始点。

2.4.3 根据所记录的链码值,采用8个方向弗里曼码进行编码,从而获得轮廓信息。图2(g)显示了对图2(f)中红枣轮廓胡跟踪结果。

通常采用红枣果实特征,比如颜色,大小等区别不同品种,但是红枣的形状特征进行红枣品种的鉴别。根据收集后的五种红枣来看,不同品种存在很大的差异,即使同一种红枣有所不同,比如周长、面积、纵轴长,短轴长等。本试验利用红枣轮廓计算描述红枣的形状绝对特征值,包括红枣的内接圆,最小包围盒,外接圆,凸包等。根据文献[4]中的介绍,特征参量计算可以得到8项相对特征值: 如纵横轴比、矩形度、面积的凹凸比、周长的凹凸比、球状性、圆形度、偏心率等。

以上8项几何特征都具有旋转、平移和尺度不变性,表1为

Hu[5]提出的7项不变矩也具有天然的旋转、平移和尺度不变性,在图像识别领域经常用到,但是仅限于灰度图像。Chen[6]等人在Hu的基础上改进其算法,使其能够适用于轮廓。表2为图2(a)中灰枣轮廓图像对其缩小一倍和旋转90°后的7项Hu不变距特征参数,可以看出,旋转和缩小后的图像与原图像的7项不变矩基本保持不变。

表1 灰枣俯视图8项几何特征数值

表2 灰枣俯视图以及缩小旋转后的Hu特征数值

从上述两种表格可以看出,红枣的8项几何特征和7项Hu不变矩不在同一个数量级上,而且存在较大的差异,因此需要对各项特征进行归一化处理,采用公式(9)能把个项特征值都归一化到[0,1]范围内。

(9)

其中E为特征值,Emax为所有特征值样本数据中该项特征的最大值,Emin为所有征值样本数据中该项特征的最小值。

人工神经网络(artificial neural network,缩写ANN),简称神经网络(neural network,缩写NN),是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模[7]。PNN是专门应用于解决分类问题的人工神经网络,其主要用基于概率统计思想。由Bayes分类规则构成,采用Parzen窗函数密度估计方法估算条件概率,从而进行分类模式识别[8]。在matlab7.0的PNN神经网络工具中包含了进行PNN分析和设计的许多函数,如newpnn(P,T,spread)可以快速创建一个神经网络。该函数使输入层P的神经元数目和T样本矢量的维数相等,其节点数目取决于输入与输出特征向量的维数。提取红枣的15项特征值,把它们归一化后作为表征红枣品种的向量输入到神经网络中,因此输入层共计有15个节点。输出层节点数一般为识别的种类数。也可以用输入的节点的编码表示。本研究输出种类5个,对应5个红枣品种,把输出设计为阿拉伯数字(如图2所示)。train(net,P,T)是神经网络的训练函数。sim( net, P)神经网络仿真函数。

表3 红枣类别对应的阿拉伯数字输出值

BP(back Progagation)网络是目前广泛的神经网络模型。该网络能学习和存贮大量的输入和输出模式的映射关系。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。BP神经网络同样有15个输入神经元和5个输出神经元;中间层的神经元个数为31个,确定隐含层神经元个数为31个。因此,网络结构为6x31x2。隐含层神经元的传递函数采用S型正切函数为tansig,输出层神经元的传递函数采用S型对数函数logsig,网络的训练函数采用trainlm。由于输出层采用的是S型激活函数logsig,输出永远不可能达到1或者0,使得BP网络无法收敛,为了避免问题,用0. 99代替1,用0. 01代替0。利用如下代码创建符合上述要求的BP网络。网络输出的结果采用编码输出如表3所示,BP训练误差曲线如图4所示。

treshold=[01; 01; 01; 01; 01; 01; 01; 01; 01; 01; 01; 01; 01; 01; 01];

net=newff(threshold,[31,3],{'tansig','logsig'},'trainlm');

图4 bp网络训练网络的误差曲线

2.5 试验结果与分析

本文应用matlab7.0平台进行图像处理,特征提取和神经网络构建。通过分析5种不同品种类的红枣,得到30组特征向量,完成了神经网络的训练样本和测试样本的构建。从5种红枣中选择20组作为网络训练样本和10组作为测试样本。分别应用BP和PNN两个网络来训练特征向量组成的样本,然后对训练样本进行监测。

表4 模型识别结果

由表4可见,PNN网络的识别率高于BP,其原因是PNN采用了Parzen 函数密度估计方法估算条件概率,只考虑样本空间的概率特性,允许增加训练样,本而无需重新进行长时间的训练。从整个网络的训练来看,PNN网络比BP网络收敛速度快,因此在该试验中分类效果较好。

3 总结

对不同品种红枣轮廓外形特征,进行PNN神经网络和BP神经网络识别的试验,表明两种神经网络作为红枣品种的分类识别器可行进行识别,PNN神经网络要比PN神经网络更高的识别率。

由于单纯的采用了形状特征作为分类的依据,有些红枣品种之间相似度很大,不能很好的识别,因此,在以后的识别中应该抓住不同红枣的局部特征提高红枣的识别率。此外在今后研究中应该增加更多的红枣品种,为实现红枣智能化识别做好准备。

[1] 刘孟军,汪民.中国枣种质资源[M].北京:中国林业出版社,2009.

[2] 郭玲,周慧杰,罗华平.新疆红枣引种成效与其潜在性危机及防控措施[M]. 北方园艺,2013(11):194-196.

[3] otsu N.A Threshold Selection Method form Gray Level Histogram[J].IEEE Trans.on Syst.Man,Cybern.1979,9(1)62-66.

[4] 王晓峰,黄德双.叶片图像特征提取与识别技术的研究[J].计算机工程与应用,2006( 3) : 191-192.

[5] Hu M K. Visual Pattern Recognition by Moment Invariants[J].IRE Transaction Information Theory, 1962, 8(2):179-187.

[6] Chen C C. Improved Moment Invariants for Shape Discrimination[J],Pattern Recognition, 1993, 26( 5):683-686.

[7] 冯全,邵新庆,王赞文.基于BP网络的典型草原群落自然演替预测模型研究[J].草地学报,2008, 16( 3):252-255.

[8] 贺鹏,黄林. 植物叶片特征提取及识别[J]. 农机化研究,2008(6):168-199.

猜你喜欢

红枣轮廓灰度
轮廓错觉
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
一颗大红枣
基于实时轮廓误差估算的数控系统轮廓控制
我爱家乡的红枣
红枣期货价格大涨之后怎么走
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
分红枣