基于压缩感知理论的葡萄干分类研究
2015-06-23刘广强卢焕达余心杰舒振宇
刘广强,卢焕达,余心杰,舒振宇
(1.太原科技大学电子信息工程学院,太原 030024;2.浙江大学宁波理工学院,浙江 宁波 315100)
基于压缩感知理论的葡萄干分类研究
刘广强1,卢焕达2,余心杰2,舒振宇2
(1.太原科技大学电子信息工程学院,太原 030024;2.浙江大学宁波理工学院,浙江 宁波 315100)
为实现机器视觉准确判别葡萄干品种,提出了一种基于压缩感知理论(Compressed Sensing,CS)的葡萄干品种分类方法。以3种葡萄干为研究对象,并提取葡萄干图像的形态、颜色和纹理特征参数,得到葡萄干训练样本的数据词典矩阵。压缩感知理论分类算法首先利用由葡萄干图像特征参数组成的数据词典矩阵对每一个葡萄干测试样本进行稀疏性表示,得到稀疏向量。然后利用稀疏向量对葡萄干测试样本进行重构,并计算重构样本与测试样本之间的残差,最后通过比较残差的大小来确定测试样本的类别。将提出的方法与最小二乘法支持向量机(Least squares support vector machine,LSSVM)和BP(Back Propagation)网络的识别结果做了对比和分析。试验结果表明,基于压缩感知理论的分类方法对于3个葡萄干品种的综合分类准确率为99.17%,获得了最好的分类效果。
图像处理;特征提取;压缩感知;稀疏表示;葡萄干分类
新疆吐鲁番是中国葡萄的重要生产基地。新疆葡萄甲天下,尤其以吐鲁番的葡萄最富盛名,吐鲁番位于新疆天山东部山间盆地,那里种植葡萄面积达50万亩,其葡萄年产量50万吨,拥有的葡萄品种100余种,吐鲁番的葡萄干产量更是占据了全国的四成还多,新疆的葡萄干产自吐鲁番地区。新疆葡萄干根据选用葡萄种类的不同可分为:无核白、特级绿、无核绿香妃、无核玫瑰香妃、无核红香妃、王中王、马奶子、男人香、玫瑰香、金皇后、香妃红、黑加仑、沙漠王、巧克力、哈密王等。传统的葡萄干品种鉴别主要依靠观测和品尝,该方法不仅花费大量人力,而且对葡萄干品种分选的质量和效率也不高。
近年来,基于计算机视觉技术在农产品籽粒品种分类以及生物雌性识别中显示出客观的优越性[1-6]。唐晶磊等[4]提出一种基于BP神经网络的葡萄干分级技术的研究,该方法基于葡萄干图像的颜色特性和形状特性建立了葡萄干分级检测模型。龚攀等[5]提出了一种基于计算机视觉的蚕蛹识别方法。通过研究雌雄蚕蛹图像的信息,发现其尾部纹理特征和形体特征等信息可作为识别雌雄蚕蛹的特征。展慧等[6]提出了一种基于机器视觉的板栗分级检测方法。文中根据板栗图像提取纹理特征参数和颜色特征参数作为识别不同级别板栗的特征。
压缩感知理论是由Candes E J[7]、Romberg J[8]、Tao T[9]和Donoho D L[10]等科学家于2004年提出的。压缩感知,又称压缩传感,该理论一经提出,就引起学术界和工业界的广泛关注。它在模式识别、图像处理、信号处理、视频信号压缩、信息论、无线通信等领域受到高度关注。另外,压缩感知理论在农产品分类识别中的应用也显示出它一定的优势,与传统的智能分类算法相比,基于压缩感知理论的分类方法具有更高的准确性。
图像含有丰富的内容,从葡萄干图像中提取的形态特征参数、颜色特征参数和纹理特征参数可以有效的对葡萄干图像进行分类识别。本文选取3个葡萄干品种作为研究对象,品种一为新疆哈密王、品种二为新疆无核白、品种三为新疆王中王,通过提取其图像的形态特征参数、颜色特征参数以及纹理特征参数,利用压缩感知理论方法进行葡萄干品种分类,为葡萄干品种分类识别提供一种新的方法。葡萄干样本情况如表1所示。
表1 葡萄干样本情况表Tab.1 Table of raisins samples
图1 识别系统流程图Fig.1 The identification system flowchart
1 图像采集
文中识别系统的流程如图1所示。所有的实验数据采集采用如图2所示的计算机视觉系统,该系统包括由两个白色LED灯组成的光源、一台计算机和一个佳能EOS60D型数码单反相机。为保证拍摄角度、高度及焦距的一致性,相机由三脚架固定后定角度、定高度及定焦距拍摄,采集的葡萄干图像以JPG格式进行存储。拍摄完成后由USB数据线将采集的葡萄干图像直接传至计算机进行保存。
图2 计算机视觉系统Fig.2 Computer vision system
2 图像特征提取
2.1 图像预处理
在采集葡萄干图像时由于受到周围灯光、灰尘杂质以及其他因素的影响,会对采集的葡萄干数字图像产生一定的噪声干扰。因此,在对采集的葡萄干图像进行特征提取时,首先需要将采集的葡萄干图像进行预处理以消除噪声对葡萄干图像产生的影响。本文利用MATLAB对采集的所有葡萄干图像进行去噪、去背景、灰度化、二值化、边缘检测、图像分割等预处理[11-12]操作。预处理后的葡萄干图像效果如图3所示。
图3 预处理后的葡萄干图像Fig.3 Raisins image after preprocessing
2.2 形态特征
对计算机图像识别系统而言,被识别对象的形态特征是一个赖以识别的重要特征。本文选用图像常用的形态特征:面积、周长、圆度、矩形度和伸长度作为葡萄干图像的形态特征参数[13]。然后由这5个形态特征参数构成葡萄干图像的形态特征向量。
2.3 颜色特征
葡萄干颜色特征是基于葡萄干数字图像分割出的每个颜色分量的灰度直方图的分析。我们可以从标准直方图[14]提取颜色特征,直方图的定义如式(1)所示:
其中l表示葡萄干图像总的灰度级数,ni表示葡萄干图像中具有灰度级i的像素的个数,i表示葡萄干图像每个像素的灰度级,N表示一幅葡萄干图像总的像素数。公式描述的是葡萄干图像中具有灰度级i的像素出现的频率。葡萄干RGB图像3个颜色分量的直方图如4所示。
图4 葡萄干RGB图像三个分量的直方图Fig.4 Histogram of 3-channel RGB image of raisins
一般不直接将葡萄干图像的每个颜色分量的灰度直方图作为葡萄干图像特征,在此定义以下颜色特征系数来反映葡萄干图像的颜色特征。
其中μ表示均值,σ2表示方差,μ1表示歪斜度,μ2表示峰态,μ3表示能量。
本文由MATLAB获取葡萄干图像的彩色空间中红(R)、绿(G)、蓝(B)颜色分量后,分别统计R、G、B分量中的μ、σ2、μ1、μ2和μ3共15个颜色特征系数构成葡萄干图像的颜色特征向量[15]。
2.4 纹理特征
灰度共生矩阵[16]被定义为从灰度为i的像素点离开某个固定位置关系的像素点上的灰度为j的概率。灰度共生矩阵用Hδ表示:
式(17)中,L表示图像的灰度级,其中i,j表示两个像素的灰度。
为了方便分析,矩阵中的元素用概率值表示,即将矩阵中的各元素Hδ(i,j)除以各元素之和S,得到各元素都小于1的归一化δ(i,j),即:
纹理特征是图像重要的特征之一。从灰度共生矩阵抽取出的主要纹理特征参数有以下几种。
其中φ1表示二阶矩,φ2表示对比度,φ3表示相关,φ4表示熵。μ4、μ5、σ21、σ22分别定义为:
文中取二阶矩、熵、对比度、相关的均值和标准差共8个参数作为葡萄干图像的纹理特征[17]。然后由这8个纹理特征参数构成葡萄干图像的纹理特征向量。部分葡萄干样本纹理特征数据如表2所示。
3 基于压缩感知理论的分类方法
3.1 压缩感知理论
压缩感知理论分类算法是近年来出现的一种新的模式识别算法。霍迎秋等[17]探索压缩感知理论在苹果病害识别中的应用,有效的对苹果病害进行识别。进而基于压缩感知理论的分类算法在诸多分类识别问题上得到广泛的应用并取得成功。
表2 部分葡萄干样本纹理特征数据Tab.2 Texture feature data of partial raisins samples
考虑实域上某个有限长一维离散时间信号X,若存在某组正交变换基φ,使得式(17)成立[18],则X称φ在上K是稀疏的。
式中:X为有限长一维离散时间信号,X∈Rn×1;φ为正交变换基,也称为稀疏矩阵,φ∈Rn×n;y为X在稀疏矩阵φ上的稀疏表示系数,即稀疏向量,y中只有K个元素不为0,y∈Rn×1;n为信号维数。
在此基础上,可以用一个与稀疏矩阵不相关的矩阵Ψ对信号X进行线性测量,使得式(18)成立。
式中:Ψ为观测矩阵,Ψ∈Rm×n;z为观测向量,z∈Rm×1,其中m<n;式(18)为欠定方程,无法从z求解出信号X.由压缩感知理论知[19-20],可以通过求解最优l0范数来解决这个问题,即:
然而式(19)求解是个NP问题,求解非常困难。压缩感知的研究理论表明[19-20],在y足够稀疏的情况下,式(19)的解等价于l1范数意义下的最优化问题的解,即:
此时式(20)为一个凸优化问题,可以方便的利用匹配追踪法、内点法、梯度投影法等成熟算法进行求解[21-22]。
3.2 压缩感知理论的葡萄干分类
分类识别问题是通过对若干已知类别的样本集进行训练,然后建立分类模型,从而利用分类模型判断测试样本所属的具体类别。具体步骤如下:
假设有k类葡萄干,第i类葡萄干有ni个训练样本。则第i类的ni个样本的特征数据可以组成如下矩阵:
则k类葡萄干所有的训练样本数据可以组成如下数据词典矩阵:
其中n=n1+n2+nk.
对于任意一个未知分类的葡萄干测试样本W∈Rm,如果数据词典矩阵充分完备,该测试样本可以由A中数据线性表示,即:
其中Q∈Rn.当m<n时,方程W=AQ为欠定方程,其解不是唯一的。由压缩感知理论知,可以利用式(20)进行求解。
通过解式(23)求得葡萄干测试样本W∈Rm的稀疏向量.进而对任意的i(1≤i≤k),可以定义葡萄干测试样本W∈Rm的第i个重构样本:
其中δi(Q)∈Rn是一个新的与第i类有关的系数向量。具体而言,除了保留Q中与第i类有关的系数外,令其它系数全部为零。这样,可以得到k个重构样本.分别计算葡萄干测试样本W与重构样本之间的残差,并确定使残差达到最小的类别为葡萄干测试样本所属的分类,即:
4 实验与讨论
选取3类不同品种的葡萄干样本,每类葡萄干随机选取160粒作为训练样本。通过选取5个形态特征、15个颜色特征和8个纹理特征共28个参数构成葡萄干图像特征向量,并由此构成维的数据词典矩阵。另外,每种葡萄干各选取40粒样本作为测试样本,共120粒。将这120粒测试样本进行编号,第1类葡萄干测试样本编号为1-40,第1类葡萄干测试样本编号为41-80,第3类葡萄干测试样本编号为81-120.
测试样本的识别结果如图5所示,横坐标表示测试样本编号,纵坐标表示每个测试样本的类别。从图5中可以看到,第1类和第2类测试样本的实际类别和识别分类结果完全重合,分类准确率为100%;而在第3类测试样本中一个被错分到第2类,分类准确率为97.5%;3类测试样本的平均识别率达到99.17%.
图5 测试样本的识别结果Fig.5 The identification results of test samples
为进一步验证压缩感知分类方法的有效性,我们还将本文方法与最小二乘支持向量机(least squares support vector machine,LSSVM)方法[23]和BP(back propagation)网络方法[24]进行比较。试验程序在MATLAB 7.0环境下编写运行。不同分类方法的试验结果如表3所示。
表3 不同分类方法的试验结果Tab.3 Experimental results of different classification methods
从表3可以看出,在第一类葡萄干分类中,压缩感知理论(CS)方法的识别准确率与LSSVM方法和BP方法中的识别准确率相同;在第二类葡萄干的分类中,CS方法的识别准确率高于LSSVM方法;在第三类葡萄干分类中,CS方法的识别准确率高于BP网络方法。总体上,CS方法的识别准确率为99.17%,LSSVM方法的识别准确率为96.67%,BP网络方法的识别准确率为95.83%.因此,基于压缩感知理论(CS)方法的综合识别准确率高于其他两种分类算法。
5 结论
本文研究基于压缩感知理论的葡萄干分类问题。对新疆哈密王、新疆无核白、新疆王中王等3种具有不同形态特征、颜色特征和纹理特征的葡萄干品种的试验结果显示,基于压缩感知理论(CS)分类方法的综合准确率达到99.17%.本文提出的方法对葡萄干品种分类识别进行了有益的尝试,研究结果对生物雌雄识别以及其他农作物籽粒的分类也具有一定的参考价值。
[1]任宪忠,马小愚.农产品粒形识别研究进展及其在工程中应用现状[J].农业工程学报,2004,20(3):276-280.
[2]应义斌,饶秀勤,赵匀.机器视觉技术在农产品品质自动识别中的应用研究进展[J].农业工程学报,2000(3):4-8.
[3]刘燕德,应义斌,成芳.机器视觉技术在种子纯度检验中的应用[J].农业机械学报,2003,34(5):161-163.
[4]唐晶磊,景旭,何东健.基于BP神经网络的葡萄干分级技术的研究[J].农机化研究,2007(11):51-53.
[5]龚攀,李光林.基于计算机视觉的蚕蛹性别识别应用研究[J].农机化研究,2014(1):206-209.
[6]展慧,李小昱,王为,等.基于机器视觉的板栗分级检测方法[J].农业工程学报,2010(4):327-331.
[7]CANDÈS E.Copressive samples principles[C]∥Proceedings of the Internation Congress of Mathermaticians.Madrid,Spain,2006,3:1433-1452.
[8]CANDÈS E,ROMBERG J,TAO T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.
[9]DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[10]CANDÈS E,TAO T.Near-optimal signal recovery from random projections:universal encoding strategies[J].IEEE Transactions on Information Theory,2006,52(12):5406-5425.
[11]王爱玲,叶明生,邓秋香.MATLAB R2007图像处理技术与应用[M].北京:电子工业出版社,2008.
[12]张强,王正林.精通MATLAB图像处理[M].北京:电子工业出版社,2012.
[13]YU X,LIU K,WW D,et al.Raisin quality classification using least squares support vector machine(LSSVM)based on combined color and texture features[J].Food and Bioprocess Technology,2012,5(5):1552-1563.
[14]郭依正.基于多特征融合的医学图像识别研究[D].镇江:江苏大学,2007.
[15]韩仲志,匡桂娟,刘元永,等.基于形态和颜色特征的花生品质检测方法[J].花生学报,2007,36(4):18-21.
[16]胡小锋,赵辉.Visual C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.
[17]霍迎秋,唐晶磊,尹秀珍,等.基于压缩感知理论的苹果病害识别方法[J].农业机械学报,2013,44(10):227-232.
[18]石光明,刘丹华,高大化,等.压缩感知理论及其研究进展[J].电子学报,2009(5):1071-1081.
[19]TSAIG Y,DONOHO D L.Extensions of compressed sensing[J].Signal processing,2006,86(3):549-571.
[20]OLSHAUSEN B A,FIELD D J.Sparse coding with an overcomplete basis set:A strategy employed by V1[J].Vision research,1997,37(23):3311-3325.
[21]CANDÈS E,ROMBERG J,TAO T.Stable signal recovery from incomplete and inaccurate measurements[J].Communications on Pure and Applied Mathematics,2006,59(8):1207-1223.
[22]DONOHO D L.For most large underdetermined systems of linear equations the minimal l1-norm solution is also the sparsest solution[J].Communications on Pure and Applied Mathematics,2006,59(6):797-829.
[23]COMAK E,POLAT K,GÜNES S,et al.A new medical decision making system:Least square support vector machine(LSSVM) with fuzzy weighting pre-processing[J].Expert Systems with Applications,2007,32(2):409-414.
[24]BISHOP C M.Neural Networks for Pattern Recognition[M].New York:Oxford university press,1995.
Raisin Classification Based on Compressed Sensing
LIU Guang-qiang1,LU Huan-da2,YU Xin-jie2,SHU Zhen-yu2
(1.School of Electronic Information Engineering,Taiyuan University of Science and Technology,Taiyuan 030024,China;2.Ningbo Institute of Technology,Zhejiang University,Zhejiang Ningbo 315100,China)
A classification method based on Compressed Sensing was proposed for discriminating the varieties of Raisin precisely.Three kinds of Raisins were investigated,and the shape,color and texture feature parameters of the Raisins image were extracted,and then,the data dictionary matrix was got.Firstly,this classification process was to represent the test samples of Raisins image by the matrix of data dictionary and to obtain the sparse vector.Secondly,the residuals were calculated between the reconstructed samples and the test samples by making use of the sparse vector to reconstruct the test samples of Raisins image.Finally,the classification of test samples were determined by comparing the sizes of residuals.In this study,the classification results on the proposed method were analyzed and compared with those of Least Squares Support Vector Machine(LSSVM)and BP network.Experimental results demonstrated that the overall classification accuracy of Compressed Sensing method is 99.17%,which has the best classification effect among three methods.
image processing,feature extraction,compressed sensing,sparse representation,raisin classification
TP391.4
A
10.3969/j.issn.1673-2057.2015.02.001
1673-2057(2015)02-0081-06
2014-11-05
国家自然科学基金(31402352);国家星火计划(2012GA701012);浙江省自然科学基金(LY13F020018);浙江省教育厅一般科技项目(Y201432753);宁波市自然科学基金(2014A610185)
刘广强(1988-),男,硕士研究生,主要研究方向为模式识别与智能信息处理研究;通讯作者:卢焕达,讲师,E-mail:huandalu@163.com