基于扩展Shearlet变换、Krawtchouk矩和SVM 的储粮害虫分类
2015-01-05吴一全陶飞翔
吴一全 王 凯 陶飞翔
(南京航空航天大学电子信息工程学院1,南京 210016)(南京财经大学江苏省粮油品质控制及深加工技术重点实验室2,南京 210046)
基于扩展Shearlet变换、Krawtchouk矩和SVM 的储粮害虫分类
吴一全1,2王 凯1陶飞翔1
(南京航空航天大学电子信息工程学院1,南京 210016)(南京财经大学江苏省粮油品质控制及深加工技术重点实验室2,南京 210046)
为了进一步提高储粮害虫的识别精度,以便更有效地防治储粮害虫,提出了一种基于纹理和形状综合特征及全局混沌蜂群优化支持向量机(SVM)的储粮害虫分类方法。首先对储粮害虫图像进行扩展Shearlet变换,利用变换系数得到能量分布均值,加权后的能量分布均值构成纹理特征向量,用Krawtchouk矩不变量描述储粮害虫的形状特征;然后将纹理特征向量和形状特征向量分别归一化,两者结合构成储粮害虫的综合特征向量;最后用全局混沌蜂群算法优化SVM的核参数与惩罚因子,并应用参数优化的SVM进行分类。结果表明:与基于Gabor小波和支持向量机方法、基于Krawtchouk不变矩和支持向量机方法相比,本方法提取的储粮害虫特征信息更加完整,识别率更高。
储粮害虫分类 纹理特征 形状特征 扩展Shearlet变换 Krawtchouk矩不变量 支持向量机全局混沌蜂群算法
我国是粮食生产和储藏大国,搞好粮食储藏对保障国家粮食安全、维护国计民生意义重大。储粮害虫检测与防治是做好粮食储藏工作的重要任务之一。检测的要求是能够实时获取粮食中害虫发生的种类、密度、危害情况等信息,便于粮库管理人员进行科学的决策,以减少虫害引起的损失,避免因盲目防治造成的浪费及不必要的污染[1]。国内外较常用的在线检测方法有诱捕器法、诱集法、电导率检测法[2]。这些检测方法易受环境干扰、效率较低并且可靠性差,不能满足储粮害虫检测的要求,且难以实现害虫检测、分析和控制的自动化。
近年来,利用图像处理方法检测储粮害虫成为重要的研究课题[3-5]。基于图像处理的储粮害虫检测系统具有准确、高效、便利、价格低廉、无环境污染等优点,并能利用计算机实现自动控制。其技术研究主要包括储粮害虫图像特征提取和分类识别两个方面。目前,常用的储粮害虫图像特征提取方法可分为两类:1)纹理特征提取方法[1],纹理特征包括斑点、花纹等高频细节;2)形态特征提取方法[6-7],形态特征包括面积、周长、不变矩等几何特征。文献[8]对图像进行Gabor滤波以提取纹理特征,得到了较好的识别效果。但Gabor小波基函数是非正交的,导致特征信息大量冗余,影响了计算效率。而扩展剪切波变换采用正交的基函数,且具有方向变换不受数目限制的优点,更能捕捉纹理细节。为此,文献[9]将扩展剪切波变换应用于纹理图像分类。其取各子带加权能量值作为特征,减少了冗余数据,与Gabor小波方法相比,更有利于分类器的准确识别。而对于纹理特征不显著的图像,文献[10]以形状特征为出发点,分别研究了基于 Hu矩、Zernike矩、Krawtchouk矩等不变矩的害虫分类方法。实验结果表明,基于Krawtchouk不变矩的分类方法具有更高的识别精度。但是,对于形状相近的害虫,该方法的识别能力并不强。此外,储粮害虫可能会受到粮粒的遮挡、拍摄角度的影响,使得呈现在图像中的害虫形态不完整,或者产生局部变形。基于形态特征的方法易受到这些因素的干扰。因此,分别提取储粮害虫的纹理特征和形状特征,通过联合两类特征,期望获取更为完善的储粮害虫信息。至于储粮害虫分类识别方面,其方法主要有支持向量机(Support Vector Machine,SVM)分类法[7]和神经网络分类法[11]。对于相同的有限样本特征,支持向量机的泛化能力优于神经网络[12]。此外,对于支持向量机中涉及的核参数与惩罚因子,可进行智能优化[13]。人工蜂群优化算法的全局搜索能力较强,其收敛速度尚有进一步提高的空间。因此,拟采用支持向量机对储粮害虫进行分类识别,并改进蜂群优化算法,以此搜索最佳核参数与惩罚因子。
本研究提出了一种基于纹理和形状综合特征的储粮害虫分类方法。首先利用扩展剪切波变换提取纹理特征,依据Krawtchouk矩不变量描述形状特征;然后运用支持向量机对综合特征向量样本进行训练和分类,通过全局混沌蜂群算法优化支持向量机的核参数与惩罚因子,大大节省了搜寻时间;最后给出了基于纹理和形状综合特征的储粮害虫分类方法结果,并分别与基于Gabor小波和支持向量机方法、基于Krawtchouk不变矩和支持向量机方法进行了定量比较。
1 储粮害虫图像的纹理和形状综合特征提取
1.1 基于扩展Shearlet变换的纹理特征提取
Shearlet是合成小波的一个特例,Shearlet变换可由合成小波理论导出[14]。在二维空间里,若合成膨胀的仿射系统构成紧框架,则该系统的元素称为合成小波。该仿射系统形式见式(1)。
式中:ψ∈L2(R2),j,l∈Z,k∈Z2;A和B为2×2可逆矩阵,|detB|=1。如果ψ满足文献[15]中的相关条件,且各向异性扩张矩阵剪切矩阵那么函数系统{Ψa,s,k(x)=a-3/4Ψ(Aa-1Bs-1x-k)}称 作Shearlet系统。式中:a∈R+,为尺度参数;s∈R,为剪切参数;k∈R2,为平移参数。
对于任一函数f∈L2(R2),连续Shearlet变换定义为:
在Shearlet变换的基础上,Wang-Q重新构造了紧支撑Shearlet框架,提出了扩展离散Shearlet变换(简称扩展Shearlet变换),能够快速实现离散Shearlet变换[16]。该变换定义 a=2j(j称为尺度值),承继原有的Shearlet变换框架,用可分离小波得到额外的基函数,使得每个剪切矩阵获得一个正交基。正交基的基元素即是一个各向异性窗口函数,方向由剪切参数s所确定。采用扩展Shearlet变换分解图像f时,可按照图1所示的流程进行。首先,分别利用剪切矩阵得到水平锥子图和垂直锥子图;再分别进行剪切变换,各得到m个方向子图像;最后,分别根据尺度值j进行各向异性离散小波变换,得到不同方向i和不同尺度值j的水平锥子带图像 si,j、垂直锥子带图像 ci,j,从而实现多尺度多方向性离散Shearlet变换。当分解层数为L时,尺度向量 χ=[χ1,χ2,...,χj,...,χL]的每个分量决定了尺度j下的水平锥方向或垂直锥方向的支撑大小。参数m由方向向量 D=[d1,d2,…,dj,…,dL]确定,尺度j时m=2×2dj+1。
图1 扩展Shearlet变换
扩展Shearlet变换得到的子带图像,是原图像在不同方向、不同频段上的映射结果,代表不同分辨率的时频局部信息。频段由尺度值j决定。j越小,对应频段的频率越高,子带图像显示的细节越明显。
计算子带图像的平方均值ei,j:
式中:P和Q分别为子带图像的行数和列数;x为子带图像si,j或ci,j的系数;ei,j表示子带图像的能量分布均值,以此作为储粮害虫的纹理特征值。
不同子带图像的能量分布均值不一样,反映不同程度的纹理细节,体现不同的分类能力。能量分布均值总体是随着尺度j的增大逐渐提高。高尺度子带图像的能量分布均值较大,对分类的影响过于显著;而低尺度的子带图像含有更丰富的纹理细节,其能量分布均值更有利于分类器的正确分类。因此,需要对不同尺度下子带图像的能量分布均值加权,用以平衡对分类器的贡献。以水平锥子图为例,加权过程:
1)计算尺度j下的能量均值之和
3)得到加权后的能量分布均值hi,j=zj·ei,j,则原图像的水平锥部分纹理特征向量H1={ hi,j}。
同理可得垂直锥部分纹理特征向量H2,从而得到储粮害虫图像的纹理特征向量:
1.2 基于Krawtchouk矩不变量的形状特征提取
Krawtchouk矩作为离散正交矩,克服了连续矩误差大、计算复杂的缺点,与Hu矩、Zernike矩等其他矩相比,对图像形状特征的描述更有优势。现利用Krawtchouk矩不变量方法[17],来获取储粮害虫图像的形状特征。
n阶Krawtchouk多项式是Krawtchouk矩的基函数,其定义为:
式中:x,n=0,1,2,...,G,G>0,p∈ (0,1),2F1(·)是超几何函数[18]。
设图像大小为M×N,对图像平移、旋转、尺度变换保持不变性的(m+n)阶Krawtchouk矩不变量为:
式中:m,n≥0,p1,p2∈(0,1),ρ(m)≜ρ(m;p1,M),
式中:w(x)≜w(x,p1,M),w(y)≜w(y,p2,N),
由Krawtchouk矩不变量构造储粮害虫图像的形状特征向量:
1.3 储粮害虫图像的纹理和形状综合特征向量
为了避免特征向量元素因过大或过小而影响储粮害虫分类的准确率,首先将储粮害虫图像纹理特征向量H的元素和形状特征向量K的元素分别归一化,然后组合成综合特征向量。
设特征向量(纹理特征向量H或形状特征向量K)为 Γ=(Γ1,Γ2,...,Γi,...,Γt),t∈Z+,Γ中元素的最大值为Γmax,最小值为Γmin。设归一化后的特征向量为,则
按式(8)将H的元素和K的元素分别归一化后得到和,由此构成储粮害虫图像的综合特征向量为:
2 基于全局混沌蜂群优化SVM的储粮害虫分类
2.1 SVM多类分类
提取了储粮害虫图像的综合特征向量之后,需要寻求合适的分类器。由于储粮害虫的样本数相对有限,而支持向量机对小样本具有较优越的学习能力和较高的分类精度,考虑到支持向量机是两类识别模型,要识别多种储粮害虫,需要构造支持向量机多分类算法。常见的多分类算法有一对一、一对其余。针对J类分类问题,一对一算法需构造C2J个支持向量机,而一对其余算法仅需构造J个支持向量机,且适用于中小规模问题。因此选择一对其余算法,其原理为:每类训练样本有一个分类器,用以区分本类和剩余其他类训练样本,分类结果由分类间隔最大的分类器决定。
支持向量机需要选择合适的核函数变换到高维空间。鉴于高斯径向基核函数在缺乏先验知识环境下具有解决分类问题的能力,本研究即采用高斯径向基核函数的支持向量机作为分类器。该分类器涉及样本错分惩罚因子G和高斯径向基核参数δ。G和δ2个参数的正确选取直接影响样本的分类精度。
现采用全局混沌蜂群算法对惩罚因子G和核参数δ进行优化,以便达到最佳分类效果。
2.2 优化SVM惩罚因子和核参数的全局混沌蜂群算法
受蜂群采蜜模式的启发,建立起了基本人工蜂群优化算法。其主要特点是引领蜂、观察蜂、侦查蜂3种蜂群协作运行,通过局部寻优得到全局最优值。基本人工蜂群优化算法具有较强的全局搜索能力,但算法性能易受最大循环次数设定值的影响。如果最大循环次数设置得过小,可能难以搜索到最佳值;反之设置得过大,又会降低收敛速度,同时还可能因为遍历性不够,出现“早熟”现象。鉴于以上问题,将中心Tent映射的混沌序列引入到基本人工蜂群算法。中心Tent映射的数学表达式为:
在当前可能的全局最佳值连续σ次循环不变时,用中心Tent映射的混沌序列代替较差的食物源,继续搜索,直至可能的全局最佳值循环不变次数达到设定值τ时终止。这种改进后的人工蜂群算法(称之为全局混沌蜂群算法)能够提高算法的遍历性,加快收敛速度。
现利用全局混沌蜂群算法优化支持向量机的惩罚因子G和核参数δ,具体算法步骤:
1)设置算法的控制参数。设蜜蜂总数为40,引领蜂和观察蜂的个数各20,最大循环次数为20,跳出局部极值的次数界限CL为3,维数为2,G和δ的搜索范围分别为[0.1,1000]、[0.01,10],循环次数C的初始值为1,σ、τ分别设为3、6;
2)对引领蜂相应食物源的位置进行初始化。食物源的位置是二维向量,其2个分量各在G和δ的搜索范围之间随机产生;
3)首先计算训练样本的特征向量,供支持向量机进行训练;然后计算测试样本的特征向量,输入到训练后的支持向量机进行分类,并根据输出结果得到分类识别率,将其作为目标函数。
4)每1只引领蜂在其周围随机搜寻具有更高识别率的食物源;
5)引领蜂对应食物源的优劣程度决定观察蜂选择该引领蜂的概率,随后观察蜂进一步搜索。
6)如果经过CL次循环,某些食物源没有改善,用随机产生的新食物源代替。
7)当次循环结束时,储存当前全局最优解。如果连续σ次或σ+1次不变,利用中心Tent映射的混沌序列代替目前较差食物源。如果不变次数达到τ次,即得到全局最佳值,跳出循环,否则C自动加1;
8)若C达到最大循环次数,输出惩罚因子G和核参数δ的最佳值。否则,转第3步。
3 结果与分析
针对玉米象、锯谷盗和赤拟谷盗3种最为常见、危害最大的储粮害虫,进行了特征提取和分类试验。经过图像采集、灰度化、阈值分割步骤后,将害虫从储粮环境中提取出来,最后共获取78幅储粮害虫图像(每种害虫图像26幅),每幅图像的大小为128×128、灰度级数为256。图像中害虫种类已在图像采集前经过生物鉴定。图2为其中6幅分割后的储粮害虫图像。随机选取每种害虫的10幅图像作为全局混沌蜂群算法优化后支持向量机的训练样本,其余16幅图像作为分类的测试样本。
图2 分割后的储粮害虫图像
对储粮害虫图像进行特征提取时,须设置扩展Shearlet变换和Krawtchouk矩不变量的相关参数。经过大量试验和比较,参数设置:扩展Shearlet变换的分解层数L=4,j=1,2,3,4,χ=[2 2 3 4],D=[2 2 1 1],则纹理特征向量H的维数为56;Krawtchouk矩不变量的阶数m+n=3,形状特征向量K的维数为6。从而,综合特征向量Π的维数为62。
具体步骤:
1)对储粮害虫图像进行扩展Shearlet变换,依据式(4)提取其纹理特征向量H;计算储粮害虫图像的Krawtchouk矩不变量,由式(7)构造其形状特征向量K;按照式(9)将这2种特征向量组合为储粮害虫图像的综合特征向量Π;
2)将30组储粮害虫图像的综合特征向量作为训练样本数据,载入支持向量机进行训练,将剩余48组综合特征向量作为测试样本数据,输入支持向量机进行分类,用全局混沌蜂群优化算法选取达到最佳分类识别率的参数;
3)利用优化后的支持向量机对玉米象、锯谷盗和赤拟谷盗3种害虫的任一图像进行分类识别。如果要识别其他种类害虫,可按照类似方式进行。
结果得出当支持向量机的惩罚因子G=814.58、核参数δ=1.33时,分类识别率最高。为了验证方法的有效性,将本研究提出的基于扩展Shearlet变换、Krawtchouk矩不变量及全局混沌蜂群优化支持向量机的储粮害虫分类方法,与基于Gabor小波和SVM方法、基于Krawtchouk不变矩和SVM方法进行了比较。表1为3种方法的分类结果。其中,方法A、方法B、方法C分别表示基于Gabor小波和SVM方法、基于Krawtchouk不变矩和SVM方法及本方法。计算3种方法对应的识别率,列于表2。
从表1可以看出,方法A判断错误的图像为第12、15、27、29、33、44、45、47、48帧;方法 B判断错误的图像为第 2、24、26、27、29、30、32、47;方法 C判断错误的图像为第34帧。对于方法A和方法B仅1种方法误判的第 2、12、15、24、26、30、32、33、44、45、48图像,方法C都做出了正确判断;而对于方法A和方法B同时判断错误的第27、29、47帧图像,方法C也同样都做出了正确判断。表1中序号12为图2b、序号24为图2c,图2b和图2c中害虫皆有缺陷。图2b的玉米象纹理不显著,基于Gabor小波方法未能识别;图2c的锯谷盗肢体缺失导致形状不完整,基于Krawtchouk不变矩方法判断错误。由此表明,Gabor小波的纹理特征提取方法或基于Krawtchouk不变矩的形状特征提取方法失效的情况下,本研究提出的基于扩展Shearlet变换、Krawtchouk矩不变量的纹理和形状综合特征提取方法能够有效地识别储粮害虫图像。再由表2可知,基于Gabor小波和SVM
表1 3种方法的分类结果
表2 3种方法的识别率比较
采集有些害虫图像时,可能受到粮食颗粒、光照等影响,产生图2所示的纹理不显著、局部变形或害虫肢体缺失等不利因素。对这些样本仅仅提取单一的纹理特征或者形状特征,不能充分地表示储粮害虫图像特征,影响了支持向量机的准确训练和分类。此外,Gabor小波变换捕捉细节能力的不足,也降低方法对赤拟谷盗的识别率较低,基于Krawtchouk不变矩和SVM方法对锯谷盗的识别能力较差。而本研究提出的方法对玉米象、锯谷盗和赤拟谷盗的分类识别率都很高,说明本研究提出的基于扩展Shearlet变换、Krawtchouk矩不变量及全局混沌蜂群优化支持向量机方法是一种行之有效的储粮害虫分类识别方法。了储粮害虫分类水平。而依据扩展Shearlet变换提取纹理特征,用Krawtchouk矩不变量描述形状特征,能够优势互补,更加完整地描述储粮害虫图像特征。其对图像中储粮害虫的纹理或形状缺陷有较强的抗干扰性,有利于支持向量机的分类识别。
4 结论
针对储粮害虫图像,提出了一种基于纹理和形状的分类识别方法。首先,依据扩展Shearlet变换提取储粮害虫图像的纹理特征,用Krawtchouk矩不变量描述其形状特征,2种特征相结合构成储粮害虫图像的综合特征向量;然后利用SVM对其进行分类识别,采用改进后的全局混沌蜂群算法优化支持向量机的惩罚因子和核参数,使分类性能达到最优。该方法充分利用了扩展Shearlet变换和Krawtchouk矩不变量特征提取方面的优势,具有更好的识别效果。结果表明,与基于 Gabor小波和 SVM方法、基于Krawtchouk不变矩和SVM方法相比,本研究提出的基于扩展Shearlet变换、Krawtchouk矩不变量及全局混沌蜂群优化支持向量机的储粮害虫分类方法,具有更好的分类识别性能,有更强的鲁棒性,可望在储粮害虫自动检测中得到广泛应用。
[1]范艳峰,吴建军,甄彤.基于属性降维的粮库害虫检测与识别[J].微电子学与计算机,2006,23(11):12-15
[2]Pearson T C,Brabec D L,Schwartz C R.Automated detection of internal insect infestations in whole wheat kernels using a Perten SKCS4100[J].Applied Engineering in Agriculture,2003,19(6):727-733
[3]Ridgway C,Davies E R,Chambers J,et al.Rapid machine vision method for the detection of insects and other particulate bio-contaminants of bulk grain in transit[J].Biosystems Engineering,2002,83(1):21-30
[4]郭敏,秦昕,马苗.基于图像处理的谷物检测与识别方法研究进展[J].中国粮油学报,2012,27(4):123-128
[5]毛罕平,张红涛.储粮害虫图像识别的研究进展及展望[J].农业机械学报,2008,39(4):175-179
[6]张红涛,毛罕平,邱道尹.储粮害虫图像识别中的特征提取[J].农业工程学报,2009,25(2):126-130
[7]胡玉霞,张红涛,罗康,等.基于ACO-SVM的粮虫特征提取研究[J].安徽农业科学,2012,40(6):3781-3782,3785
[8]赵娟.基于Gabor小波与支持向量机对储粮害虫分类识别[J].计算机与现代化,2008,(4):67-69,73
[9]胥斌,唐远炎,房斌.基于剪切波变换的纹理图像分类[J].计算机工程与应用,2011,47(29):15-17,68.
[10]皱修国,丁为民,刘德营,等.基于4种不变矩和BP神经网络的稻飞虱分类[J].农业工程学报,2013,29(18):171-178.
[11]许振伟.BP神经网络分类器在储粮害虫图像检索中的应用研究[J].中国粮油学报,2010(1):103-106
[12]甄彤,范艳峰.基于支持向量机的储粮害虫分类识别技术研究[J].计算机工程,2006,32(9):167-169
[13]胡玉霞,张红涛.基于模拟退火算法-支持向量机的储粮害虫识别分类 [J].农业机械学报,2008,39(9):108-111
[14]Guo K,Labate D.Optimally sparsemultidimensional representation using Shearlets[J].SIAM Journal on Mathematical Analysis,2007,39(1):298-318
[15]Easley G,Lim W,Labate D.Sparse directional image representations using the discrete Shearlet transform[J].Applied and Computational Harmonic Analysis,2008,25(1):25-46
[16]Wang-Q Lim.The discrete Shearlet transform:A new directional transform and compactly supported Shearlet frames[J].IEEE Transactions on Image Processing.2010,5(19):1166-1180
[17]吴一全,朱丽,周怀春.基于Krawtchouk矩和支持向量机的火焰状态识别[J].中国电机工程学报,2013,33:1-7
[18]Zhang L,Xiao W,Qian G,et al.Rotation,scaling,and translation invariant local watermarking technique with Krawtchouk moments[J].Chinese Optics Letters,2007,5(1):21-24.
A Classification Method of Stored-Grain Pests Based on the Extended Shearlet Transform,Krawtchouk Moment and SVM
Wu Yiquan1,2Wang Kai1Tao Feixiang1
(College of Electronic and Information Engineering,Nanjing University of Aeronautics and Astronautics1,Nanjing 210016)(Jiangsu Key Laboratory of Quality Control and Further Processing of Cereals and Oils,Nanjing University of Finance Economics2,Nanjing 210046)
To further improve the recognition accuracy of stored-grain pests and control stored-grain pests in amore effective way,a classificationmethod of stored-grain pests has been proposed based on the synthetic features combining texture feature with shape feature and Support Vector Machine(SVM)to be optimized by global chaotic bee colony algorithm.First,an image with stored-grain pests was decomposed by the extended shearlet transform;means of energy distribution were calculated by transform coefficients;texture feature vector was produced with the weighted energy distribution.The shape feature vector of stored-grain pestswas represented by Krawtchouk moment invariants.Second,the normalized texture feature vector and the normalized shape feature vector were combined to form the synthetic feature vector of stored-grain pests.Finally,the kernel parameter and the penalty factor of support vectormachine were optimized with global chaotic bee colony algorithm;the optimized support vectormachine was applied for classification of stored-grain pests.The experimental results showed that compared with themethod based on Gabor wavelet and SVM and themethod based on Krawtchouk moment invariants and SVM,the proposed method extracted more complete characteristic information of stored-grain pestswith higher recognition rate.
classification of stored-grain pests,texture feature,shape feature,extended shearlet transform,Krawtchouk moment invariants,support vectormachine,global chaotic bee colony algorithm
S24;TP391.41
A
1003-0174(2015)11-0103-07
江苏省粮油品质控制及深加工技术重点实验室开放基金(LYPK201304),江苏高校优势学科建设工程资助(20111008)
2014-04-20
吴一全,男,1963年出生,教授,图像处理与计算机视觉