APP下载

基于双谱和支持向量机的小麦碰撞声分类研究

2013-07-27张严严

计算机工程与应用 2013年23期
关键词:双谱虫蛀对角

张严严,郭 敏

陕西师范大学 计算机科学学院,西安 710062

基于双谱和支持向量机的小麦碰撞声分类研究

张严严,郭 敏

陕西师范大学 计算机科学学院,西安 710062

1 引言

小麦在储藏期间,易发生虫害和霉变,导致小麦质量下降,有效地检测和防治工作显得尤为重要。常见的储粮检测方法有粮食探管法、机器视觉检测法、电导率检测法、近红外反射光谱法、软X线成像法等[1]。但这些方法存在劳动强度大、代价高等缺陷。因此,具有轻便、简单、快捷、廉价等优势的声检测技术日益成为该领域的研究热点[2]。

近年来,在声检测领域,碰撞声技术因其方便、快捷得到广泛应用。2001年,Pearson等人首次采用声碰撞技术实时分析开心果碰撞钢板声,根据碰撞声信号的不同,分离壳未开和已开的开心果,分类正确率约为97%[3-4]。2007年,Pearson等人利用碰撞声信号检测小麦虫蛀粒(Insect Damaged wheat Kernels,IDK),从时域信号建模和短时窗方法等方面处理信号,用神经网络进行特征分类,识别IDK准确率为87%[5]。2007年,Ince等人利用碰撞声信号检测裂壳榛子和小麦IDK,根据Fisher判别准则对自适应分段声信号提取特征,进行分类,对完好中破损榛子和完好小麦中IDK识别率均达90%以上[6]。2008年,Elbatawi等人把碰撞声分类系统用于土豆块空心病识别,根据完好土豆块碰撞声幅度大于空心块茎、峰值频率高于空心块茎的特点,提取信号三部分特征进行分类,准确率约98%[7]。2012年,Khalesi等人采集了两个胡桃品种的碰撞声,采用时域和基于FFT变换的频域分析方法提取信号特征,用多层前馈神经网络进行分类,识别率达90%以上[8]。

本文采用双谱和支持向量机(Support Vector Machine,SVM)相结合的方法,对小麦完好粒、虫蛀粒和霉变粒碰撞钢板声信号进行识别研究。首先对信号进行双谱估计,提取信号双谱峰值和对角切片谱两部分特征,再用支持向量机分类器进行分类,得到了较高的识别率,本研究为麦粒分拣提供了一种新途径。

2 实验原理

2.1 双谱理论

高阶统计分析由于在处理非高斯和非线性信号方面的特殊性质,逐渐成为一种信号分析和特征提取的有效技术[9]。近年来,高阶谱在信号检测、参数估计、目标分类等方面都受到极大关注,粮食碰撞声信号本质上是非平稳、非高斯信号,因此可利用高阶谱进行研究分析。高阶谱中双谱的阶数最低,计算较为简单,且包含了高阶谱的所有特征,所以本文采用基于双谱的特征提取方法。

双谱可以由信号的离散傅里叶变换表示:

式中,X(ωi)为信号的离散傅里叶变换;ωi为频率变量;i= 1,2。并且双谱具有以下性质:

本文采用直接法进行双谱估计。对于一有限长度的信号,先估计其傅里叶值,然后对该信号作三重相关运算,即可得到双谱的估计。估计时采样频率设为 fs,Δ0=fs/L是双谱区域内沿水平和垂直方向上两频率采样点之间的间隔,采样点数为L,步骤如下:

(1)将数据L分成N段,每段M个数据,即L=NM,每段减去均值(为便于做FFT算法,可在每段补零)。

(2)对每段数据作DFT变换,即

其中,λ=1,2,…,M-1;i=1,2,…,N。

(3)取M=M1L0,M1为正的奇数,即:M1=2S1+1,适当选择L0使得M为偶数,根据DFT系数,得到每段数据的双谱:

2.2 支持向量机

支持向量机是在统计学习理论的基础上发展起来的新一代学习算法。其基本思想为:先通过非线性变换将输入空间变换到一个高维空间,即将非线性问题转换成高维特征空间中的线性问题进行分类,然后在这个新空间中求取最优分类面,这种变换是通过定义适当的内积函数来实现的。支持向量机中所求得的分类函数在形式上类似于神经网络,输出是若干中间层节点的线性组合,每个中间层节点对应于输入样本与一个支持向量的内积,又被称为支持向量网络。

支持向量机关键在于内积函数(核函数)选择。低维空间向量集映射到高维空间,增加了计算复杂度,而核函数正好巧妙地解决了这个问题,只要选用适当的核函数,就可以得到高维空间的分类函数。

3 基于双谱和支持向量机的小麦分类识别

首先对信号进行直接双谱估计,得到双谱等高线图,然后从两方面提取特征:(1)提取双谱峰值;(2)提取对角切片谱的谱峰。最后,在支持向量机分类器中对样本进行分类,分类过程分为两步:样本训练和样本测试。样本训练用核函数将样本映射到高维空间,在该空间中计算支持向量和最优分类面。测试时,用训练得到的最优分类面判别映射到高维空间的测试样本,确定测试样本分类编号,根据分类编号计算识别率。基于双谱和支持向量机的分类识别流程如图1所示。

图1 实验流程图

3.1 双谱分析

实验中,取小麦完好粒、虫害粒和霉变粒各300粒,麦粒掉落在24 cm×11 cm×0.06 cm的钢板上,掉落高度为50 cm,钢板的水平倾斜角度为30°,用型号为舒尔BG 4.1的专业麦克风录制碰撞声信号,并传送至装有MAYA 44声卡的计算机中,采样频率为48 000 Hz,完好粒、IDK和霉变粒各采集100个声信号。由于有效碰撞声只集中在很小一段样本点内,为减少计算量,提高处理速度,对信号双谱估计前先进行预处理,提取出有效信号。

3.1.1 双谱估计

计算时,将长为6 144的样本点分为128段,经估计得到一个256×256的双谱幅度谱Bx( ) ω1,ω2,图2给出了3类小麦碰撞声的双谱等高线及三维图,不同声信号差别显著。

双谱等高线图中:

(1)完好粒的幅值分布范围较广,几乎覆盖低频及高频区域。

(2)虫蛀粒幅值在低频部分没有分布,只在高频区域疏散分布。

(3)霉变粒幅值主要集中在低频部分,围绕着(0,0)周围分布。

双谱三维图中:

(1)完好粒的峰值比较密集,其峰值大小和虫蛀粒处于一个数量级。

(2)虫蛀粒的峰值密度最少,但其峰值是三者中最大的。

(3)霉变粒的峰值相对较少,其峰值是三者中最小的。

这种差别的主要原因与3类麦粒物理结构不同有关。虫蛀的麦粒结构会因为害虫的洞穴而被改变,其碰撞钢板时会发生共振,声音散列。而发生霉变的麦粒会使胚乳多空,麦粒收缩,重量减轻,碰撞钢板的力度较小,声音偏低。综上可见:麦粒的内部构造发生变化时,会造成它们碰撞钢板的声音有差别,这种差别在双谱中表现显著。

3.1.2 特征提取

本文从以下两方面提取特征:

(1)提取双谱峰值

双谱的谱峰是反映双谱结构的一个重要参数。在双谱三维图中,按1/256的间隔沿Y轴做平行于XZ平面的等间隔截面,可得到双谱的256个截面,取各截面最大双谱值作为特征向量,得到一个256维的特征向量。图3为小麦碰撞声信号双谱峰值图。

(2)提取对角切片谱

对角切片是指当ω1=ω2时,B(ω1,ω2)中对应的双谱值。双谱的对角切片包含有丰富的特征信息,切片谱的谱峰及形态决定了双谱的结构,同时也反应了信号的特征。图4是3类声信号的对角切片图,差异显著,因此本文提取了对角切片谱的256个谱峰作为特征向量。

3.2 支持向量机分类识别

3.2.1 最优核函数参数和惩罚参数选取

实际分类中,支持向量机性能的优劣依赖于核函数和惩罚参数的选取。不同核函数对应于不同算法,会产生不同的支持向量点和分类面,最终对分类结果产生很大影响。

图2 3类小麦碰撞声双谱等高线图

图3 3类小麦碰撞声的双谱峰值图

图4 3类小麦碰撞声双谱对角切片图

SVM对核函数的要求有两点:(l)必须满足Mercer条件;(2)在高维空间中可以构造一个支持向量数相对较少的最优分类界面。目前,较常用的核函数有3种:径向基核函数、多项式核函数、Sigmoid核函数。经实验对比,本文选择分类正确率较高且计算量最小的核函数—重尾径向基函数(HTRBF),与普通径向基函数相比,它具有指数级延迟率,公式为:它包含a、b两个参数,默认 ρ=1,x代表声音样本,yi代表第i个支持向量。对于HTRBF函数,不同的b值代表不同的分布,但是当且仅当0≤b≤2的时候,HTRBF函数满足Mercer条件,所以,根据SVM核函数的要求,b的取值只可在0到2之间。b的经典取值有以下3种:b取0.5时,代表Sublinear分布;b取1.0时,代表Laplacian分布;b取2.0时,代表Gaussian分布。参数a的选择不影响Mercer条件,但a取值在0和1之间时,会决定支持向量数的衰减速度,从而影响计算复杂度。

表1为a、b取不同值时对应的识别正确率,其中,b= 2.0,a=0.25时,识别率最高,但分类不均匀,完好粒的识别率相对较低,因此这对参数不是最佳取值;同理b=1.0,a= 0.5时,分类也不均匀;故本文选择b=2,a=0.125的核函数作为支持向量的核函数。

表1 不同核参数的SVM识别正确率(%)

惩罚参数是为了解决样本在高维空中的不完全线性可分问题,而合适的参数C也可以降低误分率。核函数参数固定后,进行惩罚参数C的选择,表2为C取不同值时的识别正确率。表中,C≥4时,识别结果均为88%。由于C值越大,算法的时间复杂度就越高,因此本文选择惩罚参数值C=22=4。

表2 不同惩罚参数的SVM识别正确率(%)

3.2.2 分类结果

选取每类碰撞声样本100个,其中50个用于训练,另外50个进行测试,识别结果如表3所示。3类声音信号的正确识别率均达到84%以上,且虫蛀粒的正确率高达94%。这表明,小麦碰撞声双谱特征明显,支持向量机分类效果良好,尤其对虫蛀粒识别效果最好。

表3 3类小麦碰撞声的识别结果

4 结束语

不同麦粒碰撞声所含信息之间存在差异,本文对3类小麦碰撞声进行分析,提取了双谱峰值和对角切片谱值作为分类依据,用支持向量机进行识别。得出以下结论:

(1)麦粒的内部构造发生变化时,会造成它们碰撞钢板的声音有差别,这种差别在双谱中表现显著。

(2)结合双谱和支持向量机方法能够有效地提取碰撞声特征,分类效果较好,为小麦粒的识别研究提供了新方法,同时也为其他农作物的分类研究提供了参考。

[1]胡丽华,郭敏,张景虎,等.储粮害虫检测新技术及应用现状[J].农业工程学报,2007,23(11):286-290.

[2]耿森林,尚志远.储粮害虫声检测技术研究进展与展望[J].农业工程学报,2006,22(4):204-207.

[3]Pearson T C.Detection of pistachio nuts with closed shells using impactacoustics[J].Applied Engineering in Agriculture,2001,17(2):249-253.

[4]Pearson T C,Cetin A E,Tewfik A H.Detection of insect damaged wheatkernelsby impactacoustics[C]//ICASSP,2005:649-652.

[5]Pearson T C,Cetin A E,Tewfik A H,et al.Feasibility of impact-acoustic emissions for detection of damaged wheat kernels[J].Digital signal processing,2007,17:617-633.

[6]Ince N F,Onaran I,Tewfik A H,et al.Wheat and hazelnut inspection with impact acoustics time-frequency patterns[C]// ASABE Meeting,2007.

[7]Elbatawi I E.An acoustic impact method to detect hollow heart of potato tubers[J].Biosystems Engineering,2008,100:206-213.

[8]Khalesi S,Mahmoudi A,Hosainpour A,et al.Detection of walnut varieties using impact acoustics and Artificial Neural Networks(ANNs)[J].Modern Applied Science,2012,6(1):43-49.

[9]严可国,柳亦兵,徐鸿,等.基于双谱分析的大型汽轮机振动故障特征提取[J].中国电机工程学报,2007,30(2):98-103.

ZHANG Yanyan,GUO Min

College of Computer Science,Shaanxi Normal University,Xi’an 710062,China

In order to realize the automatic classification of wheat kernels,a new approach that combines the bispectrum and support vector machine is introduced to classify and recognise wheat impact sounds of undamaged kernels,insect damaged kernels and moldy kernels.The impact acoustic signals are processed by bispectrum estimation.Features in bispectrum and diagonal slices spectrum are extracted.Then the features are classified in support vector machine.The recognition accuracy rates in classification of undamaged kernel,insect damaged kernel and moldy kernel are above 84%.The experimental results show that this research has a more comprehensive value in application,and it provides a new method for wheat kernels classification.

wheat impact acoustic signals;bispectrum estimation;support vector machine

为实现小麦颗粒的自动分类,采用双谱和支持向量机相结合方法对小麦完好粒、虫蛀粒和霉变粒的碰撞声进行分类识别。对碰撞声信号进行双谱估计,提取信号双谱峰值和对角切片谱两部分特征,用支持向量机分类器进行分类,对完好粒、虫蛀粒和霉变粒3种小麦颗粒识别正确率均达84%以上。实验结果表明,该研究具有较强的实际应用价值,为小麦颗粒的分类提供了新的方法和依据。

小麦碰撞声;双谱估计;支持向量机

A

TP391.42

10.3778/j.issn.1002-8331.1202-0357

ZHANG Yanyan,GUO Min.Study on classification of wheat impact acoustic signals based on bispectrum and support vector machine.Computer Engineering and Applications,2013,49(23):203-206.

国家自然科学基金(No.10974130);陕西省教育厅科研计划项目(No.11JK0519)。

张严严(1988—),女,硕士研究生,主要研究方向:信号处理、模式识别;郭敏(1964—),通讯作者,女,博士,教授,主要研究领域:数字信号处理及模式识别研究。E-mail:zhangyan-157@163.com

2012-02-20

2012-05-08

1002-8331(2013)23-0203-04

猜你喜欢

双谱虫蛀对角
拟对角扩张Cuntz半群的某些性质
建设性舆论监督:让公共治理的“大树”免遭“虫蛀”
朱森林养生漫画
朱森林养生漫画
双谱图在语音分析中的应用
虫蛀川芎挥发油成分GC-MS研究
基于双谱特征融合的通信辐射源识别算法
基于小波包域双谱的风力机振动信号监测方法研究
基于倒双谱的地震子波估计方法
非奇异块α1对角占优矩阵新的实用简捷判据