基于广义回归神经网络的小麦碰撞声信号分类*
2020-08-11张丽娜马巧梅
张丽娜 马巧梅
(宝鸡文理学院计算机学院 宝鸡 721016)
1 引言
据国家粮食局统计,全国粮食库存居于历史最高点,且1/6的粮食储存在简易仓囤,并且随着我国粮食产量的持续增加,粮食存储存在设施能力严重不足、物流通道不畅、质量安全隐患较大、粮情监测预警滞后、粮食产后损失浪费严重等问题。我国基层农户存粮约占全国粮食年总产量的一半左右,但由于储存条件差、设施简陋等原因,农户储粮损失比例约为8%左右,安全储粮面临前所未有的困难与挑战,保障粮食储存安全迫在眉睫。
随着检测技术的发展以及各项新技术的应用,在传统的储粮害虫检测方法之外,近红外光谱法、X射线法、微波雷达法、图像识别法、电子鼻法和声检测法也正被广泛应用,这些方法各有利弊,其中国内外对于储粮害虫声音检测方法也已具备一定成果,将粮食颗粒经过碰撞装置产生超声或者可听声,使用各种多种模式识别方法再对声音信号进行进一步分类识别。
广义回归神经网是基于径向基函数网络一种改进,相对传统神经网络不需反复训练且对样本数量要求不高,并具备训练速度快等优点,使其具有很大优势[1]。因此,本文以小麦碰撞声检测装置为基础,提出一种基于广义回归神经网络的小麦碰撞声信号分类方法,实现对小麦完好粒和虫害粒的识别与分类。
2 小麦碰撞声系统的基本结构
郭敏团队研究设计了一个基于声特征的粮食颗粒碰撞信号分类装置[2],研究在此基础上,创新性地使用广义回归神经网络用于声音信号的识别,系统结构如图1所示,将粮食颗粒经过碰撞声装置产生可听声,使用专业录音设备采集声音数据,计算机对原始数据进行去噪、截取有用信号等预处理操作,随后提取粮食声音信号的特征参数,使用广义回归神经网络分类得到识别结果。
图1 碰撞声信号识别系统结构
3 广义回归神经网络
3.1 GRNN原理
广义回归神经网络由美国学者Specht D.F.[3]在1991年提出,其原理是基于人脑的神经元细胞对外界反应的局部性,并具备全局逼近和最佳逼近的优点。与BP神经网络类似,它是由输入层、隐层和输出层构成的3层前向网络。网络的第1层为输入层,将输入信号传输至隐层,其数目等于样本输入向量的维数[4~6],隐层节点函数为辐射状的高斯函数,输出节点由特定的线性函数构成。其基本原理如下描述。
设j维向量,x=[x1,x2,…xj]T为过程的输入向量,对应输出向量为y,随机变量x和y的联合概率密度函数为f(x,y)。由于GRNN的理论基础是非线性回归分析,通过给定x的值,计算相应y的条件数学期望进行回归。GRNN估计和的联合概率密度函数,来建立一个估计的概率模型。通过训练输入输出集,利用非参数密度估计法构建PDF估计器。对于给定的输入向量x,假设被估计函数连续且光滑,则估计y的期望值为[7~9]
连续概率密度函数函数f(x,y)可定义为[10~11]
其中,xi,yi分别为随机变量x和y的第i个样本值,σ为平滑参数,p为随机变量x的维数,k为样本数量[12]。
3.2 GRNN模型的拓扑结构
GRNN的拓扑结构如图2所示,具有输入层、模式层、求和层和输出层4层网络结构。算法描述如下。
1)将样本输入至输入层,如图1所示,输入层的节点数目等于输入向量的维数p,随后将输入向量的各元素传送至模式层。
2)模式层的节点数等于训练样本数目,其传递函数为
3)求和层有两种类型的节点,第一种类型仅包含一个神经元,对所有模式层神经元的输出进行算术求和,模式层各神经元与该神经元的连接权值为1,其传递函数为;第二种类型包含剩余节点对所有模式层神经元的输出进行加权求和,求和神经元j的传递函数其中,yij为模式层中第i个神经元与求和层中第j个求和神经元之间的连接权值为第i个输出样本Yi中的第j个元素[13]。
4)输出层中的节点数目等于学习样本中输出向量的维数m[14]。
图2 GRNN的拓扑结构
3.3 GRNN的优势
1)网络结构相对简单,除了输入和输出层外,一般只有两个隐藏层,模式层和求和层。而模式中隐藏单元的个数,与训练样本的个数是相同的。
2)网络训练非常简单。当训练样本通过隐藏层的同时,网络训练随即完成。而不像前馈神经网络一样,需要非常长的训练时间和高的计算成本。
3)由于简单的网络结构,我们不需要对网络的隐藏层数和隐藏单元的个数进行估算和猜测。由于它是从径向基函数引申而来,因此只有一个自由参数,即径向基函数的平滑参数。而它的优化值可以通过交叉验证的方法非常容易得到。
4)网络计算结果的全局收敛性。标准的前馈神经网络的计算结果则会经常不能达到全局收敛,而停止在局部收敛。
4 试验方法
4.1 数据采集
实验中采用小麦作为粮食样本,所有样本均来自陕西省某农户粮仓,实验共随机选择霉变小麦、无损小麦、发芽小麦和虫害小麦各500颗,分别使2000颗小麦颗粒经过碰撞声信号识别系统,并录制碰撞声音,使用希尔伯特黄变换方法提取声音特征,最后利用广义回归神经网络对小麦颗粒进行分类识别。实验将每类声信号随机分为两部分,作为训练样本和测试样本。
4.2 特征提取
实验中,分别对四类声音信号的时域和频域特征进行分析,组建特征库,使用高频带能量、最强IMF中心频率、时频熵、残差平方和、方差等五种频域、时域特征作为识别受损小麦与完好小麦的有效特征,特征含义如表1所示。
表1 有效特征含义
4.3 网络训练
神经网络训练指的是向网络输入足够多的样本,通过一定算法调整网络结构,使网络的输出与预期值相符。一个神经网络的搭建,需要满足三个条件:输入和输出;权重(w)和阈值(b);多层感知器的结构。神经网络的运作过程如下:确定输入和输出;找到一种或多种算法,可以从输入得到输出;找到一组已知答案的数据集,用来训练模型,估算w和b;一旦新的数据产生,输入模型,就可以得到结果,同时对w和b进行校正。
根据学习环境中教师信号的差异,GRNN的训练属于有监督式训练,共分两个步骤:第一步为无教师式训练,确定训练输入层和隐层间的权值;第二步为有教师训练,根据提供的目标向量集来训练生成隐层和输出层之间的权值矩阵。
根据GRNN神经网络的结构特征,确定网络的输入层和输出层神经元的数目分别为输入的特征向量维数和小麦类型数,由于实验中包含小麦完好粒和虫害粒,因此待分类的样本种类为4,对应的输出层的节点数也相应确定为4。本文采用二进制形式表示四类小麦碰撞声信号的仿真结果,令小麦完好粒的对应输出为0001,虫害粒的对应输出为0010,霉变粒的对应输出为0100,发芽粒的对应输出为1000。并通过Matlab编程实现。具体程序如下:
net=newgrnn(p1n,t1n,SPRAD);其中p1n为声音数据p经过归一化处理后的数据,t1n为发病率数据t经过归一化处理后的数据,SPRAD为光滑因子。y=sim(net,p1n);网络模拟。t2n=sim(net,p2n);网络仿真与预测,最终确定光滑因子进行PRRS发病预测,检验t2值与PRRS实际发病率值拟合程度是否令人满意。
4.4 实验一:4类小麦颗粒检测实验及结果
实验一中,将小麦完好粒、虫害粒、发芽粒和霉变粒4类小麦颗粒作为实验对象,使用广义回归神经网络的分类结果如表2所示,训练样本和采样样本数量均为250粒,测试函数建模实验结果表明,识别率分别为76%、44%、50%、68%,无法得到较为满意的识别率[15]。
表2 分类结果
4.5 实验二:3类小麦颗粒检测实验及结果
表3 分类结果
重新选择实验对象,将外部特征比较明显的发芽颗粒借助肉眼识别,使用系统提取小麦完好粒、虫害粒和霉变粒碰撞声特征,并使用广义回归神经网络得到的识别结果如表3所示,训练样本和采样样本数量均为250粒,可以看出,此时可以较好地识别同种类小麦的三种不同类型,并且识别率可达到80%以上。说明了通过对小麦碰撞声信号使用恰当数字信号处理方法进行特征提取,并借助广义回归神经网络可以得到较好的识别率[2]。
5 结语
本文在团队前期研究成果基础上,将四类小麦颗粒通过碰撞声装置提取到声音特征,并采用广义回归神经网络对其进行分类识别,并没有得到比较好的识别效果。实验将外部特征比较明显的发芽颗粒人工挑选出,再使用同样的方法对剩余三类信号进行分类识别,取得了高于80%的识别率,测试函数建模实验结果表明,该方法能有效提高建模精度和模型泛化能力,为进一步实现小麦病虫害颗粒自动化检测提供了有效的方法。
未来可以对系统进行进一步改进,比如:进一步提高硬件设备的实验精度;研究特征提取方法,采用特征融合进一步提高识别率;采用多种模式识别方法进行分类识别;针对识别率较低的四类麦粒类型,考虑结合图像识别方法提高对小麦发芽粒的识别效果。