基于BP和SOM神经网络的电子鼻识别方法研究
2018-07-28陈佩峰
陈佩峰
摘要:电子鼻是一种模仿生物嗅觉的综合仿真系统,它可以用来辨别许多复杂的样本,其中用于辨别和分析气体化学成分的仿真系统应用较为广泛,而对复杂混合气体的分析判断和定性识别是电子鼻技术应用的重要方面。本文在分析研究电子鼻原理和基本构成的基础上,重点运用误差回传神经网络(BP)和自组织特征映射网络(SOM)神经网络进行电子鼻系统的定性识别,对三种气体传感器(一氧化碳CO、二氧化硫SO2、二氧化氮NO2)输出的数据进行了仿真、分析和识别,仿真结果表明这两种方法的识别准确率都能达到100%。并且自组织特征映射网络(SOM)算法的识别能力在整体上要优于误差回传神经网络(BP)算法。
关键词:电子鼻;误差回传神经网络(BP)算法;自组织特征映射网络(SOM)算法;MATLAB仿真
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)11-0168-04
Identify Method for Electronic Nose Based on BP and SOM Neural Network
CHEN Pei-feng
(Jilin Radio and Television University, Changchun 130022,China)
Abstract: Electronic nose ,a novel system ,is used to measure the chemical composition of gas, which is designed like the biological olfactory system .To identify the complicated odor is the important aspect of the application electronic nose. Based on the study of the theory and constituent of the electronic nose system, Back-Propagation Neural Network (BP) and Self-Organizing Feature Map (SOM), the two kinds of neural network models application to the qualitative analysis in an electronic nose system are utilized in the paper. And the dates output from three gas sensors (CO,SO2,NO2) are emulated, analyzed and identified. The result shows that preciseness rate of the two recognitions reaches 100%. Through this emulation, the identify capacity of SOM is better than BP in entirety.
Key words: electronic nose;Back-Propagation Neural Network (BP); Self-Organizing Feature Map (SOM);MATLAB simulation
电子鼻是一种模仿生物嗅觉的综合仿真系统,它可以用来辨别许多复杂的样本,其中用于辨别和分析气体化学成分的仿真系统应用最为广泛,而这种应用中,对复杂混合气体的分析判断和定性识别是电子鼻技术应用的重要方面。研制开发的一个用来监测、识别和分析气体的系统[1],其主要目的是把几种气体传感器通过微电子集成,形成一个多传感器的仿真系统,通过这个传感器系统,同时感应多种气体成分,达到检测、识别和分析气体的功能[2]。
近几年来,随着国内外对电子鼻系统研究的深入,研究人员对电子鼻的识别算法研究也越来越多,越来越深入。如:针对普通BP网络一些缺点,王平[3]等采用了具有侧向联想较强识别能力的SOM网络,实现了七种特殊气体的辨识分析,其平均识别正确率均为91%以上,达到甚至高于常人的识别能力。尽管如此,但由于SOM采用的是欧氏距离,样本的相关性和整体性都较差,为此王平、谢军[4]等提出了一种把RBF和FCMA结合起来的算法,该算法具有FCMA的性能好,速度快等优点,而且样本的相关性和样本集的整体特性都很强。此外,肖人岳、郑思平等 [5]针对SOM的网络结构中存在对新生成神经元的限制和人工需预先给定神经元阈值的这两个缺点,提出了改进的SOM算法。该算法不僅可以排除噪声和异常数据,无需预设神经元数目,解决了新生神经元限制,而且可以实现自组织无监督式学习。通过对人体细胞样本特征集的分析,算法可以在剔除异常数据点的同时,较好的实现对良性细胞样本和恶性细胞样本的聚类。王岩,陈向东,赵静[6]等人的基于FastICA和神经网络的模式识别研究更是将电子鼻识别气体的准确率再次提高。冯伟和胡上序采用的基于神经网络的杂交算法而进行的3种化学品的实验识别证明,该方法的识别准确率可以达到95%,是更好的模式分类方法。朱培逸、顾晓云[7]等人利用SOM网络,对检测不同储存时长的大闸蟹所得气味数据进行分析,将多维传感器特征数据作为网络输入层节点,将样本所对应的不同储存天数作为输出层节点,其评价准确率为95%,他们认为SOM网络模型能够有效地评价大闸蟹新鲜度,该研究为电子鼻实现活体水产品新鲜度无损检测提供了理论依据。
本文运用误差回传神经网络(BP)和自组织特征映射网络(SOM)神经网络进行电子鼻系统的定性识别,对三种气体传感器(一氧化碳CO、二氧化硫SO2、二氧化氮NO2)输出的数据进行了仿真、分析和识别。
1电子鼻的结构和工作原理
1.1 电子鼻的结构
电子鼻由软件部分和硬件部分组成,软件部分由多个气敏传感器组成,硬件部分由信号处理子系统和模式识别子系统两部分组成。
1.1.1 电子鼻硬件部分
气敏传感器是电子鼻检测气体的基本单元,电子鼻的气体检测部分采用交叉敏感同时具有选择特异性的气敏传感器组成传感器阵列,利用其对多种气体的交叉敏感性和对某一特定气体的特异性敏感特性,将不同的敏感物质在传感器表面的吸附脱落反应转化为便于后续处理分析的物理信号,实现混合气体分析。
1.1.2 电子鼻软件部分
1)信号处理子系统
信号处理子系统包括数据的预处理,特征提取和特征选择。该子系统要对采集的样本信息进行滤波降噪处理消除冗余,然后按照响应信号特点进行适当的特征提取,生成原始样本数据集。数据预处理包括中值滤波其数据的标准化,适当的采用对數据的特征选择与特征提取方法,则有利于提高计算效率、降低模式识别误差。
2)模式识别子系统
模式识别是对输入信号进行一系列的仿真处理,通过辨别、分析,获得样本的组成信息。
1.2 电子鼻的工作原理
电子鼻的工作原理就是模拟哺乳动物嗅觉系统对气味进行感知、处理和判断。气味分子被单个气敏传感器组成的传感器阵列吸附,发生吸附脱落反应而产生物理信号;生成的物理信号传递至信号处理单元进行预处理和加工;并最后由模式识别单元对信号处理的结果作出判断。
3 人工神经网络类型
本文提出了两种结构类型的人工神经网络用于电子鼻的定性识别,分别是误差回传网络模型和自组织特征映射网络模型。
3.1 误差回传网络模型
BP网络即误差回传神经网络(Back-Propagation Neural Network), 神经网络是目前应用最为广泛和成功的神经网络之一,它是一种无反馈的前向网络,输入样本前向传播并输出结果、误差的反向传播更新网络权值。网络中的神经元分层进行排列,神经元层可以分为输入层、隐含层和输出层。输入样本数据前向传播的时候,传播顺序为:由输入层传入,经隐含层处理后传到输出层,由于网络中每一层的层内神经元并无连接,而是由各相邻层之间的神经元相连接, 使整个网络的特性取决于网络神经元上的阈值以及相邻层之间神经元的连接权。
设BP网络为三层网络,输入神经元以i编号,隐蔽层神经元以j编号,输出层神经元以k编号,如图2:
3.2 自组织特征映射网络模型
自组织特征映射网络(Self-Organizing Feature Map,简称SOM网络)是一个全连接的、由神经元阵列组成的,具有无教师自组织、自学习性能的网络,只有输入层和输出层两层。网络的输出神经元之间在被激活的过程中相互竞争,致使在每一时刻只有一个输出神经元,所以,该算法又被称为胜者为王(winner-takes-all)算法。该算法的目标就是用低维目标空间的点去表示高维原始空间的点,使得这种表示尽可能地保留原始的距离或相关性。而且,如果从原始空间到目标空间存在非线性映射结构,该算法表现得非常出色 [8]。
3.2.1 SOM网络结构
3.2.2 SOM网络模型
由以下4个部分组成
(1)神经单元部分。接受输入,并对输入形成相应的辨识函数值(输出函数值)。
(2)比较辨识函数。用于比较辨识处理,并且选择一个处理单元,此单元的输出具有最大函数值。
(3)相互激励作用。我们选择刺激处理单元的同时,其相邻的单元被同时给予刺激。
(4)自我过程调整。修正被激励的处理单元的参数(即连接权值),以增加其相应与特定输入的辨识函数的输出值。
网络输入假定设为X[∈Rn],输出神经元[i]与输入单元的连接权向量[wi∈Rn],则输出神经元[i]的输出[oi]为:
[oi] = [wiX]
设网络具有响应的输出单元为[k],则通过“赢者通吃”的法则,确定该神经元,得到其输出为:
[ok=maxioi]
4 算法仿真
在对参考文献[9]中列举的样本数据进行仿真处理时,采用了一氧化碳气体传感器、二氧化硫气体传感器、二氧化氮气体传感器这三种不同的气体传感器,分别对由三种气体成分组成的混合气体进行辨别和分析,一共抓取30组数据,分别为15个训练样本,15个样本测试,然后采用Matlab语言对两种人工神经网络进行编程。
4.1 BP模型
先将其中一组数据作为实验采样输入神经网络,一氧化碳期望输出为[1,0,0]、二氧化硫期望输出为[0,1,0]、二氧化氮期望输出为[0,0,1],同时规定,当期望误差达到0.001时,固定网络权值和节点阈值。然后再将另外一组数据输入网络,可以得到预测输出。对于分类器规则,预测值>0.7视为1,预测值<0.3视为0,介于两者之间视为预测无效。
输入层的神经元数等于气体检测传感器的个数,确定当隐含层的神经元数为4时(如表1),其网络误差最小,而此时输出的神经元个数为3。
结果表明,在经过24次训练后,隐含层神经元为4的BP网络误差最小,而且只经过24次训练就达到了目标误差。虽然隐含层神经元为7的误差也比较小,但是它的训练步数比隐含层神经元为4的训练步数多,所以这里将神经元数目设定为4。
网络的结构为3:4:3。网络的初始值和节点阈值固定不变。误差指标设定为0.001,训练步数最大值为1000。根据Matlab程序,可知经过18次训练后,网络目标就达到了要求。其训练结果如图4。
由此可见,当误差指标取0.001时,BP网络模型训练步数是18,气体识别准确率为100%。
4.2 SOM模型
首先利用三个传感器输出响应作为神经网络的输入,三个气体传感器作为神经网络的输出,构建SOM模型。每一个样本用3个传感器输出响应表示其性状,确定网络的输入模式为:
[Pk=Pk1,Pk2,Pk3]
利用函数newsom创建一个SOM网络。其中,p为输入向量,minmax(p)指定了输入向量元素的最大值和最小值,[5 6]表示创建网络的竞争层为5*6的结构,并且网络结构可调。
然后利用函数train对网络进行训练,网络的仿真则通过函数sim实现。由于网络的聚类性能与算法训练步数选取息息相关。这里设置训练步数为1、2、3、4、5、6,分别观察其聚类结果。其运行结果如表3。
根据结果可以看出:在步数6之前,气体识别都有一定的误差。当步数为6时,气体分类准确率为100%。SOM算法的训练时间较短,步数较少,能准确地识别气体。
从结果中可以看到,BP模型学习时间长,训练步数多,而SOM模型的学习时间较短,而且其训练步数要明显少于BP模型。在该仿真中,自组织特征映射网络(SOM)算法的识别能力在整体上要优于误差回传神经网络(BP)算法。
BP算法网络具有一定的容錯能力,神经网络的结构简单、加速训练过程,增加网络在模式识别应用中的推广能力。而且,识别精度较高,满足了实际应用需要的要求。但是BP算法仍存在一些不足之处:
1)由于它是一种非线性运算,对初始网络非常敏感,权值收敛到局部极小点,从而导致网络训练失败,得不到最优解[10];
2)算法的收敛速度较慢,常需要数千步运算[11];
3)选择神经网络隐含层包含的结点个数尚无理论基础,而是依据经验公式选取[12];
4)网络在学习新样本时,存在遗忘部分已学习样本的缺陷,并要求每个样本特征的数目划分一致[13];
5)BP算法中两个重要系数(学习率[η]和动量系数[α])全凭经验给定[14]。
SOM神经网络具有拓扑保持和概率分布保持的优良特性,具有无监督自学习,非线性问题求解能力强,诊断结果简单、直观的特点。而且SOM网络能够处理不精确、不完全的模糊信息:同时能够并行分布工作。网络总体的运算速度极快。SOM网络还可以增加指标权重判定的客观性,并可以减少由不同操作者对权重赋值的不确定性。在SOM网络中,输入初始数据矩阵和预设的函数,经过网络自身的训练和学习,不需要任何外界作用,就能得到最终的聚类结果。自组织映射对存储容量要求不高。但在越来越多的实践研究发现,SOM中预设的网络拓扑结构包含对结果应设的限制,通常只有在训练结束之后才发现网络拓扑结构的差异将导致聚类结果的差异;SOM中的预设网络拓扑结构带来了神经元欠利用、网络映射欠准确以及边缘效应等缺陷;大多数情况下,并没有先验理论基础能让我们预先去选择一个合适的网络规模,所以这些因素严重地影响了SOM的应用。
5 结论
本文采用BP和SOM神经网络对电子鼻进行了CO、SO2、NO2三种气体识别的仿真实验,仿真结果表明这两种方法均可以有效地对气体进行定性识别,且SOM算法的识别能力在整体上要优于BP算法。
参考文献:
[1] 蒋雪松, 胡立挺, 陈卉卉,等. 食品中农药残留的电子鼻检测识别研究[J]. 南方农机, 2016(12):22-24.
[2] Baietto M, Wilson A D. Electronic-nose applications for fruit identification, ripeness and quality grading[J]. Sensors, 2015, 15(1):899-931.
[3] 王平,陈裕泉,吴坚,等.人工嗅觉—电子鼻的研究[J].中国生物医学工程学报,1996,15(4):346-353.
[4] Wang Ping, Xie Jun. A novel recognition method for electronic nose using artificial neural network and fuzzy recognition [J].Sensors and Actuators, 1996,B37:169-174.
[5] 郑思平. 一种改进的动态SOM算法及其在聚类中的应用[D].华南理工大学, 2010.
[6] 王岩,陈向东,赵静.基于Fast ICA和神经网络的电子鼻模式识别[J].传感技术学报,2007,20(1):38-41.
[7] 朱培逸, 顾晓云, 杜洁,等. 基于KPCA和SOM网络的电子鼻大闸蟹新鲜度评价[J]. 食品工业, 2017(2):200-203.
[8] 飞思科技产品研发中心.神经网络理论与matlab 7实现[M] .北京:电子工业出版社,2005.
[9] 王玮.基于气体传感器阵列的混合气体检测系统[D].西北工业大学硕士学位论文,2002,3.
[10] 张航. 基于硬件实现BP神经网络的电子鼻设计[D]. 西南交通大学, 2015.
[11] 张虹艳, 丁武. 基于Fisher线性判别和BP神经网络的电子鼻羊奶贮藏时间预测[J]. 中国食品学报, 2012, 12(6):166-173.
[12] Zhang H, Chang M, Wang J, et al. Evaluation of peach quality indices using an electronic nose by MLR, QPST and BP network[J]. Sensors & Actuators B Chemical, 2008, 134(1):332-338.
[13] Yu H, Peng P, Yin Y, et al. Coupled Electronic Nose and BP Neural Network to Study on the Predicting Model of Zearalenone and Aflatoxin B1[J]. Journal of the Chinese Cereals & Oils Association, 2017, 32(5):117-121.
[14] 韦彩虹. 基于电子鼻系统的混合气体的定性分析和定量估计[D]. 浙江大学, 2012.
[15] Gardner J W,Bartlett P N. A brief history of electronic nose[J]. Sensors and Actuators B,1994,18(19):211-220.
[16] Barbria N E,Llobet E. Application of a portable electronic nose system to assess the freshness of Moroccan sardines [J]. Materials Science and Engineering C,2008 (28):666-670.
[17] 韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[18] 吴春生, 王丽江, 刘清君. 嗅觉传导机理及仿生嗅觉传感器的研究进展[J]. 科学通报, 2007, 52(12): 1362—1371.