人工神经网络的苹果气体识别算法研究
2010-09-15杨艳菊黄成钧
杨艳菊 黄成钧
(铜陵学院,安徽铜陵 244000)
人工神经网络的苹果气体识别算法研究
杨艳菊 黄成钧
(铜陵学院,安徽铜陵 244000)
文章介绍了由气敏传感器阵列与人工神经网络模式识别技术相结合的人工嗅觉系统对苹果气味的定性识别,尝试运用主成分分析改进BP算法和最近邻k-均值聚类算法,实现对“好”和“坏”苹果气味的定性识别。试验结果表明:采用主成分分析结合BP算法和最近邻k-均值聚类算法对“好”和“坏”苹果气味准确率为91.67%和95.83%,而且大大的缩短了辨识时间。
人工嗅觉系统;主成分分析;气体传感器阵列
电子鼻由气体传感器阵列、信号预处理和模式识别三大部分组成。电子鼻识别气味的主要机理是在阵列中的每个传感器对被测气体都有不同的灵敏度。但是用于敏感气体或气味的传感器通常存在着严重的“交叉敏”问题,因而在实际应用中难以满足测量精度的要求。近年来,研究人员开始将气敏传感器阵列与模式识别技术相结合,形成模拟人类和其他哺乳动物嗅觉机理的人工嗅觉系统。实践证明,人工嗅觉系统是解决气敏传感器“交叉敏”问题的一种有效途径。目前采用的模式识别法:主成分分析法(PCA)、偏最小二乘法(PLS)、最小邻域法(KNN)、欧几里德聚类分析法(ECA)和人工神经网络法(ANN)等在电子鼻领域都有应用。由于人工神经网络能够处理非线性数据,能够容忍传感器的漂移和误差,并具有较高的预测精度,因而越来越引起人工嗅觉研究人员们的重视。
本文用八个半导体气敏传感器构成传感器阵列,结合改进BP算法和最近邻-k均值RBF算法形成人工嗅觉系统,并对“好”和“坏”苹果气味进行识别[1]。本研究采用日本费加罗(Figro)公司生产的八个厚膜金属氧化物锡传感器(TGS800,TGS822、TGS813,TGS824,TGS825,TGS2600,TGS2610,TGS2620)。实验结果表明用BP算法和RBF算法对苹果气味的原始数据和主成分分析后的数据进行处理,其辨识结果都在91.67%以上。从而证明主成分分析法结合人工神经网络为模式辨识提供了一种有效的方法。
1.系统组成
本文设计的电子鼻测量系统由四个基本单元组成:气体产生室(容积12升的玻璃箱),测量室(容积2升的密封塑料盒),A/D转换模块和一台负责数据采集和处理的电脑(见图1)。苹果挥发物主要成分是乙烯、乙醇、丁醇、丙醇等碳氢化合物。通过分析选取对这些气体比较“敏感”的锡氧化物气体传感器组成传感器阵列对苹果挥发气体进行分析。每一次测量时将气体室、测量室与空气充分接触,达到一个稳定的标准状态,然后在气体室中放苹果(大小、重量相当),密封好放置24小时后打开阀门让气体通过管道与测量室中的传感器阵列充分的接触(约一个小时,这一过程使传感器在测量阶段有足够的时间与苹果气体进行反应)。每一类样本分析后再让气体室和测量室与空气充分接触,传感器恢复初始状态,以便下次测量。实验的测量系统如图1所示。
图1 测量系统的原理图
传感器阵列采集的信号是模拟信号,经模数转换器(ADAM-4019)转化为数字信号后,通过RS-232接口传送给电脑进行处理。数据分析是在CPU主频为2.4G、内存512 M的计算机上用VC++6.0编程实现的。
图2 苹果气味的数据采集
2.模式识别方法
2.1 主成分分析
主成分分析(Principle components analysis-PCA)是把多指标转化为少数几个综合指标的多元统计分析方法。主成分PCk的表达形式如下:
其中X是输入数据矩阵,K为主成分为主成分序号,n为数据的维数,aik为系数。
在PCA学习中,对原始数据矩阵标准化后数据的相关矩阵[2]进行分析,得到主成分。主成分分析的主要特点是通过数据坐标轴的变化得到新的图示——得分图和负荷图[3]。得分图经常被用来研究数据聚类、分类;负荷图被用来表示原始数据和每个主成分的相关性。主成分分析实际上是选取主分量的过程,而分类辨识则要用到模式辨识算法。
2.2 反向传播学习算法
2.3 径向基函数神经网络
径向基函数(Radial Basis Function-RBF)神经网络,在选取RBF基函数中心时采用了最近邻聚类学习算法[5]和K-均值聚类算法[6]相结合的方法。其训练规则如下:
(1)选择一个适当的高斯函数宽度r,定义一个矢量A(L)用于存放属于各类的输入矢量之和,定义一个计数器B(L)用于统计属于各类的样本个数,其中L为类别数。
(2)从第一个数据X1开始,在X1上建立一个聚类中心,令C1=X1,A(1)=C1,B(1)=1。这样建立的RBF网络,只有一个隐单元,该隐单元的中心为C1。
输出层线形权的计算采用梯度下降算法。
3.实验及结果
3.1 实验系统
实验用品是从超市购买的红富士苹果,将苹果分成两类:一类“好”的富士苹果15个(大小、颜色相近);一类“坏”的苹果5个有部分褐斑或腐烂的苹果和10个好的苹果。实验时将苹果按类分别放入密闭容器内24小时后进行测试。实验数据每类苹果取20组样本(12个样本作为训练样本,8个样本作为测试样本),两类苹果共40组样本进行分析。
实验器件采用的半导体传感器组成传感器阵列,组成人工嗅觉系统前端的感应部分。传感器阵列用的是日本费加罗公司的八个传感器,并加入了温度传感器和湿度传感器模块,观测测试过程中的温度、湿度。
在气体识别中,为了提高辨识效果,需要对传感器的输出信号进行预处理,以基本消除气体浓度对输出的影响。假设金属氧化物半导体的电导用G表示,传感器i对气体样本j产生的响应用Gi,j表示,则n个传感器组成的阵列对气体样本j的响应是n维状态空间上的一个矢量Gj:Gj={g1,j,g2,j…,gn,j},预处理算法为:
式中Gi,0-传感器i在纯净空气中的电导,经过处理后的矢量:Xj={X1,j,X2,j,…,Xn,j}作为网络的实际输入。
3.2 辨识结果
图3显示了电子鼻[7]检测和区分不同程度苹果的PCA分析图。在PCA分析中,第一主成分PC1和第二主成分PC2的贡献率分别为95.46%,3.03%,前两个主成分累积占到所有信息量的98.49%。由崖底碎石图[8]确定了主成分适合的个数为2,即2个主成分即可取代原来8个变量来进行模式识别。
图3 PCA分析图
图4是两种样本在PC1和PC2上的得分图和负荷图,从图(a)中可以看出,“好”苹果和“坏”苹果可以明显地分开。在图(b)中有相似的负荷,相似的负荷代表冗余度,所以在原始数据中有冗余的信息,可以用五个传感器阵列代替原八个传感器阵列[9]。
图4 好苹果和坏苹果的得分图和负荷图
在图5中横坐标代表训练次数,纵坐标代表总的训练误差。可以看出BP经过4251次训练后误差收敛到0.001;对于RBF算法,最终的训练次数为49627,误差为0.01,两种算法的辨识结果在网络输出值上不同,但识别结果两者相同,辨识结果见下表。
表1说明BP算法和K均值与最近邻RBF算法对原始数据的分类正确率分别为91.67%,95.83%。在BP和RBF两种算法中,BP算法训练用的时间较RBF少,但辨识率较RBF低;经过主成分分析后,BP和RBF两种算法训练时间都缩短很多。
图5 训练的误差和训练次数仿真
表1 BP网络和K均RBF网络的计算结果
4.结束语
该研究分别对“好”和“坏”苹果在测试环境以及测试温度相同的条件下,运用8个传感器阵列构成的8维数据作为原始数据样本,在BP和RBF两种算法中,分类正确率分别为91.67%,95.83%,BP算法训练用的时间较RBF少,但辨识率较RBF低;通过PCA分析之后,可以将维数减小到两维,辨识的时间却大大的减少。这说明应用PCA分析在处理模式辨识问题上速度更快,同时可以得到满意的结果,为人工嗅觉系统在实际环境中的应用打下了基础。
[1]赵杰文,刘木华,潘胤飞,邹小波.遗传算法优化BP及RBF神经网络用于苹果气味分类[J].江苏大学学报(自然科学版),2004,25 (2):39-42.
[2]孟德顺.PCA应用中的几个问题[J].西北林学院学报,1995,10(1):89-94.
[3]M.Penza etc.Application of principal component analysis and artificial neural networks to recognize the individual VOCs of methanol/2-propanol in a binary mixture by SAW multi-sensor array[J].Sensors and Actuators B,2003,(89):269-284.
[4]王洪元,史国栋.人工神经网络技术及其应用[M].北京:中国石化出版社,2002.29-40.
[5]朱明星,张德龙.RBF网络基函数中心选取算法的研究[J].安徽大学学报(自然科学版),2000,24(1):72-78.
[6]徐秉铮,张百灵,韦岗.神经网络理论与应[M].广州:华南理工大学出版社,1994.312-316.
[7]J.Brezmes,etc.Fruit ripeness monitoring using an Electronic Nose[J].Sensors and Actuators B,2000,(69):223-229.
[8]J.Brezmes,E.Llobet,X.Vilanova,J.Orts,G.Saiz,X.Correig.Correlation between electronic nose signals and fruit quality indicators on shelf-life measurements with pinklady apples[J].Sensors and Actuators B,2001,(80):41-50.
[9]Richard A.Johnson,Dean W.Wichern.实用多元统计分析[M].北京:清华大学出版社,2003.358-361.
TP21
:A
:1672-0547(2010)02-0076-03
2009-10-19
杨艳菊(1981-),女,河南周口人,铜陵学院电气工程系教师,硕士。