APP下载

电子鼻的混合气体分类研究

2017-10-11梁子跃黄灿灿江正伟方志明

中国计量大学学报 2017年3期
关键词:混合气体电子鼻正确率

梁子跃,杨 昊,黄灿灿,周 建,江正伟,方志明

(1.中国计量大学 信息工程学院,浙江 杭州310018;2.浙江清华长三角研究院,浙江 嘉兴314006;3.衢州市环境监测中心站,浙江 衢州324000)

电子鼻的混合气体分类研究

梁子跃1,杨 昊1,黄灿灿2,周 建3,江正伟3,方志明3

(1.中国计量大学 信息工程学院,浙江 杭州310018;2.浙江清华长三角研究院,浙江 嘉兴314006;3.衢州市环境监测中心站,浙江 衢州324000)

针对空气污染物氨气、乙醇、氨气乙醇混合气体,搭建在线检测电子鼻系统.采用不同的特征提取方法得出特征,并利用主成分分析(PCA)和线性判别式分析(LDA)做类别区分. 结果显示,利用传感器响应最大值特征和LDA能更好地区分三类气体.利用最大响应值特征,采用多层感知器(MLP)神经网络和粒子群(POS)优化的支持向量机(SVM)对110个测试样本分类.结果显示,MLP神经网络的正确率为70%,POS优化的SVM正确率为96.364 0%.最后,根据Loadings分析,剔除了TGS2602,MQ138,MQ3传感器,优化了传感器阵列.结果表明,该在线电子鼻系统能够应用到这三类空气污染物分类.

电子鼻;特征提取;模式识别;传感器阵列优化;大气污染物

Studyonmixedgasdetectionbasedonelectronicnoses

Abstract: Targeting air pollutants of ammonia, ethanol and the ammonia ethanol mixed gas, an online electronic nose system was established. Different feature extraction methods were used to obtain their features. Principal component analysis (PCA) and linear discriminant analysis (LDA) were used to classify them. The results showed that the three kinds of gases could be distinguished by using the maximum response characteristics of the sensor and LDA. Based on the maximum response value, a multilayer perceptron (MLP) neural network and an SVM optimized by particle swarm optimization (POS) were used to test 110 samples classification. The results showed that the correct rate of the MLP neural network was 70% and the SVM optimized by POS was 96.364 0%. Finally, according to the loadings analysis, the TGS2602, MQ138 and MQ3 sensors were removed and the sensor array was optimized. The online electronic nose system can be applied to the classification of these three types of air pollutants.

Keywords: electronic nose;feature extraction ;pattern recognition;sensor array optimization;air pollutant

随着科技进步,电子鼻在环境监测[1]、食品安全和药物辨别等方面的应用得到快速发展.如:杨莉等人的交通环境有毒气体的检测技术研究[2],朱向东等人的基于DSP的便携式气体检测仪系统[3],梁喜凤等人的传感器阵列的CO与H2S混合气体检测系统设计与试验[4],以上研究在气体检测传感器优选上没有做出合理严谨的理论分析;田秀英等人的基于PCA方法的带鱼和肉类新鲜度的电子鼻系统,采用半导体传感器阵列检测在5,10,15 ℃条件下,TVBN(挥发性盐基总氮)的含量,采用PCA算法对不同天数的鱼和肉进行了分类[5],该研究仅停留在区分不同天数的鱼和肉,并未做准确率预测的研究;韦彩虹的基于电子鼻系统的混合气体的定性分析和定量估计[6],该研究在传感器响应特征的选取上仅选取了最大值,未做其他提取特征的比较效果分析.

基于以上问题,设计了该电子鼻系统. 本文设计的电子鼻,尝试采用多种分类模型,包括典型的非监督模型PCA和几类监督模型算法.经过对比和分析实验,达到精确分类三类气体的目的.

1 电子鼻材料和系统结构

1.1 材料

气体配置选用的是茂图气体设备(上海)有限公司的标准钢瓶,氨气气体浓度为295 ppm,乙醇气体浓度为295 ppm流量计和显示器选用的是北京崛场汇博隆精密仪器有限公司的MT-52;研制的电子鼻系统主要包括3类气体传感器:半导体气体传感器、电化学气体传感器和光离子气体传感器.这里做气体分类实验只需用到传感器气室1中的半导体气体传感器.

1.2 系统结构

电子鼻系统图如图1.通过与氮气混合后的标定气体分别经气室1或气室2(选择哪个气室通过开关阀门控制),根据传感器感应的信号,传给电子鼻系统内的在线数据采集板(STM32FZET6),经过数据采集板简单数据处理,将数据传给上位机(PC),经MATLAB2008a,进行模式分类.

表 1 气室1的传感器阵列和响应气体

图 1 电子鼻系统示意图Figure 1 Schematic graph of electronic noses system schemes

2 采集数据和数据预处理

有三个过程:1)基线过程 先接入纯空气钢瓶冲洗气室;2)采样过程 待基线稳定后,切换三通阀,调节气体流量计,获得所需浓度的测试气体;3)脱附过程 切换三通阀,再次通入纯空气钢瓶进行脱附[5-6].这里选用氨气浓度100 ppm,乙醇浓度100 ppm.二者混合气体.得到传感器响应曲线.由于受限气体存量,选择氨气、乙醇响应时间325 s,二者混合响应时间180 s. 并经过减基线和平滑滤波处理,得到下面曲线.见图2~4.

图2 氯气浓度100 ppm氨气浓度金属半导体传感器 响应Figure 2 Response of metal semiconductor sensors with 100 ppm ammonia concentration

图3 乙醇浓度100 ppm,金属半导体传感器响应Figure 3 Response of metal semiconductor sensors with 100ppm ethanol concentration

图4 某浓度下混合气体金属半导体传感器响应Figure 4 Response of metal semiconductor sensor with mixed gases in a certain concentration

3 特征提取方法分析与传感器阵列优化

根据得到传感器的响应曲线对比发现,不同的气体在同一段响应时间,各自曲线下的积分面积、初始响应时间段平均微分值和最大响应值有较明显不同.所以选用了这三种特征提取方法.

3.1 选取曲线下面积

这里选用了Maltab里面的Trapz函数,来提取1到180 s时间,曲线下积分面积.

3.2 选取平均微分值

平均微分法公式如下:

(1)

其中N是取得测试点数;xi为曲线中第i个测量点的值 ;xi+1是第i+1个测试点的值;Δt是时间间隔,这里选用的是1 s;平均微分值K的意义是某段时间内传感器对被测气体的平响应速度[7].这个根据传感器TGS2602在第10 s对氨气的响应趋势出现较大波动,其他传感器在该时间段相对平滑,所以选用时间1~10 s.即N取10.

3.3 选取最大值

这里截取的响应时间内的最大值.从传感器的响应结果来看,不同的气体在同一段时间内,各个对应传感器的响应值有明显差别.

3.4 传感器阵列优化

使用输出电压的变化,载荷分析用于模式文件识别时判断传感器的重要性.如果某一传感器对识别分析的作用足够小,那么就选择去掉.对于一个特定的线性判别,传感器的载荷参数接近零,说明对整个传感器阵列有很低的贡献.

图5 针对三类气体与PCA1,PCA2,PCA3相关的 载荷分析Figure 5 Loadings analysis related to PCA1, PCA2, PCA3 for three type gas

从图5可以看出,传感器TGS2620,MQ138,MQ3对当前气体分类有更低的贡献,可以去掉;而TGS2602,TGS826,MQ137,TGS832有更高的贡献,所以保留.

4 不同特征提取方法的PCA和LDA分析

主成分分析是一种从多维数据中提取信息的统计学习方法.它将原始的测得的变量(例如p维)降维为一种新的不相关的变量(假设为m维,m<=p),且尽可能大的保持原有信息.新的变量叫做原变量的主成分.PCA得分用于研究数据点在多维空间质量特性的聚类情况,前三个主成分累计贡献率均超过85%,满足了前t个主成分包含了原始变量的基本信息.图6~8是不同特征的PCA的分图.

图6 选取面积特征的三类气体样本PCA的得分图Figure 6 PCA score of three kinds of gas samples with area characteristics

图7 选取平均微分特征的三类气体样本PCA的得分图Figure 7 P CA score of three kinds of gas samples with average differential characteristics

图8 选取最大值特征的三类气体样本PCA的得分图Figure 8 The PCA score of three kinds of gassamples with maximum value

线性判别式分析与主成分分析类似,将带上标签的数据点,通过投影的方法,投影到维度更低的空间中,使得投影后的点形成按类别区分一簇一簇情况.相同类别的点,将会在投影后的空间更接近其要求投影后的模式样本在新的子空间有最小的累内距离和最大的类间距离[8-10].以下是针对三类气体的LDA分析.见图9~11.

图9 选取面积特征的三类不同气体样本的LDA分析Figure 9 LDA analysis of three kinds of gas samples with different area characteristics

图10 选取平均微分特征的三类不同气体样本 的LDA分析Figure 10 LDA analysis of three kinds of gas samples with average differential characteristics

图11 选取最大值特征的三类不同气体样本 的LDA分析Figure 11 LDA analysis of three kinds of gas samples with maximum values

综合以上分析表明,选取传感器响应的最大值特征,在PCA分析中,相同类得到更好的聚集;在LDA分析中,三类气体得到更好的区分.

5 BP神经网络和支持向量机识别对比

该系统选用标准BP神经网络和支持向量机模型对三类气体进行模式分类[11].BP神经网络一共设置3层,输入层、隐含层和输出层.因这里7个传感器提取特征信号,所以输入层确定为7个神经元.隐含层和输出层都确定为1个神经元,输出层输出不同种类气体标号.采用试错法选择隐含层节点数,根据测试的正确率结果反复调整参数.实现最优分类正确率为70%.其中参数调节如表2和表3所示.S1为输出层到隐含层神经元,S2隐含层到输出层神经元,TF1,TF2为节点传递函数,BTF为训练函数,MSE为均方误差.

表 2 BP主要参数的选择

表 3 BP次要参数的选择

但是,标准BP神经网络算法有很多缺陷.比如采用梯度下降法,训练速度慢;易形成局部极小而得不到全局最优,很容易出现欠学习和过学习.而支持向量机在分类中并不存在以上问题.针对以上BP可能出现局部最优导致的达不到理想的分类效果,增加了SVM分类模型.

支持向量机是基于统计学习方法,寻找一个最优的超平面作为高维空间中的决策函数[12].该模型参数是根据训练的数据而变化,不需要提前预置.最佳参数的寻优是训练程序的过程中,根据数据与模型的不断匹配.这跟神经网络比如:多层感知器神经网络和径向基神经网络具有共性.在本实验中,支持向量机做三类气体分类最重要的选择参数是惩罚参数c和核函数参数g(针对多项式/rbf/Sigmoid核函数).

这里选用了POS和Hold-Out-Method二种方法选择最优参数c和g.优化结果和正确率如表4所示.

表 4 参数c和g寻优

6 结 论

1)采用不同的特征提取方法进行分析,得出最大值特征样本易于被PCA和LDA区分.

2)通过PCA载荷分析,发现传感器TGS2602,MQ138,MQ3对当前气体分类有较低的贡献,可以去除.实现了传感器阵列的优化.

3)通过MLP,POS - SVM进行样本分类,比较发现POS - SVM正确率达到96.364 0%,相比BP神经网络更优.

选取传感器响应最大值特征,小样本分类预测,POS - SVM分类正确率达到96.364 0%.为了达到更好的预测效果,后续将更换不同的传感器型号,选取更多种特征获取大量样本做进一步分类和定量分析研究.

[1] 田秀英,蔡强,刘锐,等. 基于电子鼻土壤与地下水污染修复现场TVOC和恶臭的评估[J]. 环境科学,2013,34(2):463-467. TIAN X Y, CAI Q, LIU R, et al. Assessment of TVOC and odor in the remediation site of contaminated soil and ground water using electronic nose [J].EnvironmentScience, 2013,34(2):463-467.

[2] 杨莉,王磊.交通环境有毒气体的检测技术研究[J].计算机工程与应用,2010,46(8):202-204. YANG L, WANG L. Study on detection of toxic gases in traffic environment [J].ComputerEngineeringandApplications, 2010, 46(8):202-467.

[3] 朱向东.基于DSP的便携式气体检测仪系统[J].仪表技术与传感器,2011,48(2):33-37. ZHU X D. Portable gas detector based on DSP [J].InstrumentTechniqueandSensor, 2011,48(2):33-37.

[4] 梁喜凤,刘立豪.传感器阵列的CO与H2S混合气体检测系统设计与试验[J].中国计量学院学报,2015,26(1):40-45. LIANG X F, LIU L H. Design and experiments on detection system for CO and H2S gas mixtures based on sensor array [J].JournalofChinaUniversityofMetrology, 2015, 26(1):40-45.

[5] 田秀英.电子鼻在TVOC和恶臭检测方面的应用研究[D].上海:上海师范大学,2012. TIAN X Y.ApplicationofElectronicNoseinTVOCandOdorDetection[D].Shanghai: Shanghai Normal University,2012.

[6] 韦彩虹.基于电子鼻系统的混合气体的定性分析和定量估

计 [D].杭州:浙江大学,2012. WEI C H.QualitativeAnalysisandQuantitativeEstimationofMixedGasesBasedonElectronicNoseSystem[D]. Hangzhou: Zhejiang University, 2012.

[7] 赵赟,郭振华,孟凡利,等.基于分段平均微分法的动态检测识别系统[J].传感技术学报,2007,20(8):1707-1711. ZHAO Y, GUO Z H, MENG F L, et al. Dynamic detection and recognition system based on the segmental average differentiation[J].ChineseJournalofSensorsandActuators, 2007, 20(8): 1707-1711.

[8] AMARI A, EL BARI N, BOUCHIKHI B. Electronic nose for anchovy freshness monitoring based on sensor array and pattern recognition methods: Principal components analysis, linear discriminant analysis and support vector machine [J].InternationalScientificJournalofComputing, 2007,6(3) : 61-67.

[9] TIAN F G, CHENG L L. High accuracy handwritten Chinese character recognition using LDA-based compound distances [J].PatternRecognition, 2008, 41(11): 3442-3451.

[10] TANGA E, SUGANTHANA P, YAO X. Linear dimensionality reduction using relevance weighted LDA [J].PatternRecognition, 2005,38(4): 485-493.

[11] 章德宾, 徐家鹏, 许建军,等. 基于监测数据和BP神经网络的食品安全预警模型[J]. 农业工程学报, 2010,26(1):221-226. ZHANG D B, XU J P, XU J J, et al. Model for food safety warning based on inspection data and BP neural network[J].TransactionsoftheChineseSocietyofAgriculturalEngineering,2010,26(1):221-226.

[12] PAL M, FOODY G. Feature selection for classification of hyperspectral data by SVM [J].IEEETransactionsonGeoscienceandRemoteSensing,2010,48 (5): 2297-2307.

LIANG Ziyue1,YANG Hao1,HUANG Cancan2,ZHOU Jian3, JIANG Zhengwei3,FANG Zhiming3

(1. College of Information Engineering, China Jiliang University, Hangzhou 310018, China;

2.Yangtze Delta Region Institute of Tsinghua University, Zhejiang Jiaxing 314006, China; 3. Quzhou Environmental Monitoring Center, Zhejiang Quzhou 324000, China )

2017-04-24 《中国计量大学学报》网址zgjl.cbpt.cnki.net

国家重大科学仪器设备开发专项(No.2012YQ15008705),浙江省科技计划项目(No.2015C33009).

X831

A

猜你喜欢

混合气体电子鼻正确率
个性化护理干预对提高住院患者留取痰标本正确率的影响
基于电子鼻的肺癌无创检测研究
门诊分诊服务态度与正确率对护患关系的影响
CF3I混合气体比例及放电参数分析
电子鼻咽喉镜在腔镜甲状腺手术前的应用
NO、O2及NO2混合气体考点归纳
香辛料识别中电子鼻采集及算法研究
中考化学习题解析
生意
飞到火星去“闻味儿”——神奇的电子鼻