基于气体传感器动力学模型的细菌分类研究*
2017-11-23袁伟,石锐
袁 伟, 石 锐
(重庆大学 计算机学院,重庆 400044)
基于气体传感器动力学模型的细菌分类研究*
袁 伟, 石 锐
(重庆大学计算机学院,重庆400044)
对于气体传感器获得的样本数据,常规的处理方法是基于样本的表象来提取特征进行分类,具有固有的局限性。基于热电子发射理论和等温吸附理论,对气体传感器的电压响应值与温度、样本浓度等参数建立数学方程,将方程简化,构造了简易的响应动力学模型。通过主成分分析,降低样本维数。将模型向降维后的样本数据拟合,可得到模型的一组系数,作为样本的特征值。将特征值集合运用模式识别方法进行训练,测试分类性能。实验结果显示:分类预测的准确率较高。
气体传感器; 肖特基势垒; 吸附; 特征提取; 动力学模型; 分类
0 引 言
传统的疾病检测主要依靠提取患者的体液,对其化学成分进行检测或者将其涂样到培养基上进行体外培养、识别,上述方法虽然准确度较高,但需要专业人员进行操作,检测周期长、操作复杂,不适应快速检测的需求。
随着近年来人工嗅觉技术持续发展,电子鼻系统因其易操作、成本低、便携和现场实时检测[1,2]的特点而逐渐出现在人们的视野里。
电子鼻是由具有部分专一性的传感器阵列,结合相应的模式识别算法构成的系统,用于识别单一成分或复杂成分的气体[3],主要由气味取样操作器、气体传感器阵列和信号处理系统三部分构成[2]。
1 电子鼻系统原理
电子鼻系统的运行流程大致如下:系统采集样本气体,送入装有传感器阵列的气室,传感器阵列对该样本具有一组响应值,即原始特征。由于采集的原始数据具有较高的稀疏性,一般要进行数据预处理,用相关方法提取出关键特征,最后运用模式识别领域的方法进行训练和预测。
1.1 气敏传感器工作原理
以常见的SnO2气体传感器为阐述样例。
当金属氧化物半导体传感器与空气接触时,由于费米(fm)能级差的原因,其表面一般都会吸附氧
(1)
上述过程会造成传感器表面的电子被吸附的氧所捕获,半导体表面电子数量减少,电阻增大;传感器接触到还原性气体(例如H2)后,一般认为O-与还原性气体之间的作用是影响传感器电导率的主要因素[4,5]
H2+O-→H2O+e
(2)
上述反应会使得被氧捕获的电子释放回半导体表面,被测气体提供给元件敏感材料的电子增多,敏感材料的电阻显著降低[6]。同时,由反应方程式可知在该过程中,有H2O生成,根据采样数据绘制的湿度响应曲线如图1,印证了该反应过程的正确性。
图1 相对湿度响应曲线
1.2 数据处理方法
数据处理包括数据的预处理和数据训练预测。
预处理主要是对原始的响应数据进行去异常点、滤波和特征提取[7]等,特征提取方法主要有:基于传感器原始响应曲线的特征提取[8,9]、基于拟合曲线的特征提取[8,9]、基于变换域的特征提取[10]。
数据训练预测主要是基于统计学习方法或者神经网络来进行分类识别。常用的统计学习方法有:朴素贝叶斯法、决策树、支持向量机等。常用的神经网络有:反向传播(back propagation,BP)神经网络、径向基函数(radial basis function,RBF)神经网络、自组织映射(self-organization mapping,SOM)神经网络等[11]。在提取到样本的特征后,可以通过上述某一方法进行训练,待训练模型收敛后便能够对新进入的样本进行分类预测。
2 传感器响应动力学模型
烧结型SnO2传感器是N型半导体,由微小晶粒聚集、以晶界相接触的多晶结构。一般认为其敏感性属于表面控制型[5,12]。
根据热电子发射理论中的Richardson-Dushman方程[13],可以将传感器的电阻变化与材料特性、温度和势垒变化等变量联系起来
(3)
式中J为电流密度;A为Richardson常数,与具体材料有关;k为玻尔兹曼常数;T为绝对温度;q为电子的电量;Δφ为电势的变化量;ΔV为电压的变化量。
由传感器的电路设计可知,其两端加载的电压几乎不变,即ΔV→0,那么
(4)
根据电学的相关基本公式,同时为了简化计算,假设导体是单位长度、单位面积、单位电压、单位电场强度,则有
(5)
现需要以半导体与金属接触形成肖特基势垒为例分析其计算势垒变化量Δφ。
由于半导体与金属的费米(fm)能级不同,因此,半导体的电子会进入接触面的金属侧,这样接触面的半导体侧就会形成一个宽度为d的耗尽层(近似为势垒宽度,即耗尽层近似[14]),根据泊松方程可以得到抛物线形状的势垒为
(6)
式中q为载流子电荷数;Nd为施主密度;ε为介电常数;d为势垒宽度;x为距离界面的距离。在x∈(0~d)的区域的体电荷密度为qNd,又根据电中性条件,可知表面电荷密度为-qNs,那么在界面处的电势为
(7)
式中Ns为表面载流子浓度。又由于势垒φ的变化是由于传感器接触了不同的气体造成了表面电子浓度的变化,所以有φ与电子的表面覆盖率θ之间的关系
(8)
代入式(5)可得
(9)
根据等温吸附理论中的Freundlich吸附式[15]可以建立表面覆盖率与气体浓度之间的关系。又在Freundlich函数中,n一般介于2~3,而在本实验中p与t有关,不妨假设气体浓度与时间成如下分段线性关系
(10)
为了简化计算模型,即可以设在接触气体阶段的p=at-b,a,b为常数系数,t为时刻,n=2代入Freundlich吸附式并简化可得
(11)
式中A,B,C均为待定系数。根据传感器的电路设计,通过欧姆定律计算可知,最终采集的传感器响应电压为
(12)
可知传感器的电压变化可以近似为Logistic型函数,实际的样本响应曲线证实了模型的推测结论。如图2,其中实竖线为传感器开始接触样本气体的时刻,虚竖线为传感器停止接触样本气体的时刻。
由于传感器在未接触样本时,仍有一个响应基线,需要对上述模型进行修正,可得
(13)
式中A为传感器对样本响应的最大值;D为从基线开始取得最大响应值的1,2的时间点;E为未接触样本时的响应基线值;B,C均为待定系数,可在Matlab中对样本响应曲线做非线性拟合得到。式(13)即为传感器的响应电压随时间变化的简易动力学模型。
3 实验步骤与结果
实验利用项目自建的电子鼻系统采集了3个种类的细菌代谢物,分别为大肠杆菌34组,金黄葡萄球菌34组,绿脓杆菌34组,共102组样本,同种类样本的组内有浓度变化。
3.1 实验步骤
1)由于每一个原始样本数据为34×840维数据,其有效数据非常稀疏,因此对其进行一次PCA处理。以某一样本为例,得到了其第一主成分(贡献率77.15 %)和第二主成分(贡献率14.28 %)。由实验报告已知实验的各个阶段起始时间,因此,截取从基线阶段到采集阶段中的一段时间的采集的数据作为待拟合数据,处理后如图3。
图3 某样本进行PCA变换后的响应曲线
图4 PCA变换后的样本集
2)根据前文的分析,第一主成分可以用式(13)拟合。从图3观察可以知道,第二主成分可以近似用直线y=K拟合。对处理后的样本数据求解拟合参数,最后每个样本便由“6维特征+1维标签”组成。
3)由于样本数量较少,所以采用交叉验证方式建模。随机抽取80 %的样本作为训练集,剩余20 %的样本作为测试集,然后在Matlab中构建RBF神经网络和随机森林,将训练集样本分别送入训练,待预测模型收敛后,分别使用测试集测试预测性能。重复上述过程10次。
3.2 实验结果
表1为经过交叉验证后得到的数据。
表1 实验结果
实验属于三分类问题,实验结果中大肠杆菌和金黄葡萄球菌的预测准确率相对较低,从图4中也可以看出两类样本集的曲线具有较高的相似性,因此,导致了模型的整体预测准确率受到影响。但总体来说,实验显示了模型具有较好的分类预测能力。
4 结 论
本文从传感器响应变化的本质,即造成其变化的物理、化学因素入手,建立了气体传感器响应的简易动力学模型,并且通过模式识别的经典方法对模型的准确性进行验证,显示出了模型具有较好的分类预测性能。由于模型简化了一部分影响因素,而且训练集的样本数量相对较少,导致模型在分类大肠杆菌和金黄葡萄球菌的准确率相对绿脓杆菌的识别准确率偏低。因此,下一步的工作将有两个大方向:在动力学的基础上对模型继续修正,以便能更加精确地拟合响应曲线,同时增加训练集样本数量;采用新的模式识别方法。经过上述改善后的模型识别率有望得到提升。
[1] Wang Z,Wang C.Is breath acetone a biomarker of diabetes A historical review on breath acetone measurements[J].J Breath Res,2013,7(3):10-16.
[2] 张厚博,梅笑冬,赵 万,等.用于食醋品质预评价的电子鼻研究[J].传感器与微系统,2013,32(3):62-64.
[3] 闫 嘉.基于电子鼻技术的人体伤口感染检测系统构建及算法研究[D].重庆: 重庆大学,2013.
[4] 王 康.SnO2基气敏传感器的制备与研究[D].威海:山东大学,2013.
[5] 曾 文.SnO2/TiO2体系气敏性能及其机理研究[D].重庆:重庆大学,2011.
[6] 刘元隆,钟 荣,胡继豹.Fe2O3/ZnO复合氧化物气敏元件的制备与性能[J].传感器与微系统,2012,31(12):104-106.
[7] 邹慧琴.基于“气”仿生嗅觉系统在中药品质整体评价中的方法学研究[D].北京:北京中医药大学,2013.
[8] 洪雪珍.基于电子鼻和电子舌的樱桃番茄汁品质检测方法研究[D].杭州:浙江大学,2014.
[9] Mousumi Palit,Bipan Tudu,Nabarun Bhattacharyya,et al.Comparison of multivariate preprocessing techniques as applied to electronic tongue based pattern classification for black tea[J].Analytica Chimica Acta,2010,675:8-15.
[10] 樊 澍.基于量子粒子群的电子鼻伤口感染检测算法研究[D].重庆:重庆大学,2014.
[11] 杜晓亮.人工神经网络在空气质量预测中的应用研究[D].济南:山东大学,2009.
[12] 刘 阳,李 勃,姚有为,等.改善SnO2气体传感器气敏性能的研究进展[J].传感器与微系统,2012,31(12):5-8.
[13] 马殿飞.Ag/SiNWs肖特基二极管温敏特性的研究[D].上海:华东师范大学,2011.
[14] 刘恩科,朱秉升,罗晋生.半导体物理学[M].7版.北京:电子工业出版社,2008:216-221.
[15] 席彩红,高晓平,刘国汉.二氧化锡气体传感器敏感机理的研究[J].曲阜师范大学学报:自然科学版,2008(2):65-68.
Researchonclassificationofbacteriabasedonkineticsmodelforgassensor*
YUAN Wei, SHI Rui
(CollegeofComputerScience,ChongqingUniversity,Chongqing400044,China)
For sample data acquired by gas sensor,ordinary way is to extract features based on surface pattern of samples,so as to classify,so it has inherent limitation.Based on thermionic emission theory and adsorption theory,a mathematic equation can be built to demonstrate the connection of voltage response values of gas sensor with temperature,sample concentration,etc.A simple model of gas sensor's response kinetics can be derived by simplify the equation before.Through the method of principal component analysis(PCA),the dimensions of samples is reduced.A group of parameters,which will be treated as features of samples eventually,can be settled when fitting the model to the samples.A prediction model will be trained and benchmarked by using the feature sets.The result shows that the kinetics model has a satisfied prediction accuracy in classification, this is for the reason that the model is set up based on reflection of nature of sensor response.
gas sensor; Schottky barrier; adsorption; feature extraction; kinetics model; classification
10.13873/J.1000—9787(2017)11—0018—03
TP 212
A
1000—9787(2017)11—0018—03
2017—01—03
国家国际科技合作项目(2014DFA31560)
袁 伟(1990 -),男,硕士研究生,主要研究方向为模式识别,E-mail:506942891@qq.com。