APP下载

仿生嗅觉在空气净化器气味识别中的应用研究*

2018-12-25马东旭骆德汉徐勋庭钟平忠

网络安全与数据管理 2018年12期
关键词:降维识别率校验

马东旭,骆德汉,徐勋庭,冯 扬,钟平忠,方 桦

(1.广东工业大学 信息工程学院,广东 广州 510006;2.广东瑞德智能科技股份有限公司,广东 佛山 528000)

0 引言

近些年我国各行各业的高速发展不仅带动了我国经济,同时也带来了一系列环境污染问题,由环境污染导致的疾病越来越多,其中室内空气污染问题尤为显著。室内空气污染的主要污染源为醛类、苯类以及TVOC。室内空气甲醛超标轻则引起头痛、头晕等症状,重则导致白血病;苯类物质来源于油漆、涂料、地毯等,过量吸入会使人出现头晕、胸闷、甚至呕吐等症状。TVOC是总挥发性有机物,具有刺激性以及毒性[1]。室内环境大部分由天然材料或人工合成材料搭建而成,据统计,现代社会中每个人每天有70%以上的时间处于室内环境[2]。空气净化器是用于去除空气中的颗粒物、气态污染物、微生物等一种或多种污染物或具备类似功能的一种电器[3]。大多数空气净化器是根据检测到某一类气体的气体浓度,即根据某一类传感器的响应大小来控制空气净化器的运行功率。

本文基于仿生嗅觉提出一种新的方法,可选择合适的数个传感器组成传感器阵列置于空气净化器进气口处,通过模式识别的方法对气味进行分类与鉴别。本研究通过传感器阵列将气味信号转化为电信号,形成“气味指纹信息”,使用MySQL建立气味指纹信息数据库,将得到的气味指纹存储在数据库中,再通过MATLAB软件建立BP神经网络,使用数据库中的数据对网络进行训练。最后,将测试样本输入到训练好的网络中,进而得到识别结果。本实验意在寻找一种能够使空气净化器在吸收净化空气的同时,还能准确地识别出气味源,即分辨出气味种类的方法。

1 分析方法

1.1 BP神经网络

人工神经网络是通过模拟生物的运转过程,将其转换成数学模型而得来的。误差回传神经网络(Back-Propagation Neural Network)又被称为BP神经网络。BP神经网络具有信号前向传递、误差反向传播的特点,可以存储与学习输入输出的映射关系,进而根据输入来获得输出。因此,在识别与分类方面,BP神经网络得到广泛的应用。其网络模型一般是由3层或3层以上网络组成的多层网络,其中包括输入层、隐含层与输出层[4-10]。图1为三层BP神经网络结构。

图1 三层BP神经网络结构

1.2 激活函数

之所以引入激活函数,是因为存在着许多的数据集是属于线性不可分的,激活函数可以理解为是输入到输出的映射。

图2为单个神经元结构,x1,x2,…,xn为该神经元的输入,w1,w2,…,wn为每个输入对应的权值,b为该神经元的阈值。该神经元输出为:

y=f(g(x))

(1)

其中,

g(x)=WTX+bi

(2)

W为权值wn的矩阵[w1,w2,…,wi]T,X为输入xn的矩阵[x1,x2,…,xi]T,i≤n,b为规格相同的矩阵[b1,b2,…,bi]T,f(x)为该神经元的激活函数。

图2 单个神经元结构

1.3 主成分分析

主成分分析方法(Principal Component Analysis, PCA)是一种线性降维算法,将n维特征映射到k维空间上(k

PCA主要用来求解特征值以及特征向量。保留最大的k个特征值以及其相对应的特征向量,以此构成一组新的基,将原特征投影到新的基上,从而得到降维后的新特征[11-12]。

2 实验准备

2.1 气味源与传感器选择

本研究根据常见的室内环境污染气味选用了香烟、香水、榴莲、油漆作为气味源进行实验。香烟作为常见的烟草制品,其中毒性最大的当属香烟中包含的烟碱,也称作尼古丁;香水是植物性香料、动物性香料以及合成香料相配合溶于酒精后再加必要的保留剂、色素和水等配制而成的;油漆中含有大量的甲苯、二甲苯等苯系物,且油漆是室内比较常见的物质,适合用来做气味源;榴莲散发出的气味中包含了多种硫化物,气味十分特别,具有一股“臭味”。

根据气味源的种类,本实验选用了四个传感器组成了传感器阵列,型号分别为ES1-CO-100、ES4-AG1-200、TGS2600和TGS2603。这四个传感器所组成的传感器阵列,能够对选定的四类气味源做出不同的响应。

2.2 采样方式

传统的气味采集识别方法是将某一气味源放入密闭容器中静置一定时间后,通过电子鼻等其他类似的仪器对气体进行采集,采集后获取稳态时的数据作为样本[13-14]。但这种方法并不适用于产品应用中。

本研究中,为了让实验结果更贴近于实际情况,采样时,将传感器阵列安置于空气净化器进气口处,将待采样气味源放置于进气口不远处进行气味采样。

四类气味源分别采集40个样本,即四类气味源共采集160个气味样本。每次采集15 s,采样周期为0.5 s,每个样本包含了4个传感器的30个时间点的响应数据,即30×4个响应值作为一个样本。不同样本的采集过程都是处于相同条件下,即常温以及室内条件下获取的。

2.3 BP神经网络的构建

本实验构建了一个三层BP神经网络来解决气味识别问题,即单隐含层网络。对样本进行特征提取,计算15 s内每个传感器的响应值的均值、方差以及中位数,通过PCA进行降维后作为输入,输入层节点数与降维后维数相同。因为需要识别的气味种类共四种,因此,输出层的节点数为4。根据隐含层节点数公式:

(3)

其中,h代表隐含层节点数,m代表输入层节点数,n代表输出层节点数,而a是一个调节数,取值范围为1~10。考虑到本研究中样本数量有限,因此h取为10,即隐含层节点数为10。将网络中所有的w与b都设置为1,此外,为每一类气体打上相应的标签,香烟、香水、榴莲、油漆分别用[0,0,0,1]、[0,0,1,0]、[0,1,0,0]、[1,0,0,0]作为标签。由于本实验所需要的输出非0即1,并且考虑到识别效果,将隐含层激活函数设置为‘purelin’,输出层激活函数设置为‘logsig’,输出层节点输出值大于等于0.5则判断等于1,小于0.5则判断等于0。若输出是[0,0,0,1]、[0,0,1,0]、[0,1,0,0]、[1,0,0,0]以外的情况,则判定为无法识别或识别错误。

3 实验验证

3.1 实验步骤

本研究主要分为两个过程,分别是训练过程以及测试过程,分类模型如图3所示。

图3 本研究分类模型图

训练过程如下:

(1)数据预处理:输入训练样本集后,对训练样本集进行归一化处理。

(2)特征提取:将预处理过后的样本进行PCA降维处理,保留转换矩阵V和累积贡献率达到99%的k维数据。

(3)训练网络:将降维后的k维数据输入构建好的网络模型进行训练,并保存训练后的网络模型。

测试过程如下:

(1)数据预处理:输入校验样本集后,对校验样本集进行归一化处理。

(2)特征提取:通过训练过程保留下来的转换矩阵V,对校验样本进行降维,保留k维数据作为输入。

(3)识别分类:将降维后的k维校验样本输入训练好的网络中,得出分类结果。

3.2 传感器阵列响应数据

图4为四类气味源某一随机样本的传感器阵列响应。通过观察这些原始数据可知,四类气味传感器阵列给出了不同的响应。可以发现,TGS2600和TGS2603对四类气味的响应最为敏感,而ES1-CO-100、ES4-AG1-200对四类气味虽然都有不同的响应,但响应相较于另外两个传感器而言小得多。香水、榴莲和喷漆的响应曲线虽然类似,但响应值大小上有一定区别。图5为预处理之后提取的样本特征,其中横坐标1~4代表样本中四个传感器响应的均值,5~8为方差,9~12为中位数。就这四个样本而言,它们的特征存在着较大的区别。

图4 传感器阵列响应

3.3 实验结果与分析讨论

将四类气味样本均分成4个不相交的样本集A、B、C、D,每个样本集由10个香烟数据样本、10个香水数据样本、10个榴莲数据样本以及10个油漆数据样本组成。A、B、C、D四个样本集轮流作为校验集,没有作为校验集的三个样本集作为训练集对网络进行训练。表1为不同训练集情况下,使用PCA进行特征提取,并且主成分按贡献率降序排列后,不同主成分的特征值、贡献率以及累积贡献率。

图5 传感器响应特征

训练集主成分1234…12ABC特征值4.933 11.912 60.718 50.139 500.000 0贡献率/%63.4024.599.231.790.00 累积贡献率/%63.4087.9897.2199.00100.00ABD特征值4.961 01.728 40.671 40.224 00.000 0贡献率/%64.8222.588.772.930.00 累积贡献率/%64.8287.4096.1799.10100.00ACD特征值4.681 31.631 50.602 20.211 90.000 0贡献率/%65.1622.718.382.950.00 累积贡献率/%65.1687.8796.2599.74100.00BCD特征值4.538 81.130 80.484 80.161 20.000 0贡献率/%71.5917.847.652.540.00 累积贡献率/%71.5989.4297.0799.61100.00

观察表1可知,四种不同训练集情况下,前两个主成分和前四个主成分的累积贡献率分别达到了88%左右和99%以上。可见降维后前四维保留了原数据的大量信息,所以四种情况下PCA降维后保留的维数k都等于4,即神经网络的输入层节点数都为4,图6为MATLAB构建的网络结构。

图6 MATLAB构建的网络结构

记录不同训练集情况下对四种气味的识别率,并计算出四种情况下四类气味的平均识别率,将其视为最终识别率,如表2所示。

表2 交叉验证法下不同气味的识别率与识别率均值

根据K折交叉验证法的结果可见,总体上对于四类气味的识别效果还算良好。其中,香烟的识别率均值最低,当A、B、C作为训练集时,对于D校验集的识别率只有40%,但当A、B、C作为校验集时,识别结果能够达到100%。将神经网络的参数进行多番修改后,针对D作为校验集的情况,得到的识别结果最高也仅达到40%。因此推断D类样本集中香烟的数据样本在采样时可能存在某些操作不当的问题或者是该样本集采样时外部环境有较大变化,导致识别效果不佳。对于香水、榴莲和喷漆而言,不同校验集的情况下识别率都达到了90%以上,在对油漆的识别中,仅在A作为校验集的情况下,识别率相对较差,但仍处于正常范围内。

4 结束语

本文基于仿生嗅觉提出一种应用于空气净化器的气味识别方法。实验中,为了让实验情况更接近于实际情况,通过将传感器模块安装于空气净化器进气口处来获取气味数据,通过PCA和BP神经网络相结合,进行分类识别。实验结果证明了这种方法的可行性。

猜你喜欢

降维识别率校验
Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
基于类图像处理与向量化的大数据脚本攻击智能检测
降维打击
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
炉温均匀性校验在铸锻企业的应用
高速公路机电日常维护中车牌识别率分析系统的应用
大型电动机高阻抗差动保护稳定校验研究
基于加窗插值FFT的PMU校验方法
锅炉安全阀在线校验不确定度评定