面向火场助燃剂检测的电子鼻系统设计与识别方法初探*
2023-10-08孟庆浩侯惠让邓震宇李宏跃
邓 轩,孟庆浩,侯惠让,邓震宇,李宏跃*
(1.天津大学电气自动化与信息工程学院,天津市过程检测与控制重点实验室,机器人与自主系统研究所,天津 300072;2.应急管理部天津消防研究所,天津 300381)
蓄意纵火是一种犯罪行为,对社会的稳定以及人民财产和生命安全均构成了极大威胁。 根据《中国消防年鉴》[1]和公安部消防局的报告[2],从2015—2019 年,我国共发生火灾141 万起,其中人为的蓄意纵火案件约占每年总火灾发生次数的7%,死亡人数共计7 613 人,受伤人数共计4 794人,直接经济损失达189.67 亿元。 在纵火案件中,犯罪分子往往借助易燃液体(本文称之为助燃剂)放火。 火灾发生之后,火灾现场通常破坏严重、情况复杂,准确地找到起火点、提取物证并确定火场中是否存在助燃剂成分是是纵火案件确定与侦破的关键[3]。
大多数纵火犯采用基于石油基底的助燃剂,如汽油、柴油[4]等。 但随着政府部门加大对石油相关产品的市场监督以及犯罪分子反侦查能力的增强,犯罪分子也会使用酒精、稀料(油漆稀释剂)等液体作为助燃物质。 由于火场影响因素较多,导致火场助燃剂残留物的检测和识别的研究极具挑战[5]。
助燃剂鉴定结果是认定放火嫌疑案件的有效证据。 目前,用于助燃剂鉴定的方法包括气相色谱-质谱(GC-MS)法、拉曼光谱法、薄层色谱法、傅里叶红外光谱法及热分析-质谱联用等,其中GC-MS 法是国内外最为公认的助燃剂鉴定方法[6-10]。 但是,GC-MS 设备昂贵,识别过程耗时长,对结果的解释高度依赖于分析人员的经验,且无法在火灾现场及时地识别助燃剂残留物。 基于传感器阵列的电子鼻是一种仿生的气味指纹图谱识别技术,由气体传感器阵列、信号处理系统和模式识别方法组成。 因其具有较好的便携性、较低的成本、较快的识别速度等优点,近些年在食品监测、疾病诊断、环境监测和安全保护等领域得到了越来越多的应用[11]。 火场助燃剂一般具有较强的挥发性,且释放到空气中多为复合气体或气味,因此电子鼻有望在此领域发挥作用。 据本文作者所知,目前应用于火场助燃剂识别的传感器阵列式电子鼻相关研究较少,傅得锋[12]利用快速气相色谱式电子鼻实现了不同标号汽油的区分,Marta 等[13]利用顶空-质谱电子鼻识别五种不同助燃剂。 由于目前在助燃剂鉴定领域使用的电子鼻采用的技术为气相色谱分析、质谱分析等,而非通过气体传感器阵列采集气味指纹图谱,与本文提到的基于传感器阵列式的电子鼻采用不同机理和思路,导致其不具备传感器阵列式电子鼻的便携性、低成本、快速识别等优点。
为解决在火灾现场快速、准确鉴别残留助燃剂的难题,本研究设计了一种面向火场助燃剂检测的电子鼻系统(简称火鼻Ⅰ号),并采用此电子鼻采集燃烧和未燃烧两种条件下四种常见助燃剂(汽油、柴油、酒精和稀料)释放的气味,建立了2 套数据集。 在此基础上,给出了通道分离CNN(CS-CNN)算法并与四种传统的机器学习算法和两种深度学习算法进行了对比,初步的结果验证了电子鼻用于火场助燃剂识别的可行性。
1 火鼻Ⅰ号系统设计
1.1 传感器选型
针对不同应用领域的电子鼻,所需气体传感器类型也不同,常见的气体传感器有金属氧化物半导体(Metal-Oxide Semiconductor,MOS)型、导电聚合物型、质量敏感型、电化学型、催化燃烧型和光学型等。其中,MOS 传感器具有使用寿命长、灵敏度较高、体积小、价格低等优点,因此在电子鼻领域得到了广泛的应用。 MOS 型传感器具有广谱响应特性,一般需要使用多个具有不同敏感特性的传感器构成阵列,以提升电子鼻系统的选择性。
在进行传感器选型时,需要保证传感器阵列对助燃剂有明显响应且具有一定区分度。 经查阅助燃剂成分相关文献[14-16],汽油主要成分为烷烃类物质、芳烃类物质等,柴油主要成分为烷烃、烯烃、芳香烃和稠环芳烃等,稀料主要成分为乙醇、环烷烃化合物、酯类化合物以及甲苯、二甲苯、三甲苯等芳香烃化合物。 在综合考虑传感器的检测性能、对助燃剂主要成分敏感性、成本及尺寸的基础上,本研究选取了15 个贴片式MOS 传感器构成阵列。 所选传感器的具体型号及其对应的敏感气体、检测下限和生产厂家如表1 所示,其中MICS-4514 产生两路输出,这样传感器阵列共输出16 路电压信号。 出于最大化利用空间的考虑,传感器被分别焊接于两块PCB 板上,两块PCB 板分别包含9 个传感器(ASMLV-P2、CCS801、TGS8100、MICS-4514、MICS-5914、GM-102B、GM-602B、GM-702B、GM-802B)
表1 火鼻Ⅰ号传感器阵列具体信息
与6 个传感器(GM-202B、GM-302B、GM-402B、GM-512B、MICS-2714、MICS-5524),两块PCB 板上的15 个不同型号传感器共同组成传感器阵列,板间信号通过柔性印刷电路(FPC)线连接。 传感器阵列分布如图1 所示。 为使各传感器和待测气体接触的时间和气体的流速尽可能相同,传感器被尽量对称地安放到气室中轴线的两侧。
图1 传感器阵列分布图
1.2 气室设计
密闭性好且空间小的气室便于待测气体与传感器的充分接触,有利于传感器产生明显响应且缩短气室清洗时间。 气室外形及实物如图2 所示。 基于课题组前期大量的气室结构研究,本文气室设计采用了简单、有效的长条形结构[17]。 此外,在气室进出口处设有缩紧结构,便于平稳进出口处的气流流速,进而使气室内各传感器附近的气流方向、流速等尽可能一致,从而有效增强各传感器响应条件的一致性[18]。
图2 火鼻Ⅰ号电子鼻气室外形及实物图
气室通过3D 打印技术制作,所使用材料为无异味的高性能尼龙,具有良好的耐高温性能、化学惰性以及气密性。 气室壁厚为6 mm,顶面及底面开口,气室四周留有四个内径0.5 mm 的螺丝孔,通过螺丝固定气室和上下两个电路板,气室内部因此形成了一个密闭的空间,在气室与PCB 板交接处留有1 mm 深的凹槽,在其中填入无异味密封圈,以加强气室与PCB 板贴合的紧密性,使气室具有更好的气密性。
1.3 硬件设计
本研究设计的火鼻Ⅰ号整体结构如图3 所示。
图3 火鼻Ⅰ号系统框图
火鼻Ⅰ号系统主要由气路和电路(包括信号采样、传输和控制)两部分组成。 气路部分的气体流动由真空泵抽气控制,气泵位于气路的末端,通过透明胶管连接气室后端以及气泵吸气口,气室前端连接用于气路切换的电磁阀,三者构成气体流通路径。信号采集和传输部分包括传感器阵列、运算放大器、阻容(RC)滤波电路和模/数(A/D)转换四个模块。传感器供电电压为5 V,传感器阵列与待测气体在气室内反应输出响应信号(电压值),信号经过运算放大器和阻容电路放大滤波后,由模/数转换电路转换为16 位数字信号,并通过串行外设接口(SPI)通讯发送给控制器。 控制部分选用Jetson Nano 核心板,实现数据的采集、显示和保存等功能调控。 以上功能集成在一个操作简便的人机交互界面内,通过点击液晶触摸显示屏实现相应功能。
火鼻Ⅰ号整体尺寸为260 mm × 140 mm ×132 mm,整机功耗不高于20 W,配备15 000 mAh 电池,可持续工作10 h 以上,便于研究人员在火灾发生后进行长时间现场操作。 该电子鼻系统进行单次识别不超过30 s,可实现助燃剂的快速检测。
2 实验设计
2.1 未燃烧实验
火场环境较为复杂,可以作为助燃剂的可燃液体种类众多,本研究选取了最常见的四种典型助燃剂作为主要实验材料,包括汽油、柴油、酒精以及稀料。
本研究首先分析了助燃剂气体浓度对其识别的影响,通过采集一定体积比的待测气体和空气来控制目标气体浓度。 例如,使用流量为1 L/min 的气泵抽取5 min 的待测气体至采样袋,将此采样袋内气体浓度定为100%,使用流量为1 L/min 的气泵抽取2.5 min 的待测气体以及2.5 min 空气至采样袋,将此采样袋内气体浓度定为50%,以此类推,最终获取了100%、50%及20%共三种浓度气体。
各类助燃剂样本数量如表2 所示。
表2 助燃剂样本数量表
由于汽油为混合物,不同种类汽油成分不同,为分析成分对助燃剂识别结果的影响,2 号汽油以及3号汽油仅采集100%浓度。
2.2 燃烧实验
为模拟真实火场环境,本研究将助燃剂与轮胎混合燃烧,并将燃烧后的气体采集至气袋中。 为了判断是否有助燃剂参与燃烧,选取火灾中常见的干扰物如纸张、木材、棉花(表3)等在不加入助燃剂的情况下单独燃烧,并用气袋采集燃烧后的气体。
表3 燃烧后样本数量表
为了保证实验安全,燃烧在应急管理部天津消防所的燃烧实验室进行,保证了燃烧实验的安全性。
2.3 实验数据采集
在火鼻Ⅰ号进行气体采集之前,需要提前0.5 h上电预热,保证传感器处于适宜反应的温度,在预热过程中真空泵抽取清洁空气清洗气路及传感器。 在实际应用中,火灾调查是在消防人员赶至现场扑灭火势并冷却后的才开始进行,而电子鼻可在接到报警时进行上电,从消防人员出警至火灾调查阶段一般超过0.5 h,因此火鼻Ⅰ号可以实现灾后现场的快速检测。 由于灾后现场环境复杂、存在大量干扰因素,通过气袋进行气体采集后识别虽然在一定程度上降低了检测与识别的快速性,但有助于提升识别准确率,且这种方式仍然远快于目前常用的气相色谱质谱方式。
待MOS 传感器阵列基线稳定后将火鼻Ⅰ号的进气管连接至气袋出气口,打开气袋阀门,真空泵将气体抽至气室中与传感器阵列发生反应。 一个采样周期过程为:空气基线采集(5 s)—待测气体采集(8 s)—恢复阶段(17 s)。 采样周期持续30 s,之后进行2 min 的清洗阶段使传感器响应恢复至基线阶段。 采样频率设置为60 Hz。 对于酒精气体的单次采集结果如图4 所示。 其中横坐标对应时间,纵坐标对应传感器响应值,不同线型对应不同传感器,其中响应值为与气体传感器串联的负载电阻两端电压值,由于串联分压作用,基线值并非为0 V。 判断传感器是否有响应的依据是电压是否有上升,电子鼻所采用的模数转换芯片精度为1.22 mV,若传感器未与气体发生反应,响应电压一般稳定在基线或呈下降趋势,当响应电压值出现1.22 mV 及以上时,即可认定传感器产生响应。 当进入待测气体采集阶段(5 s~13 s)后,所有响应曲线均呈现上升趋势,且各传感器响应幅值不同,恢复阶段(13 s~30 s)传感器响应值逐渐下降。
图4 火鼻Ⅰ号采集酒精气体的响应图
3 助燃剂识别算法
目前国内外电子鼻信号分类领域常用的模式识别算法有k近邻[19]、支持向量机[20](SVM)以及人工神经网络[21]等。 近年来,以人工神经网络为基础的深度学习技术在语音和图像识别及自然语言处理等领域取得了可喜的进展。 卷积神经网络[22](Convolutional Neural Network,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,与其他深度神经网络相比具有更少的参数,便于实现轻量化并嵌入便携式电子鼻系统中。 本文采用通道分离卷积神经网络(CS-CNN)网络建立助燃剂识别模型,并与在电子鼻信号分类领域广泛应用的一维卷积神经网络(1D CNN)、二维卷积神经网络(2D CNN)网络以及k近邻、SVM、决策树及随机森林四种传统机器学习算法进行对比。
3.1 电子鼻信号特征提取
由于火鼻Ⅰ号采集到的初始数据维度过高,无法直接输入到分类器中,因此在建立分类模型前要对初始数据预处理,包括特征提取与特征降维。
根据传感器响应曲线的形状特点,提取七个典型时域特征,分别为采样阶段变化值F1、一阶微分最大值F2、一阶微分最大值对应值F3、一阶微分最小值F4、一阶微分最小值对应值F5、二阶微分最大值F6、二阶微分最小值F7,七种特征对应计算方法如式(1)~式(7)所示:
式中:V代表传感器的响应值,ts代表开始待测气体采集时刻,te代表结束待测气体采集时刻,tmax、tmin分别代表一阶微分最大、最小值对应时刻,max(·)和min(·)分别代表取最大和最小值。
对电子鼻的15 个传感器输出的16 条响应曲线分别提取上述7 个特征,共112 个特征,之后通过主成分分析法降维至10 维,并对新生成的10 维特征进行标准化处理。 最终生成的标准化特征可直接输入分类器模型中。
3.2 通道分离CNN 算法
火鼻Ⅰ号传感器阵列采集的原始数据为多变量时间序列,其数据维度为m×n×1(其中m为传感器数量,n为采样点个数)。
常规的卷积运算使用的是与输入的特征图具有相同通道数的卷积核,卷积核的每个通道与输入的每个通道对应卷积后相加就得到输出特征的一个通道上的一个数据点。 常规的卷积操作实现通道相关性和空间相关性的联合映射,单个卷积核的任务是同时映射通道相关性和空间相关性。 电子鼻的传感器数量相当于通道数量,每一个传感器采集的时间序列代表空间维度。 对于电子鼻数据而言,通道维度间的相关性与空间维度间的相关性可以分开映射,以达到更好的特征提取效果。 因此,本研究采用CSCNN[23]进行特征提取。 通道分离卷积主要分为两个过程,分别为逐通道卷积(Depthwise Convolution,DW)和逐点卷积(Pointwise Convolution,PW)。
DW 过程中一个卷积核负责一个通道,一个通道只被一个卷积核处理。 输出的特征图与原始输入通道数相同。 PW 的卷积核尺寸为C×1×1,C为上一层的通道数。 PW 运算会将上一步DW 输出的特征图在通道上进行加权组合,生成新的特征图,输出特征图的数量与PW 核的个数相同。 本文所使用的CS-CNN 整体模型如图5 所示。
图5 CS-CNN 模型图
将通道分离卷积单元与其他网络结构整合构成的CS-CNN,整体网络结构与参数设置如表4 所示。
表4 网络结构与参数设置
假设输入特征图尺寸为H×W×Cin,其中H、W、Cin依次代表输入特征图的高、宽和通道数,卷积核尺寸为KH×KW×Cin,其中KH、KW代表卷积核的高和宽,生成一个尺寸为H×W×Cout的输出特征图,所需参数量为KH×KW×Cin×Cout。
使用通道分离卷积单元,通道卷积负责滤波,尺寸为KH×KW×1,共Cin个,作用在输入的每个通道上,参数量为KH×KW×1×Cin;逐点卷积负责转换通道,尺寸为1×1×Cin,共Cout个,作用在通道卷积的输出特征映射上,参数量为1×1×Cin×Cout,通道分离单元参数量与常规卷积参数量对比如式(8)所示:
由上式可知,通道分离卷积单元与常规卷积运算相比可以大幅度减少参数量与计算量,便于算法嵌入便携式电子鼻平台上。
本研究网络模型使用PyTorch 框架搭建。 训练时网络参数优化算法选用Adam 优化器,损失函数选择交叉熵,初始学习率设置为0.000 3,批尺寸设置为16,epoch 设置为50。
CS-CNN 网络与1D CNN 网络、2D CNN 网络模型大小以及Flops 对比如表5 所示。
表5 网络模型大小与Flops 对比图
由表5 可见,CS-CNN 网络通道具有较小的网络参数量、较低的模型复杂度和更快的运算速度,便于嵌入到运算能力相对较低的便携式电子鼻系统中。
4 结果与分析
本研究对未燃烧实验与燃烧实验分别建立识别模型,并对比不同识别算法的识别效果。
4.1 未燃烧助燃剂识别模型对比
将未燃烧助燃剂共2 440 个样本与200 个空气样本划分为5 类(汽油、柴油、酒精、油漆稀释剂、空气),并进行训练集与测试集划分,采用2 折交叉验证方法。 首先按比例将不同标签的样本均匀划为2份子集,挑选其中1 份作为测试集,另1 份作为训练集用于模型训练,重复2 次,分别建立2 个模型,取2 个模型在测试集上准确率的平均值作为识别准确率。
分别绘制CS-CNN 模型、1D CNN 模型、2D CNN模型以及SVM 分类器下的混淆矩阵如图6 所示。
图6 混淆矩阵对比图
由混淆矩阵可见,各分类器均能较好地区分四种不同助燃剂与空气。
在此基础上进一步按照浓度将助燃剂细分为表2中的14 个类别,和200 个空气样本混合对分类模型进行训练,以此检验各算法对助燃剂内部细微差别的区分能力。 不同分类器在两种分类情况下的平均准确率如表6 所示。
表6 未燃烧助燃剂不同分类器分类效果
由表6 可见,当不考虑浓度因素影响(5 分类)时,分类模型均能取得较高识别准确率,当考虑浓度影响因素(15 分类)后,各分类器识别准确率均有一定程度的下降,其中CS-CNN 网络模型在两种分类情况下均取得了最佳结果,且浓度因素对其识别结果影响较小,说明CS-CNN 网络模型具有较好的泛化性,当目标气体浓度不低于传感器的检测下限时,有望在任意浓度下均可准确识别助燃剂类别。
4.2 燃烧后助燃剂识别模型对比
将燃烧后的1 240 个样本与200 个空气样本划分为5 类(汽油+轮胎、柴油+轮胎、酒精+轮胎、干扰物、空气),采用2 折交叉验证方法,各分类算法的识别准确率如表7 所示,各分类算法均可准确区分各类助燃剂与干扰物,其中CS-CNN 取得了最优的识别准确率。 由于同类气体均来源于相同采气袋,使得气体类内差异性小,故各算法的识别率普遍较高。
表7 燃烧助燃剂不同分类器分类效果
4.3 超参数寻优实验
由于CS-CNN 在进行逐通道卷积后使用逐点卷积提取不同通道之前的耦合特征,通过选取不同的逐点卷积核数量改变逐点卷积对通道间的耦合特征提取能力。 固定网络其他参数,分别设置逐点卷积核数量为8、16、32、64、128,对比不同逐点卷积核数量对模型分类准确率的影响。 对五种不同卷积核数,在未燃烧助燃剂数据集上分别采用2 折交叉验证方法,模型准确率对比结果如图7 所示。
图7 不同逐点卷积核个数下的模型准确率对比结果
由图7 可见,随着逐点卷积核个数由8 个增大到32 个时,通道间耦合特征提取能力增强,模型准确率随之增加,当逐点卷积核个数进一步增大时,反而提取了通道间的冗余特征,造成模型过拟合,导致模型准确率下降,因此本文选取逐点卷积核个数为32。
5 结论
本文设计了一种用于火场助燃剂检测与识别的电子鼻系统,并基于此电子鼻采集四种助燃剂在未燃烧与燃烧两种情况下释放的气体,从而建立了2套助燃剂气体数据集。 分别采用支持向量机、k近邻、决策树、随机森林、1D CNN、2D CNN 和通道分离CNN 七种算法进行了助燃剂识别实验,结果表明通道分离CNN 优于其他六种算法。 在类别增多后,通道分离CNN 的分类准确率没有出现明显下降,具有更强的鲁棒性。 电子鼻系统单次检测时长不超过30 s,初步实现了对四种常见助燃剂以及干扰物之间的准确识别。
在实际助燃剂检测与识别应用中,电子鼻会受到火灾现场复杂环境的干扰,因此需要提高电子鼻硬件的稳定性。 目前的研究只针对4 种典型助燃剂在燃烧与未燃烧情况下进行实验与分析,在后续的研究中需要建立更为完善的燃烧助燃剂气体数据库。 此外,深度学习网络依赖大量训练数据,且训练时间长。 为了提升深度学习网络的适用性,可以考虑建立云端数据处理系统,将电子鼻采集数据上传至云端进行分析识别。 本研究采用的电子鼻自初次使用至今已有8 个多月,依然可以准确识别四种典型助燃剂,初步证明传感器稳定性较好,后续将继续检测该方面性能,同时将尝试加入其他气体环境监测传感器以实现如PM2.5、PM10、温湿度、风速风向、大气压等参数监测,并将探索电子鼻在长期环境监测方面的性能。