用于苹果品质监测的多温度扫描电子鼻系统*
2023-10-25李中洲魏广芬黄正兴朱慧超
刘 旭,余 隽,李中洲,魏广芬,黄正兴,朱慧超
(1.大连理工大学 电子信息与电气工程学部 辽宁省集成电路与生物医学电子系统重点实验室,辽宁 大连 116024;2.山东工商学院 信息与电子工程学院,山东 烟台 264005)
0 引 言
苹果的新鲜程度与其气味有着密切联系,研究表明苹果存储过程中产生气体主要成分有酯类、醇类、乙烯等气体,苹果在变质(如出现烂疤、损伤)或腐败时其散发的乙烯浓度增加,并且可能产生的硫化氢(H2S)、烷烃、氨类等气体[1,2]。这些气体大都具有一定的还原性,所以,使用金属氧化物半导体式传感器可以探测到贮藏苹果气味的变化,进而通过电子鼻技术识别变质苹果的出现。
Ghasemi-Varnamkhasti M等人采用基于8个金属氧化物半导体(MOS)传感器阵列的电子鼻系统,结合主成分分析(principal component analysis,PCA)、线性判别分析(linear discriminant analysis,LDA)和支持向量机(support vector machine,SVM)等模式识别方法,研究草莓的分类问题[3]。另外有学者使用电子鼻测试不同状态的水果气味变化,进而预测水果的压损程度或新鲜程度[4,5]。而具有多传感器的电子鼻系统,常面临高功耗、复杂的传感电路等问题。同时,研究表明,改变单只传感器的工作温度等方法能够产生多维响应信号[6,7],从而构筑虚拟传感器阵列以减少实际传感器数量,进而降低功耗和系统复杂度。
本文开发了一种基于虚实融合微热板气体传感器阵列的便携式电子鼻。微热板气体传感器阵列中的4 只传感器均工作在温度扫描模式下,监测苹果在贮藏期间的气体信息。通过温度扫描测试大幅扩展传感器信号阵列规模的同时采集了更多样本信息。对于在不同品质的苹果气氛实验测得数据,提出了高低工作温度特征值混合的提取样本方法,然后对提取样本进行LDA 算法降维和K 最近邻(Knearest neighbor,KNN)算法分类。最后,分别将本文研究与传统单一温度下工作方式以及多温度非稳态工作的电子鼻进行了对比,讨论了方法的可行性和分类效果。
1 测试原理与数据处理
1.1 系统传感器阵列
传感器采用课题组内自主研发基于互补金属氧化物半导体(complementary metal-oxide semiconductor,CMOS)+MEMS工艺的四阵列微热板传感器芯片,如图1 所示。每只微热板气体传感器由悬空介质薄膜、加热电极、气敏电极以及气敏材料组成[8]。氧化锡(SnO2)和三氧化钨(WO3)为金属氧化物气敏材料研究热点,且对于还原性气体有良好响应[9]。所以,1#、2#涂敷了SnO2气敏材料,3#、4#涂敷了WO3材料。因为悬空结构具有良好的绝热性能,所以微热板气体传感器仅需十几毫瓦(mW)的功耗就能达到气敏材料所需的数百摄氏度(℃)的工作要求[10]。
图1 传感器工作原理
如图1(b)所示,传感器的加热电阻和气敏电阻分别等效为可变加热电阻Rh和可变气敏电阻RS。VH和VCC分别为加热电压和气敏测试电压,采集模块采集负载电阻RL的电压值作为输出,体现了气敏电阻值RS的实时变化
Vout=(RL×VCC)/(RL+RS) (1)
RL为10 MΩ,VCC为3.3 V,测定Rh的I-VH曲线得到在不同加热电压值下的Rh大小。计算微热板传感器的工作温度TS如下
式中 电阻温度系数(temperature coefficient of resistance,TCR)经标定为1.95×10-3/℃,T0为室温21 ℃,R0为216 Ω。
1.2 测试实验设置
被测样品为100 个富士苹果,包括品质良好和有瑕疵的苹果各50 个。表皮状态无缺陷、果径大于70 mm 的为“品质良好”,如图2(a)所示;果径小于55 mm,并且表皮上出现多处果锈的为“有瑕疵”,如图2(b)所示。“混合苹果”样本则是从2 种苹果样本中分别随机抽取合并组成。将电子鼻置于5 L 的密闭玻璃容器内,设置恒温和多温度2种电子鼻的工作模式分别进行气氛采集实验。
图2 测试用富士苹果照片
恒温条件下微热板传感器工作温度为200 ℃,每个测试周期持续10 min;多温度工作模式下,设定100,150,200,250,300,350 ℃6个微热板工作温度,每个温度持续10 min,共计1 h为1个测试周期。分别在实验室空气气氛、品质良好的富士苹果气氛、有瑕疵富士苹果气氛以及混合2 种富士苹果气氛下进行数据采集。为了产生稳定的气体样本,从待测苹果样本中随机取2个富士苹果放置于玻璃容器之中,使其气味在密封容器内自然扩散,等待0.5 h 后气氛稳定,再进行传感器测试。1 个周期传输数据完成后,将苹果取出,待玻璃容器敞开放置0.5 h后进行下一次实验。
1.3 传感器数据处理
将气敏电阻RS在反应气氛中的阻值Rg与在空气中的阻值Ra之比作为响应值RES,由式(1)得
式中 Voutg为传感器在反应气氛中的传输电压值,Vouta为传感器在空气气氛中的传输电压值。并且对响应值RES进行了归一化,如式(4)
式中 RESmax为所有样本数据的最大值,RES 为所有样本数据的最小值,这样就能得到标准化后的数据RESnew。首先根据其曲线特点进行了特征值点的选取,然后采用LDA算法对特征矩阵进行了降维。最后采用KNN 算法对降维后标准化的数据进行分类,并使用3 折交叉验证分类的准确率。
1)特征降维
采用LDA 算法[11]将传感器标准化后的n 维数据RESnew向2 维投影,寻找投影到2 维最佳的投影基向量(ω1,ω2),为了使不同类别的数据的类别中心之间的距离尽可能大,同时同一种类别数据的投影点尽可能接近。定义了Sb为类间散度矩阵,Sw为类内散度矩阵。其定义式如下
式中 Nj(j =1,2,3)为第j类样本的个数,μj为第j类样本的均值向量,Σj为第j类样本的协方差。求解目标式最大值问题,如式(7)
进而求解广义瑞利商的特征值问题,如式(8)
此时的最佳投影向量(ω1,ω2)为SSb的前2 个最大特征值(λ1,λ2)所对应的特征向量构成的矩阵。
2)苹果状态分类算法
在KNN算法[12]中,本文采用3 次闵氏距离计算点与点之间的距离,若n维空间有两点x,y,计算公式如式(9)
最后对于不同的K 值进行了训练,从而得到最适宜K值条件下的最高准确率。
2 系统的整体架构和算法流程
2.1 电子鼻系统的整体架构
电子鼻系统的整体架构如图3所示。
图3 系统整体架构
2.2 系统的软件与算法流程
系统软件分为集成在下位机硬件系统上的程序和用于接收和处理数据的上位机电脑软件算法流程,如图4所示。
图4 整体软件与算法流程
3 实验结果与分析
3.1 特征值点的选取
系统一个测试周期内所采集到的负载电阻RL的电压值Vout数据如图5所示,从100 ℃到350 ℃对传感器进行温度扫描。单个温度对应的600 s 周期内,响应值在前300 s呈现增加或减少趋势,在后300 s趋于稳定。取每个温度第300,400,500 s 的响应值作为稳定阶段初始、中间和后期3类特征点,对原始曲线的稳定阶段进行表征。4只传感器在6种工作温度下相当于构成4 ×6 的虚实结合传感器阵列,每只传感器又包含3类特征。
图5 传感器在不同氛围下的典型响应曲线
使用软件对在6种温度下不同气氛中的特征样本进行单因素方差分析,结果表明,200,250,300,350 ℃温度下不同气氛的特征样本差异较大,所以选用了这4 种温度下的数据进行后续处理。经检验的多重比较结果表明,350 ℃的特征样本品质良好的苹果和混合苹果差异不大。为了进一步增大不同气氛特征样本的差异,将200 ℃和300 ℃的同种特征点、250 ℃和350 ℃的特征点进行混合。如图6 为不同气氛中,混合温度所提取的归一化响应值特征样本,每条曲线为4只传感器在2个温度下采集的同种特征点。取10 个测试周期的数据作为训练集,简称为多温度稳态训练集。
图6 4 种温度的稳态混合特征值样本
取200,250,300,350 ℃各自第50 s和150 s的响应值以及300~500 s的平均响应值作为初始、中间和稳定3类特征点,对原始线进行表征,进一步验证取每种温度所有阶段对分类结果的影响,简称为多温度非稳态训练集。
单因素方差分析的多重比较结果表明在200 ℃工作模式下,4只传感器对不同品质的苹果表现的显著性差异最大。因此,作为对比,只取200 ℃下20个测试周期的数据作为训练集,简称为单一温度稳态训练集。
3.2 LDA算法降维
图7(a)为多温度稳态训练集进行LDA降至2 维后的效果,前2个特征LD1 与LD2 包含了98%以上特征值信息。对于4种特征值混合样本的LDA降维,品质良好的苹果、有瑕疵的苹果以及混合苹果的样本各自的聚类效果较好。不同品质的苹果样本重叠较少,LDA 算法降维的整体效果较好。相较于多温度稳态训练集,多温度非稳态样本的LDA降维结果如图7(b)所示。前2 个特征LD1 与LD2包含了98%以上特征值信息,整体上取得了较好的降维效果,有瑕疵的苹果样本与其他2 种气氛下的样本的类间间距较大,但部分混合苹果和品质良好的苹果样本有混叠。单一温度稳态训练集的前2 个特征LD1 与LD2 包含了97%以上特征值信息,降维效果如图7(c)。不同气氛的苹果聚类效果不明显,有瑕疵的苹果样本类内间距较大,不同气氛的苹果样本混叠较多,尤其是品质良好的苹果样本与混合苹果样本存在大量混叠情况。
图7 LDA降维结果
由LDA的降维结果可见,在微热板4 种工作温度稳定阶段混合的特征样本,相较于多温度非稳定阶段混合特征样本以及单一温度的特征样本进行LDA降维后的效果更优。
3.3 KNN算法分类
将LDA 降至二维过后的样本进行KNN 算法分类决策。多温度稳态混合特征样本、非稳态样本和单一温度的稳态样本的KNN分类混淆矩阵分别如图8(a)~(c)所示。其中,1、2、3 类分别为品质良好、有瑕疵和混合苹果样本。各种气氛样本数量为60、总样本数量为180一致的条件下,使用4种稳态温度下混合的特征样本进行分类。结果表明,对于品质良好的苹果、有瑕疵的苹果以及混合氛围中的苹果的分类准确率都有不同程度的提升,尤其相较于其他2种方法减少了品质良好的苹果被判定为有瑕疵的苹果和混合苹果的数量。
图8 不同样本KNN算法分类混淆矩阵
当K值(近邻样本数)在1~60 变化时,使用三折交叉验证KNN算法的准确率如图9 所示。多温度稳态的混合特征样本的最高准确率为98.3%,相较于多温度非稳态混合特征样本的90%以及单一稳态温度的76.13%的最高准确率有了大幅提升,进而验证了方法的有效性。
图9 不同温度样本准确率随K值变化
4 结 论
本文设计的集成4 只传感器阵列的便携式电子鼻系统,采用了温度扫描工作模式采集苹果的气味信息,使用虚实融合的传感器阵列增加样本数量。对在不同品质的苹果气氛中用多微热板工作温度采集的实验数据,提出了利用其稳定阶段提取特征样本进行高低温度混合的特征值提取方法。并对于提取的特征样本进行了LDA 降维和KNN 算法分类,与常规的单一温度加热以及多温度非稳态的方式相比,最高分类准确率达到了98.3%。并设计了用于人机交互的图形用户界面上位机软件,能够有效地对于苹果品质进行监测,对于贮藏品质良好的苹果中出现有瑕疵的苹果实现准确“报警”。实现了用于苹果品质监测的简单、可视化电子鼻系统设计。