用于山核桃陈化时间检测的电子鼻传感器阵列优化
2017-03-04徐克明邓凡霏韦真博程绍明
徐克明,王 俊,邓凡霏,韦真博,程绍明
用于山核桃陈化时间检测的电子鼻传感器阵列优化
徐克明,王 俊※,邓凡霏,韦真博,程绍明
(浙江大学生物系统工程与食品科学学院,杭州310058)
为更好地进行山核桃陈化时间检测,论文拟通过传感器阵列优化来有效提高电子鼻对其区分预测能力。该文依据响应曲线保留响应明显的传感器,并在提取传感器特征值构成初始特征矩阵的基础上,结合均值分析、变异系数分析、聚类分析、相关性分析和多重共线性分析进行逐步优化以获取最终优化传感器阵列。对优化前后的数据采用主成分分析法(principal component analysis,PCA)和偏最小二乘回归(partial least squares regression,PLSR)进行样品区分和预测能力的对比。结果表明:通过优化,经不同人工陈化时间(0、5、10、15d)处理的山核桃能有效区分开,且在PCA得分图中更为聚集;优化后的陈化时间回归模型(2=0.933 4)较优化前(2=0.888 7)具有更好的预测能力。说明所给出的阵列优化方法有效可行,为电子鼻针对性检测提供了一种思路。
传感器;优化;主成分分析;电子鼻;特征值矩阵;偏最小二乘回归
0 引 言
中国是山核桃生产大国,2013~2015年,山核桃产量分别为1422万t、1562万t、172万t[1-2],占世界总产量的近一半。由于山核桃极高的营养价值和独特的口感,使其成为广受消费者喜爱的高档坚果。然而,坚果中的油脂易受光照、氧气、水分等环境因素的影响,氧化酸败而产生哈味,不仅使其营养价值大大降低,也严重破坏了其独有的口感[3],因此进行山核桃品质检测具有一定的实际意义。常用的品质检测方法有感官评价、微生物检测、理化指标测定等传统检测方法以及近红外光谱分析[4-5]、机器视觉分析[6]等无损检测方法。然而传统检测方法耗时且成本高昂,光谱分析与机器视觉在坚果品质的检测中易受外壳干扰,具有一定的局限性。
电子鼻是一种基于特定气敏传感器阵列来模拟动物嗅觉的仿生系统,通过获取样品中挥发性成分的整体信息即“指纹图谱”,以实现客观、准确、快速地识别样品。近年来,许多研究者将电子鼻技术应用于复杂气体的检测识别,并得到了很好的应用,其中也包含了坚果品质检测[7-9]。相比于传统检测方法及上述无损检测方法,电子鼻具有高效、便捷的优点,同时其通过检测样品挥发性气体来分析其内部品质,受外壳干扰小,准确度高,在坚果品质检测领域具有很好的应用前景。
传感器阵列是电子鼻系统尤为关键的一部分,其性能的优劣在很大程上决定了电子鼻检测性能的好坏。由于山核桃气味成分复杂,且不同陈化时间山核桃之间的差异性较小,为提高识别的准确性,需进行阵列优化以获得较佳的传感器阵列。
常见的传感器阵列优化方法多以传感器个体为对象,即提取传感器某一特征值表征传感器,采用搜索性[10-12]或非搜索性[13-14]特征选择策略进行优化。搜索性特征选择策略如史波林[15]等提取传感器响应最大值构成特征矩阵并利用遗传算法进行阵列优化;非搜索性特征选择策略如王智凝等[16]及亓培锋等[17]提取传感器响应的相对变化值及稳定值分别构成特征矩阵并结合一系列多元统计算法进行优化。然而,由于不同传感器的不同特征值在模式识别中均具有包含有效信息的可能,为获取较佳传感器阵列,本文在提取电子鼻原始信息的多个相关特征值构成初始特征矩阵的基础上,提出一种以特征值为对象,并基于非搜索性特征选择策略的传感器阵列优化方法。对阵列优化前后的数据,采用主成分分析(principal component analysis,PCA)法进行样品区分能力对比,并用偏最小二乘回归(partial least squares regression,PLSR)分析法验证优化矩阵的预测能力,以验证优化的有效性。
1 材料与方法
1.1 材料
试验所用山核桃为采摘于临安市龙岗镇的新鲜山核桃。挑选颜色、大小基本一致的新鲜山核桃置于温度为35 ℃、相对湿度为30%的陈化箱(CTHI-150B,施都凯仪器设备有限公司)进行人工陈化,每隔5 d取样一次,获得人工陈化时间为0、5、10、15 d的山核桃,其中未陈化的即为新鲜山核桃。
1.2 仪器与设备
试验使用浙江大学农业装备与智能检测(AE&ID)团队自行研发设计的嵌入式电子鼻系统,结构如图1所示。其由气敏传感器阵列、直筒式气室、放大调理电路、DSP采集控制系统、可编程智能触摸显示屏(PS-LCD)、SD卡及蓝牙模块等组成。
1.气体采样操作器2. 进气口 3. 数据线 4. 电源线 5. 开关 6. 触摸显示屏 7. 信息处理与控制系统
根据山核桃挥发性气体已有的GC-MS分析结果[18-19],针对含量较多的醛类、烯烷烃类、醇类、酸类等挥发性成分初步选择13只金属氧化物传感器,它们分别是S1(TGS2600)、S2(TGS2602)、S3(TGS822)、S4(TGS825)、S5(TGS2444)、S6(TGS2611)、S7(MQ138)、S8(TGS2620)、S9(WSP2110)、S10(TGS826)、S11(TGS2442)、S12(TGS813)、S13(TGS816)。各传感器工作电压为3.3V,加热电压为5V,保持采样室温度为(25±2)℃。
1.3 试验方法
山核桃进行人工陈化后,将其均匀地分成30份,每份20颗。试验采用静态顶空采样方式,将山核桃置于 500 mL的烧杯中,用保鲜膜将其密封静置1 h。检测前用空气将电子鼻响应信号清洗至基准值,清洗时间为90 s,然后用电子鼻的针头刺入保鲜膜,抽取顶空气体进行检测,电子鼻检测时间为60 s,数据采样时间间隔为1 s。每检测一次,都需用空气进行清洗方可进行下一轮检测。
1.4 传感器阵列优化方法
在电子鼻的应用中,传感器阵列由灵敏度高、敏感带宽的气敏传感器组成,同时其具有稳定性好、响应速度快的特点[20-21]。本文待构造初始传感器阵列及进行特征提取获得初始特征矩阵后,采用非搜索性特征选择策略进行优化。非搜索性特征选择策略主要通过考察初始阵列中各传感器的相关特性,如灵敏度、选择性、重复性、稳定性、相关性等,来淘汰阵列中性能不好的个体以实现优化的目的。阵列优化具体流程如图2所示。
图2 传感器阵列优化流程
2 结果与分析
本试验以特征值为对象进行阵列优化,故首先依据初步选择的13只气敏传感器对山核桃的响应信号来剔除响应不敏感的传感器以构成初始传感器阵列,然后对阵列中各传感器进行多个特征值提取以获得初始特征矩阵,并结合非搜索性特征选择策略进行优化。
2.1 传感器响应分析
图3为新鲜山核桃检测中的13个传感器电阻比的变化响应图。从图中可知,传感器S11、S12、S13的响应曲线比较平稳即几乎没有响应和变化,说明其对山核桃挥发性气体不敏感。其余10只传感器随着挥发物在传感器表面富集不断地增大,传感器的电导比不断增大,并在40 s后趋于平缓,达到一个相对稳定的状态。对于几种不同陈化时间的山核桃样品,传感器响应趋势大致相同(图略),传感器S11、S12、S13几乎没有响应和变化,因此剔除传感器S11、S12、S13,选择剩余的10只传感器构成初始阵列。
2.2 特征参数提取及初始特征矩阵构建
特征参数提取需尽可能选取能表征原始曲线信息的特征参数,有效的提取可以大大提高电子鼻性能[22]。在实际应用中,平均微分值[23]、稳定值[24]、面积值[25]等作为常见的特征参数被应用于模式识别中,且均取得不错的区分效果。因此本试验提取传感器初始阵列中传感器的平均微分值、稳定值、面积值作为特征参数,则每个测试样品共提取10´3个特征参数,构成30维特征矩阵;每个测试样本的30个特征参数分表标记为M,S,P,=1,2…10,其中M,S,P分别代表第个传感器的平均微分值,稳定值,面积值。阵列中的传感器编号为1,2…10,对应关系如表1所示。
表1 特征编号和传感器编号的对应关系
2.3 基于响应差异性和稳定性的传感器阵列筛选
由于传感器性能不一,不同传感器的特征值往往会表现出不一样的特性,因此每个测试样品所提取的特征值不一定对分类识别都起到积极的作用,有的甚至会产生消极的影响[26]。
2.3.1 均值分析
为获得差异性较大的特征值和优化传感器阵列,本文采用均值分析[27]方法来分析特征值的差异性。均值分析指对处理结果均值的分析,是一种近似分析法,属于非参数统计范畴。通过计算不同陈化时间山核桃30个样品特征值均值的相对变化率,来直观反映其差异性。
采用主成分分析对各个测试样品的初始特征矩阵进行鉴别分析,结果如图4a所示。由图可知,陈化10 d和陈化15 d处理的山核桃并不能很好地被区分开,且未陈化与陈化5 d山核桃的类内距较大。故以陈化10 d和陈化15 d山核桃原始数据为基础,进行均值分析,来剔除陈化10 d和陈化15 d山核桃样本中变化不明显,即差异性小的特征值,以降低数据冗余度。
由表2可知,陈化时间不同,各传感器的特征值存在差异,而样本间特征值差异性大小取决于成分变化显著与否。故为了提高特征矩阵的有效信息比例,需剔除相对变化率较小的特征值。
陈化时间 Aging time/d
表2 人工陈化10 d与陈化15 d山核桃样本特征值均值的相对变化率
经对比发现,剔除相对变化率小于5%的特征值,即剔除编号为1、1、2、5、5、6、7、7、7、8、8、9、10、10的特征值后,不同陈化时间处理的山核桃区分效果较佳,PCA1和PCA2贡献率分别为73.60%、14.77%,其PCA得分图如图4b所示。此时,人工陈化10 d与陈化15 d的山核桃能基本区分开,且同类样品聚集度明显提升。
2.3.2 变异系数分析
变异系数常作为数据变异程度的判定标准,若变异系数过大,说明测试数据离散程度较大,即稳定性不好,需将其剔除,反之则说明其稳定性好,可以采用[28]。变异系数(CV)计算公式如式(1)所示:
根据上式分别计算陈化10 d与陈化15d山核桃响应信号特征值的变异系数,其结果如表3所示。从表中可知,编号为6和10的特征值在陈化10 d和陈化15 d处理的山核桃样本中,其变异系数均大于0.15,故予以剔除。PCA处理结果如图4c所示,可知各类样品类内距进一步减小,陈化10 d与陈化15 d山核桃类间距增大,且此时PCA1和PCA2累计贡献率为91.47%,有所提高。
表3 人工陈化10 d与陈化15 d山核桃样本特征值的变异系数
2.4 基于数据相关性的传感器阵列筛选
2.4.1 聚类分析和相关性分析
聚类分析可依据研究对象的特征,将其根据一定的相关关系进行聚类,有助于后续探求其间的相关性。本文对经均值分析和变异系数分析筛选得到的14个特征值以平方Euclidean距离为度量标准,组间联接为聚类方法进行聚类分析[29]。
特征值聚类全过程如图5所示。若特征值对应的直方柱相连接,则相应特征值归为一类。反之,则属于不同类。由此可知,当特征值聚为2类时(图中虚线所示),则3、4、6和2、3、4、8、9、1、2、3、4、5、9各聚为一类。聚类数为4类、5类、6类等时,特征值聚类情况依次可从图中推出。
经聚类分析处理后,各类内特征值之间存在相似性,需从各类中选取有效信息较多的特征值作为该类的代表以剔除冗余信息[30]。由于在不同的聚类情况下,将会产生不同的特征值筛选结果。为获取较佳优化效果[31],本文在特征值分别聚为2、3、4、5、6、7、8类时,结合相关性分析进行逐一验证。然而相关系数[32]只能反映任意两个特征值之间的相关性,无法推知和其余类外特征值的整体相关度,故采用相关系数绝对值累加和R来反映特征值与其他类特征值的整体相关性,计算公式如下:
式中为类数,为各类中特征值个数,为该特征值所在类,R为该特征值与第类第个特征值之间的系数。
图5 特征值聚类全过程冰柱图
Fig.5 Icicles figure of clustering process of features
当聚类数为4时,经相关性分析所得特征矩阵的PCA结果如图6所示。从中可知,未陈化与陈化5d山核桃类内矩变大,类间距变小,区分效果相对变差。经逐一对比发现,当特征值聚为6类时,即第一类:2、3、8、9;第二类:1、2、3、4、5、9;第三类:3;第四类:4;第5类:6;第6类:4,基于筛选后特征矩阵的PCA区分效果最佳,其结果如图4d所示。此时,相关性分析结果如表4。
陈化时间 Aging time/d
图6 聚类数为4时的PCA得分图
表4 各特征值的相关系数绝对值累加和(Rr值)
R值越小,该特征值与其他类特征值相关度越低。但当剔除第一类与第二类中R小于6的特征值时,由于剔除特征值过多,使得其有效信息丢失,从而导致PCA区分效果不佳。故优先考虑第一类中R值小于8的特征值,即删除特征值3;优先考虑第二类中R值小于6的特征值,即删除特征值1、4;其余各类特征值均保留。
2.4.2 VIF多重共线性分析
方差膨胀因子(variance inflation factor, VIF)即容忍度的倒数[33],其反映了特征值与特征矩阵间的相关性。VIF越大,共线性越大。一般地,0 式中VIFi是第个变量的方差膨胀因子;R是以第个变量为被解释变量,其余1个解释变量为解释变量建立多元线性回归模型的决定系数。 将不同人工陈化处理山核桃对应的实际陈化时间预先设定为0、5、10、15 d,用SPSS对4种不同陈化时间山核桃检测得到的特征值进行多元线性回归分析并结合上式以获取各特征值的VIF值,结果如表5所示。经验证,当剔除VIF值大于20的特征值,能取得较好的区分效果。故剔除编号为2、3、9的特征值获得最终优化特征值矩阵。 表5 各特征值方差膨胀因子 2.5 检验结果与分析 综合上述一系列对初始特征矩阵的优化方法,选取编号为2、3、4、4、5、6、8、9的特征值作为最终优化矩阵,并根据特征值选择对应的传感器组成传感器阵列,其对应关系如表6所示。 表6 优化阵列中传感器型号、特征值编号及特征值之间的对应关系 优化后特征矩阵的PCA得分图如图4e所示,即为经VIF多重共线性分析后的结果图,通过对比图4a和图4e可知,优化后的特征矩阵前两个主成分的贡献率分别为:76.01%、14.60%,较优化前的66.36%、13.45%有所提高。陈化10 d和陈化15 d山核桃也得到了明显的区分,同时各类山核桃的聚集度也明显提高。 为进一步验证优化阵列对不同陈化时间山核桃的预测能力,每批样品取20个样本作为训练集,10个样本作为预测集,分别提取经PCA降维处理后矩阵的前5个主成分进行PLSR分析,以建立预测模型。 图7a和图7b分别为阵列优化前后的PLSR分析结果,对比可知:优化后预测模型的R(0.9334)和均方根误差(RMSE=1.452 9 d)均优于优化前(R=0.8887,RMSE=2.509 2 d),且训练集与预测集的R和RMSE没有很大差异,说明预测模型不存在过拟合现象,即表明基于优化后特征矩阵建立回归预测模型有效可用,且对不同陈化时间处理的山核桃较优化前具有更好的预测能力。 图7 优化前后特征矩阵PLSR分析结果 本试验以特征值为对象,根据非搜索性特征选择策略进行传感器阵列优化。试验采用AE&ID团队自行设计的嵌入式电子鼻对经不同人工陈化处理(0、5、10、15 d)的4批山核桃样品进行检测,在提取响应明显传感器特征值构成初始特征矩阵的基础上,结合均值分析、变异系数分析、聚类分析、相关性分析及方差膨胀因子分析对初始特征矩阵进行逐步筛选优化,最终获得由TGS2602、TGS822、TGS825、TGS2444、TGS2611、TGS2620、WSP2110构成的传感器阵列及其相应特征值组成的优化特征矩阵。优化后特征矩阵基于主成分分析(principal component analysis,PCA)的区分效果更好,所建立的偏最小二乘回归(partial least squares regression,PLSR)预测模性能更佳(2=0.9334,RMSE=1.452 9d)。证实了本文提出的优化方法能有效优化传感器阵列,降低了数据维度,为专用性电子鼻的研发提供了一种思路。 [1] 李淑芳,习学良,杨建华,等. 我国核桃产业标准化现状与进展[J]. 北方园艺,2016(22):185-188. Li Shufang, Xi Xueliang, Yang Jianhua, el at. Present situation and progress of standardization of walnut industry in China[J]. Northern Horticulture, 2016(22): 185-188. (in Chinese with English abstract) [2] 张有林,原双进,王小纪,等. 基于中国核桃发展战略的核桃加工业的分析与思考[J]. 农业工程学报,2015(21):1-8. Zhang Youlin, Yuan Shuangjin, Wang Xiaoji, el at. Analysis and reflection on development strategy of walnut processing industry in China[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(21): 1-8. (in Chinese with English abstract) [3] 金应,路兴花,庞林江,等. 基于理化指标的山核桃新鲜度模型构建[J].食品与机械,2011(6):209-211,240. Jin Ying, Lu Xinghua, Pang Linjiang, el at. Model of aging time of walnut (carya cathayensis sarg) base on physical and chemical values[J]. Food & Mechinery, 2011(6):209-211, 240. (in Chinese with English abstract) [4] Nakariyakul S. Internal damage inspection of almond nuts using optimal near-infrared waveband selection technique[J]. Journal of Food Engineering, 2014, 126(1): 173-177. [5] Moscetti R, Monarca D, Cecchini M, et al. Detection of mold-damaged chestnuts by near-infrared spectroscopy[J]. Postharvest Biology and Technology, 2014, 93(2): 83-90. [6] Huang K Y. Detection and classification of areca nuts with machine vision[J]. Computers & Mathematics with Applications, 2012, 64(5): 739-746. [7] Wei Z, Wang J, Zhang W. Detecting internal quality of peanuts during storage using electronic nose responses combined with physicochemical methods[J]. Food chemistry, 2015, 177:89-96. [8] 庞林江,王俊,王允祥,等.基于电子鼻的山核桃陈化时间检测[J].传感技术学报,2011(6):928-933.Pang Linjiang, Wang Jun, Wang Yunxiang, et al. Discrimination of aging time of walnut (carya cathayensis sarg) by electronic nose[J]. Chinese Journal of Sensors and Actuators, 2011(6): 928-933. (in Chinese with English abstract) [9] Shui Jiang, Jun Wang. Internal quality detection of Chinese pecans (Carya cathayensis) during storage using electronic nose responses combined with physicochemical methods[J]. Postharvest Biology and Technology, 2016, 118: 17-25. [10] 闫嘉.基于电子鼻技术的人体伤口感染检测系统构建及算法研究[D].重庆:重庆大学,2012. Yan Jia. System Construction and Algorithm Research in Human Wound Infection Detection Based on Electronic Nose Technology[D]. Chongqing: Chongqing University, 2012. (in Chinese with English abstract) [11] Bertolazzi P, Felici G, Festa P, et al. Integer programming models for feature selection: New extensions and a randomizedsolution algorithm[J]. European Journal of Operational Research, 2016, 250(2): 389-399. [12] Jeong Y S, Shin K S, Jeong M K. An evolutionary algorithm with the partial sequential forward floating search mutation for large-scale feature selection problems[J]. Journal of The Operational research society, 2014, 66(4): 529-538. [13] 费雅君,白雪,康小红.LDA优化电子鼻传感器阵列的研究[J].食品与机械,2012,28(1):97-100. Fei Yajun, Bai Xue, Kang Xiaohong. Optimization for sensor array of electronic nose system by linear discriminant analysis[J]. Food & Machinery, 2012, 28(1): 97-100. (in Chinese with English abstract) [14] 邹慧琴,刘勇,陶欧,等.电子鼻MOS传感器阵列优化及其在中药材快速鉴别中的应用[J].中国中药杂志,2013(2):161-166. Zhou Huiqin, Liu Yong, Tao Ou, et al. Optimization method of MOS sensor array for identification of traditional Chinese medicine based on electronic nose[J]. China Journal of Chinese Meteria Medica, 2013(2): 161-166. (in Chinese with English abstract) [15] Bolin Shi, Lei Zhao, Ruicong Zhi, etal. Optimization of electronic nose sensor array by genetic algorithms in Xihu- Longjing Tea quality analysis[J]. Mathematical and Computer Modelling, 2013, 58(3), 752-758. [16] 王智凝,郑丽敏,方雄武,等.电子鼻传感器阵列优化对猪肉新鲜度法的检测[J].肉类研究,2015(5):27-30. Wang Zhining, Zheng Limin, Fang Xiongwu, et al. Pork freshness detection using optimized electronic nose sensor array[J]. Meat Research, 2015(5): 27-30. (in Chinese with English abstract) [17] 亓培锋,孟庆浩,井雅琪,等.电子鼻中预处理算法选择及阵列优化[J].数据采集与处理,2015(5):1099-1108. Qi Peifeng, Meng Qinghao, Jing Yaqi, et al. Preprocessing algorithm selection and optimization of sensor array in electronic noses[J]. Journal of Data Acquisition & Processing, 2015(5): 1099-1108. (in Chinese with English abstract) [18] 王丽霞,盛希茜,吴峰华,等.浙江山核桃油脂香气萃取条件优化及组分分析[J].食品与机械,2010,26(1):38-41,73. Wang Lixia, Sheng Xixi, Wu Fenghua, et al. Optimize extraction condition of C. Cathayensis sarg.oil aroma and aroma components analysis[J]. Food & Machinery, 2010, 26(1): 38-41, 73. (in Chinese with English abstract) [19] 周拥军,郜海燕,房祥军,等.SPME-GC-MS分离鉴定山核桃的挥发性风味物质[J].中国粮油学报,2012,27(6):115-119. Zhou Yongjun, Gao Haiyan, Fang Xiangjun, et al. Separation and identification of volatile compounds of processed carya cathayensis by gas chromatography – mass spectrometry[J]. Journal of the Chinese Cereals and Oils Association, 2012, 27(6): 115-119. (in Chinese with English abstract) [20] 王俊,崔绍庆,陈新伟,等.电子鼻传感技术与应用研究进展[J].农业机械学报,2013,44(11):160-167,179.Wang Jun, Cui Shaoqing, Chen Xinwei, et al. Advanced technology and new application in electronic nose[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(11): 160-167, 179. (in Chinese with English abstract) [21] 吴文娟,方向生,蔡强,等.基于气敏传感器阵列和PCA的猪肉新鲜度快速分类方法[J].传感技术学报,2010(11):1536-1540. Wu Wenjuan, Fang Xiangsheng, Cai Qiang, et al. Rapid classification of pork freshness using gas sensor array and PCA method[J]. Chinese Journal of Sensors and Actuators, 2010(11): 1536-1540. (in Chinese with English abstract) [22] 占琼,张顺平,范超群,等.特征选择在电子鼻系统阵列优化中的应用[J].传感器与微系统,2008,27(2):114-117. Zhan Qiong, Zhang Shunping, Fan Chaoqun, et al. Application of feature selection in sensor array optimization of E-nose[J]. Transducer and Microsystem Technogies, 2008, 27(2): 114-117. (in Chinese with English abstract) [23] 赵赟,郭振华,孟凡利,等.基于分段平均微分值法的动态检测识别系统[J].传感技术学报,2007,20(8):1706-1711.Zhao Yun, Guo Zhenhua, Meng Fanli, et al. Dynamic detection and recognition system based on the segmental average differentiation[J]. Chinese Journal of Sensors and Actuators, 2007, 20(8): 1706-1711. (in Chinese with English abstract) [24] Hui G, Jin J, Deng S, et al. Winter jujube (Mill.) quality forecasting method based on electronic nose[J]. Food chemistry, 2015, 170: 484-491. [25] Wei Z, Wang J, Jin W. Evaluation of varieties of set yogurts and their physical properties using a voltammetric electronic tongue based on various potential waveforms[J]. Sensors and Actuators B: Chemical, 2013, 177(1): 684-694. [26] 张靖.面向高维小样本数据的分类特征选择算法研究[D].合肥:合肥工业大学,2014. Zhang Jing. Classification and Feature Selection on High- dimensional and Small-sampling Data[D]. Hefei: Hefei University of Technology, 2014. (in Chinese with English abstract) [27] 吴文亮.聚类分析中-均值与-中心点算法的研究[D].广州:华南理工大学,2011.Wu Wenliang. Study of-means and K-medodis Algorithms in Clustering Analysis[D]. Guangzhou: South China Univeristy of Technology, 2011. (in Chinese with English abstract) [28] 周海涛,殷勇,于慧春.劲酒电子鼻鉴别分析中传感器阵列优化方法研究[J].传感技术学报,2009(02):175-178. Zhou Haitao, Yin Yong, Yu Huichun. Optimization method of gas sensor array for identification of Jing wine based on electronic nose[J]. Chinese Journal of Sensors and Actuators, 2009(02): 175-178. (in Chinese with English abstract) [29] 薛芳,施丰成,李耀光,等.基于电子鼻的星座图聚类分析法在烟叶分类中的应用[J].烟草科技,2015(07):25-28.Xue Fang, Shi Fengcheng, Li Yaoguang, et al. Classifying flue- cured tobacco leaves with electronic nose-based constellation diagram clustering analysis[J]. Tobacco Science & Technlogy, 2015(07): 25-28. (in Chinese with English abstract) [30] 周世兵.聚类分析中的最佳聚类数确定方法研究及应用[D].无锡:江南大学,2011. Zhou Shibing. Research and Application on Determining Optimal Number of Clusters in Cluster Analysis[D]. Wuxi: JiangNan University, 2011. (in Chinese with English abstract) [31] 白雪.聚类分析中的相似性度量及其应用研究[D].北京:北京交通大学,2012. Bai Xue. Similarity Measures in Cluster Analysis and Its Application[D]. Beijing: BeiJing Jiaotong University, 2012. (in Chinese with English abstract) [32] 黎量,杨诗龙,刘玉杰,等.基于相关性分析的山楂炮制过程气味变化机制研究[J].中国中药杂志,2014(17):3283-3286. Li Liang, Yang Shilong, Liu Yujie, et al. Preliminary study of odor change mechanism in Crataegi Fructus stir-fried process based on correlation analysis[J]. China Journal of Chinese Materia Medica, 2014(17): 3283-3286. (in Chinese with English abstract) [33] 张凤莲.多元线性回归中多重共线性问题的解决办法探讨[D].广州:华南理工大学,2010.Zhang Fenglian. The Discussion on Solutions of Multicollinearity in Multilinear Regression Models[D]. Guangzhou: South China University of Technology, 2010. (in Chinese with English abstract) Optimization of sensor array of electronic nose for aging time detection of pecan Xu keming, Wangjun※, Deng fanfei, Wei zhenbo, Cheng Shaoming (310058,) As one of the most popular nuts produced in China, pecan contains large amounts of protein and a variety of unsaturated fatty acids required for human body. However, pecans are prone to rancidity because of the influence of environmental factors such as light, oxygen, and moisture. Therefore, the detection of pecan’s quality has a certain practical significance. As a bionic electronic system, electronic nose (E-nose) detects the quality of pecan qualitatively and quantitatively through the analysis of sample volatile gas’s fingerprint information, and is pretty suitable for pecan quality detection. However, pecan odor is comprised of complicated compositions and small differences exist among pecans with different qualities, which makes the detection difficult. In order to improve the accuracy of detection, it’s essential to optimize the sensor array of E-nose during the application. In this research, an embedded E-nose based on digital signal processer (DSP) was designed for pecan detection, and 4 batches of pecans with different aging time were used for experiment. According to the existing GC-MS (gas chromatography- mass spectrometer) analysis of pecan volatile, 13 gas sensors were selected, and part of them with small response were obsoleted by analyzing the response curve of each sensor firstly. Then, 3 feature extraction methods were applied to each sensor’s abstraction to generate the initial feature matrix, thus the mean differential coefficient value, stable value and response area value. After that, a series of data analysis methods were applied to select the features with good performance and realize the optimization of array. First, features with smaller otherness were rejected by the mean analysis. Then, variation coefficient was used to remove the features with poor stability. Afterwards, the features reserved were classified through the cluster analysis based on the correlation, and the feature with the minimum redundancy in each class was selected according to the result of correlation coefficient analysis. Eventually, the degree of matrix’s multicollinearity was decreased by removing the features with high value of variance inflation factor, and the optimized sensor array was chosen according to the ultimate feature matrix. To verify the validity of optimization, principal component analysis (PCA) and partial least squares regression (PLSR) were used to compare the ability of discrimination and forecast between the data before and after optimization. Results indicated that pecans different in aging time were well classified by using the optimized array. Each group of samples were clustered closely in PCA score plot, and the contribution rates of the first 2 principal components of the optimized array (they were 76.01% and 14.60%, respectively) were obviously better than that of pre-optimized array (they were 66.36% and 13.45%, respectively). Meanwhile, the result of PLSR showed that the fitting determination coefficients and root mean square error (RMSE) of the regression model based on the optimized array (2=0.933 4, RMSE=1.452 9 d) performed better than that based on the pre-optimized array (2=0.888 7, RMSE=2.509 2 d), and there was little difference of prediction parameters between the training set and validation set, which meant the phenomena of over-fit didn’t exist and the ability of forecast was better for the optimized array. As a result, through the optimization of sensor array, E-nose can perform better in the detection of pecan’s quality and reduce the dimension of data, and the research provides an efficient method for E-nose’s application in various fields. sensors; optimization; principal component analysis; electronic nose; feature matrix; partial least squares regression 10.11975/j.issn.1002-6819.2017.03.038 S225.5+3 A 1002-6819(2017)-03-0281-07 2016-07-05 2016-12-09 国家自然科学基金资助项目(31370555) 徐克明,男,浙江温州人,主要从事电子鼻开发及应用。杭州浙江大学生物系统工程与食品科学学院,310058。 Email:xukeming@zju.edu.cn 王俊,男,浙江东阳人,教授,博士生导师,主要从事电子鼻电子舌技术开发及其智能检测应用。杭州浙江大学生物系统工程与食品科学学院,310058。Email:jwang@zju.edu.cn 徐克明,王 俊,邓凡霏,韦真博,程绍明.用于山核桃陈化时间检测的电子鼻传感器阵列优化[J]. 农业工程学报,2017,33(3):281-287. doi:10.11975/j.issn.1002-6819.2017.03.038 http://www.tcsae.org Xu keming, Wangjun, Deng fanfei, Wei zhenbo, Cheng Shaoming. Optimization of sensor array of electronic nose for aging time detection of pecan[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(3): 281-287. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2017.03.038 http://www.tcsae.org3 结 论