基于电子鼻的番茄种子不同储藏时间的鉴别研究*
2011-10-19程绍明马杨珲王永维
程绍明,马杨珲,周 博,王永维,王 俊*
(
(1.浙江大学生物系统工程与食品科学学院,杭州 310058;2.浙江科技学院信息学院,杭州 310023)
番茄作为一年生草本植物,果实中富含多种维生素和多种矿物质元素,并有降血压、降胆固醇和防癌作用。目前,中国已成为仅次于美国、意大利的第三大番茄产国。因而相应的种子市场需求也很大,在山东寿光蔬菜生产基地里,每年就有6亿元的种子销售量。
由于不同的贮藏方法和贮藏年限,种子在贮藏过程中品质都有明显的变化。王若菁等[1]人的研究表明,番茄种子贮藏年限越长,番茄种子的发芽率、种子的活力以及田间出苗率均下降;当贮藏期达4 y的番茄种子,田间小苗、畸形苗将增加较大。赵国余[2]也提出番茄种子的生产使用年限为2 y~3 y。为获取高额利润,销售商常用陈年种子掺入到新种子进行销售,给农户带来损失。
目前,快速检测种子发芽率的常用方法有:感观法、四唑法(TTC法)、电导率法、红墨水染色法、吸胀状态法和酶学方法。这些方法存在要么受环境和人为因素的影响较大,要么检测时间较长等缺点[3]。近十年来,电子鼻技术的兴起让人们看到综合评价气味整体信息的巨大潜力。本文以番茄种子为试验材料,借助电子鼻区分不同贮藏年限种子,为番茄种子纯度鉴定、防止种子掺假提供一种快速、无损检测。
1 材料和方法
1.1 试验材料
本次实验用的番茄种子(浙杂809)购买于浙江省农业科学研究院。番茄种子的年份分别为2006年、2007年和2008年。实验时间为2009年6月。
1.2 PEN2电子鼻系统
采用德国Airsense公司生产的电子鼻系统(PEN2)。PEN2电子鼻包含10个金属氧化物传感器阵列,根据传感器接触到样品挥发物后的电阻量G与传感器在经过标准活性碳过滤气体的电阻量G0的比值而进行数据处理和模式识别,其敏感性为1 cm3/m3。
图1 电子鼻系统示意图
1.3 试验方法
据文献表明样品密封1 h后其顶部空间的挥发物将达到平衡状态[4]。三种不同年份的番茄种子分别以12.5%,25%,37.5%和50%四种比例相互掺杂。本试验条件为样品质量取5 g,放置于50 mL的烧杯中密封,样品静置1h后开始采样,得到电子鼻对番茄种子的响应曲线如图2所示。图中横轴为采样时间,纵轴为信号值,其中G是传感器接触到样品气体后的电导率、G0是传感器在经过活性炭过滤气体清洗后的电导率。从图中可以看出,电子鼻的检测从55 s左右开始趋于稳定,因此本文取60 s处的信号作为分析的时间点。
图2 番茄种子的响应曲线
2 结果和分析
2.1 不同年份番茄种子的发芽特性研究
根据我国国标GB/T 3543.4—1995《农作物种子检验规程发芽试验》对三种不同年限的番茄种子进行了试验,其发芽情况见表1。表中发芽率=(n/N)×100%(n:正常发芽粒数,N:供试种子数);发芽势为种子发芽达到高峰时正常发芽种子数与供试种子数的百分比;平均发芽速=∑(dn)/∑n(d:从播种之日算起的天数,n:相应各日正常发芽粒数);平均速率系数=100╳∑n/∑(dn)(d:从播种之日算起的天数,n:相应各日正常发芽粒数)。
表1 不同贮藏时间对番茄种子的发芽影响
2.2 主成分分析
主成分分析是将多个指标化为较少的几个综合指标的一种统计方法。降维后的综合指标之间互不相关,却能反映原来多指标的信息[5-6]。指标的贡献率越大,说明主要成分可以较好地反映原来多指标的信息。从图3可知,第一和第二主成分贡献率分别为61.25%和31.50%,累计贡献率达92.75%,在不掺杂的情况下,电子鼻可以很好的区分不同年份的番茄种子。图4~图9是三种不同年份的番茄种子分别以不同比例进行两两混合得到的主成分分析结果。从图4~图9可看出,第一和第二主成分的累计贡献率达89.46%以上,基本可以区分不同年份的种子相互掺杂。同时从图中可看出掺杂比例分别为37.5%和50%时,两部分图形有重叠,此时较难区分。
图3 三种不同年份番茄种子主成分得分图
图4 在2006年的种子中掺入不同比例的2007年种子
图5 在2006年的种子中掺入不同比例的2008年种子
图6 在2007年的种子中掺入不同比例的2006年种子
图7 在2007年的种子中掺入不同比例的2008年种子
图8 在2008年的种子中掺入不同比例的2006年种子
图9 在2008年的种子中掺入不同比例的2007年种子
图10 三种不同年份的番茄种子的线性分析得分图
2.3 线性判别分析(LDA)
线性判别分析(LDA)利用了所有传感器的信号以提高分类的准确性[7]。LDA分析更加注重样品在空间中的分布状态及彼此之间的距离分析,将样品信号数据通过运算法则投影到某一方向,使得组与组之间的投影尽可能分开。图10~图16是利用线性判别分析降维后得到的二维图。从图10~图16可看出,利用线性判别分析可以很好将相互掺杂的不同年份的种子区分开。结合不同掺杂比例的番茄种子采用LDA方法分析的结果来看,其第一和第二主成分的累计贡献率也达到了83%以上,保留了样本绝大部分的信息,而且掺杂的和未掺杂番茄种子的区域集中性也比较好,可以很好的辨别区分各种掺杂比例的番茄种子。虽然利用PCA方法的累计贡献率要普遍高于利用LDA方法的累计贡献率,但PCA分析的集中性不如LDA分析的集中性好些,而且利用LDA方法得到的数据区域集中性要明显优于PCA方法的结果。
图11 在2006年的种子中掺入不同比例的2007年种子
图12 在2006年的种子中掺入不同比例的2008年种子
图13 在2007年的种子中掺入不同比例的2006年种子
图14 在2007年的种子中掺入不同比例的2008年种子
图15 在2008年的种子中掺入不同比例的2006年种子
图16 在2008年的种子中掺入不同比例的2007年种子
3 基于MATLAB的BP神经网络和支持向量机的分类识别研究
在主成分分析和线性判别分析的基础上,进一步采用基于MATLAB7.0的BP人工神经网络和支持向量机二种模式识别算法识别相互掺杂的7个类别种子。BP神经网络具有通过学习逼近任意非线性映射的能力,特别适合于因果关系复杂的非确性推理、判断、识别和分类等问题[8-10]。支持向量机是在统计学习理论基础上发展起来的一种新的机器学习方法,目前已应用于模式分类、回归分析、函数估计等领域[11-12]。
实验中每组掺杂都准备了24个样品,分别取前13个样品作为校正集,后11个样品作为预测集。三种不同年份种子(a类)取前39个样品作为校正集和后33个样品作为预测集,在2006年中掺入2007年(b类)、2006年中掺入2008年(c类)、2007年中掺入2006年(d类)、2007年中掺入2008年(e类)、2008年中掺入2006年(f类)和2008年中掺入2007年(g类)6个类别中分别取前65个样品作为校正集和后55个样品作为预测集。
文中利用电子鼻传感器在60s的响应信号作为BP神经网络的输入,建立一个三层的BP神经网络结构,不同掺杂比例作为网络的输出层。通过反复测试来调整隐含层神经元数来优化网络结构,得到较好的网络结构为10—15—1的三层BP神经网络。设定目标误差为0.000 1,网络学习速率为0.01,训练迭代次数为10 000次。
SVM种类繁多,按照不同的标准,可分为不同的类型。采用不同的内积函数将导致不同的支持向量机算法,目前研究的内积函数形式主要有三类,即多项式核函数、径向基核函数和Sigmiod核函数,它们都与已有的方法有对应的关系。通过反复测试,最后支持向量机的类型选为V-SVC,核函数为径向基核函数K(x,y)=exp[-‖x-y‖2/(2σ2)],其余参数采用默认值。BP神经网络和支持向量机对不同掺杂种子的识别效果见表2。
表2 BP神经网络和支持向量机的识别效果
从表2可看出,BP神经网络和支持向量机识别的训练集正确率平均值分别为99.34%和97.3%,BP神经网络和支持向量机的预测集正确率平均值分别为91.43%和77.7%。从训练集的效果来看,BP神经网络和支持向量机识别的效果差不多,区别并不明显,但从预测集结果来看,相对于支持向量机模式识别,BP神经网络预测系统的误差较小,具有很好的预测性能。
4 结论
①利用电子鼻可以很好的区分不同年份的番茄种子;②利用主成分分析(PCA)方法可以辨别出不同掺杂比例的番茄种子,但是种子掺杂比例为37.5%和50%时,较难利用电子鼻进行辨别区分;③利用线性判别分析(LDA)方法可以很好的辨别出不同掺杂比例的番茄种子,并且每个混合种类的区域集中性都很好;相对于PCA方法,利用LDA方法得到的数据区域集中性要明显优于PCA方法得到的结果;④相对于支持向量机模式识别,BP神经网络预测系统的误差较小,具有很好的预测性能。
[1]王若菁,张占光,吴云.不同贮藏年限番茄种子劣变及检验[J].内蒙古农牧学院学报,1997,18(2):46-49.
[2]赵国余.蔬菜种子学.北京农业大学出版社,1989:136-140.
[3]陈启林.POD和EST同工酶PAGE在番茄品种纯度鉴定中的应用[D].西北农业大学硕士研究生论文,1997:5-13.
[4]庞林江,王俊,路兴花.电子鼻判别小麦陈化年限的检测方法研究[J].传感技术学报,2007,20(8):1717-1722.
[5]Labreche S,Bazzo S,Cade S,et al.Shelf Life Determination by E-lectronic Nose:Application to Milk[J].Sensors and Actuators B,2005,106:199-206.
[6]于慧春,王俊.电子鼻技术在茶叶品质检测中的应用研究[J].传感技术学报,2008,21(5):748-752.
[7]Goschnick J,Koronczi I,Frietsch M,et al.Water Pollution Recognition with the Electionic Nose KAMINA[J].Sensors and Actuators B,2005,106:182-186.
[8]甘信化,石勇,林保国.基于MATLAB的BP神经网络在大气环境质量评价中的应用[J].安徽化工,2008,34(5):59-61.
[9]郑丽敏,田立军,朱虹,等.基于MATLAB的BP神经网络在猪等级评定中的应用研究[J].计算机应用研究,2008,25(6):1642-1644.
[10]桂现才.BP神经网络在MATLAB上的实现与应用[J].湛江师范学院学报,2004,25(3):79-83.
[11]王晓丹,王积勤.支持向量机训练和实现算法综述[J].计算机工程与应用,2004,13:75-78.
[12]陈铁冰,邢媛媛,谭也平.基于MATLAB的支持向量机结构可靠度分析方法[J].华中科技大学学报,2009,26(1):60-63.