应用可见/近红外光谱技术快速鉴别山西陈醋品种
2010-04-25秦刚宋海燕陆辉山
秦刚,宋海燕,陆辉山
(1.山西农业大学 工学院,山西 太谷030801;2.中北大学 机械工程与自动化学院,山西 太原030051)
醋是山西特色产品之一,但市场上山西醋品种太多 ,“宁化府”,“水塔”,“东湖”,“四眼井” ……数不胜数,这使得一些投资少、技术低的“游击队”、“杂牌军”趁机而入充斥市场,严重影响了山西“老陈醋”的形象。对山西老陈醋开展品种快速鉴别,建立其品牌库,可以大大改善此局面。
近红外光谱分析技术是一种快速、无损、绿色的分析检测技术,在农产品[1~4]和食品安全领域的应用越来越广,如在液体食品(如酒类[5~8]和醋[9~14]等)的主要成分检测和品种、陈酿年份上的应用。陈醋陈酿过程中由于生产工艺的不同导致陈醋内部成分和品质的差异,这为利用可见/近红外光谱技术对不同品种的老陈醋进行判别分析提供了依据。
本文采用可见/近红外透射光谱分析技术分别获取4个(东湖、古灯、宁化府、水塔)不同品牌山西老陈醋的光谱特性曲线,并对其进行分析,建立主成分分析和神经网络鉴别模型,并进行了验证。
1 材料和方法
1.1 材料
试验样品均为市售常见山西老陈醋,分别为东湖、古灯、宁化府、水塔品种,每个品种60个样本,共240个样本。建模时样本随机分成校正样本和预测样本,校正样本设置为180个,每个品种45个;预测样本设置为60个,每个品种15个。
1.2 仪器及工作参数
老陈醋的可见/近红外透射光谱曲线使用美国ASD(Analytical Spectral Device)公司的Handheld FieldSpec光谱仪及其相应的透射附件进行采集。其光谱采样间隔(波段宽)1.5 nm,测定范围350~2500 nm,扫描次数30次,分辨率3.5 nm。液体样品池为5 mm光程的石英比色皿,试验采用空气为参比,在室温下进行光谱采集。
1.3 光谱预处理和化学计量学分析
经ASD View Spec Pro软件对光谱数据进行一阶、二阶微分处理,然后再以ASCII码形式将原始、一阶、二阶微分光谱导出,最后在MAT LAB环境中实现主成分神经网络定性判别。
人工神经网络技术是一种大规模并行的非线性动力系统。在识别那些人们所不易观察的变量之间的相互关系上,也拥有较强的能力,因此得到预测科学研究者的重视[15]。与建立各种数学模型一样,正确获取输入变量是建立神经网络最关键的一步。大量光谱数据的输入,既增加了计算量 ,又会使所建模型与训练样本集产生“过拟合”,反而影响模型精度。因此,本研究将主成分分析作为神经网络的前处理。主成分分析是多元统计中的一种数据挖掘技术。其主要思路是将原变量进行转换,使数目较少的新变量成为原变量的线性组合,而且新变量在不丢失原始信息的前提下,能够最大限度地表征原变量的数据结构特征,并且彼此之间不相关,以达到简化的目的。
2 结果与分析
2.1 不同品种山西老陈醋可见/近红外光谱
4个不同品种山西老陈醋的原始可见/近红外平均光谱如图1所示。从图中可以看出:4个品种(东湖DH 、古灯GD、宁化府NHF、水塔 ST)山西陈醋的可见/近红外光谱曲线变化趋势基本一致,光谱在500~600nm和1400~1900nm波段处有比较强的吸收峰;在600~1900nm波段范围内可直观地看出品种间的差别,但真正区分判别还必须结合化学计量学方法对所得的光谱数据进行处理,通过建立老陈醋品种的分类判别模型才能知道它们之间的差异。图2是其对应的一阶微分可见/近红外平均光谱,从中可以看出4个品种的光谱差异很难区分。
图1 不同品种山西老陈醋的原始可见/近红外光谱Fig.1 Vis/NIR transmittance raw spectra of four different varieties of mature vinegar
图2 不同品种山西老陈醋的一阶微分可见/近红外光谱Fig.2 1st derivative transmittance spectra of four different varieties of mature vinegar
2.2 基于神经网络的老陈醋判别分析
从图1可以看出,光谱曲线的首端和末段都有较大的噪音,为消除这些影响选取600~1900 nm波段的光谱进行研究。为研究不同老陈醋品种光谱间的差异,找到可以区分不同品种陈醋的最佳谱图,分别对4个不同品种的原始光谱、一阶微分光谱、二阶微分光谱采用主成分神经网络进行鉴别分析。再对其原始光谱、一阶微分光谱、二阶微分光谱数据进行主成分分析后,原始光谱、一阶微分光谱、二阶微分光谱的前32、42、40个主成分的累计贡献率达到99.9%,说明这些主成分能够很好地表征原数据的信息。将这些主成分数作为神经网络的输入,1、2、3、4分别表示不同品种,作为神经网络的输出(1表示东湖,2表示古灯,3表示宁化华府,4表示水塔),建立不同品种陈醋的神经网络模型。表1为采用主成分神经网络对校正样本分类的鉴别结果。本研究中,采用四舍五入法来计算正确分类百分比,例如对东湖老陈醋,其输出值若在0.45~1.45范围内,则认为其判别正确。
表1 校正样本纯醋品种的鉴别结果Table 1 Analysis results for calibration set
由表1可以看出,原始光谱结合主成分神经网络对陈醋品种的鉴别效果最佳,样品正确分类百分比为92.1%,其次为一阶微分光谱,二阶微分光谱的鉴别效果最差。
2.3 判别模型的验证分析
根据上述分析,选用原始光谱结合主成分神经网络建立的鉴别模型对预测集的60个样品的原始光谱进行预测分析,其分析结果见图3。
从图3可以看出,东湖有4个鉴别错误,其正确分类百分比为73.3%;古灯有2个鉴别错误,其正确分类百分比为86.7%;宁化府有1个鉴别错误,其正确分类百分比为93.3%;水塔有2个鉴别错误,其正确分类百分比为86.7%。60个样本的总体正确分类百分比为85.0%。由此可见,原光谱数据结合主成分神经网络技术实现陈醋品种鉴别还是可行的。
图3 人工神经网络预测60个未知纯醋样品Fig.3 Prediction results for 60 unknown samples by PCA-ANN
3 结论
本文应用可见/近红外透射光谱分析技术结合主成分神经网络对山西陈醋品种进行了判别分析。结果表明:应用可见/近红外原始透射光谱结合主成分神经网络判别分析法,对山西老陈醋的不同品种进行分类,校正集分类的正确率为92.1%,预测正确率为85.0%。可见/近红外透射光谱分析技术用于山西老陈醋品种的定性分析具有简单快速、无需样品预处理的优点,且具有较好的分类结果,对山西老陈醋的品种快速鉴别有一定实用价值。
[1]夏俊芳,李培武,李小昱,等.不同预处理对近红外光谱检测脐橙Vc含量的影响[J].农业机械学报,2007,38(6):107-111.
[2]邹小波,赵杰文,夏蓉,等.苹果糖度近红外光谱小波去噪和iPLS建模[J].农业机械学报,2006,37(6):79-82.
[3]田海清,应义斌,徐惠荣,等.西瓜可溶性固形物含量近红外透射检测技术[J].农业机械学报,2007,38(5):111-113.
[4]曾一凡,刘春生,孙旭东,等.可见/近红外光谱技术无损检测果实坚实度的研究[J].农业工程学报,2008,24(5):250-252.
[5]彭帮柱,龙明华,岳田利,等.傅立叶变换近红外光谱法检测白酒总酸和总酯[J].农业工程学报,2006,22(12):216-219.
[6]陈斌,王豪,林松,等.基于相关系数法与遗传算法的啤酒酒精度近红外光谱分析[J].农业工程学报,2005,21(7):99-102.
[7]于海燕,应义斌,傅霞萍,等.近红外透射光谱应用于黄酒酒龄的定性分析[J].光谱学与光谱分析,2007,27(5):920-923.
[8]H Y Yu,H R Xu.Prediction of Trace Metals in Chinese Rice Wine by Fourier Transform Near-infrared Spectroscopy[J].Transactions of the ASABE,2006,49(5):1463-1467.
[9]陈斌,黄传旭,李国权,等.模极大值法在食醋近红外光谱定量分析中的应用[J].农业机械学报,2005,36(5):65-67.
[10]Fei Liu,Yong He,Li Wang.Determination of effective wavelengths for discrimination of fruit vinegars using near infrared spectroscopy and multivariate analysis[J].Analy tica Chimica Acta,2008,615(1):10-17.
[11]王莉,刘飞,何勇.应用可见/近红外光谱技术进行白醋品牌和pH值的快速检测[J].光谱学与光谱分析,2008,28(4):813-816.
[12]王莉,李增芳,何勇,等.应用近红外光谱技术快速检测果醋糖度[J].光谱学与光谱分析,2008,28(8):810-813.
[13]Fei Liu,Yong He,Li Wang.Comparison of calibrations foe the determination of soluble solids content and pH of rice vinegars using visible and short-wave near infrared spectroscopy[J].Analytica Chimica Acta,2008,610(2):196-204.
[14]M onica Casale,Maria-Jose Saiz Abajo,Jose-M aria Gonzalez Saiz,et al.Study of the aging and oxidation processes of vinegar samples from different origins during storage by near-infrared spectroscopy[J].Analytica Chimica Acta,2006,557:360-366.
[15]杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001:1-5.