近红外光谱结合线性判别分析方法在食醋品牌鉴别中的应用
2019-10-10古丽君林振华吴世玉郑彦婕周晓文袁福定江培淳林长虹
古丽君,林振华,吴世玉,郑彦婕,周晓文,袁福定,江培淳,林长虹
(深圳市计量质量检测研究院,广东 深圳,518000)
食醋味酸醇厚,液香柔和,是一种具有医药保健功效的食用调味品[1]。早在《本草纲目》中就有记载“醋能消肿、散火气、杀邪毒、理诸药之功效”。食醋含有丰富的风味物质[2]、糖类、有机酸、维生素和无机盐等成分[3]。根据调味品消费者协会的统计,在全国6 000家食醋制造企业中,品牌企业产量仅占30%,其他作坊式小企业占70%,目前市售的醋产品多为小作坊产品,食醋质量参差不齐,在营养和价格等差异也比较大,制假售假现象严重,而且各品牌食醋在外观和味道上几乎没有差别,消费者难以鉴别区分。2018年山西“平遥县假食醋”事件致使消费者“闻醋色变”。目前亟需一种能精确快速鉴别食醋品牌的方法。
近红外光谱技术是一种新型的物理测定技术,具有分析速度快、成本低、操作简单、非破坏性、无污染等特点[4]。近红外光谱结合化学计量学方法在食品安全[5-7]和食品溯源[8-10]领域得到了广泛应用。范睿等[11]基于近红外光谱定量分析花生牛奶,并建立定量分析模型,结果表明,花生牛奶使用PLS建模方法可以有效地对光散射、花生与奶粉之间的干扰做出补偿,适合用于花生牛奶复杂成分体系的分析;日本秋田大学SATO等[12]采用便携式近红外光谱仪结合化学计量学方法主成分分析对日本清酒进行鉴别区分,并取得了理想结果;巴西学者PONTES等[13]以Brandy、Rum、Vodka、Whiskey四种酒为实验对象,采用近红外光谱结合化学计量学方法对其进行品牌区分和掺假鉴别,结果表明,在95%的置信度下可以达到100%的鉴别准确率;夏蓉等[14]采用近红外光谱结合化学计量学方法对144个食醋样品进行品牌和贮藏年份鉴别,结果表明这种方法可以为食醋原产地保护和年份鉴别提供一种快速的参考方法。
线性判别分析不同于主成分分析,线性判别分析是有监督模式识别技术,它通过最大化类间方差和最小化类内方差,确定线性判别函数,是一种有效的特征抽取和降维技术[15],在白酒[16~18]、牛奶[19-20]和饮料[21]的判别分析上有广泛的应用。本研究采用近红外光谱技术结合线性判别分析对食醋品牌鉴别,为保护名优品牌食醋的质量、维护消费者和合法生产经营者的权益提供一种快速的参考方法。
1 材料和方法
1.1 样品收集
市售东湖牌食醋(13组)、恒顺牌食醋(13组)、宁化府牌食醋(13组)、紫林牌食醋(8组)、金山寺牌食醋(8组),以及其他品牌(48组)共103组食醋样品。
1.2 仪器及工作参数
Bruker MPA近红外光谱仪,德国布鲁克公司。扫描的波数范围:4 000~12 500 cm-1;分辨率:8 cm-1; 漫透射测量模式。
1.3 光谱采集
将食醋样品充分混匀,使用移液枪准确移取1 mL 食醋样品,小心加入样品管中立即测量。首先从测量仪器的背景单通道光谱扣除背景。通过近红外光谱仪对样品重复扫描64次得一张光谱图,再重复3次操作后得到3张光谱。
将样品3次的光谱图作均一化处理,与相应的近红外数据库及相关的数据模型进行鉴别分析。
1.4 建立评价模型
采用二阶导数(second derivative, SD)对图谱进行预处理,SD通常可以消除基线漂移,克服谱带重叠现象,由此达到强化谱带特征的作用,并通过自动波段的选择,依次进行标准处理、T检验、主成分分析(PCA)及PCA特征提取,然后利用留一法构建线性判别(LDA)模型。样品的正确识别率R评价定型模型的精确度。按照公式(1)计算模型正确识别率。
(1)
2 结果与分析
2.1 不同品牌的食醋近红外光
近红外光谱显示的是测试样品中含氢基团的振动倍频和组合频信息,样品中所含成分、浓度等都会影响光谱信号。本研究每隔8 cm-1波数进行光谱测量,图1中横坐标波数范围4 000~12 500 cm-1,纵坐标为光谱吸收度。图中6 900 cm-1附近出现的大的吸收峰,为食醋中醇类和酚类的O—H键伸缩振动所引起;在5 500、8 600 cm-1附近出现的小的吸收,代表了C—H键振动的倍频区域,这与食用醋中含有的乙酸等有机酸有关。漫反射模式下采集近红外光谱信号时,光谱信息包含了样品所含的物质结构以及成分含量信息,但也会因外界噪声干扰、仪器响应、杂散光等因素导致噪音信号,从而影响后续的光谱分析。同时由于各品牌食用醋主要成分相似,峰形相近,并存在严重重叠现象,无法通过直接观察方法将不同品牌醋区分开,如图1-a所示,因此需要结合化学计量学手段将光谱数据集进行预处理,才能达到品牌区分目的。依次采用SD对图形进行预处理(图1-b)、然后选择>阈值0.3的波段(图1-c)进行标准化处理,并通过T检验(图1-d)对存在显著性差异的点进一步进行特征值提取处理并建立分类模型。
图1 食醋近红外光谱预处理图Fig.1 The pretreatment of near infrared spectrum of vinegar注:其中图a~图d对应的分别为食醋近红外光谱原始图、经过二阶导数预处理图、波段选择图和T检验图。
2.2 不同品牌食醋的主成分分析结果
主成分分析方法是模式识别分析中常用的特征抽取和降维技术之一,可在不具备任何相关知识背景的条件下对未知样品进行类别归属的判别,常被用于解决谱带重叠[22]。本研究对5个品牌食醋的近红外光谱进行主成分分析,并保留3个主成分。如图2所示,X、Y、Z轴分别代表食醋样品的第1、第2和第3主成分得分。由图2可知,5个品牌的食醋样品具有明显的聚类趋势,然而主成分分析无法准确地划分各个品牌之间的界限,因此,需要有监督的模式识别方法,本研究利用留一法构建线性判别(LDA)模型。
图2 不同品牌食醋的3个主成分分布图Fig.2 Distribution of three principal components of different brands of vinegar注:其中图a~图e对应的分别为东湖、恒顺、宁化府、金山寺和紫林等单一品牌和其他品牌之间的区分图f对应的为东湖、恒顺、宁化府、金山寺以及紫林等五大品牌相互之间的区分。
2.3 LDA应用于食醋品牌的鉴别
由于食醋的组成成分繁多复杂,且受到品种、产地、原料和发酵工艺等多方面影响,仅通过主成分分析并不能准确的鉴别食醋的品牌。在主成分分析的结果上,提取PCA特征,并采用留一法构建线性判别模型。由图3可以看出,食醋品牌近红外光谱经处理后可以达到一定的聚类效果,和其他品牌食醋能够较好的分离,对于单一品牌和其他品牌的区分,通过留一法构建线性判别模型交叉验证结果东湖正确率达到89.69%、恒顺87.63%、宁化府87.63%、紫林92.78%、金山寺85.57%,结果令人满意。但对于5个品牌相互之间的区分鉴别,LDA模型交叉验证结果正确率仅为58.18%。以上数据结果表明各品牌食醋在原材料上有所不同,也表明食醋红外光谱在食醋品牌区分上具有一定的应用前景。
3 结论
本研究采用近红外光谱结合化学计量学方法(主要是主成分分析和线性判别分析)对5个品牌的食醋进行判别分析。主成分分析结果表明,5个品牌的食醋样品具有明显的聚类趋势,然而无法准确划分各个品牌之间的界限。线性判别模型交叉验证结果东湖正确率达到89.69%、恒顺87.63%、宁化府87.63%、紫林92.78%、金山寺85.57%,结果令人满意。
图3 不同品牌食醋的线性判别(LDA)模型结果Fig.3 Results of linear discriminant analysis model of different brands of vinegar注:其中图a~图e对应的分别为东湖、恒顺、宁化府、金山寺和紫林等单一品牌和其他品牌之间的区分,图f对应的为东湖、恒顺、宁化府、金山寺以及紫林等五大品牌相互之间的区分。