主成分和判别分析在清香型白酒产地溯源中的应用
2018-01-31李艳敏张立严狄红梅
李艳敏,张立严,狄红梅
(北京顺鑫农业股份有限公司 牛栏山酒厂,北京 101301)
俗话说“曲为酒之骨,水为酒之血”,无水、无曲自然就谈不上酒了。水的好坏取决于地理位置,虽然曲的好坏可以人为干预,但却与当地的自然环境息息相关,这也就意味着同一香型的白酒因产地不同,风味成分的种类和数量会有明显的差异。众所周知,白酒中98%左右为乙醇和水,剩余的2%为醇、醛、酸、酯类等微量成分,是决定白酒香型、风格、口味、口感的关键[1]。近年来,随着分析检测技术的不断升级,白酒中被检测到的风味物质达到几百甚至上千种,且不同风味物质之间存在千丝万缕的联系,因此为通过复杂的数据分析来判断白酒的来源增加了困难[2-4]。
主成分分析(principal component analysis,PCA)简单地说就是数据的压缩和解释,即将原来彼此关联的多个变量浓缩成几个彼此不相关的几个变量,同时保留原来变量所蕴含的大部分信息,从而降低对复杂的多变量分析的难度。判别分析是为了解决未来个案的归属问题而提出的数据分析技术,是在已有数据的基础上寻找判别规则,并根据判别规则对未来数据的归属进行判定。目前,以上方法在数据分析中的优势日益凸显,在食品、茶叶、中药等领域均有应用[10-14]。
本实验采用气相色谱仪对清香型白酒中的主体风味物质进行检测[5-7],应用主成分分析不同产地白酒各风味物质的量比关系,并在主成分分析的基础上建立判别模型,为白酒样品的产地溯源提供新的手段。
1 材料与方法
1.1 材料与试剂
清香型白酒酒样78个,其中山西地区25个(编号分别为SX01~25)、河北地区8个(编号为HB01~08)、东北地区15个(编号为DB01~15)、四川地区10个(编号为SC01~10)、北京地区20个(编号为BJ01~20),除北京地区样品为自产外,其余均购于市场。
乙酸乙酯、己酸乙酯、乳酸乙酯、丁酸乙酯、乙酸正戊酯、叔戊醇、甲醇、仲丁醇、异丁醇、异戊醇、正丙醇、正丁醇、乙缩醛、乙酸(均为色谱纯,纯度≥99.5%):天津光复精细化工研究所。
1.2 仪器与设备
Aligent 7890B气相色谱仪(附氢火焰离子化检测器、Aligent 7693自动进样器):安捷伦科技(中国)有限公司。
1.3 方法
1.3.1 溶液的配制[8-9]
混合标准溶液:分别称取一定质量的试剂溶液,以体积分数为60%的乙醇溶液定容于50mL容量瓶中,得到各物质的混合标准溶液,备用。
内标溶液:称取一定质量的叔戊醇、乙酸正戊酯、2-乙基正丁酸试剂,以体积分数为60%的乙醇溶液定容于50 mL容量瓶中,备用。
标准使用液:将混合标准溶液用体积分数为60%的乙醇溶液稀释6个梯度,每个梯度加入等量的内标溶液,得到标准使用液S1、S2、S3、S4、S5、S6,进样分析。
1.3.2 样品预处理
准确吸取一定量样品于10 mL比色管中,加入一定量叔戊醇、乙酸正戊酯、2-乙基正丁酸内标,混合均匀后,进样分析。
1.3.3 仪器条件设定
采用CP-Wax 57色谱柱(50 m×250 μm×0.2 μm);色谱柱温度:初温40℃,保持1 min,以4.0℃/min升至130℃,以20℃/min升至200℃,保持5 min;检测器温度:230℃;进样口温度:250 ℃;载气流速:1.0 mL/min;进样量:1.0 μL;分流比:20∶1。
1.3.4 数据处理方法[15-16]
气相色谱所得数据分析采用SPSS22.0软件中的主成分分析法(PCA)和判别分析法(linear discriminant analysis)在计算机上进行。
2 结果与分析
2.1 不同产地白酒理化指标检测结果
白酒中的香气物质主要有酸类、醇类、酯类、醛类等几种微量成分,其含量的差异直接影响了白酒的风格和口感。因此,本文主要测定样品中的酸类(1种)、醇类(6种)、酯类(4种)、醛类(1种),各组分含量检测结果如表1所示。
由表1可知,对于清香型白酒来说,乙酸乙酯、乳酸乙酯、乙酸、异戊醇是含量相对较高的组分,在不同产地样品中含量波动较大。
表1 不同产地白酒各指标检测结果Table 1 Detection results ofBaijiufrom different producing areas
2.2 主成分分析
以表1中12种组分为自变量,利用SPSS 22.0软件对选定的不同产地的清香型白酒的检测结果进行主成分分析。
2.2.1 适应性检验
确定数据是否适合进行主成分分析的常用检验方法是Bartlett球形度检验和KMO取样适合度检验,用来判断原始变量之间的相关性,即只有原始变量之间有重叠的信息,才能提取这几个变量之间的公因子进行主成分分析。
由表2可知,KMO取样足够度的检验结果为0.769,说明不同产地酒样中各指标之间的信息重叠程度较高,能够进行主成分分析。Bartlett球形度检验的显著性为0.000,也说明各变量之间的存在相关性可以进行主成分分析。
表2 KMO和Bartlett检验结果Table 2 Results of KMO and Bartlett tests
2.2.2 主成分方差贡献率
原来的12个指标变量,通过正交变换,也产生12个新变量,每个新变量可以解释的原始变量的总方差比例不同,但是所有解释的比例之和为100%。
由表3可知,以提取特征值>1的3个新变量作为主成分,解释了88.630%的总方差,它们解释了大部分各指标在不同产地白酒中的所反应的原始信息。
表3 主成分方差贡献率Table 2 Variance contribution rate of principal components
2.2.3 主成分因子载荷及各变量得分系数
表4 主成分与原始指标变量的相关系数Table 4 Correlation coefficients between principal components and original index variables
由表4可知,第一个主成分主要代表是仲丁醇、异丁醇、异戊醇等醇类物质的信息;第二个主成分主要是乳酸乙酯、乙酸乙酯两个清香型白酒主体香味成分的携带的信息;而第三个主成分主要是己酸乙酯、甲醇、正丁醇等清香型白酒中含量相对较低的指标的信息。
表5 各指标在每个主成分中的得分系数Table 5 Score coefficients of each index in each principal component
将酒样的12个原始指标分别记作X1、X2、X3……X12,3个主成分分别记作F1、F2、F3。
根据表5各指标在每个主成分中的得分系数,得到3个主成分的数学模型分别为:
将原始指标标准化后的结果带入上述数学模型,可以得到每个样本的3个主成分结果。
2.2.4 主成分相关性分析
分别以F1、F2、F3为x、y、z坐标,建立每个样品的三维图,结果见图1。
图1 主成分三维分布图Fig.1 3D distribution figure of principal components
由图1可知,同一产地的样品有很好的聚合性,不同产地的样品之间能够彼此完全分开,不存在交叉现象。同时也可看出,原始指标含量相近的样品,在图中位置越靠近。
2.3 判别分析
以主成分F1、F2、F3为原始变量,利用SPSS22.0进行判别分析,得到3个典型判别函数。
表6 典型判别式函数系数Table 6 Function coefficients of typical discriminant
根据3个判别函数和组质心处坐标函数,计算每个样品坐标与质心的距离,与哪个产地的质心最近,该样品就判定为来自哪个产区。
表7 组质心处的函数系数Table 7 Function coefficients of the centroid
利用函数1和函数2对组质心和样品做散点图,结果见图2。
图2 典型判别散点图Fig.2 Scatter plot of typical discriminant
由图2可知,来自5个产地的78个样品可以根据判别函数划分为不同的区域,北京、河北、山西三个产区距离较近,与东北、四川两个产区距离较远。但5个产区的质心却相互分离,没有重叠现象。
2.4 判别结果验证
将北京产区其中的一个样品的产地来源假定为未知,利用上述主成分分析方法和判别函数模型进行该样品产地溯源验证。
表8 判别分类结果Table 8 Results of discriminant classification
由表8可知,利用上述模型,77个样品的产地被全部正确溯源。表格的最后一行的一个未知样品被判定为来自北京产区,判别结果正确。
3 结论
虽同为清香型白酒,但因不同产地的气候、水质、微生物种群、工艺等的差异而导致不同产地酒的微量成分种类和含量不同。本实验利用SPSS 22.0分析78个来自山西、东北、四川、河北、北京5个产地的清香型白酒的12种微量成分进行主成分和判别分析。共提取3个主成分,累计方差贡献率达到88.63%,建立3个典型判别函数,通过验证,可以实现对抽取的不同产地样品进行100%正确判别。可见,用此方法对不同产地的白酒进行溯源是可行的。
[1]沈怡方.白酒生产技术全书[M].北京:中国轻工业出版社,2007:245-248.
[2]曹 静,余有贵,曹智华,等.中国复合香型白酒研究进展[J].食品与机械,2017,33(7):200-204,209.
[3]钱 冲,廖永红,刘明艳,等.不同香型白酒的聚类分析和主成分分析[J].中国食品学报,2017,17(2):243-255.
[4]王先桂,曾 丹,郭坤亮.传统十种白酒香型骨架成分的亲缘性分析[J].中国酿造,2013,32(9):87-92.
[5]任玉兰,田 密,李春彦,等.白酒中微量组分的气相色谱分析[J].中国酿造,2011,30(7):181-183.
[6]周玮婧,江小明.气相色谱法测定不同香型白酒中醇类与醛类物质含量[J].中国酿造,2017,36(4):181-183.
[7]张 文,张琪玮.毛细管气相色谱法分析白酒中的甲醇和酯类[J].现在农业科技,2016(20):256,259.
[8]中华人民共和国国家卫生和计划生育委员会,国家食品药品监督管理总局.GB 5009.266—2016食品安全国家标准食品中甲醇的测定[S].北京:中国标准出版社,2016.
[9]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 10345—2007白酒分析方法(含第1号修改单)[S].北京:中国标准出版社,2007.
[10]兴 丽,赵凤敏,曹有福,等.不同产地亚麻籽矿物质元素及脂肪酸组成的主成分分析[J].光谱学与光谱分析,2014,34(9):2538-2543.
[11]程铁辕,李明春,张 莹,等.主成分分析法在浓香型白酒酒质评价中的应用研究[J].中国酿造,2011,30(1):95-96.
[12]李芳芳,袁 丽,吴卫宇.气相色谱法定量检测白酒中酯、醇、酸等微量成分[J].酿酒,2015,42(1):104-107.
[13]张 玥,王朝辉,张亚婷,等.基于主成分分析和判别分析的大米产地溯源[J].中国粮油学报,2016,31(4):1-5.
[14]黄艳梅.酱卤肉制品的工艺改进及综合保鲜技术的研究[D].无锡:江南大学,2016.
[15]李 昕,张明明.SPSS 22.0统计分析从入门到精通[M].北京:电子工业出版社,2015:280-312.
[16]谢汉龙,尚 涛.SPSS统计分析与数据挖掘[M].北京:电子工业出版社,2012:484-488.