偏最小二乘方法在不同白酒香型判别分析中的应用
2020-11-04魏泉增范江涛刘嘉玲宋丽君谢玉锋
魏泉增,范江涛,刘嘉玲,宋丽君,李 瑞,谢玉锋
(1.许昌学院 食品与生物工程学院,河南 许昌 461000;2.河南省食品安全生物标识快检技术重点实验,河南 许昌 461000;3.哈尔滨学院 食品工程学院,黑龙江 哈尔滨 150086)
传统的白酒香型鉴别方法主要依靠品酒师凭借感官品评。酱香型、浓香型、清香型是我国主要的三大香型白酒,由于生产地域不同,使得不同产地的白酒具有风味成分众多、香气成分复杂的特点,给香型的辨别分析带来困难。但近年来,随着分析技术的发展,对白酒香味成分进行了深入研究[1-6]。范文来等[7]对洋河酒厂的蓝色经典系列白酒进行分析,结果表明在浓香型白酒中认为重要的化合物如乙酸乙酯、乳酸乙酯、乙酸、丁酸等化合物并不是洋河蓝色经典系列白酒的重要香气成分[8]。孙细珍等[9]采用保留指数结合标准品比对法分别从现代工艺和传统工艺小曲清香型白酒中鉴定出116种和121种挥发性成分,并通过化合物遗漏实验寻找到了清香型白酒重要的风味物质。陈华明等[10]采用气相色谱法对酱香型白酒中63种风味组分进行检测,结合嗅阈值计算各样品中风味组分的香气活性值(odor active values,OAVs),确定29种主要风味组分进行主成分分析,确定酱香型白酒的主要香气成分。目前采气相色谱与质谱联用(gas chromatography-mass spectrometry,GC-MS)方法[11-13]对白酒香气成分进行分析,所获得的数据量较多[14],数据之间的相关性高,处理起来相当困难,同种香型的白酒也存在明显差异[15]。偏最小二乘回归(partial least square,PLS)是近年来应用实际需要而产生和发展的一个具有广泛使用性的新型多元统计分析方法,是多元线性回归、主成分分析和典型相关分析的有机结合[16]。PLS能有效地解决样本量少、自变量较多、相关性较高的数据模型,近年来在食品行业领域受到了极大的重视及应用[17-18]。
本实验用气相色谱技术测定不同香型白酒,将所获得的信息转化为数据矩阵,采用PLS对数据进行建模分析,以期建立一种白酒香型分析方法。
1 材料与方法
1.1 材料与试剂
1.1.1 材料
浓香型白酒(7个品牌,分别编号为NX1、NX2、NX3、NX4、NX5、NX6、NX7)每个品牌3个样品,酱香型白酒(8个品牌,分别编号为JX1、JX2、JX3、JX4、JX5、JX6、JX7、JX8)每个品牌3个样品,清香型白酒(7个品牌,分别编号为QX1、QX2、QX3、QX4、QX5、QX6、QX7)每个品牌3个样品:市售。
1.1.2 试剂
甲酸乙酯、乙酸乙酯、乙缩醛、甲醇、丁酸乙酯、仲丁醇、正丙醇、乙酸丁酯、异丁醇、乙酸异戊酯、戊酸乙酯、正丁醇、2-甲基-1-丁醇、3-甲基-1-丁醇、己酸乙酯、正戊醇、庚酸乙酯、壬酸乙酯、癸酸乙酯、β-苯乙醇、乳酸乙酯、正己醇、辛酸乙酯、十六酸乙酯、乙酸正戊酯、乙酸、丙酸、丁酸、异戊酸、戊酸、己酸、庚酸、辛酸、2-乙基丁酸标准品(均为色谱纯):美国Sigma公司。
1.2 仪器与设备
安捷伦7890A气相色谱仪(配有DB-WAX毛细管柱(60 m×0.25 mm×0.25 μm),火焰离子化检测器(flame ionization detector,FID)):美国安捷伦公司。
1.3 方法
1.3.1 混合标准溶液配制
内标溶液配制:分别吸取200 μL乙酸正戊酯,200 μL 2-乙基丁酸,用体积分数60%的乙醇溶液定容至10 mL。
混合标准溶液配制:分别吸取甲酸乙酯、乙缩醛、甲醇、丁酸乙酯、仲丁醇、正丙醇、乙酸丁酯、异丁醇、乙酸异戊酯、戊酸乙酯、正丁醇、3-甲基-1-丁醇、2-甲基-1-丁醇、正戊醇、庚酸乙酯、正己醇、辛酸乙酯、乙酸、丙酸、壬酸乙酯、丁酸、癸酸乙酯、异戊酸、戊酸、己酸、β-苯乙醇、庚酸、辛酸、十六酸乙酯40 μL,分别吸取乙酸乙酯、己酸乙酯、乳酸乙酯200 μL,用体积分数60%的乙醇定容至10 mL作为母液。分别吸取母液5 mL、1 mL、200 μL、80 μL,用体积比为60%乙醇定容至10 mL,加入内标溶液0.1 mL,为标准溶液。
1.3.2 色谱条件
起始温度为40℃维持10min,3℃/min升至70℃,4 ℃/min升至180 ℃,15 ℃/min升至210 ℃,维持5 min。进样口温度200.0 ℃;隔垫吹扫流量30 mL/min。分流比20∶1。检测器温度230.0 ℃;空气流量400 mL/min,氢气流量3 mL/min。流动相为氮气,流速1 mL/min。
1.3.3 工作曲线的制作及检出限的测定
不同浓度混标由低浓度到高浓度依次进样分析,绘制标准工作曲线。以信噪比(S/N)=3,计算检出限(limitofdetection,LOD)。
1.3.4 精密度试验
测定NX7酒样中不同物质的含量,平行测定3次,计算相对标准偏差(relative standard deviation,RSD)。
1.3.5 加标回收试验
采用标准品加入法对NX7酒样做3个水平加标回收试验(各做3次平行),测定回收率。
1.3.6 白酒样品测定
白酒样品过0.45μm水相滤膜,定容到10 mL,加入0.1 mL内标溶液,采用气相色谱测定白酒成分。进样量:1 μL。每个样品平行测定3次。
1.3.7 数据处理
以白酒样品为酱香型白酒赋值为0,为浓香型赋值为1,为清香型赋值为2,设定为因变量[16]。以香气成分的含量设定为自变量。选取样本的16%为验证集,84%为训练集,先将训练集导入SIMCAP-14.1软件中进行PLS分析。
2 结果与分析
2.1 混合标准溶液色谱图
图1 32种香气成分混合标准溶液气相色谱图Fig.1 Gas chromatogram of 32 kinds of mixed standards of aroma substance
由图1可知,除3-甲基-1-丁醇和2-甲基-1-丁醇的分离度为0.9,其余相邻两种物质的分离度均大于1.5。因此,标准品色谱图中32种标准品与2种内标的分离效果较好,满足实验要求。
2.2 定量关系及检出限
以信噪比为3为检测限浓度,以质量浓度(X)为横坐标,峰面积(Y)为纵坐标,建立线性方程。相关系数R2、检出限各组分的相关系数R2在0.999 01~0.999 99,R2均>0.999,检出限范围分别为0.17~7.50 mg/L。说明在一定浓度范围内,32种香气成分的线性关系良好。
2.3 精密度
采用气相色谱对某浓香型白酒的香气成分进行定量,实验结果见表1。结果表明,各成分测定结果的相对标准偏差(relative standard deviation,RSD)<6%,表明该方法精密度较高,该方法能够满足白酒中香气成分的定量要求。
表1 精密度实验结果Table 1 Results of precision tests
2.4 加标回收试验
香气物质加标回收率试验结果见表2。结果表明,NX7酒样中香味物质加标回收率结果的RSD在0.18%~3.63%,表明具有良好的重复性,回收率也均在80.20%~97.93%。可见该方法回收率高,可用于检测白酒中香味物质的含量。
表2 香气物质加标回收率试验结果Table 2 Results of recovery rates of aroma compounds
续表
续表
2.5 样品香气成分测定
浓香型白酒中己酸乙酯的含量在813.19~1370.53mg/L,乙酸乙酯的含量在596.00~955.46 mg/L,乳酸乙酯的含量在316.55~792.97 mg/L。酱香型白酒中己酸乙酯19.38~87.47mg/L,乙酸乙酯1.19~2641.87mg/mL,乳酸乙酯624.46~1 798.68 mg/L。清香型白酒中己酸乙酯0~3.54 mg/L,乙酸乙酯在340.46~1389.06mg/L,乳酸乙酯198.67~983.61mg/L。
浓香型白酒中酸类物质含量仅次于酯类,其中乙酸350~561.92 mg/L,己酸388.07~554.15 mg/L和丁酸24.17~140.28 mg/mL具有较高的浓度水平。酱香型白酒中乙酸443.01~1 730.89 mg/mL,己酸10.61~48.82 mg/mL,丁酸23.51~96.26 mg/mL。在清香型白酒中乙酸247.39~699.57 mg/mL,己酸4.18~16.17 mg/mL。
高级醇一般由发酵过程中氨基酸的降解和葡萄糖经糖酵解途径的转化而生成[19]。浓香型白酒含量较高有正丙醇(2.28~170.25mg/L)和3-甲基-1-丁醇(2.37~190.22mg/L)。酱香型白酒有正丙醇(178.16~1 428.39 mg/L),3-甲基-1-丁醇(22.33~316.39 mg/L)。清香型白酒中有正丙醇(58.84~167.13 mg/mL),3-甲基-1-丁醇(0~286.10 mg/L)。
2.6 模型判别分析
2.6.1 PLS分析
采用Simac-p14.1软件中内置的留一法(leave-one-out)对样本进行PLS 分析。PLS模型提取3个主成分t1、t2和t3。主成分t1自变量特征值贡献度为29.5%,因变量特征值贡献度为66.7%;主成分t2自变量特征值贡献度为12.3%,因变量特征值贡献度为20.7%;主成分t3自变量特征值贡献度为17.1%,因变量特征值贡献度为5.83%。前3个主成分自变量特征值贡献度为59.0%,对因变量特征值贡献度为93.3%,而3个主成分所预测模型的累计差异为89.9%。这说明该模型的预测精度和效度不错。
训练集所建立的模型中,以第一主成分t1的得分值为横坐标和第二主成分t2的得分值为纵坐标绘制得分散点图2。由图2可知,不同香型的白酒彼此分开,其中香型相同白酒较集中。所有样本都落在95%的置信区间内,无异常值。
图2 训练集得分图Fig.2 Score plot of the training set
2.6.2 模型验证
采用样本数据的随机排列进行统计推断PLS模型是否存在过拟合的情况[20]。Y的顺序被随机地重复50次。比较训练集模型的拟合优度R2与预测优度Q2。从图3可以看出,拟合优度都大于预测优度,且拟合优度的趋势线在纵轴上的截距为0.201,预测优度的趋势线在纵轴上的截距为-0.399。一般认为拟合优度的趋势线在纵轴上的截距<0.4,预测优度的趋势线在纵轴上的截距<0.05,则模型不存在过拟合的情况。
图3 不同白酒香型样品排列检验Fig.3 Permutations plot for the different flavor Baijiu
以训练集真实值为纵坐标、估计值为横坐标,绘制散点图4。由图4可知,且两者之间的差异由评估均方差(root mean square error of estimation,RMSEE)表示。显示了PLS模型中作为训练集的不同真实值与估计值之间的关系。RMSEE的值为0.217 623,且可以看出不同香型白酒能明显分开。由于预测均方差(root mean square error of prediction,RMSEP)值与RMSEE值相差不大,说明模型的效果好。为了验证PLS训练集模型,将不同香型白酒的验证集带入训练集所创建的模型中进行验证。预测不同白酒的香型,模型能力由验证集产生的RMSEP表示。PLS模型中作为验证集的不同香型白酒的真实值与估计值之间的关系见图5。由图5可知,RMSEP 的值为0.245 351,且不同香型白酒被预测出来。
图4 偏最小二乘法分析中训练集中的真实值与估计值的关系Fig.4 Relationship between true value and estimate value of partial least square derived training set
图5 偏最小二乘法分析中验证集中的真实值与估计值的关系Fig.5 Relationship between true value and estimate value of partial least square derived validation set
3 结论
为建立一种白酒香型判断方法,采用气相色谱分析白酒香气成分。结果表明该方法香气成分线性相关系数R2>0.999,检测限<5.11 mg/L,精密度试验结果RSD<4.11%;平均回收率为80.20%~97.93%。采用PLS对不同香型白酒香气成分分析,建立了预测模型,由排列检验结果说明模型不存在过拟合现象,通过比较预测值与真实值表明PLS模型具有较好地预测能力,由参数RMSEE和RMSEP值能证明预测精度较高,能够较好的判断出白酒香型。本研究为白酒香型判别提供一条新的途径和思路。