葡萄酒评价分析
2013-04-29高真杨海生
高真 杨海生
摘要:随着人们物质生活水平的不断提高,葡萄酒越来越受到各国人民的喜爱,人们对葡萄酒质量的关注也日益加强,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行评价,每个评酒员在对葡萄酒进行品尝后对其分类指标进行打分,然后求和得到其总分,从而得到葡萄酒的质量。
关键词:葡萄酒;理化特性;主成分分析;典型相关分析
中图分类号:F27
文献标识码:A
文章编号:1672-3198(2013)09-0088-02
1基本假设
(1)不同种类中酿酒葡萄的成分数值统一标准无差异;
(2)不同种类中酒葡萄的成分数值统一标准无差异;
(3)酿酒方式及酿酒过程对葡萄酒的质量无影响;
(4)品酒先后对打分没有影响;
(5)检测理化指标为标准值误差。
2模型基本思想
2.1主成分分析法基本思想
主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP(比如p个指标),重新组合成一组较少个数的互不相关的综合指标Fm来代替原来指标。那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。
2.2典型相关分析基本思想
典型相关分析(canonical correlation analysis)就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。由于典型相关分析涉及较大量的矩阵计算,其方法的应用在早期曾受到相当的限制。但随着当代计算机技术及其软件的迅速发展,弥补了应用典型相关分析中的困难,因此它的应用开始走向普及化。典型相关分析是研究两组变量之间相关关系的一种统计分析方法。
3主成分分析模型建立和实证分析
3.1符号定义
(1)酿酒葡萄的理化指标进行符号定义。
Xi(i=1,2,……,32)——{花色苷,单宁,总酚,酒总黄酮,白藜芦醇,反式白藜芦醇苷,顺式白藜芦醇苷,反式白藜芦醇,顺式白藜芦醇,DPPH半抑制体积(IV50)1/IV50,L*(D65),a*(D65),b*(D65),H(D65),C(D65)}。
(2)葡萄酒的理化指标进行符号定义:
Yj(j=1,2,……,15)——{花色苷,单宁,总酚,葡萄总黄酮,白藜芦醇,反式白藜芦醇苷,顺式白藜芦醇苷,反式白藜芦醇,顺式白藜芦醇,DPPH自由基1/IC50,L*(D65),a*(D65),b*(D65),H(D65),C(D65)}。
3.2酿酒葡萄红葡萄的主成分分析
通过SPSS18.0软件对酿酒葡萄红葡萄的32项酿酒葡萄红葡萄标准化的指标进行主成分分析(即模型检验)。
表2列出了9个主成分对应的特征值、占总方差的百分比及累计百分比。第一个主成分占总方差的百分比为22.21%,说明他可解释原来变量中22.21%的信息。前9个主成分的累计贡献率为85.104%,说明用九个主成分来表示原来的32个变量,可以反映85.104%的信息。85.104%%,已经超过85%,根据主成分选取指标的原则,选取前9个主成分完全可以来代表19项指标。因此,选择该9个主成分,并定义为Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8,Y9。
3.3建立主成分方程
用表1中的数据除表2中主成分相对应的特征值开平方根便得到主成分中每项指标所对应的系数,即特征向量。特征向量将得到的特征向量与标准化后的数据相乘得出主成分表达式。
第一种主成分方程:
Y1=0.050X1+0.086X2-0.019X3+…+0.012X31-0.059X32
第1主成分方差贡献率最大为22.21%,通过线性方程能得出特征向量较大的是X4(花色苷)。
第二种主成分方程:
Y2=0.109X1+0.079X2-0.073X3+…+0.022X31+0.080X32
第2主成分方差贡献率最大为15.762%,通过线性方程能得出特征向量较大的是X6(苹果酸)和X15(黄酮醇)。
同理,我们可以分析得到第三至第九种主成分方程的特征向量较大的指标。
上述主成分方程的结果显示,特征向量较大的为X1(氨基酸总量),X4(花色苷),X6(苹果酸),X7(柠檬酸),X8(多酚氧化酶活力),X9(褐变度),X12(单宁),X13(葡萄总黄酮),X15(黄酮醇),X24(百粒质量)和X19(PH值)等11项。
对酿酒白葡萄进行上述类似的主成分分析,可以选取出特征向量较大的为X1(氨基酸总量),X4(花色苷),X6(苹果酸),X7(柠檬酸),X8(多酚氧化酶活力),X9(褐变度),X12(单宁),X13(葡萄总黄酮),X15(黄酮醇),X24(百粒质量)和X19(PH值),X26(出汁率)h和X17(还原糖)等13项。
同时,对红葡萄酒和白葡萄酒标准化的理化指标进行与上述类似主成分分析,红葡萄酒可以选取出特征向量较大的为Y2(单宁),Y2(单宁),Y3(总酚),Y4(酒总黄酮),Y5(白藜芦醇),Y10(DPPH半抑制体积),Y11(色泽L*(D65)),Y12(色泽a*),Y13(色泽b*(D65))。白葡萄可以选取出特征向量较大的为Y2(单宁),Y3(总酚),Y4(酒总黄酮),Y5(白藜芦醇),Y10(DPPH半抑制体积),Y11(色泽L*(D65)),Y12(色泽a*),Y13(色泽b*(D65))。但是白葡萄酒中未检测到X1(花色苷),而红葡萄酒中含有X1(花色苷),并且X1(花色苷)与红葡萄酒的颜色密切相关,其直接影响红葡萄酒感官品质评定,所以红葡萄酒的必须考虑花色苷指标。
将以上得出的主成分特征向量进行下一步典型相关分析。
4典型相关分析的模型建立与模型解释
4.1相关符号定义
V—红葡萄,U—红葡萄酒,X1—氨基酸总量mg/100gfw,X2—花色苷mg/100g鲜重,X3—苹果酸(g/L),X4—柠檬酸(g/L),X5—多酚氧化酶活力E(A/min·g·ml),X6—褐变度ΔA/g*g*min*ml,X7—单宁(mmol/kg),X8—葡萄总黄酮(mmol/kg),X9—黄酮醇(mg/kg),X10—百粒质量/g,X11—PH值,X12—出汁率(%),X13—还原糖(g/L),Y1—花色苷(mg/L),Y2—单宁(mmol/L),Y3—总酚(mmol/L),Y4—酒总黄酮(mmol/L),Y5—白藜芦醇(mg/L),Y6—DPPH半抑制体积(IV50),Y7—色泽L*(D65),Y8—色泽a*,Y9—色泽b*(D65)。
4.2红葡萄和红葡萄酒理化指标之间的典型相关分析
表4给出的是9对典型变量之间的典型相关系数等数0的显著性检验结果,第一列给出的是Wilk's Lambda值,第二列为卡方值,第三列为自由度,第四列为P值,从上面的结果中可以看出,第一和第二显性相关系数是显著的(P分别为0.000和0.004小于0.05),说明第一对和第二对典型相关是有价值的,而第三以后的显性相关系数不显著(P均大于0.05),所以第三队以及以后的变量可以不考虑。
4.4拟合线性方程
同样由表5的方法可得线性方程组:
V1=-0.385Y1-0.181Y2+0.395Y3-0.070Y4-0.255Y5+0.385Y6
+0.851Y7+0.540Y8+0.080Y8
V2=-1.637Y1+0.531Y2-0.464Y3+0.582Y4+0.528Y5-0.278Y6
-0.855Y7-1.112Y8-0.401Y9
结论:由于U1和V1最相关,且U2和V2很相关,说明U1所代表的红葡萄和V1所代表的红葡萄酒相关。
同理可以通过对白葡萄和白葡萄酒的典型相关分析,得出白葡萄和白葡萄酒之间的相关关系。
分析结论:第三对以后的典型变量可以不考虑;最后对结果进行分析得出:(1)酿酒葡萄的理化指标有抗氧化、防变质、抑菌作用,而葡萄酒的理化指标也具有抗氧化、防变质、抑菌作用。(2)酿酒葡萄的理化指标影响着葡萄酒的理化指标,从而使葡萄酒的颜色有红、白之分。(3)酿酒葡萄中的苹果酸有助于葡萄酒的发酵,增强了葡萄酒DPPH半抑制体积的作用。(4)酿酒葡萄中含有的酒石酸和单宁可以使葡萄酒的持久性更强。
参考文献
[1]李运,李记明,姜忠军.统计分析在葡萄酒质量评价中的应用[J].酿酒科技,2009(4):79-82.
[2]马腾,赵丽,李军.2008年份昌黎原产地葡萄酒理化指标的统计学分析[J].河北科技师范学院学报,2012,26(1):1-12.
[3]郭其昌,郭松泉.葡萄酒的质量等级法[J].中外葡萄与葡萄酒,1999(4):64-66.
[4]韩中庚.数学建模方法及其应用[M].北京:高等教育出版社,2005.
[5]朱建平,应用多元统计分析(第二版)[M].北京:科学出版社,2006.
[6]葛庆龙.SPSS的聚类分析功能在试卷分析中的应用[J].统计教育,2008(1):53-54.