基于统计学原理的白葡萄酒评价体系的研究
2018-06-25曹忠威米津娇
曹忠威,米津娇
(吉林财经大学应用数学学院,吉林长春 130117)
对于葡萄酒质量的评价,主要考虑葡萄及葡萄酒中所含指标.由于葡萄酒级别标准的模糊性,级别之间没有严格的界定,如果仅通过单因子评价,将各因子依次与给出的葡萄酒分级标准进行比较,给出每个因子的级别,从中选取最劣因子的级别作为该葡萄酒的级别评价,这样对于葡萄酒质量的评价有可能会出现以偏概全的结果.因此需建立综合各影响因子的联系和相关性的评价模型,综合评价葡萄酒的级别,按照以下几个步骤进行:首先进行F、T-检验,对评价结果作变异系数比较;然后用主成分分析法和层次分析法相互验证进行葡萄分级;最后运用逐步多元线性回归分析理化指标对葡萄酒质量的影响.
1 基于SPSS软件的葡萄酒评价
假设:(1)酿造优质的葡萄酒必须使用优质葡萄;(2)将可信品酒员组给出的评分作为评判葡萄酒质量的标准.根据数据,如果总体标准差未知,而且样本容量小于30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t分布.由于样本的数量不足够大,样本均值不具备统计学意义.本文将运用F、T-检验,对独立样本进行有效检验.对白葡萄酒进行F、T-检验,结果见表1.
表1 白葡萄酒F、T-检验结果
由表1可以看出,Levene检验结果判断是第一步,Sig=0.051>0.05,应该接受原假设,即两组评酒员的评价结果无显著性差异;而根据独立样本T-检验结果,得出Sig=0.041<0.05,应该拒绝原假设,即有显著的差异.由此无法确定其显著性.通过对两组变异系数进行比较可以看出,第二组评酒员的评价结果的方差变异系数更加平稳,第二组评价结果更为准确、可信.
2 主成分分析法确定评价权重
从多元统计理论出发,运用主成分分析法来确定白葡萄酒的评价权重.该方法的优点是考虑综合评价指标体系中各层因素的重要程度,使各指标权重趋于合理.采用酿酒白葡萄中的糖、酸、干物质含量、果穗质量四项指标对白葡萄酒进行评价、分析.通过查阅文献[1]以及计算这些指标与品酒员打分的相关性得出结果,选取对白葡萄酒比较重要的四个指标项目,利用SPSS软件求得相关系数矩阵的白葡萄酒前四个特征根及其贡献率,见表2.
表2 主成分分析结果
由表2可以看出,前两个成份特征根的累计贡献率接近78.4%,主成分分析效果很好.
3 建立层次分析模型
将影响白葡萄酒质量因素问题分解成三个层次,最上层为目标层,即白葡萄酒质量;中间层为准则层,即外观C1、口感C2、香气C3三个因素;最下层为指标层,即糖P1、酸P2、干物质含量P3、果穗质量P4、出汁率P5五个指标.依此构建其指标体系,在建立层次结构后,上下层元素间的影响关系就被确定了,由此构造一系列的判断矩阵.
表3 判断矩阵
将通过四个判断矩阵计算得出的权重向量A、最大特征值λmax和一致性指标CI列入表3中,其中C为判断准则,P为指标.可以得到五项重要指标的各自权重,与主成分分析法得出的权重基本一致.根据层次分析法得出的权向量进行计算得出的白葡萄排名,与主成分分析法得出的白葡萄排名也基本一致.
4 运用多元线性回归模型评价葡萄酒的质量
酿酒葡萄和葡萄酒的理化指标不能完整地反应葡萄酒的质量,葡萄酒中的芳香物质也会影响到葡萄酒的质量.随着香气成分鉴定技术的不断提高,利用芳香成分来评价葡萄酒质量有望成为一种新方法.现对不同等级酿酒葡萄和葡萄酒的样品进行重要芳香物质对比分析.
表4 三种等级酿酒葡萄及其对应葡萄酒中酯类化合物的比较
注:“—”表示未检测出。
表5 三种等级酿酒葡萄及其对应葡萄酒中醇类化合物的比较
注:“—”表示未检测出。
绝大多数的酯类能产生令人愉悦的香气,大部分的酯类化合物表现出水果香味.由表4看出,在酿制过程中重要酯类化合物增加得越少,葡萄酒的质量越好.一些重要的醇能够赋予葡萄酒令人愉快的典型风味.由表5看出,在酿制过程中重要醇类化合物降低得越少,葡萄酒的质量越好.
表6 三种等级酿酒葡萄及其对应葡萄酒中有机酸类化合物的比较
注:“—”表示未检测出。
对酿酒葡萄及葡萄酒的理化指标进行多元线性回归分析,其方程为:
y白1= 64.098+0.037x1+0.093x2-0.293x3-0.399x4+0.189x5
+0.123x6-0.588x7+0.411x8-0.373x9+0.465x10.
(1)
根据逐步回归方法,选取显著性水平为α进=0.05,α出=0.10.在SPSS中,将y白1与x1至x10分别选入各自变量框,建立逐步回归的最优回归子集为模型,回归方程为:
y白2=75.644-0.291x4-0.548x7+0.483x10.
(2)
由于芳香物质的存在,需结合芳香物质再次对其进行多元线性回归分析,得到多元线性回归分析的最优回归子集,回归方程为:
y=87.213-0.573x3-0.579x5+1.089x7+0.357x17-0.437x19.
(3)
逐步回归的选元过程是根据变量有进有出的思想,这种有进有出的结果说明自变量之间具有相关性.如果自变量之间是完全不相关的,那么引入的自变量就不会再被剔除,而剔除的自变量也就不会再被吸引.
5 结语
如果只用葡萄及葡萄酒的理化指标来对葡萄酒的质量进行评价,会以偏概全.影响葡萄酒质量的因素有很多,如气候、产地、工艺等,甚至由于品酒员个人喜好不同而对品尝质量有不同的评价结果.因此,不能完全用葡萄及葡萄酒的理化指标来评价葡萄酒的质量,但理化指标可以作为评价葡萄酒质量的重要参考因素.
[参考文献]
[1]韩中庚.数学建模方法与应用[M].2版.北京:高等教育出版社,2005.
[2]刘宏.综合评价中指标权重确定方法的研究[J].河北工业大学学报,1996(4):44-46.
[3]司守奎.数学建模算法与应用[M].北京:国防工业出版社,2011.
[4]何晓群.实用回归分析[M].北京:高等教育出版社,2008.