葡萄酒评价结果的差异性分析与可信度确定
2014-12-01刘婵江伟
刘婵++江伟
摘 要:当前对葡萄酒评价主要依赖评酒员的品评,很大程度上带有主观因素,因此评酒员评价结果的差异性与可信度的研究具有重要意义。该文首先针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,得出第二组结果更可信的结论。
关键词:差异性分析 可信度确定 假设检验 多元统计分析
中图分类号:C81 文献标识码:A 文章编号:1674-098X(2014)09(c)-0230-03
葡萄酒的历史可谓源远流长,要追溯其究竟始于何时何地,似乎是不可能的。根据考古发掘的历史材料证实,葡萄酒大约出现于公元前7000年至公元前5000年,起源自小亚细亚至中东一带。新华社1996年6月6日报导:考古学家在伊朗北部扎格罗斯山脉的一个石器时代晚期的村庄里,挖掘出的一个罐子证明,人类在距今7000多年前就已饮用葡萄酒了[1]。
葡萄酒的评价问题一直依赖评酒员的人为打分,除去一些客观影响因素,评酒员的个人主观意愿爱好也对评价结果有着重大的影响。因此,一般情况下都要请很多评酒员进行评酒,这些评价结果是否有差异,哪些结果更可信是值得研究的问题。该文将对2012年数学建模A题给出的评酒员评价结果进行统计分析。
1 数据及预处理
为了分析两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。为此,我们对数据进行预处理,删去一些具有明显错误的数据,针对专家评分中的整体评分,对其平均值建立双正态总体方差比和均值差的检验模型,分别用Matlab自编程序和EXCEL软件中的数据处理功能进行有无显著性差异分析并比较结果;为了进一步确定比较结果,运用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行检验运用。最后,利用组内方差来确定各组评分的可信度。
将同一样品酒的10位评酒员所评出的各项评分求取平均数来作为该组评酒员对此样品酒的各项评分,整理后的数据部分见表1。
2 评价结果的差异性分析
(1)双正态总体方差比均值差的检验模型[2]。
运用逐对比较法,在显著性水平下判断两组评酒员的评价结果有无显著性差异。根据题意,先在未知的条件下检验假设:
根据输出的检验报告h=0可知,应接受假设。因此,在显著性水平下两组评酒员对于红葡萄酒的评价结果有无显著性差异。
利用在上面对于红葡萄酒的分析方法对白葡萄酒数据进行检验,可以得出h=0,即两正态总体方差相等的假设成立。而在方差相等的条件下作均值是否相等的假设检验中得出h=1,应拒绝原假设因此,在显著性水平下可认为,即两组评酒员对于白葡萄酒的评价结果有显著性差异。
综合上述讨论结果,可以认为两组评酒员对红葡萄酒的评价结果无显著差异,而对白葡萄酒的评价结果有显著性差异。
(2)双样本等方差假设的Excel求解[3]。
依据表(1)中红,白葡萄酒的数据,经Excel计算可得表2如下。
依上表中数据可知,对于红葡萄酒,所以应接受原假设因此,在显著性水平下可认为认为两组评酒员的评价结果无显著差异;对于白葡萄酒,所以应拒绝原假设因此,在显著性水平下可认为认为两组评酒员的评价结果有显著差异。
(3)多元正态总体的假设检验与方差分析。
为了进一步确定结果的正确性,利用表1中的所有数据,并通过多元正太总体的假设检验与方差分析进行评价结果的分析。
假定两组样本相互独立,已知两总体有相同的协方差阵>0,但未知,要检验的假设为:,.其中为已知维向量。
记,
作假设,利用SAS程序求解F值和P值,得到的输出中主要的是表3和表4。
由上表3可见对于红葡萄酒来说,计算得到的P值是0.0741,因而两组评酒员的评酒结果无显著性差异。
由表4可见对于白葡萄酒来说,计算得到的P值是0.0005,因而两组评酒员的评酒结果有显著性差异。
至此运用上述三种方法所得结果一致,两组评酒员对红葡萄酒的评价结果无显著性差异但对白葡萄酒的评价结果有显著性差异。并且也可以得出仅使用总评分来对差异性来分析是可行的,也说明了总评分是所有打分中具有代表性的分数,可以反映评酒员的真实意思表达。
3 评价结果的可靠性分析
要比较两组评酒员的评价结果的的可靠性,我们利用评价结果的方差来分析他们结果的可靠性。方差的大小反映了评酒员之间对于样品酒评价的统一性,再无外界干扰的情况下,方差越小说明评价越统一,进而说明结果越可信。
分别计算出对于每一个样品,第一组和第二组内部得到总分的方差,见表5,每个组对于所有样品打分的方差的平均值体现了,该组成员对打分结果的认可度。该数值越小说明认可度越高,反之认可度越低。
比较两组方差的平均值0.5221> 0.3667;1.0428>0.5685。所以可以判断第二组的结果更可信。
4 结语
葡萄酒的历史几乎是和人类文化史一道开始的,世界古老的文明民族的神话传说中都流传着葡萄酒的故事。现有的葡萄酒评价方法很大程度上带有主观因素,本文在对两组专家的评价结果进行分析与简单处理之后,首先,针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,运用Matlab 软件计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果显示对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著,与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,运用Matlab软件计算得出红葡萄酒0.5221>0.3667、白葡萄酒1.0428>0.5685,所以第二组结果更可信。
参考文献
[1] 滕波,赵云财,陈成,等.浅谈葡萄酒[J].酿酒,2004(6).
[2] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等出版社,2008.
[3] 潘鸿,张小宇,吴勇民.应用统计学[M].北京:人民邮电出版社,2011.endprint
摘 要:当前对葡萄酒评价主要依赖评酒员的品评,很大程度上带有主观因素,因此评酒员评价结果的差异性与可信度的研究具有重要意义。该文首先针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,得出第二组结果更可信的结论。
关键词:差异性分析 可信度确定 假设检验 多元统计分析
中图分类号:C81 文献标识码:A 文章编号:1674-098X(2014)09(c)-0230-03
葡萄酒的历史可谓源远流长,要追溯其究竟始于何时何地,似乎是不可能的。根据考古发掘的历史材料证实,葡萄酒大约出现于公元前7000年至公元前5000年,起源自小亚细亚至中东一带。新华社1996年6月6日报导:考古学家在伊朗北部扎格罗斯山脉的一个石器时代晚期的村庄里,挖掘出的一个罐子证明,人类在距今7000多年前就已饮用葡萄酒了[1]。
葡萄酒的评价问题一直依赖评酒员的人为打分,除去一些客观影响因素,评酒员的个人主观意愿爱好也对评价结果有着重大的影响。因此,一般情况下都要请很多评酒员进行评酒,这些评价结果是否有差异,哪些结果更可信是值得研究的问题。该文将对2012年数学建模A题给出的评酒员评价结果进行统计分析。
1 数据及预处理
为了分析两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。为此,我们对数据进行预处理,删去一些具有明显错误的数据,针对专家评分中的整体评分,对其平均值建立双正态总体方差比和均值差的检验模型,分别用Matlab自编程序和EXCEL软件中的数据处理功能进行有无显著性差异分析并比较结果;为了进一步确定比较结果,运用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行检验运用。最后,利用组内方差来确定各组评分的可信度。
将同一样品酒的10位评酒员所评出的各项评分求取平均数来作为该组评酒员对此样品酒的各项评分,整理后的数据部分见表1。
2 评价结果的差异性分析
(1)双正态总体方差比均值差的检验模型[2]。
运用逐对比较法,在显著性水平下判断两组评酒员的评价结果有无显著性差异。根据题意,先在未知的条件下检验假设:
根据输出的检验报告h=0可知,应接受假设。因此,在显著性水平下两组评酒员对于红葡萄酒的评价结果有无显著性差异。
利用在上面对于红葡萄酒的分析方法对白葡萄酒数据进行检验,可以得出h=0,即两正态总体方差相等的假设成立。而在方差相等的条件下作均值是否相等的假设检验中得出h=1,应拒绝原假设因此,在显著性水平下可认为,即两组评酒员对于白葡萄酒的评价结果有显著性差异。
综合上述讨论结果,可以认为两组评酒员对红葡萄酒的评价结果无显著差异,而对白葡萄酒的评价结果有显著性差异。
(2)双样本等方差假设的Excel求解[3]。
依据表(1)中红,白葡萄酒的数据,经Excel计算可得表2如下。
依上表中数据可知,对于红葡萄酒,所以应接受原假设因此,在显著性水平下可认为认为两组评酒员的评价结果无显著差异;对于白葡萄酒,所以应拒绝原假设因此,在显著性水平下可认为认为两组评酒员的评价结果有显著差异。
(3)多元正态总体的假设检验与方差分析。
为了进一步确定结果的正确性,利用表1中的所有数据,并通过多元正太总体的假设检验与方差分析进行评价结果的分析。
假定两组样本相互独立,已知两总体有相同的协方差阵>0,但未知,要检验的假设为:,.其中为已知维向量。
记,
作假设,利用SAS程序求解F值和P值,得到的输出中主要的是表3和表4。
由上表3可见对于红葡萄酒来说,计算得到的P值是0.0741,因而两组评酒员的评酒结果无显著性差异。
由表4可见对于白葡萄酒来说,计算得到的P值是0.0005,因而两组评酒员的评酒结果有显著性差异。
至此运用上述三种方法所得结果一致,两组评酒员对红葡萄酒的评价结果无显著性差异但对白葡萄酒的评价结果有显著性差异。并且也可以得出仅使用总评分来对差异性来分析是可行的,也说明了总评分是所有打分中具有代表性的分数,可以反映评酒员的真实意思表达。
3 评价结果的可靠性分析
要比较两组评酒员的评价结果的的可靠性,我们利用评价结果的方差来分析他们结果的可靠性。方差的大小反映了评酒员之间对于样品酒评价的统一性,再无外界干扰的情况下,方差越小说明评价越统一,进而说明结果越可信。
分别计算出对于每一个样品,第一组和第二组内部得到总分的方差,见表5,每个组对于所有样品打分的方差的平均值体现了,该组成员对打分结果的认可度。该数值越小说明认可度越高,反之认可度越低。
比较两组方差的平均值0.5221> 0.3667;1.0428>0.5685。所以可以判断第二组的结果更可信。
4 结语
葡萄酒的历史几乎是和人类文化史一道开始的,世界古老的文明民族的神话传说中都流传着葡萄酒的故事。现有的葡萄酒评价方法很大程度上带有主观因素,本文在对两组专家的评价结果进行分析与简单处理之后,首先,针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,运用Matlab 软件计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果显示对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著,与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,运用Matlab软件计算得出红葡萄酒0.5221>0.3667、白葡萄酒1.0428>0.5685,所以第二组结果更可信。
参考文献
[1] 滕波,赵云财,陈成,等.浅谈葡萄酒[J].酿酒,2004(6).
[2] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等出版社,2008.
[3] 潘鸿,张小宇,吴勇民.应用统计学[M].北京:人民邮电出版社,2011.endprint
摘 要:当前对葡萄酒评价主要依赖评酒员的品评,很大程度上带有主观因素,因此评酒员评价结果的差异性与可信度的研究具有重要意义。该文首先针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,得出第二组结果更可信的结论。
关键词:差异性分析 可信度确定 假设检验 多元统计分析
中图分类号:C81 文献标识码:A 文章编号:1674-098X(2014)09(c)-0230-03
葡萄酒的历史可谓源远流长,要追溯其究竟始于何时何地,似乎是不可能的。根据考古发掘的历史材料证实,葡萄酒大约出现于公元前7000年至公元前5000年,起源自小亚细亚至中东一带。新华社1996年6月6日报导:考古学家在伊朗北部扎格罗斯山脉的一个石器时代晚期的村庄里,挖掘出的一个罐子证明,人类在距今7000多年前就已饮用葡萄酒了[1]。
葡萄酒的评价问题一直依赖评酒员的人为打分,除去一些客观影响因素,评酒员的个人主观意愿爱好也对评价结果有着重大的影响。因此,一般情况下都要请很多评酒员进行评酒,这些评价结果是否有差异,哪些结果更可信是值得研究的问题。该文将对2012年数学建模A题给出的评酒员评价结果进行统计分析。
1 数据及预处理
为了分析两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。为此,我们对数据进行预处理,删去一些具有明显错误的数据,针对专家评分中的整体评分,对其平均值建立双正态总体方差比和均值差的检验模型,分别用Matlab自编程序和EXCEL软件中的数据处理功能进行有无显著性差异分析并比较结果;为了进一步确定比较结果,运用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行检验运用。最后,利用组内方差来确定各组评分的可信度。
将同一样品酒的10位评酒员所评出的各项评分求取平均数来作为该组评酒员对此样品酒的各项评分,整理后的数据部分见表1。
2 评价结果的差异性分析
(1)双正态总体方差比均值差的检验模型[2]。
运用逐对比较法,在显著性水平下判断两组评酒员的评价结果有无显著性差异。根据题意,先在未知的条件下检验假设:
根据输出的检验报告h=0可知,应接受假设。因此,在显著性水平下两组评酒员对于红葡萄酒的评价结果有无显著性差异。
利用在上面对于红葡萄酒的分析方法对白葡萄酒数据进行检验,可以得出h=0,即两正态总体方差相等的假设成立。而在方差相等的条件下作均值是否相等的假设检验中得出h=1,应拒绝原假设因此,在显著性水平下可认为,即两组评酒员对于白葡萄酒的评价结果有显著性差异。
综合上述讨论结果,可以认为两组评酒员对红葡萄酒的评价结果无显著差异,而对白葡萄酒的评价结果有显著性差异。
(2)双样本等方差假设的Excel求解[3]。
依据表(1)中红,白葡萄酒的数据,经Excel计算可得表2如下。
依上表中数据可知,对于红葡萄酒,所以应接受原假设因此,在显著性水平下可认为认为两组评酒员的评价结果无显著差异;对于白葡萄酒,所以应拒绝原假设因此,在显著性水平下可认为认为两组评酒员的评价结果有显著差异。
(3)多元正态总体的假设检验与方差分析。
为了进一步确定结果的正确性,利用表1中的所有数据,并通过多元正太总体的假设检验与方差分析进行评价结果的分析。
假定两组样本相互独立,已知两总体有相同的协方差阵>0,但未知,要检验的假设为:,.其中为已知维向量。
记,
作假设,利用SAS程序求解F值和P值,得到的输出中主要的是表3和表4。
由上表3可见对于红葡萄酒来说,计算得到的P值是0.0741,因而两组评酒员的评酒结果无显著性差异。
由表4可见对于白葡萄酒来说,计算得到的P值是0.0005,因而两组评酒员的评酒结果有显著性差异。
至此运用上述三种方法所得结果一致,两组评酒员对红葡萄酒的评价结果无显著性差异但对白葡萄酒的评价结果有显著性差异。并且也可以得出仅使用总评分来对差异性来分析是可行的,也说明了总评分是所有打分中具有代表性的分数,可以反映评酒员的真实意思表达。
3 评价结果的可靠性分析
要比较两组评酒员的评价结果的的可靠性,我们利用评价结果的方差来分析他们结果的可靠性。方差的大小反映了评酒员之间对于样品酒评价的统一性,再无外界干扰的情况下,方差越小说明评价越统一,进而说明结果越可信。
分别计算出对于每一个样品,第一组和第二组内部得到总分的方差,见表5,每个组对于所有样品打分的方差的平均值体现了,该组成员对打分结果的认可度。该数值越小说明认可度越高,反之认可度越低。
比较两组方差的平均值0.5221> 0.3667;1.0428>0.5685。所以可以判断第二组的结果更可信。
4 结语
葡萄酒的历史几乎是和人类文化史一道开始的,世界古老的文明民族的神话传说中都流传着葡萄酒的故事。现有的葡萄酒评价方法很大程度上带有主观因素,本文在对两组专家的评价结果进行分析与简单处理之后,首先,针对总体评价得分利用双正态总体方差比的检验模型,得到方差相同的结论,然后在此基础上利用等方差双正态总体均值差的检验模型对两组评酒员的评价结果有无显著性差异进行建模分析,运用Matlab 软件计算得出两组专家在对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著。其次,运用EXCEL中两个正态总体均值之差的T-检验方法进行求解得出一样的结果。此外为了进一步验证结论的真实性,还将模型进行了改进,用两个多元正态总体均值向量的检验法对专家打分中的全部数据进行了检验,结果显示对红葡萄酒进行打分时差异不显著,而对白葡萄酒进行打分时差异显著,与之前得到的结论吻合。最后,利用评价结果的组内方差来分析两组专家打分结果的可信度,运用Matlab软件计算得出红葡萄酒0.5221>0.3667、白葡萄酒1.0428>0.5685,所以第二组结果更可信。
参考文献
[1] 滕波,赵云财,陈成,等.浅谈葡萄酒[J].酿酒,2004(6).
[2] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等出版社,2008.
[3] 潘鸿,张小宇,吴勇民.应用统计学[M].北京:人民邮电出版社,2011.endprint