显著性差异分析
2021-02-22孙平爽
孙平爽
【摘要】近年来,随着经济的迅速发展,大数据时代已经悄然到来,很多问题都离不开数据的处理.大量数据需要处理,这样就使很多统计软件走进数学及各个领域.本文以葡萄酒评价数据为例,讨论如何通过SAS软件来实现数据的处理和计算.
【关键词】评价数据;SAS;數据的处理
随着经济全球化的不断发展和我国经济的高速发展,全国都面临着难得的发展机遇.为适应现代化应用型大学公共基础课的发展需要:让软件对数学领域科研发展提供强有力的支撑;通过改革加大对学生应用能力的培养;增添数学实验课,加大对数学建模能力的培养,解决实际中的复杂问题.下面以“葡萄酒两组评价结果是否有显著性差异”作为教学内容,说说如何由讲授统计学原理转向对学生实践能力的培养.数学实验课程的开设,使学生能够把所学的理论知识与实际解决问题的方法联系起来,加强运用计算机解决数据处理、画图、模拟等问题的能力.在研究葡萄酒两组评价结果是否有显著性差异问题时可以运用SAS系统对数据进行处理,但由于对SAS系统完全运用自如有一定难度,所以对学生而言,只需掌握如何应用SAS系统解决实际中的统计问题即可.本文以葡萄酒两组评价结果是否有显著性差异为例,讨论如何通过SAS软件来实现数据的处理和计算.充分利用好SAS软件这一工具,有助于解决其他类似相关的数学统计问题及其他领域问题.
葡萄酒是国家大力发展消费品中酒类产品的重点发展品种之一,是轻工业部部管产品之一,也是广大消费者越来越青睐的产品之一,但是,假酒也层出不穷.所以,如何对酒的质量进行评价已成为质量监管部门日益关心的问题.本文引用2012年全国大学生数学建模竞赛数据对葡萄酒评分的可信度进行研究.
针对每组评酒员对一组、二组的红葡萄酒和白葡萄酒的评分,计算其平均值,进而对两组红葡萄酒和白葡萄酒的评分结果用SAS软件进行配对样本t检验,以判断两组评价结果是否有显著性差异.对于两组评酒员的评价结果哪一组更可信,我们采用肯德尔和谐系数W=S112K2N3-N进行检验,从而做出判断.
表中列出了两组评酒员对两类酒的不同样本的评分结果,利用配对样本t检验,计算检验统计量的P值,进而检验两组评酒员的评价结果有无显著性差异.数据的处理和计算我们借助SAS软件来实现.
一、两组评酒员的评价结果有无显著性差异
先把每组评酒员对每种酒的感观评分作和等于∑10n=1,k=1Akn,再求出每种酒样品感观的平均分Wk=1n∑10n=1,k=1Akn,将数据输入Excel表格整理之后导入SAS软件对两组专家评价结果进行配对样本t检验,检验两组评分之间是否存在显著性差异.
检验结果显示:对红葡萄酒两组评分检验的p值为0.0278,对白葡萄酒两组评分检验的p值为0.0399,这个检验在0.05水平下是显著的,即两组评酒员的评价结果有显著性差异.
图1 红葡萄酒评分t检验模型图
分析结果如下:
图2
图3 白葡萄酒评分t检验模型图
分析结果如下:
图4
二、两组评酒员的评价结果哪一组更可信
肯德尔和谐系数是一种检验测量结果信度的有效方法.当测验是不能直接客观量化测试题时,不同评分者的评分就是以等级来评定的.不同的评分者对相同测试题评定的等级一般是不同的,甚至出现较大差异,此时出现的误差主要来源于评分者自身的差异.当有K(K≥3)个评分者对N份测试题进行评分,若要考量所得结果的可信度,此时可以利用肯德尔和谐系数来验证.在大多数情况下,由于统计学原理的方法难于理解和掌握,直接影响了肯德尔和谐系数在实际中的运用.
利用肯德尔和谐系数,对比两组肯德尔和谐系数大小评判哪组更可信.我们选择每组评酒员对每一组的红葡萄酒和白葡萄酒的评分计算其平均分,要想判断两组评价结果是否有显著性差异,我们采用的是用SAS统计软件对数据进行均值双样本成对的t检验,在考虑两组评酒员哪一组更可信时,我们采用的是计算肯德尔和谐系数K,判断哪一组K值越大越可信.
下面我们对两组评酒员的评价结果哪一组更可信进行判断.我们分别计算每组数据的肯德尔和谐系数,进而比较和判断.肯德尔和谐系数公式具体如下:
W=S112K2(N2-N),(1)
其中S=1K∑ni=1R2i-∑ni=1Ri2.
K表示评判员数(或相关数据组数),N表示被试频数(或各组频数),Ri表示各配对数据的秩次和.
研究结果分析:
在这个问题中,K=10,N1=27.由此计算得出W″1=0.529768,W′1=0.47656,W″2=0.4017,W′2=0.6309.因为我们知道肯德尔和谐系数值越大,一致性越高,则结果越可信,所以,对于红葡萄酒而言,W″1>W′1,也就是说第一组的评酒员对红葡萄酒评分的可信程度更高,而对白葡萄酒来说,W″2 三、结 语 在研究葡萄酒两组评价结果是否有显著性差异问题中,使用SAS系统可以方便快捷地得到数据处理结果.此案例为显著性分析,实验设计较为合理,SAS系统数据处理也值得信任.不仅科研工作者需要软件来解决大数据问题,学生在处理与本专业相关的问题时,同样有这样的需求,所以软件为数学实验课提供了很好的帮助.近年来,数学研究的步伐不断提速,科研水平不断提高,此时更应该厚积薄发,不断地充实教育者自身的能力,与时俱进,为学生不断输送新鲜的知识,鼓励学生用科技手段解决问题.这样不仅有助于提高学生解决问题的能力,更有助于锻炼学生的思维能力.本文以葡萄酒评价为例,进行数学实验,对案例数据进行显著性分析,借助于SAS软件来实现数据的处理和计算.在大数据时代,对数据的分析和处理尤为重要,数学统计SAS软件作为分析和处理数据的工具,更具有专业性,为很多领域都提供了强有力的技术支撑,为数学中的统计分析提供了有效的帮助. 【参考文献】 [1]崔峻山.肯德尔和谐系数计算及显著性检验的简化[J].教育科学研究,1992(05):25-28. [2]赵建国,何嘉玉,李怡婷,等.数学建模经典案例分析:以葡萄酒质量评价为例[J].无线互联科技,2018(09):105-106. [3]刘艳锋.利用肯德尔和谐系数检验测量结果的可信度[J].新乡教育学院学报,2006(02):95-96. [4]李文霞,吕文河,邹德堂,等.农业科研中常见统计分析方法的 SAS 应用[J].林区教学,2013(07):99-101.