Excel在《生物统计学》双因素有重复方差分析中的应用与探讨
2017-02-13白俊艳杨又兵李广录
白俊艳+杨又兵+李广录
摘 要: 本文探讨了利用Excel在双因素有重复观测值方差分析中的具体应用,并以比较不同原料、不同温度对酒精产量的影响为例题,详细阐述双因素有重复观测值的方差分析过程及结果如何分析等。用Excel进行双因素有重复观测值的方差分析从数据的建立、分析过程、结果分析等方面来看,操作相对比较方便,而且Excel在结果输出时候给出了相伴概率P和F值这2种结果,可以以2种方式对结果进行分析,而SPSS只是以相伴概率P为依据判定结果,相对单一。
关键词: Excel 生物统计学 方差分析 双因素 重复观测值
《生物统计学》是对数据资料进行收集、整理、分析、解释的科学[1],在《生物统计学》教材中不仅提供了如何通过合理的试验设计获得理想的数据资料,还提供了各种数据资料分析方法,是所有高等学校本科生的必修课。《生物统计学》是畜牧、兽医、农学、林学、微生物、医学等生命科学领域不可缺少的统计工具,越来越多的数据分析离不开生物统计学原理与方法,随着计算机技术的发展,已有更多软件被应用于《生物统计学》,如SPSS[2-4],Excel[5],SAS[6]等,但是不同统计软件具有不同的统计特点,如Excel统计功能虽然简单,但是操作方便,分析出来的结果更为直观,更适合《生物统计学》初学者。《生物统计学》由于公式比较多,理论相对深奥,因此高等学校本科生对这门课程的学习兴趣相对不高。本文主要介绍如何利用Excel对双因素有重复观测值方差分析,以案例的形式详细阐述其分析过程,希望通过本文的应用与探讨提高学生学习《生物统计学》的兴趣,并增强学生分析数据能力。
1.分析工具库的安装
Excel一般并不直接带着“分析工具库”这一模块,需要在Excel的基础上自己安装,安装步骤:Excel的工具→加载宏→分析工具库→确定。
2.双因素有重复的方差分析
双因素有重复观测值方差分析,一般适用于双因素试验设计的数据分析,而且是不同因素水平组合(处理)的观测值需要2个或2个以上才可以运用此分析模块。
2.1数据资料的建立
例1:为了从3种不同原料(A)和2种不同温度(B)中选择使酒精产量最高的水平组合,每一水平组合重复4次,试进行方差分析[1]。数据资料建立如图1,可以将原料(A)放在行上,温度放在列上。
2.2单因素方差分析过程
在Excel中:工具→数据分析→方差分析:可重复双因素分析,点击确定进行分析,输入区域:选择原始数据(包含行和列的标志在内);每一样本的行数:4,也就是填写重复观测值的个数;a(显著水准):0.05(或者0.01),输出选项:输出区域处选一空白处,单击确定按钮,具体选项见图2。
2.3 结果分析
结果部分见图3,图3只是对数据进行了描述统计量分析,只是简单地列出了不同水平组合的样本大小、平均数、方差、总和等信息,从此结果可以初步看出,每个组合的样本大小均为4,A2B2组的酒精产量均值(15.5)是最小的,而A2B1的酒精产量均值(49)是最大的。
方差分析的最终结果见图4,针对所有数据资料的变异来源分为样本行(在此例中为不同原料)、列(本例中为不同温度)、交互(原料与温度的互作)、内部(随机误差),分别列出了平方和(SS),自由度(df),均方(MS),F值(F),相伴概率(显著性概率P-value),F的临界值(分位数,F crit)。根据图4的结果可以有2种方法判断结果,其一是直接根据显著性概率判断,也可以根据F值判断。由图4可以看出,利用相伴概率判定结果如下,不同原料(样本):P=0.039486<0.05(小概率),因此不同原料的酒精产量差异显著。不同温度(列):P=2.87E-06=2.87×10-6<0.01(小概率),因此不同温度的酒精产量差异极显著。交互:P=0.232715>0.05(小概率),因此交互作用对酒精产量无显著差异。
如果根据F值判定,不同原料(样本):F=3.888219>F临界值=3.554561,因此不同原料的酒精产量差异显著。不同温度(列):F=44.66207>F临界值=4.413863,因此不同温度的酒精产量差异显著,如想看是否会差异极显著需要返回到图2,在a处输入0.01,然后重新判定结果。交互:F=1.582673
3. 讨论
在双因素方差分析中Excel数据资料的建立是十分方便的,基本按照将一个因素放在行上,另一因素放在列上建立数据资料就可以,而SPSS统计软件的数据建立[7]需要将同一因素的所有水平建立在同一列里。Excel在结果输出时候则给出了相伴概率P和F值这两种结果,可以以两种方式对结果进行分析,而SPSS只是以相伴概率P为依据判定结果相对单一[7]。可以看出,利用Excel进行双因素有重复观测值方差分析虽然从数据的建立、分析过程、结果分析等方面来看,操作相对比较方便适合初学者,但是也有不足之处,当方差分析结果是差异显著(或极显著)时,不能对数据资料进行进一步多重比较。
参考文献:
[1]张勤.生物统计学.中国农业大学出版社,北京,2009.
[2]白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践.畜牧与饲料科学,2013 ,34 (10 ) : 57-58.
[3]白俊艳,武晓红,张小辉,等.生物统计附试验设计课程考核方式的改革与实践.安徽农业科学,2015,43( 5) : 369-370.
[4]秦立金.SPSS统计软件在生物统计课程中的探索研究.赤峰学院学报(自然科学版),2014,30(3):198-199.
[5]韦若勋.生物统计学上机实验课中Excel互动教学方式的应用.高等教育,2013,8:185-186.
[6]黄中文,张丹.生物统计与SAS教学中大学生自主学习能力的培养.新乡学院学报(社会科学版),2013,27(5):140-142.
[7]白俊艳,徐廷生,张小辉.《生物统计附试验设计》上机实验改革与实践.教育教学论坛,2015,18:247-248.