SPSS软件在交互效应方差分析中的应用
2016-01-08龚学臣
SPSS软件在交互效应方差分析中的应用
龚 学 臣
(河北北方学院农林科技学院,河北 张家口 075000)
摘要:为了寻找SPSS软件在多因素试验结果方差分析中实现对处理间和交互效应的分析方法,以实例介绍了SPSS软件利用单变量方差分析模块实现多因素试验各处理间变异的F测验与多重比较,利用一般线性模型模块实现主效应、交互效应的方差分析和因素间交互效应图的制作,并通过编写程序的方式实现一个因素各水平下另一个因素内不同水平间简单效应的多重比较。
关键词:SPSS;多因素试验;方差分析;多重比较;交互效应
中图分类号:TP 393
基金项目:国家级大学生创新创业训练计划项目(201312216030,201312216032);安徽新华学院特色课程项目(2012tskcx04,2012tskcx05);安徽新华学院大学生素质教育研究中心项目(IFQE201419)。
作者简介:褚正清(1984-),男,安徽合肥人,安徽新华学院公共课教学部讲师。
Application of SPSS Software in Multivariate Analysis of Variance
GONG Xue-chen
(College of Agronomy and Forestry Technology,Hebei North University,Zhangjiakou,Hebei 075000,China)
Abstract:To find the analysis method of SPSS software in a multiple factors variance analysis between treatment combination and simple effect of various factor,the SPSS software is introduced with examples of using the univariate analysis of variance(One-way ANOVA)module to realize F-test and the multiple comparison between treatment combination.The general linear model(GLM univariate)module is used to realize the analysis of variance between main effect and interaction effect and the make methods of interaction plot.And programming is used to achieve the multiple comparison(LSD)between different levels of simple effect of a certain factors.
Key words:SPSS;multiple-factor experiment;analysis of variance;multiple comparisons;interaction effect
多因素试验是指在同一试验中包含两个或两个以上的试验因素,每个因素都有不同水平的试验,其处理组合数为各因素水平数之积。例如二因素完全实施的试验中,一个因素设4水平,另一个因素设5水平,则这一试验就有4×5=20个处理组合。多因素完全实施的试验不但可以分析各因素不同水平间的简单效应和主效应(平均效应),还可以分析因素间的交互效应,试验比较的结果可以找出最优处理组合。
SPSS统计软件是目前世界上最流行统计分析软件之一,以其界面友好、操作简单,并且能够实现大多数田间试验数据的统计分析,被越来越多的农业科技工作者所使用。洪楠、卢纹岱、章文波、李志辉、张庆利、谭旭辉、李悦等介绍了SPSS统计软件在医学、生物学和经济学领域的应用;在农业科学研究领域,隋益虎、龚江[10]等介绍了利用SPSS软件实现二因素试验资料的F测验与主效应多重比较方法,但对处理组合间和某一因素不同水平下另一因素各水平间简单效应的分析方法未见报导。本文以二因素完全随机设计试验结果资料为例,探讨了SPSS 18.0统计软件实现二因素试验资料方差分析中,对处理组合和某一因素不同水平下另一因素各水平间简单效应分析的方法,以供农业科学研究工作者参考。
在SPSS统计软件中,有重复设置的二因素完全随机设计资料的方差分析称为A×B析因设计资料的方差分析,它可以通过“一般线性模型(general linear model)”中的“单变量(univariate)”方差分析过程来实现。
将A1、A2、A33种肥料分别施于B1、B2、B33种土壤,以小麦为指示作物,每处理组合种3盆,得出产量结果(g/盆)。作方差分析(表1)。
表1 3种肥料施于3种土壤的小麦产量(g)
1对处理间的比较分析
对多因素试验设计处理间进行比较分析时,可以通过均数比较(compare means)中的“单因素方差分析(One-way ANOVA)”模块来实现
1)建立数据文件。分组变量名为“处理”,编码为1~9,分别代表处理组合A1B1、A2B1、A3B1、A1B2、A2B2、A3B2、A1B3、A2B3、A3B3,重复3次;数据变量名为“小麦产量1”,数据2列27行。如果是随机区组试验设计,再增加一列“区组”。
2)操作步聚。【分析(analyze)】→【比较均值(compare means)】→【单因素ANOVA(One-way ANOVA)…】,打开单因素方差分析主对话框。①将数据变量(大麦产量)选入因变量列表(dependent list)框,将分组变量(处理)选入因子(factor)框。②单击【两两比较(post hoc)…】按钮,打开两两比较(post hoc multiple comparisons)对话框,在此选择多重比较方法。SPSS统计软件中有14种多重比较方法,此例选择Duncan(新复极差法)。在显著性水平(significance)框中,输入多重比较的显著水平,默认为0.05。单击【继续(continue)】按钮,回到主对话框。③单击【确定(OK)】按钮,执行。
表2 ANOVA 小麦产量
表3 小麦产量 Duncan a
3)结果输出。以上操作可输出对处理间所做的方差分析结果见表2,处理平均数间的多重比较(Duncan法)结果见表3。表2中“组间”项为“处理间”,“组内”项为“误差”,“总数”项为“总变异”。表3中小麦平均产量位于同一列上的处理间无显著差异,不在同一列上的处理间有显著差异。
2对A×B交互效应的比较分析
1)建立数据文件。分组变量名分别为“因素A(肥料种类)”,编码取值1~3;“因素B(土壤种类)”,编码取值1~3;数据变量名为“小麦产量2”,数据3列27行。如果是随机区组试验设计,再增加一列“区组”。
2)操作步聚。选择【分析(analyze)】→【一般线性模型(general linear model)】→【单变量(univariate)】,打开单变量(univariate)主对话框。①将数据变量(小麦产量)选入因变量(dependent variable)框;将分组变量(因素A和因素B)选入固定因子(fixed factor)框;②单击【模型(model)…】按钮,打开模型(model)对话框,在指定模型框中选择设定(custom),将因子与协变量(factors & covariates)列表中的变量,以“因素A”、“因素B”和“因素A*因素B”的形式分别选入模型(model)列表中。完成本对话框的操作后,单击【继续(continue)】按钮,回到主对话框。③单击【两两比较(post hoc)…】按钮,打开“单变量:观测值的两两比较(post hoc multiple comparisons)”对话框,在此可选择14种多重比较方法,如:LSD法或Duncan法(新复极差法),可实现对因素A和因素B主效应(平均效应)的多重比较。④单击【绘制(plots)】按钮,打开单变量:“轮廓图”对话框,将因子变量列表中的变量“因素A”选入水平轴(horizontal axis)框,将“因素B”选入单图框,然后单击中间“添加(add)”按钮,设置“因素A*因素B”进入“图”列表框;将上述两变量交换选入,即可设置“因素B*因素A”进入“图”列表框。⑤单击【确定(OK)】按钮,执行。
3)结果输出。对两个因素及其交互效应的F测验结果为主体间效应的检验表(略),以因素A为x轴反应因素A与因素B交互效应的轮廓图见图1(a),以因素B为x轴反应因素A与因素B交互效应的轮廓图见图1(b)。利用LSD法和Ducan(新复极差法)等方法对因素A和因素B的主效应进行的多重比较(略),可参照李志辉、张庆利等的介绍。
(a) (b) 图1 因素A与因素B交互效应图
F测验的结果表明,因素A与因素B的互作为极显著(P=0.006),需对因素A(肥料种类)各水平下,因素B(土壤种类)不同水平间的简单效应进行分析。SPSS统计软件不能通过菜单操作实现这一统计分析过程,但可利用编写程序的方式实现。
在SPSS语法编辑窗口中输入下列语句:
UNIANOVA小麦产量BY因素A因素B
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/EMMEANS=TABLES(因素B*因素A)COMPARE(因素A)ADJ(LSD)
/CRITERIA=ALPHA(.05)
/DESIGN=因素A因素B因素A*因素B.
表4 估计 因变量:小麦产量
UNIANOVA语句用于调用GLM过程,因变量为“大麦产量”,自变量为“因素A”和“因素B”;METHOD子句用于平方和(SS)计算方法的选择,这里SSTYPE(3)为“类型Ⅲ”;INTERCEPT子句说明模型中包括截距;EMMEANS子句中,TABLES(因素B*因素A)用于输出因素B固定在某一水平上因素A不同水平的均值、标准差和均值95%的置信区间,输出结果见表4;COMPARE(因素A)ADJ(LSD)用于输出因素B固定在某一水平上,因素A不同水平间简单效应的多重比较(LSD法),输出结果见表5;如果要输出因素A固定在某一水平上,因素B不同水平的均值、标准差和均值95%的置信区间及其因素B简单效应多重比较(LSD法)结果,可在此增
表5 成对比较 因变量:小麦产量
基于估算边际均值
*.均值差值在.05级别上较显著。
a.对多个比较的调整:最不显著差别(相当于未作调整)。
加一个子句“/EMMEANS=TABLES(因素A*因素B)COMPARE(因素B)ADJ(LSD)”;CRITERIA子句用于多重比较显著水平的选择,本例为0.05;DESIGN子句指出模型中变异来源包括因素A、因素B和A×B交互项,如果是随机区组试验,在此再加上“区组”项即可。在SPSS中GLM模块的EMMEANS子句下,多重比较的方法有LSD、Bonferroni和Sidak 3种。在编辑语句时,所有符号都是英文状态下的。
在语法编辑窗口的菜单栏中选择【运行(run)】→【全部(all)】,或单击工具栏上向右的箭头,都可运行程序,并输出统计结果。
3结论与讨论
多因素试验是一种全面、均衡、高效的试验设计方法,试验结果即可以分析各处理组合间的效应,也可以分析因素间交互效应,还可以分析各因素不同水平间的平均效应(主效应)和简单效应。陈平雁[11]、卢纹岱、章文波、李志辉、张庆利等介绍了不同版本SPSS统计软件利用一般线性模型(GLM-univariate)实现试验因素主效应(平均效应)和交互效应的方差分析方法。本文重点阐述了利用SPSS 18.0版本的单因素方差分析(One-way ANOVA)模块,通过菜单操作的方法实现农业科学研究中,多因素试验处理间变异的F测验与处理平均数间的多重比较;利用一般线性模型(GLM-univariate)模块实现试验因素间交互效应图的制作;通过编写程序的方式实现一个因素固定在某一个水平上,另一因素不同水平间简单效应的比较(LSD法)。
参考文献:
[1]盖钧镒.试验统计方法.北京:中国农业出版社,2000:122-124.
[2]洪楠.SPSS for Windows统计分析教程.北京:电子工业出版社,2000:148-162.
[3]卢纹岱.SPSS for Windows统计分析.北京:电子工业出版社,2000:257-261.
[4]章文波,陈红艳.实用数据统计分析及SPSS 12.0应用.北京:人民邮电出版社,2007:110-121.
[5]李志辉.PASW/SPSS Statistics中文版统计分析教程.3版.北京:电子工业出版社,2010:215-220.
[6]张庆利.SPSS宝典.2版.北京:电子工业出版社,2011:197-206.
[7]谭旭辉,钱俊,陈平雁.析因设计资料的单独效应分析.中国卫生统计,2011,28(03):324-325.
[8]李悦,朱凯,俞慧强.析因设计资料单独效应分析及其SPSS程序实现.中国卫生统计,2009,26(06):643-646.
[9]隋益虎.利用SPSS for windows进行试验结果的统计分析——方差分析(续).农业网络信息,2005,(09):85-88.
[10]龚江,石培春,李春燕.使用SPSS软件进行多因素方差分析.农业网络信息,2012,(04):31-33.
[11]陈平雁,黄浙明.SPSS 8.0统计软件应用教程.北京:人民军医出版社,2000:122-126.
[责任编辑:刘守义英文编辑:刘彦哲]