SPSS统计软件在林业试验设计课程中的应用
2010-02-11李国雷
李国雷 刘 勇
(北京林业大学林学院,北京 100083)
林业试验设计课程提供了林业科学研究的基本方法,对提升林学学科的科学研究水平、提高学生的专业素质具有重要作用[1],因此成为林学专业课程建设的重要部分。试验设计来源于科学试验与统计学的交叉融合。SPSS (S tatistica lPackage for Social Science)、SAS(Statistical Analysis System)、BMDP(Biomedica l Programs)等统计软件,虽然是针对统计学而设计的,但在试验设计中也有所运用和发展。随着科学研究的信息量不断递增以及计算机技术的普及,统计软件已成为科学研究和试验设计中的必要技术。SPSS作为常见的统计软件之一,被广泛应用于医学、社会学、气象学等试验设计与统计中[2-4],对这些学科的发展起着至关重要的作用。
目前广泛使用的林业试验设计教材是1995年中国林业出版社出版的《林业试验设计》一书[5]。该教材的特色在于针对试验设计介绍统计方法,将统计方法的应用建立在试验设计的基础之上,使设计与统计浑然一体。科学研究是学科建设和教材发展的内动力。随着我国林业科学的不断发展,林业试验设计的理论与实践必然发生相应的变化。通过更新教材、改善教学条件、丰富教学手段、加强师资队伍建设等措施,加强林业试验设计课程的建设已成为共识[1]。因此,以现有的林业试验设计课程为基础,增加有关统计软件的教学内容,使统计高效、简便、易为学生接受,是非常必要的。
一、SPSS统计软件的特点
SPSS的中文名称是社会科学统计软件包,由S PSS公司出品,与SAS( 统计分析系统)、BMDP(生物医学程序)并称为国际上最有影响的3大统计软件。SPSS名为社会科学统计软件包,只是为了强调其在社会科学领域应用的一面(因为社会科学的研究中有许多现象都是随机的,要使用统计学和概率论的定理来进行研究),而实际上其在社会科学、自然科学的各个领域都能发挥巨大的作用,目前已应用于经济学、生物学、教育学、心理学、医学等领域。
SPSS、SAS、BMDP这3大统计软件各有特色:SAS和BMDP统计软件仍然坚持命令行操作,受到熟悉统计学并擅长编程的专业人士的青睐,但对已经熟悉视窗操作系统的用户来说很不方便;SPSS统计软件的优势在于用户界面友好、菜单式操作可以实现绝大部分统计分析功能、特别适合具有初级统计知识的用户使用。因此,笔者尝试将SPSS统计软件引入林业试验设计课程教学。
二、SPSS统计软件在林业试验设计课程中的运用
(一)SPSS统计软件教材的选用
教材是制约教学质量的关键因素之一。一本好的试验设计教材,既要有对如何进行试验设计的阐述,也要包含对试验数据进行统计分析的方法。而目前SPSS教程大都缺乏对试验设计方法的介绍;同时,大多数SPSS教程仅是利用一些数据孤立地讲解SPSS统计软件的具体应用,从而造成试验设计与统计方法的分离,使学生不能根据具体的试验设计选择正确的统计方法。例如,同为单因素组内没有重复测量的完全随机试验设计与完全随机区组试验设计,由于完全随机区组试验设计适用的前提是试验条件存在单向变化,设计时需要进行区组控制,所以在选用SPSS统计软件时,完全随机试验设计选用的程序为One-Way ANOVA,而完全随机区组试验设计则选用的是线性模型General Linear Model中的单因变量多因素方差分析 Univariate。再如,同为单因素完全随机区组试验设计,如果组内有重复测量,那么重复测量会使误差来源比组内单个观测值多,这就要求在统计时应选用线性模型Gene ral Linear Model中的单因变量多因素有重复测量的方差分析Repeated Measures。
由此可见,选用的SPSS统计软件教材应能将试验设计方法与SPSS统计软件有机地结合起来,要能够在试验设计和统计分析基本原理的基础上,利用SPSS统计软件将传统的统计分析方法简单化。优秀的SPSS统计软件教材在内容编排上至少应满足以下2个方面的要求:第一,对统计方法的介绍始于具体的案例,以便于学生了解各种统计分析过程所适用的条件和情境,使学生在面对不同的情境时能够选择适当的统计分析方法。第二,要强调统计方法的前提条件、分析步骤和对输出结果的解读,以便于学生在统计软件的实际操作中能用、易用。目前,教育学[4]、食品学[6]等领域的教材已成功地将试验设计、统计、SPSS软件3者很好地结合起来,这对林业试验设计课程的教材建设具有借鉴作用。
(二)SPSS统计软件在林业试验设计与统计分析中的运用
虽然利用SPSS统计软件进行统计分析非常简便和快捷,菜单式操作可以实现绝大部分的统计分析功能,但是要正确运用SPSS,用户需要掌握一定的试验设计与统计知识。林业试验设计主要包括完全随机试验设计、完全随机区组试验设计、拉丁方试验设计、裂区设计、正交试验设计、嵌套试验设计等。每一种试验设计原理与适用范围都有自己的特点,每一种设计又有不同的类型。例如,两因素的裂区设计包括主区为完全随机设计和副区为完全随机区组设计的裂区设计、主区为完全随机区组设计和副区为完全随机区组设计的裂区设计、主区为拉丁方设计和副区为完全随机区组设计的裂区设计等3种类型,每种类型根据观察值的不同又可分为组内有重复测量和组内无重复测量2种类型;而且每种试验设计及其亚类均有不同的特点。因此,用户只有具备试验设计与统计的知识,才能实现SPSS统计软件在林业试验设计中的应用。
实现SPSS统计软件与林业试验设计的对接,关键在于将试验设计的原始数据转化成SPSS数表和SPSS分析过程中自定义选取变量,而这2种关键技术建立在试验设计的差异来源基础之上。例如,组内没有重复测量的单因素拉丁方试验设计的差异来源有4个,分别为行、列、处理和随机。其中,随机误差来源为不可控差异来源,前3个差异来源对SPSS数据表的建立、自定义分析具有决定性作用。因此,在建立SPSS数据表时,首先需要定义3个变量,即行、列、处理;然后将某试验小区所对应的行、列、处理分别输入这3个变量。在自定义分析时,选用线性模型General Linear Model中的单因变量多因素方差分析Univariate,并选用Model-Custom-Main effects将行、列、处理3个自变量依次导入Model。由于该试验设计的行、列、处理3个变量间没有交互效应,所以勿需选用Interaction。
需要注意的是,根据上述原则利用SPSS法和公式推导法进行方差分析,对一些试验设计又有所不同。例如,对组内没有重复测量的主区和副区均为完全随机区组的裂区设计,若运用公式进行推导,主区和区组F值的计算方法为以各自的均方除以整区的均方,副区、主区和副区的交互效应F值的计算方法则以各自的均方除以副区的均方,主区和副区F值的计算建立在整区、副区2个误差的基础之上。若利用SPSS法进行方差分析,在建立数据表时将主区和副区导入 fixed factors,把区组导入Random factors;在自定义分析时,选择Model-Custom-Main effects,首先将主区导入Model,然后从Build term( s)菜单中将Main effects更换为Interaction,把主区*区组导入Model,再从菜单中把Interaction变回Main effects,将副区导入Model,最后将Main effects更换为Interaction,把主区*副区导入Model。与公式推导法不同的是,利用SPSS法进行方差分析,主区F值是主区的均方除以主区*区组的均方,而副区、主区*副区的F值是分别以副区、主区*副区的均方除以主区*副区的误差均方。
(三)SPSS统计软件在林业试验设计课程教学过程中的合理使用
在林业试验设计课程教学中,合理使用SPSS统计软件至关重要。首先,要摆正SPSS统计软件的应用在林业试验设计课程教学中的地位。将SPSS统计软件纳入林业试验设计课程教学,是为了让学生跳过繁多、复杂的公式推导过程,将试验结果与试验设计目的直接对接,以解决学生将精力过分放在计算过程上而无暇顾及试验设计目的的问题。在教学过程中,教师可以先按照传统的教学方法,引导学生针对试验设计进行统计分析的手算,使学生在公式推导中理解试验设计的内涵、变异来源;然后在学生掌握试验设计与统计知识的前提下,利用SPSS统计软件进行辅助教学,对统计过程进行演示和讲解。只有这样,学生才能真正体会到统计思维和推理的乐趣,才能使试验设计的艺术与统计的魅力合二为一。
其次,通过为学生提供在实验室上机体验的机会,加强SPSS统计软件的实验教学。SPSS统计软件具有极强的广泛应用性,其教学既讲究严密又强调灵活性,所以如果没有相对应的上机实验课很难想象学生可以结合统计学理论学会SPSS统计软件的操作,并理解统计分析结果[7]。因此,在林业试验设计课程教学过程中,教师对每个试验设计的原理、方法、统计分析(公式推导)、SPSS统计软件运用等进行演示后,要为学生提供另外一些素材,让学生先手算推导,使知识点以作业的形式进行固化、理解;然后再让学生在实验室上机使用SPSS统计软件,以掌握SPSS统计软件的操作技能。
最后,教师要鼓励学生运用SPSS分析身边的实际问题,将林业试验设计与统计知识迁移到具体问题的解决上,以提高学生的知识应用水平。为了鼓励本科生参与科研、培养学生的合作意识,很多高校都确立了与各专业相符的科研命题,由大学生以创新团队的形式进行申报。例如,北京林业大学在大学三年级开设了林业试验设计课程,同时开设了一些专业课,学生可以根据自己的爱好申请学校确立的专项课题。在课题研究过程中,学生面对的是一个完整的试验,需要完成文献阅读、命题确定、试验设计、试验布设与观测、统计分析、论文写作等环节。学生带着在课题研究中遇到的问题进行试验设计课程的学习,将SPSS统计软件置入一个特定的环境中运用,既能强化SPSS统计软件的学习,又能提高科研工作的效率,使试验结果更为可靠;尤其是可以使论文水平和科研质量得到相应的提升、个人的综合素质得到提高。
三、SPSS统计软件在《林业试验设计》教材修订中的应用
林业试验设计课程教材《林业试验设计》出版于1995年,印刷量仅为1500册,目前已经很难买到,所以学生上课基本依靠从图书馆借阅和复印教材。此外,《林业试验设计》出版至今已有15年,随着林业研究的不断深入和教学技术的持续更新,对教材进行修订已迫在眉睫,这也是很多学者的呼吁[1]。
SPSS与特定学科的试验设计和统计的结合,是当前相关教材的研究热点之一,并在已发表的学术论文[8-10]和出版的教材[4,6]上得以充分体现。这些成果都为《林业试验设计》教材的修订提供了参考。现有教材已将试验设计与统计紧密联系起来,在教材修订时,如果能够在每个试验设计与统计后面加入SPSS实现过程及结果解读,并增加一些最新的案例供学生练习,那么就能形成试验设计和统计过程(公式运算过程)、SPSS实现、案例分析等内容相互结合与衔接的教材体系。在教材章节的调整方面,除了根据科研的发展适当增删某些试验设计外,还需要增加聚类分析、相关分析、主成分分析、回归分析以及SPSS的实现过程等章节,使教材内容满足当代本科生科学研究的要求。
在大学林业试验设计课程教学过程中引入SPSS统计软件进行辅助教学,不仅丰富了教学手段,也给传统的林业试验设计课程及其教学注入了新的活力,加深了学生对林业试验设计与统计的理性认识;同时,还改善了学生的知识结构,提高了其科学研究的能力,提升了学生的综合素质。但是,林业试验设计的种类繁多,要使SPSS与林业试验设计有机结合并发挥更大的作用,尚需在今后的教学和科研中深入探索,从而促进林业试验设计课程教学水平的不断提升和完善。
[1]李颖岳,续九如.浅议林业试验设计课程对林学学科建设的作用[J].中国林业教育,2007,25(6):16-18.
[2]卢纹岱.SPSS for Window s从入门到精通[M].北京:电子工业出版社,1997.
[3]GREEN S B,S ALKIND N J,AKEY T M.Using SPSS for Window s:Analyzing and Understanding Data:2th ed.[M].Upper S addle River,New Jersey:Prin tice Hall,2000.
[4]丁国盛,李涛.SPSS统计教程:从研究设计到数据分析[M].北京:机械工业出版社,2006.
[5]续九如,黄智慧.林业试验设计[M].北京:中国林业出版社,1995.
[6]王颉.试验设计与 SPSS应用[M].北京:化学工业出版社,2007.
[7]李付坤.SPSS教学方法探讨[J].统计与咨询,2008(2):70-71.
[8]叶红卫,朱蓝辉.应用S PS S进行双因子方差分析[J].河北北方学院学报,2008,24(12):63-65.
[9]刘加妹,周志坚.利用S PS S处理生物实验数据[J].生殖医学杂志,2008,17(2):130-134.
[10]李玉红,彭晓峰,陈慧青.统计软件 SPSS在应用统计学教学中的应用[J].金融教学与研究,2009(3):71-72.