APP下载

《二语习得研究中使用SPSS进行统计分析指南》述评

2014-04-09申云化

山东外语教学 2014年3期
关键词:卡方二语研究者

申云化

(吉林大学公共外语教育学院,吉林 130012)

《二语习得研究中使用SPSS进行统计分析指南》述评

申云化

(吉林大学公共外语教育学院,吉林 130012)

二语习得研究中的一个根本问题是方法论问题。研究方法按照其本体论和认识论的取向,有“定量研究”和“定性研究”之分。然而对于该领域的学生甚至一些研究者来说,“定量研究”所涉及的复杂、抽象的统计概念和方法往往令人望而却步。正是在此驱使下,Jenifer Larson-Hall(2010)希望通过介绍SPSS的使用方法,从而帮助初涉研究的人熟悉统计概念,懂得如何选择统计检验方法和解释统计分析结果。

二语习得研究;量化研究方法;统计产品与服务解决方案

1.0 引言

二语习得研究中的一个根本问题是方法论问题。研究方法按照其本体论和认识论取向,有“定量研究”和“定性研究”之分。然而对于该领域的学生甚至一些研究者来说,“定量研究”所涉及的复杂、抽象的统计概念和方法往往令人望而却步。正是在此驱使下,Jenifer Larson-Hall(2010)希望通过介绍 SPSS的使用方法,从而帮助初涉研究的人(novice researcher)熟悉统计概念,懂得如何选择统计检验方法和解释统计分析结果。

Jenifer Larson-Hall是北德克萨斯大学的一名助理教授,除了本文所介绍的《二语研究中使用SPSS进行统计分析指南》以外,她还著有《二语研究中使用R进行统计分析指南》。在该书序言里,作者曾多次提到统计软件R,并充分肯定了R在数据包更新、图表制作、复杂统计分析,特别是稳健统计(robust statistics)等方面所具备的优势。但是为让读者更容易理解接受,她选择介绍SPSS软件使用。因为相比较而言,SPSS的集成图形界面令其操作简便易行,输出结果清晰、直观、权威,因而倍受二语学界青睐。在本书中,Jenifer Larson-Hall运用平实的语言,详尽的数据分析实例和根据二语习得真实研究案例所改编的习题,帮助读者更准确地理解相关统计概念,正确选择和统计运行检验程序,并规范地报告自己的统计分析结果。

2.0 内容简介

本书共两大部分,分成14个章节。第一部分“统计概念”由4个章节构成,分别从SPSS操作使用、统计的基本概念、参数检验的数据描述和假设条件以及假设验证、检验效能(power)和效应量(effect size)等方面介绍统计的基础性知识。第二部分“统计检验”包含10个章节,分别介绍了二语习得研究中常用的各种统计检验方法的选择原则、假设条件和运行步骤,例如t检验、相关分析、方差分析、卡方检验和回归分析等,并且通过实际研究中的案例,帮助读者根据研究问题和研究所涉及的变量性质来选择统计检验方法。

2.1 二语研究的定量分析:数据、概念和报告

第一章作者利用软件截图讲解SPSS的一些基本操作,其中包括介绍软件的数据、变量和输出视窗,如何打开、录入、导入和存储数据,以及数据编辑器每列的功能意义。在数据的准备和预处理阶段,作者说明了如何通过合并、排序、计算和重新编码等方式转换数据变量,以及使用可视离散化将变量分段和删除数据个案。

第二章主要针对统计初学者,介绍统计学的基本概念,如虚无假设、p值、自由度、描述性统计和推断性统计,并且结合实例帮助读者理解研究报告中的常见统计值含义。作者先通过研究问题说明如何操作(operationalize)要测量的概念,然后介绍变量的不同种类和测度的不同水平,例如分类变量和连续变量、自变量和因变量,以及定类、定距和定序数据等。作者指出,“称一个变量是连续变量还是分类变量主要取决于研究者选择意愿而不是测度本身”(Larson-Hall,2010:35)。在说明统计假设验证时,作者认为研究者和出版界均存在一种唯“统计显著意义”马首是瞻的倾向,即看p值是否小于0.05,但却忽视了检验效能的重要性。在介绍非参数检验时,作者指出稳健统计(robust statistics)是在数据不满足参数检验条件情况下比较理想的选择。

第三章介绍如何用数字和图形概括描述数据,和怎样用SPSS软件获取描述结果。读者从中可以理解描述数据集中和离散趋势的统计学概念,例如均值、中位数和众数;方差、标准差和标准误;全距和四分卫全距;以及数据的偏度和峰度。此外,作者还介绍了如何通过直方图、茎叶图和Q-Q图观察数据的参数检验假设条件,如正态分布、方差齐性,并探讨缺失值的替换和奇异值的处理方法。作者认为简单删除奇异值会带来其它问题,如产生新的奇异值或数据不再相互独立,因此作者希望SPSS将来会利用稳健程序更客观地处理奇异值。

第四章首先作者阐明了零假设检验和单尾、双尾检验,以及统计检验结果中I型错误和II型错误(Type I error&Type II error)的基本含义。随后的两个关键问题是统计检验效能的分析计算以及效应量的分类和计算。作者认为二语学界对检验效能缺乏理解,而忽视检验效能会致使重要数据丢失,甚至造成错误拒绝零假设。另外,本章以表格形式总结的d族和r族两类效应量的计算方法和相应值的含义,值得读者关注。

2.2 统计检验方法:特点、选择及SPSS运用

在二语习得研究中,有时候研究者因为选择了错误的统计检验方法,导致数据结果分析失去意义。正像Michael Craw ley(2007)所说,“任何统计工作最困难的部分是怎样开始,而其中最大的难点之一就是选择正确的统计分析方法”(Larson-Hall,2010: 323)。因此,作者在第二部分中着重说明了每个统计检验的目的、特点、数学公式和假设条件。

第五章作者把统计检验方法划分为相关性检验和群组差异性检验两大类,并概要介绍了各统计检验的目的和特点。为方便读者理解和记忆,作者创造了一套手指记忆术方法(mnemonic device),通过图形、表格和图片等表现形式,结合真实二语研究问题,具体说明了相关分析、多元回归、卡方检验、t检验、单因素方差分析和因子方差分析等一系列统计检验的目的和假设条件。在结尾处,作者归纳总结了统计检验选择的四大原则:1)检验变量间的关系还是寻找组间差异;2)变量数量和变量内的水平或分组数量;3)变量是连续变量还是分类变量;4)变量是自变量还是因变量。

第六、七章探讨双变量和多变量之间的相关。作者首先说明如何使用SPSS软件创建散点图、在散点图上添加回归线、观察数据的线性分布,随后介绍了相关效应(R2)的内涵和皮尔逊、斯皮尔曼、肯德尔相关系数的计算和报告。另外,作者还简要说明了其它类型相关检验的用途和操作,如部分相关和点双列相关,以及怎样用SPSS计算评分者间信度等。关于寻找多个解释变量的回归分析,作者讨论了多元回归分析的假设条件和样本容量,指出研究者对于样本大小的经验法则观点不一,其中,Cohen (2003)的“回归分析所需样本数量表”显示研究者预计的检验效应量(R2)越高,所需受试的数量越小”(Larson-Hall,2010:185)。作者建议不要分析所有可以想到的因素变量,因为这对受试的数量会有更高的要求。紧接着,作者对回归分析的操作步骤、输出结果和结果报告做了详细的说明。

第八章集中讨论了卡方检验的假设条件、运行步骤和结果报告,主要介绍了两种基本的卡方检验——卡方拟合度检验和卡方独立性检验。卡方检验统计观察值与期待值间的差异并观察其卡方分布的差异显著性。虽然卡方检验是为数不多能够分析的定类数据(nom inal data)的检验方法(Dornyei,2007:228),但作者列举了几种不宜运行卡方检验的情形(如:只有一个受试的个案研究)。在应用语言学和社会语言学研究中,作者认为经常会有违背数据独立性条件而使用卡方检验的情况。

第九章分别围绕独立样本t检验和配对样本t检验的假设条件、箱图数据检验,以及在SPSS中的运行步骤和结果报告予以说明。另外,作者说明了多重t检验中,为避免错误拒绝虚无假设而采用的Bonferroni校正方法。关于t检验的结果报告,作者认为检验效应量因为不受样本容量的影响,所以其重要性甚至超过p值。因此,美国心理语言学会要求研究者需要报告主要结果的检验效应量(Dornyei,2007:212)。

第十章是关于方差分析。方差分析(ANOVA)是应用语言学研究中最常用的统计检验之一。Lazaraton(2005:214)对1991-2001年间发表在国际顶级期刊上的524篇文章所做的元分析显示,有超过40%以上的作者使用了方差分析检验,但他指出其中也存在违反假设条件的情况。本章主要说明一维方差分析在SPSS中的运行、数据的分析和报告,以及效应量的计算。作者比较了t检验和一维方差分析的异同,指出后者比较三个以上均值的差异,所以为控制族群误差率(Familywise error rate),研究者一般采取总体比较(omnibus)和事后比较(post-hoc)的办法,而作者认为使用计划比较(planned comparison)则会大大提高检验效能。另外,尽管存在争议,作者认为实验前的等价性检验非常必要,且实验前非等价性影响可通过协方差分析(ANCOVA)排除。

第十一章探讨两个自变量的二维方差分析和多个自变量的因子方差分析设计。如果研究设计中含多个自变量,研究者不仅需考虑因变量与自变量的关系,还要考虑自变量间的相互作用。基于此,一些学者建议自变量的个数最好控制在三个以内。作者结合二语研究实例,进一步说明变量与水平的概念,并且介绍了因子方差分析的数据准备、数据分析和数据结果的理解和报告等。

在第十二、十三章中,作者指出如果对受试进行多次重复测量(如研究设计中包含前测、后测或延迟后测),或者一次测试中包含若干相关部分(如测试由名词和动词、音素辨别和句法形态等部分组成),则要求研究者使用重复测量分析统计检验。作者建议一直使用球形(sphericity)校正因子,同时还建议使用Games-Howell事后检验,来处理数据违反参数检验条件的情况。与ANOVA不同,协方差(ANCOVA)设计中自变量包含连续变量(如前测成绩或年龄),作者以Lyster(2004)法语名词性别的教学实验为例来说明协方差设计。

第十四章介绍了SPSS中可以运行的非参数检验的操作方法和分析结果解释,例如二项式检验、Mann-Whitney U检验、Kruskal-Wallis检验、W ilconx符号秩检验和Friedman检验等。作者认为如果研究者对数据的正态分布性没有把握,可以同时运行参数检验和非参数检验,最后选择检验效能(power)较大的检验结果。但如果数据不服从正态分布,那么非参数检验则是最佳选择。

3.0 评价

3.1 本书优点

丰富的应用练习:国内近些年也十分强调外语教学研究方法的规范性和科学性,陆续出版了一些关于定量研究方法和数据统计分析的书籍。据笔者了解,这些专著包括韩宝成 (2000)的《外语教学科研中的统计方法》、鲍贵(2011)编著的《二语习得研究中的常用统计方法》以及秦晓晴(2004)的《外语教学研究中的定量数据分析》。其中,韩宝成(2000)更侧重于对统计基本原理的阐释和说明,并未介绍SPSS的具体使用;与之类似,鲍贵(2011)也把焦点关注到统计学原理和知识,书中不乏复杂的数学公式,对于文科背景的读者而言理解起来比较吃力;秦晓晴(2004)则通过数据案例详细地讲解了如何使用SPSS对外语教学研究中的定量数据进行分析,知识脉络清楚,略微遗憾的是该书缺少相应的练习。笔者注意到新近出版的《第二语言研究中的统计案例分析》(2013)一书,作者许宏晨结合了大量的实际案例和习题来帮助读者学习统计学和SPSS的使用,一定程度上弥补了前者的不足。同样,《二语研究中使用SPSS进行统计分析指南》一书也提供了二语习得研究者的真实案例,并根据案例设计了相关应用活动和习题,而且书中所用数据均可在该书附录网站(http://www.routledge.com/ textbooks/9780805861853)上免费下载,方便了读者动手实践。

结构内容紧凑,语言平易近人:纵观全书,作者由浅入深,循序渐进地向读者依次介绍统计的常识和概念、SPSS的操作方法和SPSS软件中可以运行的统计检验方法。各统计检验方法也按照其复杂程度予以展开介绍,读者可以按照本书的章节先后顺序进行阅读。作者口语化的语言风格和第一人称的叙述方式,拉近了与读者间的距离,令原本晦涩的统计学原理显得活泼亲切。另外,在第二部分,作者每章都借用二语习得研究中的研究问题实例。例如,第9章关于使用t检验比较两个均值采用了Leow&M rogan-Short(2004)的实验数据;第10章运用Ellis&Yuan(2004)关于准备时间与句法复杂度关系的实验数据,介绍一维方差分析的应用,非常有利于读者通过观照自己的研究方向正确选择统计检验方法。附录部分的专业词表(glossary)详细解释了书中涉及到的所有统计术语和概念,方便了读者更好地理解本书内容。

3.2 本书的不足

首先,作者在书中不时穿插统计软件R的应用,特别是在讨论统计检验效能的时候,这对于国内从事外语学习和研究的师生来说相对陌生,较难理解。其次,书中习题的答案有的在文中直接给出,有的则要到附录网站上查询,如果能统一在每章或全书结尾处呈现,则更有利于读者检验学习效果。除此之外,在数据分析举例时存在个别的运算错误。例如,为说明卡方独立性检验,作者对一组虚构数据的观测频数和期待频数的差异(Larson-Hall,2010: 208)进行分析,结果将100*39/200计算成18.5 (实际值应为19.5),直接影响到后边卡方值(?= 8.374)的准确性。但总体来讲,瑕不掩瑜,该书不失为一本很好的学习二语定量数据分析的参考指南。

[1]Larson-Hall,J.A Guide to Doing Statistics in Second Language Research Using SPSS[M].London:Routledge,2010.

[2]Dornyei,Z.Research Methods in Applied Linguistics[M].Oxford:Oxford University Press,2007.

[3] Lazaraton,A.Quantitative research methods[A].In E.Hinkel(ed.).Handbook of Research in Second Language Teaching and Learning[C].New Jersey:Lawrence Erlbaum,2005.209-224.

[4]鲍贵.二语习得研究中的常用统计方法[M].北京:外语教学与研究出版社,2011.

[5]韩宝成.外语教学科研中的统计方法[M].北京:外语教学与研究出版社,2000.

[6]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2004.

[7]许宏晨.第二语言研究中的统计案例分析[M].北京:外语教学与研究出版社,2013.

“传统与现实——当代中外翻译理论与实践研究”高层论坛会议通告及征文通知

翻译改变世界,与此同时,翻译也在随着世界的改变而改变。回顾历史,严复、林纾等翻译家曾以他们关注现实的目光,为我国的社会发展和文明进步作出了巨大贡献;放眼今日,当代翻译工作者们正在为促进我们国家与世界各国在政治、经济、文化等诸多领域的交流与合作发挥着日益重要的作用。

2014年恰逢著名清末闽籍翻译家严复诞辰160周年、林纾逝世90周年,值此中国翻译史上具有特别纪念意义的年份,我们欢迎海内外译界同仁同来中国翻译史上两位前贤严复和林纾的故土——福州,瞻仰严林故居,缅怀严林译绩,继承、发扬他们的翻译思想,在新的历史语境下,共同努力和深入探讨翻译如何更好地为促进中外文化交流服务,如何为实现中华民族的复兴服务。

为此,中国比较文学学会翻译研究会、中国翻译协会翻译理论与翻译教学委员会、教育部全国MTI教育指导委员会和福州大学外国语学院,决定于2014年11月8日至10日在福州举办“传统与现实——当代中外翻译理论与实践研究”高层论坛,邀请中国译协、教育部全国MTI教指委领导,邀请在翻译理论、实践与教学领域卓有成就的专家学者、广大师生以及一线从业者和实践者齐聚严林故乡,共话振兴中国的翻译事业,同铸中华译学建设大业。

论坛将由福州大学外国语学院承办,有意与会的专家学者与师生请于2014年7月31日前,通过电子邮件提交300字左右论文提要;经会议筹备组审阅研究后将发出正式邀请信。论文提要请注明作者姓名、工作单位、职称或研究生身份、联系方式(通信地址、邮编、电邮、手机号码)。电邮接收者为中国比较文学学会翻译研究会秘书处郑晔博士,其电子邮箱是:zhengye_gf@126.com。

A Review of A Guide to Doing Statistics in Second Language Research Using SPSS

SHEN Yun-hua
(School of Foreign Language Education,Jilin University,Jilin 130012,China)

A fundamental issue in second language(L2)research ismethodogy.Basically,there is a dichotomy of the quantitative approach and the qualitative approach based on different ontological and epistemological assumptions.However,tomany novice researchers of L2,the complicated concepts and the numerical analysis concerning quantitative research in L2 are discouraging and intimidating.In light of this,Jenifer Larson-Hall(2010)introduces statistical concepts and assumptions,aswell as the explanation of tests and outcomes by means of SPSS.

second language research;quantitative approach;SPSS

H319

A

1002-2643(2014)03-0109-04

2013-11-10

本文为吉林省教育厅“十二五”规划社会科学研究项目“元认知过程法在听力英语课堂教学中的效果研究”(项目编号:吉教科字0588)的阶段性成果。

申云化(1978-)男,汉族,黑龙江省尚志市人,硕士,讲师。研究方向:应用语言学研究方法,英语听力教学,学术英语写作。

猜你喜欢

卡方二语研究者
卡方检验的应用条件
卡方变异的SSA的FSC赛车转向梯形优化方法
卡方检验的应用条件
高等教育中的学生成为研究者及其启示
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
《教学二语习得简介》述评
Ferris与Truscott二语写作语法纠错之争
国内二语写作书面纠正性反馈研究述评
医生注定是研究者