我国外语教学中的形成性评价研究:回顾与思考(2002—2016)*
2017-03-29三明学院袁树厚上海外国语大学束定芳
三明学院 袁树厚 上海外国语大学 束定芳
1.引言
国外形成性评价研究始于20世纪60年代末。1967年美国评价学家Scriven在其发表的“评价方法论”一文中首次提出了形成性评价与终结性评价的概念。1969年美国教育家Bloom把这一概念引入到教育评价实践中。几经发展后,Genesee & Upshur(1996)在《第二语言课堂评估》中系统介绍了形成性评价的理论、方法和工具等。目前,国外二语教学中的形成性评价研究围绕促学功能在理论、内容、工具、方法、应用等方面不断向纵深发展。
我国对形成性评价概念的提出始于20世纪80年代中期(卢耀增,1987;陈孝大,1988),主要是针对终结性评价在人才培养中存在的弊端,从教育学的视角来探讨实施形成性评价的重要性。外语教学中的形成性评价研究始于21世纪初,特别是在2003年罗少茜的《英语课堂教学形成性评价研究》出版后,和2004年《大学英语课程教学要求》提出过程性评估(形成性评价)的术语后,形成性评价逐步成为我国外语教学领域中的一个研究热点。作为克服我国传统应试教育弊端的一个切入点,许多学者对外语教学中的形成性评价展开研究并取得了丰硕的成果。本文对2002年至2016年我国外语教学中的形成性评价研究论文进行梳理,采用定量和定性相结合的方法,从研究的发展趋向、对象、领域、内容和方法等5个层面述评形成性评价研究,指出国内外语教学形成性评价研究所取得的进展与不足,展望该研究领域的发展前景。
2.我国外语教学中形成性评价研究回顾
在外语教学论文中,考虑到许多专家和学者对形成性评价研究所使用的术语和选取的视角有较多的差异。笔者在中国知网(CNKI)上,在文献来源检索项中分别输入18种外语类期刊①这18种期刊包括《外语教学与研究》、《外语教学理论与实践》、《外语界》、《现代外语》、《外语与外语教学》、《外语教学》、《中国外语》、《外语电化教学》、《外语学刊》、《解放军外国语学院学报》、《外语研究》、《西安外国语大学学报》、《当代外语研究》、《山东外语教学》、《外国语文》、《天津外国语大学学报》、《北京第二外国语学院学报》和《中国翻译》。《外国语》未刊登外语教学形成性评价研究的文章,故未列入检索期刊。,检索2002年至2016年刊登的论文,通过对题名、关键词和摘要等内容进行逐篇阅读的方法,得到相关论文158篇。这些论文以直接或间接的促学为目标,其内容主要涉及形成性评价的本体、理论和方法、评价模式、反馈、评价效应等方面,并呈现出以下特征:(1)从师评、互评和自评逐步发展到电子档案袋评价和机器自动评价;(2)从思辨研究为主转变到实证研究为主;(3)从调查问卷法过渡到评价体系实验法;(4)英语学习形成性评价研究对象从本科生纵向发展到研究生和中小学生;(5)从对学生的形成性评价促学研究扩展到对英语教师的形成性评价能力发展的研究。以下对此进行回顾与分析。
2.1 形成性评价研究的趋势
2002年至2016年,外语教学中的形成性评价研究论文数量每年动态变化,但整体上升趋向明显(见图1)。这十五年的论文都是英语教学中的形成性评价研究,未涉及其他语种。因此,从严格意义上讲,我国外语教学中的形成性评价研究几乎是在英语教学环境中的研究。
图1.2002—2016年我国外语教学中形成性评价研究发展趋向
图1显示,2008年是我国外语教学中形成性评价研究的一个重要分水岭。2002年至2008年,外语教学中的形成性评价研究数量呈明显上升趋势,这7年间的论文数量共40篇,占总数的25.3%。从2009年起,研究进入较为波动的发展期,论文数量上下波动,最多年度21篇,最少有9篇。这8年间的论文共有 118篇,占总数的74.7%。可见,国内学者越来越重视外语教学中的形成性评价研究,高质量的论文数量不断增加,这从侧面反映出外语教学中形成性评价研究的学术价值。
2.2 形成性评价研究的对象
2002年至2016年,外语教学中的形成性评价研究涵盖不同教育层和类别的对象,包括研究生(楼荷英,2005)、本科生(蒋宇红,2005)、高职高专学生(李雪莲,2016)、中学生(刘学华、张薇,2011)、小学生(孙明、赵飞、赵江葵,2007)、大学英语教师(许悦婷、刘永灿,2008)以及小学、初中和高中不同层次英语教师(赵晨,2005),还包括英国某大学英语语言预科班学生(庄欣,2012)等其他各类研究对象。在158篇论文中,有明确研究对象的论文共有112篇。其中,涉及本科生的有83篇,占总数的74.1%,其余研究对象的论文比例都很低(见表1),这说明我国外语教学中的形成性评价研究主要关注本科生群体。在该群体中,形成性评价研究对象又可分为英语专业学生和大学英语学生,前者占总数的31.2%,后者占42.9%。
表1.2002—2016年我国外语教学中形成性评价研究对象分布
简而言之,2002年至2016年外语教学中的形成性评价研究主要探讨大学英语学生和英语专业学生的形成性评价,而对小学生、中学生、高职高专学生以及研究生的形成性评价关注度不足。在教师方面,不论是对高校英语教师,还是对中小学英语教师形成性评价能力的研究同样存在关注度不足的现象。在今后的研究中,国内学者应通过理论或应用研究来填补这些学术研究不足。特别是对中小学英语教学展开形成性评价研究,探讨不同年龄段、不同外语水平的形成性评价理论、方法和要求,以此形成对中小学生外语综合素质培养的反拨。
2.3 形成性评价研究的领域
在形成性评价研究的158篇论文中,具有明确研究领域的论文共有139篇。其研究领域涵盖技能教学、课程教学、课堂和网络教学等3个方面。其中,技能教学领域占总数的76.4%,课程领域占18%,课堂和网络教学领域占5.6%。而在各小类研究领域中,有关英语写作的论文有75篇,占总数的54%,其次是口语、翻译和大学英语教学所占比例较大,皆为9.4%,而其他各类所占比例均很小(见表2)。可见,我国外语教学形成性评价研究主要关注技能领域的写作、口语和翻译以及课程领域的大学英语教学。
表2.2002—2016年我国外语教学中形成性评价研究领域分布
由此可见,2002年至2016年外语教学中的形成性评价研究主要探讨对外语技能习得的促学,而对课堂教学和网络教学的形成性评价促学研究较少。在今后的评价研究中,国内学者应做好课堂教学、网络教学这两大阵地的形成性评价研究,其成果将会对外语教学过程及其教学评价改革产生重大的影响。
表3.2002—2016年我国外语教学中形成性评价研究内容的类别及其比例
2.4 形成性评价研究的内容
2002年至2016年,外语教学中形成性评价的研究内容可分为8类,即综述、理论、应用、自动评价、模式或系统、反馈、效应以及本体等研究。各类研究数量及其比例如表3所示。下面述评各类评价研究,以揭示外语教学中形成性评价研究的概貌。
1)综述研究。综述类论文多达19篇,占总数的12%。这些研究分别从形成性评价的应用、即时评价、档案袋评价、自动评价以及反馈等不同视角述评外语教学中的形成性评价研究成果与问题,推动研究向多视角、跨学科的纵深方向发展。值得关注的方面之一是国内学者对国外自动评价进行综述研究的论文多达6篇,这些论文通过介绍国外研究最新进展试图引领国内外语教学中形成性评价研究的新领域(如罗凯洲、韩宝成,2014);另外值得关注的是,反馈已成为形成性评价研究中的一个焦点,综述论文也有6篇,主要是对负反馈的述评,而目前国内外对正反馈的研究还较少。
2)理论研究。该类论文仅有5篇,占总数的3.2%。与以往研究内容不同的是杨华和文秋芳(2014a,2014b)采用扎根理论和话语分析的方法,对外语课堂中的即时评价进行了研究。李清华、曾用强(2008)研究了外语课堂形成性评价的效度理论。这些研究丰富和拓展了形成性评价的理论基础,但从整体来讲在形成性评价中的测量理论还没有得到根本解决。另外,今后结合我国国情和文化的形成性评价理论研究将产生更大的理论与应用价值。
3)应用研究。该类研究占总数的15.2%,数量位列第三。在各类应用研究中,国内学者主要采用理论分析法、问卷调查法、实验法等多种方法来探讨外语教学中形成性评价的各种应用,试图在应用中实现以评促学的目的,或实现教、学、评一体化,或探索新的评价形式(文秋芳,2016)。其中,较为值得关注的是互评和自评量表的编制(白丽茹,2012;樊葳葳、吴卫平、彭仁忠,2013)。这些量表明确、细化、具体了形成性评价的导向功能,使互评和自评过程更具有操作性和效度。
4)自动评价研究。随着国内外自动评价软件的开发和网络技术的不断发展,外语教学中的写作和翻译已成为形成性评价研究的新领域。2002年至2016年,自动评价软件研究论文有5篇。它们主要从词汇和语法的角度验证了自动评价的方法或效度(如袁煜,2016)。今后的自动评价研究还应关注人的高级思维能力的发展,来进一步提高评价的促学效果。
5)应用模式研究。国内研究者在借鉴国外形成性评价模式研究的基础上,或针对外语教学中终结性评价的弊端,或依托网络技术的发展与评价软件的开发,纷纷从学习动机理论、连接理论、学习过程理论、评价理论、效度理论等众多学科理论视角进行形成性评价模式研究,确立了多种评价模式(如王华、甄凤超,2008;佟敏强、石彤喆,2009),来提高形成性评价的促学效果。今后根据我国外语教学评价的现状,在课堂教学或任务教学中,研究形成性评价与终结性评价相结合的应用模式可能会有更大的应用价值。
6)反馈研究。
在形成性评价的促学过程中,反馈是不可或缺的关键环节(Bell& Cowie,2001:11),其主要功效是支持学生解决学习发展中的信息沟问题或提供情感支持。2002年至2016年形成性评价论文中的反馈研究占20.2%,数量位列第二。研究内容涉及对不同水平学习者的反馈、不同的反馈主体、反馈的能力或信念、反馈的时机或内容、互动式或修正性反馈方式等(如赵晨,2005;龚晓斌,2007;张凯、王同顺,2014)。其目的为试图发现何种反馈可使学生最大程度地接受评价结果,从而产生最佳反拨效应。但研究内容主要集中在写作领域,而对阅读、听说等领域的反馈研究鲜见,并且今后的反馈促学逻辑可能是更适合、而非最佳。
7)评价效应研究。2002年至2016年,外语教学中的形成性评价效应研究论文占总数的13.9%,数量位列第四。其研究内容主要涉及学生的学习成绩、自主学习能力、自我效能感等方面(如吴育红,2013;章木林、宋红波,2014)。从研究方法来看,该类研究思辨多、实证少。从研究内容来看,对学生的知识和技能研究多,而对其情感、态度、认知方式的研究少,并且对外语教师群体形成性评价的知识与技能、方法、态度、信念等的研究更少。
8)本体研究。外语教学中形成性评价的本体研究数量最多,占论文总数的20.9%。研究内容主要从外语教学形成性评价的口语、阅读、翻译、写作等方面展开(如刘建达,2002;徐锦芬、李红、李斑,2010;李小撒、柯平,2013;叶萍,2014)。这些本体研究有助于形成性评价的理论和方法与外语学科教学的融合。但总体来讲,形成性评价与外语具体学科融合的研究有待进一步拓展。此外,在英语写作同伴互评中也出现了相互矛盾的实证研究结论(如邵名莉,2009;白丽茹,2013),这种现象是值得进一步探讨的问题。
2.5 形成性评价研究的方法
在国内的外语教学中,形成性评价的实证与思辨研究相得益彰。实证研究主要采用问卷调查、访谈、课堂观察、有声思维等方法,其数据统计多采用均值和标准差、百分比、T值、方差、元分析等参数来检测差异或验证观点。因实证中单因素研究较多,故结论中出现了不少矛盾现象。所以,今后研究设计应多采用三角验证或多因素动态的方法。对形成性评价研究方法的分类统计有助于从宏观角度把握研究的整体态势,2002年至2016年我国外语教学中的形成性评价研究方法分布状况如表4所示。
表4.2002—2016年我国外语教学中形成性评价研究方法分布
从表4可知,2002年至2016年外语教学中的形成性评价研究主要采用实证研究的方法。其论文占总数的69%,而思辨类论文占27.2%。在定性研究中,许悦婷和刘永灿(2008)所采用的叙事研究法具有一定的创新性。
3.对形成性评价研究的思考
新世纪以来,国外学者在二语教学形成性评价研究中,不断融合心理学、二语习得、计算机科学、语用学、统计学等领域的理论和方法,促进了形成性评价的理论研究或应用模型建构等。他们多采用先进的评价软件或统计方法,对二语教学中形成性评价的本体、反馈、效应等进行研究,如Hung等人(2013)使用雷达图等工具研究了课堂教学中的多模态形成性评价;Doe(2015)研究了学生对评价反馈的解释与促学功效;Elshawa等人(2016)述评了教师的评价素养与评价促学的关系。这些成果具有重要的理论意义和实践价值。相比之下,虽然国内外语教学中的形成性评价研究成果颇丰,但研究的局限性亟待消除。其不足可归纳为以下5个主要方面。
1)研究内容和范围仍需拓展。近些年来,国外二语教学中形成性评价研究的内容和范围不断拓展,并已出现新进展,如将形成性评价的促学理念与社会文化理论和互动假说融合而产生的动态评价研究 (van Compernolle& Zhang,2014;Poehner,Zhang & Lu,2015;Veen,Dobber &Oers,2016)。国内学者对外语教学形成性评价的研究,一方面可以借鉴/把握国外研究中新的方法、工具、内容或领域,进行形成性评价的深入研究;另一方面也要挖掘国内形成性评价中的问题,来创新研究内容并开拓研究领域,促进国内形成性评价研究课题的发展。
2)研究视角有待进一步创新。外语教学中的形成性评价研究主要关注本科学生的英语学习形成性评价,涉及其他语种的形成性评价研究几乎没有,而且探讨中学生、小学生以及学龄前儿童外语学习形成性评价的研究甚少。为解决我国外语学习中在应试教育方面存在的突出弊端,集中力量进行中小学阶段外语教学形成性评价的课堂融入研究(如Tan&Turner,2015)以及终结性评价的形成性使用(教育部高等教育司,2016)研究尤为重要。
3)研究对象应强调个性化差异。外语教学中形成性评价的一大特征是个性化。可对不同学历、不同基础和学能、不同年龄、不同认知风格外语学习者形成性评价的内容和方式增加针对性研究,如形成性评价中的协议学习研究(Zandi,Kaivanpanah& Alavi,2015)。这些差异研究,将对形成性评价的促学产生更加适合的现实意义。
4)研究结论有效性有待检验。首先,不少研究过程脱离我国应试教育的大背景,导致研究方法和结论难以推广。其次,在国内外语教学中,尽管许多形成性评价研究成果皆以一定的实证研究为基础,但在实验设计中因缺少三角验证等方法,有些结论在实践中促学的有效性仍需今后实践的验证。
5)政策和条件研究有待加强。一方面,在中小学和高校教育中,虽然对形成性评价的要求均已被写入教育部文件,但在中小学和高校中如何落实形成性评价还悬而未决。因而,进行外语教学中形成性评价政策落地研究是当前的迫切需求。另一方面,尽管在国内外对外语教学中形成性评价促学的理论和应用都做了大量的研究,但根据我国国情在日常教学中对实施形成性评价的影响因素还不够明确。因此,研究国内课堂教学中实施形成性评价的先决条件可能对评价促学会产生巨大的“临床效果”。
4.结语
本文运用定量和定性相结合的研究方法,对2002年至2016年国内18种外语类期刊上发表的外语教学形成性评价相关论文进行统计分析,结果显示:国内外语教学形成性评价研究范围不断拓展;形成性评价新模式不断涌现全新视角;研究领域越来越广泛;新的研究方法不断出现。总体而言,国内外语教学形成性评价研究呈现出研究重点各异,研究视角多样,研究特点鲜明等状况。
当然,国内外语教学中的形成性评价研究也存在不足之处。在今后外语教学形成性评价理论与应用研究过程中,研究者应注意不可将形成性评价研究与终结性评价、与学生的外语综合素质培养割裂开来,而应分析国情,剖析应试教育的弊端,发挥评价文化的优势,培养全面发展的外语人才。国内研究者应借鉴国外二语形成性评价研究的先进方法和手段,同时要挖掘国内评价研究中的问题,创新形成性评价的研究内容,提高国内外语教学形成性评价研究的理论价值和应用价值。
Bell,B.& B.Cowie.2001.Formative Assessment and Science Education.Boston:Kluwer Academic.
Doe,C.2015.“Student interpretations of diagnostic feedback”.Language Assessment Quarterly 12.pp110-135.
Elshawa,N.R.M.,C.S.Heng,A.N.Abdullah,et al.2016.“Teachers'assessment literacy and washback effect of assessment”.International Journal of Applied Linguistics& English Literature 5.pp135-141.
Genesee, F.& J.A.Upshur.1996.Classroom-based Evaluation in Second Language Education.Cambridge:Cambridge University Press.
Hung,H.,Y.Chiu & H.Yeh.2013.“Multimodal assessment of and for learning:A theory-driven design rubric”.British Journal of Educational Technology 44.pp400-409.
Poehner,M.E.,J.Zhang & X.Lu.2015.“Computerized dynamic assessment(C-DA):Diagnosing L2 development according to learner responsiveness to mediation”.Language Testing 32.pp337-357.
Scriven,M.S.1967.“The methodology of evaluation”.In R.W.Tyler,R.M.Gagne & M.Scriven (eds.).Perspectives of Curriculum Evaluation.AERA:Monograph Series on Curriculum Evaluation. 1. Chicago: Rand McNally.pp39-83.
Tan, M.& C.E. Turner.2015.“The impact of communication and collaboration between test developers and teachers on a high-stakes ESL exam:Aligning external assessment and classroom practices”.Language Assessment Quarterly 12.pp29-49.
Van Compernolle,R.A.& H.Zhang.2014.“Dynamic assessment of elicited imitation:A case analysis of an advanced L2 English speaker”.Language Testing 31.pp395-412.
Veen,C.V.D., M.Dobber & B.V.Oers.2016.“Implementing dynamic assessment of vocabulary development as a trialogical learning process:A practice of teacher support in primary education schools”.Language Assessment Quarterly 13.pp329-340.
Zandi,H.,S.Kaivanpanah & M.Alavi.2015.“Contract learning as an approach to individualizing EFL education in the context of assessment for learning”.Language Assessment Quarterly 12.pp409-429.
白丽茹,2012,大学英语写作中同伴互评反馈模式测量评价表的编制,《现代外语》第2期:184—192。
白丽茹,2013,基础英语写作同伴互评反馈模式的可行性及有效性检验,《解放军外国语学院学报》第1期:51—56。
陈孝大,1988,论教师的形成性评价和终结性评价,《教育理论与实践》第2期:1—4。
樊葳葳、吴卫平、彭仁忠,2013,中国大学生跨文化能力自我评价分析,《中国外语》第6期:53—59。
龚晓斌,2007,英语写作教学:优化的同伴反馈,《国外外语教学》第3期:47—51+57。
蒋宇红,2005,在线同伴评价在写作能力发展中的作用,《外语教学与研究》第3期:226—230。
教育部高等教育司,2004,《大学英语课程教学要求》,上海:上海外语教育出版社。
教育部高等教育司,2016,《大学英语教学指南》,https://wenku.baidu.com/view/69680453d1f34693dbef3e7a.html(2016-09-16)。
李清华、曾用强,2008,外语形成性评估的效度理论,《外语界》第3期:82—90。
李小撒、柯平,2013,同伴互评在翻译教学中的应用效果及其教学法意义,《外语教学理论与实践》第2期:83—88。
李雪莲,2016,促进学习的课堂评价及学习目标的自我管理研究,《现代外语》第3期:399—407。
刘建达,2002,学生英文写作能力的自我评估,《现代外语》第3期:241—249。
刘学华、张薇,2011,修正性反馈引发的注意对中国学习者目标语发展的作用,《外语与外语教学》第3期:50—55。
楼荷英,2005,自我评估同辈评估与培养自主学习能力之间的关系,《外语教学》第4期:60—63。
卢耀增,1987,教育评价应突出形成性评价,《天津教育》第5期:6—7。
罗凯洲、韩宝成,2014,Ordinate与SpeechRater口语自动评分系统述评与启示,《外语电化教学》第4期:27—32。
罗少茜,2003,《英语课堂教学形成性评价研究》,北京:外语教学与研究出版社。
邵名莉,2009,同伴评价在英语专业写作教学中的运用研究,《外语教学理论与实践》第2期:47—53。
孙明、赵飞、赵江葵,2007,互动式反馈对儿童二语疑问句发展作用的研究,《国外外语教学》第2期:1—9+15。
佟敏强、石彤喆,2009,网络多媒体外语教学评估体系的建设与思考,《外语电化教学》第5期:65—69。
王华、甄凤超,2008,基于语言教学项目的形成性评估流程效果研究和再完善,《外语研究》第3期:56—64。
文秋芳,2016,“师生合作评价”:“产出导向法”创设的新评价形式,《外语界》第5期:37—43。
吴育红,2013,同伴互评对自我效能感的影响,《山东外语教学》第6期:68—72。
徐锦芬、李红、李斑,2010,大学生英语阅读能力自我评价的实证研究,《解放军外国语学院学报》第5期:46—50。
许悦婷、刘永灿,2008,大学英语教师形成性评估知识的叙事研究,《外语教学理论与实践》第3期:61—67。
杨华、文秋芳,2014a,目标在外语课堂即时形成性评估中的动态变化特征及方式,《外语教学与研究》第3期:389—400。
杨华、文秋芳,2014b,外语课堂即时形成性评估的“相倚性”研究,《外语教学》第4期:41—45。
叶萍,2014,同伴互评法在英语演讲课堂中的应用研究,《外语教学》第4期:46—50。
袁煜,2016,翻译质量自动评估特征集,《外语教学与研究》第5期:776—787。
张凯、王同顺,2014,口头反馈对中国学习者英语冠词和介词习得效果研究,《外语教学理论与实践》第2期:64—70。
章木林、宋红波,2014,档案袋评价与英语自主学习能力培养的关系,《天津外国语大学学报》第2期:42—48。
赵晨,2005,不同水平英语教学中的教师纠正反馈语,《解放军外国语学院学报》第3期:35—39+44。
庄欣,2012,课堂英语口语纠错反馈机制研究,《外语教学》第2期:48—52。