开启语言评估与测试的大门——《探索语言评估与测试:行动中的语言》评介
2015-03-29郭凯,金檀
开启语言评估与测试的大门
——《探索语言评估与测试:行动中的语言》评介
郭凯金檀
(东北大学,沈阳,110819)
Green, A. 2014.ExploringLanguageAssessmentandTesting:LanguageinAction. London & New York: Routledge.ⅱ+269 pp. ISBN 978-0-415-59723-4.
作者简介:郭凯,东北大学外国语学院语言测试研究中心研究助理。主要研究方向为语言测试与评估。电子邮箱:tokaiguo@gmail.com
金檀,东北大学外国语学院英语系副教授、语言测试研究中心主任。主要研究方向为语言测试与评估。电子邮箱:alextanjin@gmail.com
*本文受到国家社科基金重点项目“基于语料库的大学英语语言能力标准特征参数研究”(编号13AYY005)的资助。
1. 引言
无论是在大规模测试还是在实际课堂教学中,语言测试与评估都在检验学习者掌握程度和教师教学成果中起到重要作用。Anthony Green是目前语言评估与测试领域内极具影响力的人物之一,他曾在牛津大学、布鲁克斯大学和北伦敦大学教授语言评估课程,目前的研究兴趣包括评估与学习之间的关系和实际测试开发过程等。他于2014年推出的新作《探索语言评估与测试:行动中的语言》(ExploringLanguageAssessmentandTesting:LanguageinAction)是继其《语言功能的重新审视》(LanguageFunctionsRevisited,2012)之后,又一部语言测试与评估领域专著,对普及语言教师的测试与评估素养将产生积极作用,值得国内读者研读。
2. 简介
近些年来,语言测试领域中最具代表性的专著教材当属Bachman和Palmer(2010)和Fulcher和Davidson(2007)。前者属于语言测试与评估领域的偏学术型教材,主要面向的读者群体为博士生和语言测试研究者,后者则属于该领域的高级教程,主要面向的读者群体为具备一定能力背景知识的研究生,这两本专著教材均适合用于具备一定语言测试与评估基础的读者来阅读和学习。《探索语言评估与测试:行动中的语言》一书则不同,作为语言测试领域的基础性入门读物,本书的读者群体主要为该领域的初学者,可作为语言学专业高年级本科生和研究生的基础教程。因此,本书采用案例式导入,将基础性与趣味性相结合,侧重基础概念的讲解、理论知识的应用以及历史背景的介绍,作者深入浅出地讲解基础概念,使读者更容易接受和理解,并使读者具备一定的实践应用能力,也增强了读者对语言测试发展历史的了解。
全书分为三部分,共七章。第一部分(第1~4章)概述了语言评估的基本概念、操作目的、制定要求以及具体实践。第二部分(第5~6章)从输入和产出两方面介绍对语言技能的评估。第三部分(第7章)回顾了语言评估的发展历史,并展望了其未来的发展趋势。这样的结构框架安排使读者在掌握基础知识的前提下,对语言评估的发展史有所了解,加深了对语言评估的理解。
在第1章“认清语言评估本身”中,作者概述了语言评估的基本概念以及在教育情境中,语言教学、语言学习与语言评估三者之间的相互依赖关系。作者认为,广义上的语言评估是以听到或读到的语言片段为证据来对语言产出者进行判断,但本书所探讨的语言评估更加注重语言知识的掌握与语言能力的运用。由此,作者对语言评估进行了简单定义:“通过获得证据来对一个人的语言知识和语言能力进行推断”(Green 2014:5)。其中,语言知识包括对外语单词的识别、外语句子的翻译以及语法规则的了解等,语言能力则更多强调在实际生活中对所学语言的使用。作者认为语言评估应该是对这两者的综合判断。由于语言教学、语言学习和语言评估三者是一个不可分离的整体,教师不仅应了解语言评估是如何制定、评分和解释的,还应具备独立完成这一系列任务的能力。在语言教学和学习方面,语言评估的重要性体现在两个方面:第一,语言评估可以为教师提供信息,帮助他们做出正确的决定,以提高教学质量。教师一旦缺少了评估所提供的反馈信息,或者因评估不当获得错误的反馈信息,教学活动和学习活动便会受到影响。第二,除了学习者自身通过对教师的模仿来进行语言学习以外,教师也可以通过观察学习者的学习情况并提供反馈信息来帮助学习者进行语言学习。
在掌握语言评估基本概念的基础上,第2章“语言评估的目的”阐述了人们对语言进行评估的目的,说明了语言评估与评估结果实际应用之间的紧密联系。研究者们通常通过语言评估来收集两类数据:一类是与语言学习的进展程度有关的数据;另一类是与语言能力能否满足具体需要有关的数据。根据收集数据类型,语言评估目的又可分为两种,一种用来检验学习者的学习成果和学习进度;另一种是用来检验学习者在具体情境中对所学语言的应用能力。根据目的的不同,作者将语言评估分为“教育评估”与“水平评估”。教育评估主要应用于课堂教学,评估内容为学习者所学(或将要学习的)知识,主要实施者为教师。水平评估通常考察的是学习者在特定环境中对语言的使用能力以及其语言水平能否满足某种特定需求,比如开展工作、学习学术课程、出国旅游及移民等,其主要实施者是国家政府部门或者国际性学术组织。在学习者的学习成果和应用能力得到检验之后,评估结果在实际教学和学习中能够得到充分运用才是评估另一意义所在。在教学过程中,教师可以通过评估来激励学习者,通过表扬学习者的进步程度,对其学习成果给予肯定,来激发学习者的学习兴趣和热情。在学习者的学习过程中,评估能够在其不同阶段发挥作用。
第3章“语言评估的实践”主要讨论如何提高评估的有效性,作者建议应从“设计”(Planning)、“反思”(Reflection)、“提高”(Improvement)、“合作”(Cooperation)以及“证据”(Evidence)五个方面加以努力。我们应将评估看做是一个连续的、不断重复的循环活动,由此,作者引入了评估循环模型这一概念,它将整个评估设计的流程分成七个不同阶段,各个阶段之间相互联系、相互作用,共同构成一个不可割裂的循环过程,每个阶段都有不同的执行者。第一阶段,主要执行者为“评估设计师”(Designer),根据评估目的列出所要评估的知识、能力以及技巧,并设计将如何对此进行评估。第二阶段,“制作人”(Producer)担任主要角色,根据设计师的设计来制定评估形式和评分程序。第三阶段,“组织者”(Organiser)决定整个评估的控制和管理方式。第四阶段,“管理者”(Administrator)根据前三个阶段制定的设计方案和指导方针来执行评估,并针对评估效果进行报告。第五阶段,“考生”(Assessee)参与评估,其表现被记录在案。第六阶段,“评分者”(Scorer)将考生表现与评分工具对比,对考生表现进行打分工作。第七阶段,“使用者”(User)将考生得分作为决策基础进行决策。到此,一个完整的评估流程得以完成。各环节作为整体的有机部分,任何一个环节的失误都会影响其他环节的发展,只有保证每个环节的有效性,才能实现整个评估系统的有效性。
第4章“有效评估系统的特质”描述了有用的评估应具备的品质和特点,这四个基本特质是“可行性”(Practicality)、“可靠性”(Reliability)、“有效性”(Validity)以及“积极后效”(Beneficial Consequences)。(1)可行性是指开展评估所需资源与现有资源之间的差距(Bachman & Palmer 2010),这里的资源主要包括时间、工具、资金以及专业知识等,两者之间的差距越小,评估的可行性越大,越容易实现;反之,则越小,越难实现。可行性是所有评估实施的最基本要求,如果没有足够的资源,任何评估都将无法开展。(2)可靠性是指评估结果是否有用、可信、站得住脚。语言能力是一个不稳定的、不确定的概念,在不同环境下,我们很难将人们的语言能力进行对比,于是,应该根据使用语言的社会目的的差异将语言能力分类进行评判。同时,评判过程中也不可避免地会存在大量不确定因素或测量误差,因此,要求我们从测量工具、具体情况、不同考生等多个方面来减小误差,从而保证评估的可靠性。(3)有效性是指评估结果对评估目的的反馈程度以及理论和实践证据对评估结果的支持程度,它经常被认为是好的评估的必要条件。好的评估应该实现最初的评估目的,达到理想的评估效果。(4)积极后效指的是评估对所评估的语言知识、语言能力和语言技巧本身的影响,对评估所涉及的个人的影响,甚至是对整个社会的影响。一个真正有用的评估对每个所涉及的个人甚至是整个社会群体的有利影响应大于不利影响。任何一个评估都不能够完全满足可行性、可靠性、有效性和积极后效这四个重要特征,但可通过优化与合理使用所有资源来达到最佳评估效果。
第5章“输入性技能的评估”主要探讨对“输入性技能”(Receptive Skills)的评估与测试,这里的输入性技能是指学习者的阅读技能和听力技能。对这两种能力进行评估的目的是为了考察学习者应用其语言能力对文字和口头输入内容的理解水平,这些输入内容常常为考生在语言学习过程中或日常生活中会遇到的问题和内容。通过对考生输入性技能的评估,评估使用者可以了解学习者在学习外语过程中在读和听两方面所面临的主要困难,并帮助他们采取措施,进行解决。作者提出,无论是在大规模的语言测试还是在课堂教学评估中,评估设计者首先应该明确的是所要评估的阅读能力和听力能力,有目的的展开评估工作。在本章中,作者分别介绍了阅读和听力的种类和过程,以及如何选择合适的输入内容来对学习者的输入性技能进行评估。然而,应当指出,学习者的理解技能是不能够被直接观察的,仅仅通过看别人读一段文章或听一段新闻,我们很难了解其对输入内容的理解程度。因此,评估设计者只能通过设计其他评估方式来找到评估学习者输入性技能的证据,这可能包括让学习者根据指令来说或写。
第6章“输出性技能的评估”与第5章对应,主要探讨对“输出性技能”(Productive Skills)的评估与测试,这里的输出性技能是指学习者的口语技能和写作技能。在积累了一定的语言知识、具备了一定的语言技能之后,学习者需要利用所学语言来传达个人思想,输出所要表达的内容,这时,学习者的说和写的技能则更为重要。在语言的输出过程中,说话的人或写作的人需要将想要表达的信息内容通过具体形式表现出来,然而,其信息内容对听者或读者来说是未知信息,因此,说话的人或写作的人就需要在具备一定的语法、词汇、语篇以及音韵知识的基础上,按照一定的目标设定、交流策略将想要传达的信息内容清楚表达出来,使听者或读者明白其表达用意。因此,学习者的输出性技能直接影响其思想的传达。对输出性技能进行评估的目的是了解学习者是否具备完成现实任务的能力,如写一篇技术报告、做一次有效果的演讲等。
本书的第一部分和第二部分向读者介绍了语言测试与评估的基本概念和两种技能评估的实际操作,使读者大致了解语言评估基础知识和相关应用,在第三部分,即第7章“语言评估的发展”中,作者进一步向读者介绍语言评估的发展历史及发展脉络,并分析其未来发展趋势,并分析了语言评估发展不同时期激烈争论的话题。具体来说,作者将历史追溯到大约五十年前在华盛顿召开的学术会议,主要介绍近五十年来测试领域的发展、语言教育目标的变化、评估与教学间的关系、语言熟练度的本质以及技术性改变等问题,其中涵盖了综合性测试的出现、分数解释方法的发展、语言交流能力的评估以及语言评估的道德影响等多方面内容,并在最后部分展望了语言评估未来的发展,为读者开辟了一条深入研究和探索语言评估之路。
3. 简评
正如本书前言中所说,本书为应用语言学方向的本科生与研究生而设计,目的是为他们开启应用语言学领域的大门,使其对语言评估与测试拥有初步了解。作者在书中通过列举具体实例来阐述基本概念问题,使读者在了解概念的基础上,能够在模拟实践中加以应用。通览全书,作者确实达到了预期的写作目的。作为一本语言测试与评估领域的基础性读物,本书具有问题驱动式设计、案例结合式讲授以及任务实践式应用等诸多特点:
第一,问题驱动式设计。作为一本语言测试与评估领域的基础性读物,在结构设计上,本书将基础性与趣味性相结合。例如,在本书的第一章中,作者首先为读者提出几个反思问题,引起读者关于本章节内容的思考,将读者的自身经历与理论知识相结合,使读者能够通过对实践经验的思考,带着问题在接下来的内容中寻找答案,这种问题式驱动设计能够很好地达到激发读者阅读兴趣的目的。
第二,案例结合式讲授。在介绍具体理论知识之前,作者会列举实际生活中的具体事例,使读者拥有一个熟悉的情境,在这个情境中,作者通过类比来讲解理论知识,使读者明白如何评价语言评估的质量,这种基础概念讲解与现实案例相结合的讲授方式更易于读者的理解和掌握。除此之外,作者在语言使用方面多采用通俗易懂的词汇,在内容讲解时多采用图文并茂的方式,以帮助读者的思考和理解。
第三,任务实践式应用。本书在理论知识讲解的基础上,更多强调理论与实践相结合,培养读者将理论知识应用到具体实践情境中的能力,为此,作者在每部分的讲解中根据所讲解的理论知识为读者提出了相应的读者任务。例如,在本书的第三章中,作者在讲解评估循环模型概念时,为读者提出了设计评估流程、列出主要活动和每个环节涉及到的相关人员的任务,使读者不局限于对理论知识本事的掌握,同时也能具备实践应用的能力。
作为语言评估与测试领域的基础性入门读物,本书也还存在一些不足之处。例如,本书对网上评卷(Onscreen Marking)(Coniam 2009)和自动评分(Automated Scoring)(Williamson,Xi & Breyer 2012)等新兴信息科学技术的介绍略显不足。
本书内容由浅入深,例证丰富多彩,语言通俗易懂,以趣味性和基础性相结合的方式向读者介绍了该领域的发展历史和基础知识,为语言测试与评估领域未来的发展提供了一定的理论参考,对其实践操作也具有一定的指导意义。对于该领域的初学者来说,这是一本不可多得的好书。
参考文献
Bachman, L. F. & A. S. Palmer. 2010.LanguageAssessmentinPractice[M]. Oxford: Oxford University Press.
Coniam, D. 2009. A comparison of onscreen and paper-based marking in the Hong Kong pulic examination system [J].EducationalResearchandEvaluation15: 243-63.
Fulcher, G. & F. Davidson. 2007.LanguageTestingandAssessment:AnAdvancedResourceBook[M]. London & New York: Routledge.
Green, A. 2014.ExploringLanguageAssessmentandTesting:LanguageinAction[M]. London & New York: Routledge.
Williamson, D. M., X. Xi & F. J. Breyer. 2012. A framework for evaluation and use of automated scoring [J].EducationalMeasurement:IssuesandPractice31: 2-13.
(责任编辑玄琰)
Abstracts of Major Papers in This Issue
Transitivity Shifts of Chinese Ascriptive Clauses in Translation, by ZHAO Jing, p. 8
In systemic functional linguistics, Chinese ascriptive clause refers to a kind of relational clause without a verbal phrase. It could be further divided into three types: the one with nominal as predicate, with adjective as predicate, and with subject-predicate phrase as predicate. This paper is mainly concerned with the features of Chinese ascriptive clauses and the transitivity shifts caused during the process of translation, including process type shifts, process deletion, transitivity scale moderation and the employment of metaphorical transitivity expressions. Those shifts are caused by either language structure, or distinctive status of nominals and adjectives in Chinese and English, or the need to optimize discourse. Languages have different ways of construing experience. The transference of experiential function does not guarantee the matching of transitivity types. Translation should conform to the features of construing experience in the target language.
Research Methods of Sound Change: Current Situation and Future Development, by QIU Chun’an, p. 13
The paper deals with the research approaches of sound change in Chinese dialects. The traditional methods are as follows, i.e., descriptive and comparative method, the integration of text-research method and historical-comparative method, lexical diffusion theory, overlapped theory, and historical strata analysis. The article also discusses the future developments of sound change, i.e., equilibrium-punctuation, phonetic typology, geographical linguistics, experimental phonetics, and variation sociolinguistics. The author holds that these methods are complementary to each other.
Evaluative Analysis of Projections in English and Chinese Academic Book Review, by ZHOU Hui & LIU Yongbing, p. 18
Based on an analysis of the use of projections in English and Chinese academic book reviews in Applied Linguistics, this study aims to explore the evaluative meanings in the review discourses from a cross-cultural perspective. The quantitive and textual analyses of the corpus data reveals that compared with English academic book review, there exists a marked difference in a less frequent use of projections in Chinese book reviews, specifically, in the categories of Author’s Acts and Writer’s Stance, and that a reduced interpersonal investment is made in Chinese book reviews with a preference for the experiential meaning potential, in contrast with the evaluative meaning potential. These differences are interpreted in reference to the nature of academic culture, interpersonal relations in the disciplinary community and the authorial voice.
Reflection of Teaching Reform of General Linguistics at Beijing Normal University, by PENG Xuanwei & YU Li, p. 29
Here a general description of the course reform of General Linguistics at Beijing Normal University is reported. First, a three-level course goal, namely, knowledge, skill and ability is introduced. Then, a practical reform scheme is put forward consisting of five aspects: teaching and learning content, methodology, experiential subjects, procedure and assessment, the focus of which lies in a three-subject interactive model with a question-oriented route: teacher, assistant and student. Finally, objective descriptions from students’ responses are presented. Remaining issues are also laid out for further thinking.
A Study of Chinese Relatives Produced by L2 Learners:A Typological Perspective, by LI Jinman, p. 34
As shown by typological observations, Chinese relative clause (RC) is prenominal, which is typologically rare in Verb-Object languages. Thus Chinese RC might be a difficult structure to acquire for learners whose first language does not have this type of word order. Based on a comparative corpus analysis of Chinese RCs produced by English, Japanese, and Korean learners, this study investigated the commonalities and differences between the distributions of Chinese RCs produced by the three groups of learners. The learner corpus data show that the distributional patterns of Chinese RCs produced by these second language learners, regardless of their first language, conform in varying degrees to typological generalizations derived from natural language observations as well as some minor disparities.
Uncovering Phrase Teaching Design via Meta-linguistic Sequences in English Textbooks: A Co-selection Perspective, by LIANG Hongmei, p. 40
The present paper, within the framework of co-selection theory, sets out to uncover features of phrase teaching design in three phrase-centered English textbooks by analyzing the meta-linguistic sequences in the textbooks. By applying the working model of extended units of meaning to analyzing the co-text of the “word” type words, the study works out the meaningful patterns of the meta-linguistic sequences in the textbooks which either highlight the four aspects of phrase knowledge or represent the two levels of cognitive demands on phrase exercises. Significance of the present research lies in the fact that the descriptive mechanism of co-selection analysis manifests itself as a powerful way to uncover features of a specific pedagogic approach embedded in English textbooks by retrieving recurrent patterns of meta-linguistic sequences.
A Study of China’s MTI Learner Translator Corpus Construction and Research, by ZHOU Qinqin, p. 56
This paper, resting on the systematic review and evaluation of corpus-based translation studies at home and abroad in the past two decades, sets out to propose that China’s MTI Learner Translator Corpus Construction be a strategic option that serves MTI translation pedagogy and the training of translation talents. This study puts forwards some prospect for the linguistic as well as translation research, and elaborates on the research approaches and methodology employed in this study, with a view of expanding the scope of translation studies and generating the paradigm of interdisciplinarity.
An Integrated Approach to Text-oriented Translation and Translation Teaching, by FENG Quangong, p. 63
Text-oriented translation requires that text should be treated as an organic whole and that a translator should follow the wholeness and harmony principles with great textual awareness when translating a text. Translation teaching should also be text-oriented or take a relatively independent text as the unit of teaching, and analyze the translation from a larger perspective. Relevant theoretical resources should be integrated into text-oriented translation teaching, such as rhetoric, writing, translation techniques and theories, contrast and comparison between English and Chinese languages, so that the students’ translation competence will be improved and their understanding of translation will be deepened.
Reconstructed Classics: Compensating Translation ofAhQZhengZhuan’s Style, by CUI Yanqiu, p. 68
Among the five translations of Lu Xun’sAhQZhengZhuan, Mr. and Mrs. Yang Xianyi’s version is widely acknowledged; William A. Lyell’s version is characterized by detailed notes and explanatory translation with a clear purpose of cultural dissemination; while Julia Lovell’s translation published in 2009 is recommended as “the most accessible” byTIMEmagazine. The translators, in different times, with different cultural identity and purposes of translation, convey the fiction’s style differently in register, temporal and spatial traits, narration, ways of humor and irony. Comparing with the Yangs’ faithful translation, Lyell and Lovell make creative attempts in representing Lu Xun’s style, some of which are successful. With the aim of Chinese literature going global, target readers’ reception and cultural dissemination should be important factors in translation criticism.