APP下载

基于核心素养的语文开放性试题多维评量模型的设计与探索

2017-02-01周宓李瑛

中国考试 2017年11期
关键词:评量开放性试题

周宓 李瑛

(湖南省教育考试院,长沙 410006)

2014年3月,教育部发布的《关于全面深化课程改革 落实立德树人根本任务的意见》中指出:“教育部将组织研究提出各学段学生发展核心素养体系,明确学生应具备的适应终身发展和社会发展需要的必备品格和关键能力。”[1]同时要求建立以“学生发展核心素养”为统领的课程体系和评价标准,树立科学的教育质量观,通过课程改革、教学实践和教育评价等途径落实核心素养。基于发展学生核心素养设计的最新高中语文课程标准(征求意见稿)提出:“语文素养是学生在积极的语言实践活动中积累与构建起来,并在真实的语言运用情境中表现出来的语言运用方式及其品质;是学生在语文学习中获得的语言知识与语言能力,思维方法和思维品质,情感、态度与价值观的综合体现。”[2]语文学科核心素养将成为语文学科考试着力考查的重要内容。

语文试卷中的开放性试题一般比较关注大的内容或单元,注重对学习内容的整合和构建,非常强调学生在具体真实的情境中,通过积极思维和语言实践活动,有效表达思想、解决实际问题的能力,常用来测量学生高层次的认知水平和技能,在考查学生语文核心素养方面有着独特的优势。由于学生在解答语文开放性试题时表现出的语文素养呈现出交互性、多层次性等复杂特点,如何准确评量非常重要。本文拟从如何更好地区分和评价学生在开放性试题中反映出的认知层次与策略,以及表现出来的语文核心素养,并能更为有效地实现试题评分的可解释性探寻一种评量方法。

1 开放性试题的特点

开放性试题是相对于封闭性试题而言的。封闭性试题的条件一般相当完备、答案也很固定,而开放性试题却不具备完备的条件和固定的答案[3]。开放性试题一般具有问题开放性、问题解决方法多样性,以及答案不唯一性等特点,也就是说,开放性试题的结构比较复杂,多基于真实性情境,有较强的现实性依据,需要调动学生已有的知识和经验去寻求或创造分析问题、解决问题的方法。从试题的题干呈现方式来看,开放性试题提供了或者说有多种解答途径或方法的可能;从解答结果来看,开放性试题通常有几个甚至是多个正确的答案;从学生解答问题的认知活动来看,问题解决的认知活动不仅仅只包含回忆、复现等低级认知技能,还应该包括解决、创造等高级认知技能,可以从多方面、多角度、多层次探索问题;从考查目的角度来看,开放性试题能够有效考查学生的发散性思维和创新意识与能力。

开放性试题能够打破学生已有的认知平衡,学生通过独立思考,对问题进行综合分析和深层次理解,建立新的认知平衡状态。开放性试题不是选择一个简单的答案,而是要求学生根据自己的知识背景和对题目的理解水平积极构建自己的反应,自主采用不同的方法,有创造性地解决问题,为学生主动选择信息并超越或创造给定的信息提供了可能。开放性试题能让学生有机会展示与众不同的问题解答思路和过程,有利于完善学生的认知结构,更好地培养学生的独立思考、探索精神和创新意识,同时能激发学生的学习兴趣,转变学习方式,根据自己的学习基础有更快更高的发展[4]。

在语文考试中,相对于封闭性试题,开放性试题题干的表述文字量相对较小,因而影响试题开放度大小的因素会更多。试题开放度越大,其问题结构就越复杂,解决问题需要调动的认知技能就越高级,学生思维路径和问题解决方法呈现就越多,并且在表述上的差异性也越大,对评分精准度的追求也越高。

2 开放性试题的多维评量模型

语文考试中开放性试题评分的常用方法主要是采分点计分和三论要素评分两种。采分点计分是指在评卷中一般是将答案细分为若干个采分点,根据学生答案的关键信息点与评分预设的采分点重合数量的多少来计分,这是一种简便评阅试题的方法,操作性强,评分耗时比较少,比较适用于强调知识或事实的再现、开放度相对较小或是客观性较强的主观性试题的评阅与计分,但对于开放度大、学生认知结构表现复杂的试题就不太适合。采分点计分的方式容易让教师在评阅试题的过程中死扣采分点,容易忽视学生语言的丰富性、思维的逻辑性和结构的严谨性等,容易断章取义导致僵化执行评分规定,降低试题评阅计分的准确性,进而降低测试的信度和效度。

三论要素评分是指采用议论三段论评判形式,即从论点、论据、论证三个方面对学生答题情况进行评分。论点以是否提出论点或观点为前提,再根据提出的论点或观点正确、模糊或错误进行评判;论据以是否有前提,再对论据以充分、不充分或有错误进行评判;论证以观点与论据联系的契合程度为依据进行评判。三论要素评分方式多运用于论文式试题,能够快速有效地将学生答案先进行分类,然后在不同类别分数区间给学生以确定的分数。但此评分方法比较粗放,试题赋分越大,不同类别分数区间也就越大,由此导致评分误差就会增大,尤其是在论据与论证部分,学生的作答不会先举论据再进行论证,多为将两者合在一起或是混在一起。学生的思维方式千差万别,表达也各不相同,因此,评分时从学生作答中提取论据和论证信息的难度会比较大,并且很难区分相同分数的学生在学科能力上的不同。

在充分考虑传统评分方法客观存在的缺陷的前提下,充分借鉴SOLO(Structure of the Observed Learning Outcome)分类评价和 PTA(Primary Trait Analysis)量表法,在PISA(Programme for Internation⁃al Student Assessment)问题解决能力等级水平量表、高考语文作文评分等级量表和上海市高考语文部分开放性试题评分量表的基础上,尝试设计一种语文开放性试题的评量模型。

2.1 维度划分

多维评量模型的构建首先需要弄清多维评量的层次结构,有多少个维度,各维度之间的关系如何等。多维评量模型应满足:1)试题需要运用等级量表实施评分;2)试题可以构建多个评价维度;3)每个维度都独立存在;4)维度与维度之间不存在内容交叉;5)每个维度对每个学生的评价都有效;6)对每个学生都必须从设定的不同维度进行评价。据此构建如图1所示的多维评量模型。多维中的任何一个维度都应具有普适性,也就是说,对于评价对象而言,模型中的每一个维度都是可以用来独立评价学生的一个标准。不同的维度之间一般情况下相互不从属,为并列关系。

思维是大脑通过分析和综合而获得的对客观世界或现实更为全面和本质的认识的复杂心理过程,而语言是运载思维的有效工具。思维的结构、内容等都需要通过语言的实践而表达,学习语言的过程也就是训练思维的过程,思维的发展是随着对语言这个思维工具的不断掌握,正确、熟练、有效地运用而向前发展。语文科是语言学科,同时也是思维学科,在语文教学中,对语言和思维同等重视是众多国家的现状,也是世界性的趋势[5]。语文学科的根本属性可以说是思维和语言的辩证统一,常说的语文“听”“说”“读”“写”实质上是学生语言水平的思维操练,是语文学科实现学生思维与语言相互转换的最基本的表现与实践形式。“读”与“听”的过程是以理解他人思想为核心的思维过程,从对语言的感知到对文章内容的本质理解,再到对说话内容或文章内容及形式作出判断,其间需要经过一系列多层次的分析、综合等思维过程;“写”和“说”的过程是以表达自己的思想为核心的思维过程,从对生活或文字的感知到形成自己的认识,再到以语言的形式把这种认识表达出来,其间也要经过一系列多层次的分析、综合等思维过程。语文学习中的理解和表达过程离不开思维和语言的共同作用,如果运用了模糊的语言,人的思维就不可能清楚,语言的清晰、准确、有序等都是思维表达的基础。不同的人会具有不同的语言组织方式,不同的语言组织方式能够构造出无数的意义世界,语言的丰富和语言组织的个性化能够更有利地表达要表达的思想和认识,有个性化的思维就有可能有个性化的表达,有个性的表达一定能体现思维的与众不同。

图1 多维评量模型结构图

最新普通高中语文课程标准(征求意见稿)提出语文学科素养是指语文素养的核心要素和关键内容,主要包括语言建构与运用、思维发展与提升、审美鉴赏与创造、文化传承与理解4个方面,这4个方面构成一个整体[2]。语言是重要的交际工具,也是重要的思维工具;语言的发展与思维的发展相互依存,相辅相成。语言文字是文化的载体,又是文化的重要组成部分;学习语言文字的过程也是文化获得的过程。语言文学作品是人重要的审美对象,语文学习的过程也是人审美能力和审美品质发展的重要途径。由此可见,语言构建与运用是语文核心素养的重要组成部分,也是语文素养整体结构的基础层面。在语文课程的学习中,学生语文运用能力的形成、思维品质与审美品质的发展、文化的传承与理解,都是以语言的建构与运用为基础,并在学生个体言语经验的建构过程中得以实现的。课程目标中进一步将语文核心素养的4个方面细化为语言积累与建构、语言交流与沟通、语言梳理与整合、发展形象思维、发展逻辑思维、提升思维品质、增进对祖国语文的美感体验、鉴赏文学作品、美的表达与创造、传承中华文化、理解多样文化、关注与参与当代文化12个方面。

基于语文学科的根本属性和语文学科核心素养,语言和思维可以被确定为语文开放性试题多维评量模型的基本维度。语言维度,侧重于评价学生的语言运用能力,思维维度更多地评价学生的抽象思维能力,尤其是对学生抽象思维过程中的分析和综合能力(具体表现为比较、分类、抽象、概括等能力)的系统考查。

语文开放性试题多数情况下都由阅读材料和具体问题构成。阅读材料或是直接依托试卷中文章阅读题中的原有文本,或是另外提供独立的小段文本。不同的文本有不同的语言类型,不同语言类型则表现出不同的文本世界,设置一定的问题情境,文本和设置的问题形成了特殊的语境。学生须在这一具体的语境中,理解与追索文本内涵或作者“原意”,实现个性化理解“意义”的构建,并展示其语文素养。对于科学文本与问题构成的语境,学生需要摒弃自己的“先见”,以“静虚”的心态准确地接受科学语言陈述、概括和阐明的文本传递的信息,从而完成对问题解决方案的构建;对于文学文本与问题构成的语境,学生需要迅速融进文本语境,拉近心理距离,借助平时语文学习中的感受、经验和理解的积淀,将文学作品世界转换为对生活的再认识、再体验、再感受,通过审美感知和创造来构建问题或生活的“意义”。此外,学生在解决具体问题的时候需要结合试题设问本身的文体风格要求,进行议论性表达或记叙性表达。这种由内容、情感、想象等交织在一起的符合试题设问文体风格要求的表达,构成了学生作答自然生成的语境,也就是语文开放性试题多维评量模型的第三个维度,即语境维度。

除上述3个方面之外,部分试题的设问会存在特殊要求,对于这些在设问中有特殊要求的试题,可从思维、语言、语境和试题特殊要求等多方面,以“3+”的形式构建多维评分等级量表对学生作答进行评定。

2.2 多维评量模型

语文开放性试题评分的维度有思维、语言和语境,构建如图2所示的模型。

图2 语文开放性试题多维评量模型

思维的维度侧重于检测学生的抽象思维能力,细化为思维的深刻性、思维的严密性、思维的开放性以及思维的灵活性。思维的深刻性主要表现在学生认识是否有深度或有一定的层次,思维的严密性主要表现在逻辑判断的正确度、推理的明晰程度和思维的完整程度,思维的开放性主要表现在学生视野的开阔度和观点的新颖程度,思维的灵活性主要表现在问题解决是否使用多种不同的方法。上述维度可以进一步细化为4个层级,见表1。

语言的维度侧重于检测语言文字的运用,细化为语言的复杂性、语言的个性化、语言的清晰度、语言的准确度等。语言的复杂性主要表现在语言现象的复杂和丰富程度,语言的个性化主要表现在语言文字表达是否具有个性特征或个人风格,语言的清晰度主要表现在语言文字表达是否流畅或通顺,语言的准确度主要表现在语言文字运用中是否有病句和错别字。上述维度可以进一步细化为4个层级,见表2。

语境的维度侧重于检测学生的内容与情感表达,细化为内容的丰富性、情感的真实性、想象的合理性和文体的一致性等。内容的丰富性主要表现在内容是否充实,情感的真实性主要表现在表达的情感是否真实,想象的合理性主要表现在联想和想象是否自然和顺畅,文体的一致性主要表现在是否有明显的文体特征。上述维度可以进一步细化为4个层级,见表3。

依据普通高中新课程标准中对高中语文素养水平的描述,将不同的维度进一步细化,分级分层,为多维评分等级量表的等级描述提供可能,能够实现从不同的维度对学生作答表现进行评分和解释。按照目前设定的多维评分等级,每个维度可细化为“3”“2”“1”“0”4 个等次,一道试题的评分点能将达到48个。如果试题有特殊的作答要求,这一特殊要求也将成为评分的维度之一,则评分点更多。从某种角度来看,评分维度越多,等级和标准越细,则评分越准确,分数解释越精确。但从实际评分操作的角度来看,太多过细的评分标准在人工评卷的现实中会增加试题评阅人对评分标准掌握的难度,会增加评分时间,因此多维评分等级量表不一定是划分越细越好,而是需要根据实际进行适度划分和确定。

表1 思维维度评量等级描述

表2 语言维度评量等级描述

表3 语境维度评量等级描述

2.3 建立多维评量模型的实例分析

通过具体试题(见例题),构建多维评分等级量表,并进行评分实践来验证语文开放性试题多维评量模型的可行性。

例题[6]:

中国语中“学”与“问”连在一起说,意义至为深妙。人生来有向上心,有求知欲,对于不知道的事物喜发疑问。对于一种事物发生疑问,就是对于它感兴趣。既有疑问,就想法解决它,几经摸索,终于得到一个答案,于是不知道的变为知道的,所谓“一旦豁然贯通”,这便是学有心得。学原来离不掉问,不会起疑问就不会有学。许多人对于一种学问不感兴趣,原因就在那种学问对于他们不成问题,没有什么逼得他们要求知道,但是学问的好处正在原来有问题的可以变成没有问题,原来没有问题的也可以变成有问题。

君子学必好问。问与学,相辅而行者也,非学无以致疑,非问无以广识。好学而不勤问,非真能好学者也。贤于己者,问焉以破其疑,所谓就有道而正也;不如己者,问焉以求一得,所谓以能问于不能,以多问于寡也;等于己者,问焉以资切磋,所谓交相问难,审问而明辨之也。

结合中国古代文化典籍中有关“学”的观点,简要谈谈你对学习的认识。不超过140字。

根据试题将等级描述的内容进行多维构建,由于试题有征引中国古代文化典籍中的关于“学习”相关论述的特殊要求,所以除思维、语言和语境维度之外,这道试题的评分等级量表应该增加一个特殊要求的评量维度,即征引维度。征引维度包括两个方面,具体如图3所示。

图3 具体试题特殊要求评量维度——征引维度

将这道试题评量维度的分类内容与等级进行结合,对4个维度的内容进行编号,分别为:1)维度1表示征引的维度:征引的正确性编号1-1,征引与主体内容的结合性编号1-2;2)维度2表示思维的维度:思维的深刻性编号2-1,思维的逻辑性编号2-2,思维的开放性编号2-3,思维的灵活性编号2-4;3)维度3表示语言的维度:语言的复杂性编号3-1,语言的个性化编号3-2,语言的清晰度编号3-3,语言的准确度编号3-4;4)维度4表示语境的维度:内容的丰富性编号4-1,情感的真实性编号4-2,想象的合理性编号4-3,文体的一致性编号4-4。上述模型简化为表4。

表4 多维评量模型的简化表

需要补充说明的是,并不是所有的开放性试题都必须设定为上述4个维度。不同的试题根据具体的情况可以设定不同数量的维度和标准。

在此题的评分中,每一个维度内划分的标准之间是并列的关系。评分教师完全可以在掌握评分等级量表的基础上,按照简化后的量表进行量化和评分,即达到某项标准可以在相应空格内填入“√”或其他符号进行标记。简化后的多维评分等级量表能有效提醒评分教师在评分过程中不忽视每一个维度的每一项标准,不仅可以达到减少根据主观印象评分、严格执行评分等级量表的效果,同时也能提高评分速度和效率。

根据多维模型给学生作答进行评定还必须考虑各维度及其维度下的等级标准在试题分值中的权重,通过分数转换得出该题最后的评分。权重的设定通常是根据该模型的大项(维度)或小项(标准)的数量,比如这道例题,如果按大项平均设定权重,每个维度都可设定权重为0.25;如果以小项平均设定权重,维度1的权重可设为0.143,维度2、3、4的权重可分别设为0.286[7]。不论如何设定权重,都须先根据学生在不同维度中的行为表现给定相应的分数,通过权重计算合成在这道试题中获得的总分。当然也可根据实际情况直接为不同维度分配不同的分数。

3 结语

运用多维等级量表评分能够实现相同分数间的可比性。对于在同一试题获得相同分数的学生,多维等级量表评分可以通过他们在不同维度等级量表标示呈现出的差异性,实现对不同学生认知层次和策略以及学科核心素养等方面表现的比较与分析,还可以提供详尽的分数报告。

多维等级量表评分还能帮助教师发现教学问题。如果以学生群体为单位,通过多维等级量表评分可见学生或学生群体在不同维度上的表现,帮助教师了解学生个体与群体在学习中的优势和不足、在某个维度上的差距等,能为教师更加准确地制定或改进教学方案提供服务。

此外,通过对多维评分模型不断精细和完善,可以增加试题完全机器评阅的可能,降低开放性试题人工评分过程中的主观性误差因素,提高评分的精准度,同时也能为试题测量信度校正和效度的提升提供更为有效的支撑。

[1]教育部.关于全面深化课程改革落实立德树人根本任务的意见[EB/OL].(2014-03-30)[2017-09-28].http://old.moe.gov.cn//pub⁃licfiles/business/htmlfiles/moe/s7054/201404/xxgk_167226.html.

[2]教育部基础教育课程教材专家工作委员会,普通高中课程标准修订组.普通高中语文课程标准(征求意见稿)[R].北京,2016.

[3]戴再平.数学习题理论[M].上海:上海教育出版社,1996:35-36.

[4]王伟宜,王晞,等.考试与评价[M].福州:福建教育出版社,2008:100-101.

[5]朱绍禹.中学语文教学法[M].北京:高等教育出版社,1988:16.

[6]湖南省教育考试院.2010—2014年高考湖南卷试题分析(语文)[M].长沙:湖南教育出版社,2014:113-114.

[7]李瑛.试测在高考命题试题难度调控中的实践研究[J].中国考试,2013(3):23-30.

猜你喜欢

评量开放性试题
2021年高考数学模拟试题(四)
例析三类开放性问题的解法
台湾地区素养导向的语文评量研究及其启示
初中英语开放性探究式阅读教学策略
心理量表,你应该知道的那些事儿
大数据时代基于OBE的线上会计基础培训评价
2019年高考数学模拟试题(五)
《陈涉世家》初三复习试题
2019届高考数学模拟试题(二)
寻求开放性道路