APP下载

基于现代教育测量理论的大规模教育考试命题原则研究

2015-01-21王池富

基础教育参考 2014年22期
关键词:命题

[摘要]命题工作是教育考试的核心环节,命题工作需要教学经历、命题经验支持;命题工作更需要命题技术、教育测量理论的支撑。本文根据现代教育测量理论对命题工作开展研究,从正向和反向提出命题工作应坚持的相关原则。

[关键词]教育测量理论;教育考试;命题

教育考试属于教育评价的一种常用形式,教育评价有形成性评价、过程性评价、终结性评价等多种形态。现代教育测量和评价理论的兴起和发展对教育考试工作提供了直接的科学理论指导,有力地促进了教育考试工作的科学发展。

大规模的教育考试,一方面,希望命题遵循和符合课程标准要求;另一方面,还希望学生通过对问题的分析和解答真实反映他们所掌握的知识和所具备的能力。以上两方面是教育考试的内在需要,但它们往往受到很多现实问题和不确定因素的制约和影响。如课程标准规定的培养目标不一定都是可测的,即使是可测目标也受纸笔考试形式和考试时长的限制等。

近十年来,我们对项目反应理论等现代教育测量理论开展了系统的学习和深入的研究,并在武汉市初中毕业生学业水平考试等大规模教育考试命题及数据分析处理工作中尝试有机地运用相关理论及其模型,并建立了相应的工作机制阳。本文结合实践对大规模教育考试命题工作从理论和技术层面进行分析,从正向和反向提出命题应遵循的有关原则。

一、基于教育测量理论应遵循的几个基本原则

根据教育测量相关理论,为了保证考试学科试题良好的信度和效度,也为了保证学科试题适宜的难度和一定的区分度,理论研究者和学科命题专家对试题设计的程序和方法开展了有益探索,形成既有理论上创新又能指导命题实践的丰富成果。与此同时,理论研究者和学科命题专家也不断归纳和提炼,形成了指导命题工作的关于试题设计的系列基本原则,如适纲性原则、科学性原则、导向性原则等。根据项目反应理论,结合大规模教育考试命题实践,在此我特别提出以下几个补充性原则。

1.能力立意原则

能力立意原则包括:依据课程标准构建对学科能力清晰、完整的认识,建立学科能力结构图;学校教育依据课程标准和教材及学科能力结构,构建学科能力的行为特征目标系统;教育考试以能力考核为主要目的,通过考查知识实现考查能力;教育考试命题以考查学科思维能力为核心,全面考查各种能力,强调能力考查过程的综合性和应用性,强调考查过程和内容的适度开放性。

自20世纪中叶心理学家开始进行能力测量研究以来,对能力形成及其构成和测量的研究一直没有停止过。特别是伴随脑科学研究的深入、信息化技术的广泛应用对能力和要素的认识越来越深刻,测量理论越来越丰富,测量的技术和方法也日益完善和成熟。但因为关于能力的认识具有明显的间接性和主观性,所以对能力的认识也常常包含一定程度的分歧,即使对学科能力要素及其构成也存在认识上的分歧。虽然如此,但人们一致认同学校教育应该培养学生的学科思维能力、创新精神和实践能力;认同大规模教育考试应该突出能力和素质导向;认同知识与能力互相依存,能力在学习活动中逐步形成和发展,能力也在学习活动中通过认识与行动表现出来。

在大规模教育考试中如何有效测量能力是一个颇具挑战性的问题。凯诺尔认为,“教育考试是一个通过设计的过程来诱导学生表现出某种行为,从而推测考生具备某些心理特征”,考试所获得的行为样本要与期望考查的能力之间具有匹配特征,并且两者要可量化考核。

由于不同学科能力要素及其培养目标差异较大,所以对能力的研究、考查要充分结合学科特点和规律来进行。另外,由于学科能力因素的复杂性,能力立意原则的应用也要综合考虑学科能力的构成因素、呈现形式、依存载体及其内在联系。总之,能力立意要通过素材、知识、应用烘托反映出来,并且考试结果可量化分析。

2.内容聚敛原则

内容聚敛原则主要包括:学科考试内容的抽样向学科基础性知识、关键性知识和主干内容聚集;立足学科,在学科内知识点的综合呈现处设计试题,考查学生用综合应用知识(点)来分析和解决问题的能力;创新情景在学科思维和方法交叉层面设计问题,通过此类具体问题考查宏观、抽象层面的学科思维能力。

由于学科知识内容丰富,有的学科知识点分布达数百之多,教育考试不可能覆盖所有知识点。因此,教育考试对内容的选择必须通过抽样来实现,而内容的抽样应该尽可能提高覆盖率。如何提高考试内容的抽样覆盖率和典型代表性,向学科基础性知识、关键性知识和主干内容聚敛是有效的策略。因为学科核心的基础性知识、关键性知识是必须要掌握的,也是必须要考查的,只不过是需要变换考试的题型和知识载体而已。学科主干内容是形成和支撑学科知识体系的骨架,它决定学科知识系统和学科理论的整体性和完备性。同时,也决定了学科主干内容的特殊地位和作用。

学科内有些知识内容通过素材、情景、问题或方法可建立一个整体予以考查;还有的可以通过分层次考查来逐次综合,在知识综合过程中自然渗透考查能力。对学科思维和方法相对具体的学科知识而言属于比较抽象的知识内容,对学科思维和方法类的较高层次的知识,无论其知识的领会与理解,还是其知识的巩固和掌握,乃至其知识的内化与应用对学习者要求都比较高。因此,对此类问题的考查能较好地测量和区分学科思维能力。

在命题时,首先可编拟包含知识能力等要素的双向或多维细目表;然后根据学科知识与能力细目表研究如何在学科命题中依据内容聚敛原则来设计试卷和试题。

3.创新性原则

创新性原则主要包括:对学科试题的内容、形式、问题等创新设计,防止出现雷同试题;通过创新试题考查学生学习的潜能,考查其学科创新思维能力;通过创新问题考查学生的创新意识。

大规模教育考试是周期性进行,对学校起着教育的反拨和引导作用。所以,大规模教育考试要保持适当的连续性和稳定性。但是强调连续和稳定又必须防止僵化和模式化,因此处理好稳定和创新的关系既是现实需要,也是命题工作的技术要求。

教育考试命题对情景的创新、选材的创新、设问的创新是第一层次的创新;对试题结构的创新、试题立意的创新是第二层次的创新;考查创新意识或结合知识、能力来考查创新意识是最高层次的创新。在命题实践中,我们尝试命制开放性问题、测试学科高端认知技能,使用真实情景材料引导学生关注生活和联系实际解决问题、预测学科学习潜能等,教育考试的实际结果分析证明其效果不错。创新是必要的,但创新必须尊重和符合现实;创新要有度,要防止异化,比如繁难偏怪、拐弯抹角、牵强附会等;创新要有技术支撑,比如有意义的情景、可测可评的试题结构模型、创新思维的要素呈现形式等。

二、基于反向控制思想的反向控制原则

教育考试命题是一门学问,命题管理是一门艺术;将教育测量理论与学科教育理论有机结合是一门科学。命题过程中既要按教育测量规律遵循一定的程序和格式,比如编制学科多维细目表、预测试题难度等,也要防止将教育测量理论玄学化、虚化。如果教育测量理论与学科教学理论分离必然会形成两张皮现象,两者不有机结合其科学性就没有保障,对试卷和学生学习水平及能力的评价就没有根基。

命题过程中,既要遵守既定的命题工作规程,坚持按制度、按程序工作;又要确保命题专家独立思考、独立判断,发挥命题专家的创造性和智慧。同时,命题过程中,既要合理分工,让命题专家集中精力思考和创造,又要学科内相互协作,确保充分交流、充分质疑,服从大局、达成共识。大规模教育考试试题是命题专家创造性劳动和相互协作的结晶。命题工作是一个既坚持个人专业观点又合理妥协达成共识的过程。

为了确保命题工作安全、公正、科学,特从实践层面提出以下反向控制原则。

一是有宗教色彩和涉嫌各种歧视的材料坚决不用。歧视包括性别歧视、年龄歧视、地域歧视等。背景资料、试题素材不应选择带有歧视观点的材料,防止有传播不正确价值观的嫌疑,也防止影响考试公正、公平。

二是超出课程标准范围的知识原则上不涉及。学科命题涉及的知识应在课程标准和教材范围之内,但对能力的考查可突破其限制。对课程标准和教材没有要求的知识如果要涉及一定要有交代,要有所涉及知识及过程的介绍。如数学学科可以定义一个课标和教材上没有的新运算来考查学生的理解和运用能力。

三是偏离社会发展主流价值取向、有悖常识和违背科学的素材坚决不使用。社会主义核心价值观倡导坚持以社会为本位,坚持集体利益,而西方价值观是个人为本位,以个人自由为出发点。命题素材要坚持弘扬社会主义核心价值观,要坚持多选用正面素材、积极典型。对宣扬极端个人主义、享乐主义的材料不要选用;对放大社会不公正现象,甚至刻意描写社会诟病的素材要批判性对待;对无从考证、有悖常识,甚至违背科学的材料理应增强判断和辨析能力,不可违背规律、违反科学构设搞创新点。

四是学术界尚存争议或虽达成共识尚未列人公共标准的观点不引用。作为科学家开展研究产生争议是社会发展和科技进步的正常现象,但并非所有研究的内容都可以引入大规模教育考试的。学界尚存争议的观点一旦人题必将引起来自社会各个层面人士出于各种目的的争议,从而影响社会和谐,影响教育秩序的稳定。

五是单纯反映个人学术观点的内容不引用。由于人们的认识是螺旋上升、逐步完善的,即使普遍使用的学科教材中也难免会有认识不到位甚至错误之处。对认识不统一的内容教学中可以引导、启发、组织学生开展探究,教师个人也可以开展针对性深入研究,但是大规模教育考试命题时对个人学术观点一定要慎重对待。因为,大规模教育考试不是传播个人学术观点的工具,不是学术争鸣的平台,不是检测个人学术观点认同的实验。经验和实践证明,凡是命题专家以个人极其擅长和单纯个人学术观点的内容为载体命制的试题,实测效果极差,对学校教育极易产生不正确的诱导。

六是学科组内存在分歧的素材和内容不引用。如果学科组内专家在认识上存在明显分歧,那么一旦作为正式素材和内容形成试题在社会上势必存在阵营对垒式分歧,既妨碍试卷的科学性也有悖公平原则。至于对学科知识内容考查的能力层次问题,由布卢姆教育目标分类理论结合不同学科可以形成不同的理解,所以不同学科对所要考查内容的考试要求不尽相同。有的学科简单分类为了解、理解、掌握三个层次;有的学科划分为识记、理解、分析综合、鉴赏评价等多个层次;有的学科划分为识记、理解、简单应用、问题解决等层次;还有的实验性学科把知识性考试水平分为了解、理解和应用水平,技能性考试水平分为模仿水平、独立操作水平和迁移水平,体验性考试水平为体验水平、反应和领悟水平。对不同层次的考查要求,特别是学科试题呈现的问题设计确属仁者见仁智者见智,这不仅对参加考试的学生具有一定的不确定性,对参加命题的专家同样具有挑战性。正因如此,命题专家的思维空间才留有发挥余地,命题专家的创造性劳动才具备物理性根基。

七是市面教辅资料已经出现过的素材及其试题坚决不用。如果素材对不同群体熟知程度不一样势必影响大规模教育考试的公平性。如果市面教辅资料已经出现过的素材及其试题一旦引用不仅妨碍考试公平性,还冲击考试的安全性。即使对工具书的引用也必须考虑全体考生共同使用的版本。不过,为了引导学校教育防止出现追求偏、难、怪的现象,为了引导学校教育回归本真、回归教材、回归基础,应提倡对学生共同使用的教科书中的素材进行创造性挖掘。实践证明,此举对扼制过重的学业负担、扼制资料过多过滥效果显著。

八是社会过于关注的热点话题尽量回避。学校教育应与社会教育、家庭教育相结合,应引导学生关注生活、关注社会,引导学生应用所学知识分析和解决生活中的实际问题。但大规模教育考试是一种与考生利益高度相关的考试,它对学科考试内容的选择实则是一种有目的性的抽样。大规模教育考试为了实现考试的公平公正,不得不考虑防止押(压)题行为,而社会过于关注的热点往往是市场和学校押(压)题的重要方向。因此,讲政治但不追逐热点、讲应用但不脱离实际、讲综合但不牵强附会,应成为命题工作的智慧选择。

九是立足学科内考查知识的综合应用,慎对跨学科知识的综合应用。虽然引导学生综合性应用所学知识分析和解决问题是教学的追求,学校应通过校本课程和研究性学习等活动大力培养学生综合性观察问题、提出问题、分析问题和解决问题的能力;但是由于目前学校普遍分科设置并实施课程,学科教师单一知识背景情况普遍,特别是命题工作中不可能一个学科命题组由跨学科命题专家组成。诸多现实因素和技术条件的局限,使大规模教育考试考查跨学科知识的综合时机不太理想,因此应大力推进立足学科内来考查知识的综合应用。学科内知识的综合无论从课程、教学、命题技术手段、专家资源等方面,还是从学生学习方法层面,甚至从考查学生进一步学习的潜能角度都具备可操作性。现在各级大规模教育(包括全国高考)都倡导能力立意,即立足学科内考查知识的综合应用成为命题重要的指导思想和技术原则。

总体来说,大规模教育考试命题工作不仅是学科专业性很强的创造性劳动,而且跨学科涉及多门学科理论知识,同时还具有明显的社会属性。加强对教育考试命题工作的研究,不仅有利于提高命题工作的科学化水平,而且有利于引导学校教育教学工作沿着素质教育方向发展。教育考试命题工作承载着学校、家庭、社会多方期望,其影响往往超出命题工作本身。从这个角度来讲对教育考试命题工作要“减压”,即尽可能减少社会因素的干扰,用现代教育测量与评价的理论指导命题工作,让教育考试命题工作沿着专业化方向发展。

参考文献

[1]洛林·W·安德森等.布卢姆教育目标分类学(修订版)[M].北京:外语教学与研究出版社,2009(1).

[2]2014年普通高等学校招生全国统一考试大纲(课程标准实验版)[S].北京:高等教育出版社2014(1):1.

[3]周远方,王池富.高考数学命题理论与实践[M].武汉:湖北人民出版社2011(5):1.

[4]陆璟.PISA测评的理论和实践[M].上海:华东师范大学出版社2013(5):1.

[5]2014年武汉市初中毕业生学业水平考试说明[S].武汉:武汉出版社,2014(3):1.

(责任编辑 罗登廉)

猜你喜欢

命题
能简单也能复杂
中考“命题”怎样考?
细说“否命题”与“命题的否定”
圆锥曲线的两个孪生命题
浅谈命题
浅谈“命题的否定”与“否命题”
含有一个量词的命题的否定
否命题与命题的否定辨析
命题及其关系、逻辑联结词、量词