能力导向的小学语文质量监测实践与反思
2019-04-14邵巧治
邵巧治
2015年~2017年,教育部基础教育质量监测中心组织实施了第一周期国家义务教育质量监测。从这一周期的质量监测来看,能力导向非常明显。教育部基础教育质量监测中心明确表示,“我国监测坚持能力导向,重点突出对学生综合运用知识能力和解决问题能力的测查,逐步引导全社会和教育系统优化培养方案,致力于学生多层次能力的培养和提升”。在其引领之下,各省市开展的义务教育质量监测也纷纷由以往的重基础知识考查转为重能力运用测验,试卷题目、题型、题量发生了巨大变化。但由于缺乏国家级专家的参与和指导,如何保证较高质量的命题,尤其是难度方面的把握,科学引领一线教学真正优化培养方案,值得探讨。
当前质量监测中存在以下认识误区。
第一,知识与能力的转换关系尚未厘清。语文是一门综合性、实践性课程,能力倾向明显。但能力的形成离不开知识的学习与积累,尤其是小学阶段。然而《义务教育语文课程标准(2011年版)》(以下简称“课标”)除了有明确的识字写字量规定之外,再无其他语文知识方面的具体要求。对此,课标在教学建议中专门指出:“本标准‘学段目标与内容中涉及语音、文字、词汇、语法、修辞、文体、文学等丰富的知识内容,在教学中应根据语文运用的实际需要,从所遇到的具体语言实例出发进行指导和点拨。指导和点拨的目的是为了帮助学生更好地识字、写字、阅读与表达,形成一定的语言应用能力和良好的语感,而不在于对知识系统的记忆。因此,要避免脱离实际运用,围绕相关知识的概念、定义进行‘系统、完整的讲授与操练。”在评价建议中又补充“语文知识的学习重在运用,其概念不作为考试内容”。这样的要求固然符合小学阶段的教学规律,但在笔试中,命题的难度就相当大,学生如何独立完成课外短文阅读,完成到什么程度,是靠母语环境养成的语感完成,还是依靠一定的语文知识完成?显然,单靠母语环境养成的语感是不够的,那一定的语文知识应有哪些,这些知识经过什么样的训练可以转化成能力,怎样外显出来加以考查?
第二,能力与年级的层递关系划分模糊。由知识转化为能力需要过程,随着年级递升,学生的语文能力在逐步提高,如何适当划分等级,区分各年级考试的难度,从而减轻考试给学生带来的负担?课标在学段目标的表述中提到了各学段的学习重点,但相应的行为动词比较模糊,区分度不够,如第二学段“能初步把握文章的主要内容,体会文章表达的思想感情”,“初步”的要求是什么?其实在第一学段中已提到“借助读物中的图画阅读”,是否有了图画这一工具,学生就能初步把握文章主要内容?第三学段不再提把握文章主要内容的要求,直接提文章的表达顺序、基本表达方法的要求,还提出对叙事性作品要求了解事件梗概,而梗概是比主要内容简单、粗略的。因年级而定的能力层级不明显,命题难度大。一份试卷似乎可以不同的年级通用。
第三,标准与学情的关系调整不顺。课标对能力层级的表述含糊,借鉴国外大型测试,又发现学生达标率不够理想,如何调整这二者之间的关系,合理引领一线教学逐步提升?在国家义务教育质量监测的试卷没有公开的情况下,区域性质量监测命题如何探索适合自己发展的路径?是否可以依据学情适当调整标准,引领学生逐步发展?
我市小学语文从2012年开始研究PIRLS(国际阅读素养进展研究项目)测试,2015年进入实际筹备阶段,2016年正式开展市级质量监测。通过这几年不断摸索,总结出解决以上三个难题的一些经验。
一、借鉴布卢姆教育目标分类学框架,明确知识到能力的转换条件
根据布卢姆教育目标分类学修订版的划分,知识有四个维度:事实性知识、概念性知识、程序性知识和元认知知识。课标中也涉及这四个维度的知识,如识字方法、阅读方法、强调“养成良好的语文学习习惯,初步掌握学习语文的基本方法”。方法是程序性知识,习惯含有元认知知识。正是由于对后两个维度知识的学习与掌握,前两个维度知识才得以由“知识”转换成“能力”。概括文章主要内容向来是阅读的首要任务,也是高年级阅读测试的必考题,但事实上,学生在学习一篇篇课文时只记住了课文主要内容(这属于事实性知识),而没有学到概括课文主要内容的方法,更没有展开充分的实践(这属于程序性知识及其运用),因此,学生在测试中丢分严重,害怕课外阅读测试。
布卢姆教育目标分类学修订版除了界定知识的四个维度,还提出认知过程的六个维度十九个小类:记忆/回忆,理解,应用,分析,评价,创造。把知识维度和认知过程维度纵向横向联系起来看,发现每一个维度的知识都有六个认知维度,且交替螺旋式发展。这启发我们语文质量监测在考虑知识维度的同时还要考虑认知过程维度,避免事实性知识、概念性知识考查过深、过难,又兼顾到程序性知识、元认知知识的隐性考查。对此,我们作了如下探索。
积累与运用部分的“看拼音写词语”是老题型,将其换成“读句子,看拼音写词语”:
八旬老人上山采药不慎滑下山坡被困。解救时,不管消防官兵们如何轻轻地nuó yí( )他的身体,老人还是痛得咬紧牙关。他既没有k6ngshēng( ),也没有chōu yē( ),多么顽强啊!(2018年我市某区六年级毕业考试题)
看起来只是多了具体语境,考查学生词语运用的水平(属于事实性知识应用),其實也考查了学生程序性知识的应用。学生需要先拼读拼音,再结合语境排除同音字或拼错音造成的错字,最后梳理括号处三个词语的联系并确认书写正确。
阅读与欣赏部分的课外阅读考查更是注重对程序性知识、元认知知识的理解、应用、分析甚至评价。一定的识字量是学生阅读的基础,基本的句段篇、修辞、表达技巧方面的概念性知识是学生阅读的保障,但如何从文字表面人手理解文章的内容、表达形式,再到评价文章内容、作者观点、表达特色等,还需要程序性知识和元认知知识的帮助。
程序性知识、元认知知识的考查符合语文课程的性质。PIRLS(国际阅读素养进展研究项目)、PISA(国际学生评估项目)阅读评估框架以理解过程为考查要点,其实就是注意到了这一方面。无论是PIRLS的“关注并提取明确陈述的信息,进行直接推论,解释并整合观点和信息,检视并评价内容、语言和文本成分”四个层级,还是PISA的“访问和检索、整合和解释、反思和评价”三个层级,都一定是四个知识维度的综合运用。因此,小学语文质量监测必须厘清要考查什么知识和知识的运用程度即认知过程维度。
我市在命题双向细目表上已有一定的体现。详见表1。
能力指标1指向的是事实性知识、概念性知识,能力指标2指向的是程序性知识、元认知知识。能力层级也分为两部分,前者指事实性知识或概念性知识的达标情况,后者指程序性知识或元认知知识的达标情况。虽然程序性知识与元认知知识的达标情况难以从试题的最后得分看出,但在考试观察中,可以借助学生答题的速度和答题后的访谈得出部分结果。有了这些努力与尝试,命题时就能适当兼顾,使试题更能检测出学生的真实水平和达标状况。
综上所述,区域性的小学语文质量监测要真正起到诊断、改进的作用,必须有全面正确的知识观,明白由知识到能力的转换通道,命制合适的题目、题型加以检测。
二、努力设置适切的情境,合理区分不同年级的能力层级
一份试卷到底适合测评哪个年级的语文学业质量?情境是其中至关重要的因素。试卷中的阅读材料,小到一句话,大到一篇文章,都是具体的语言情境。这个具体的语言情境是否适合该年级的学生水平,就决定了试卷的难度、效度。北京师范大学语文教育研究所李英杰、王红梅认为:“信息是影响不同种类阅读任务难度的共同因素。并且,PISA在表格中反复强调的是信息的数量、排列方式、明确程度、复杂程度等因素。由此可见,文本信息的特征是影响读者信息加工的基础因素。然后是读者自身已有经验的丰富程度,即对文本内容的熟悉程度;最后是信息加工的复杂程度,即对信息的筛选提取、关联比较、整合反思,不同的加工要求。”一个复杂的语言情境所包含的信息必定比较复杂,反之亦然。而复杂的语言情境对学生而言也会比较陌生。因此可以这样认为,要命制一份能力层级合适的试题,必须考虑选择适合学生已有知识、经验背景的语言情境,设置合理的阅读任务(信息加工要求)。特别是在阅读文本材料的选择上要仔细斟酌、筛选。
1.合理配置各部分比例
教育部基础教育质量监测中心组织的国家义务教育质量监测(以下简称“国检”),连续几年的小学语文四年级监测框架基本分为“积累与运用”“阅读”“习作”三大部分五种能力(识字写字能力、古诗文诵读能力、文学类文本阅读能力、实用类文本阅读能力、书面表达能力),我省的四年级语文质量监测框架与国检相同,其中各部分所占分值比例大约为33%、52%、15%,题量比例为41.3%、55.2%、3.4%。2007年教育部组织开展的中小学生学业水平测试中,小学三年级语文三大部分的题量所占比例大约为58.8%、38.2%、2.9%。我市小学语文五年级质量监测三大部分的分值比例为26%、46%、28%(其中含2分书写分),题量比例为38.23%、58.8%、2.9%;我市小学语文三年级质量监测三大部分的分值比例为40%、32%、28%(其中含3分书写分),题量比例为48.3%、48.3%、3.2%。
不管从题量还是分值看,习作都占最小份额,基础题部分随年级升高而递减,阅读则反之。我市的小学三年级、五年级质量监测按这样的比例设置,均分可达80分左右,师生的压力都不会太大。一份试卷包含三大部分,首先保证了试题效度。其次,各部分比例的差别设置也就是情境难易度的差别控制。积累与运用部分虽然也强调基础字词句等事实性知识和概念性知识的运用,但设置的情境都相对短小、简单,一句话、几句话或一段话,内容也是尽量接近学生的背景经验,甚至源于教材。阅读中的文本至少都是两段话,几百个字,信息量增大很多。因此积累与运用的比例越大,试题的难度就越低,年级的区分就明显了。
2.精心创设不同层级的情境
积累与运用部分重基础,似乎没有难度区别,其实它的难度系数可以利用情境间的区别度制造干扰而进行控制。如:
将词语填入句子中,最恰当的是( )(2018年我市小学五年级质量监测试题)
人生在世,成功并非易事,它需要破茧而出的决心,______的毅力,永不放棄的信念。
A.水滴石穿 B.坚贞不屈
C.入木三分 D.赴汤蹈火
将词语填入下面文段中,最恰当的是哪一组?(2019年我市小学五年级质量监测试题)
一百年前,在民族危难之际,三千多名北京学生走上街头,掀起了轰轰烈烈的五四爱国运动。他们为了国家利益,_______,在所不辞。这种爱国行动,赢得全国各地学生、工人、商人们的热烈响应,大家_______,救国家于危亡。
A.含辛茹苦扶危济困
B.肝胆相照废寝忘食
C.绞尽脑汁冲锋陷阵
D.赴汤蹈火同心协力
前者句子短,但暗藏“破茧而出”与“水滴石穿”的修辞运用技巧,得分率为0.5;后者句子长了些,但都是简明易懂的表达,且选项间可以运用排除法选择,得分率为0.89。
积累与运用部分利用小情境控制难度,阅读部分在文本选择上更是需要谨慎。2017年我省迎接小学四年级国检时,在文学类阅读部分曾选择了王宜振的童话《鹿树》和贾赛赛的散文《一碗水》,童话比较符合儿童的背景经验,其表达的“友爱”这一主旨也比较容易理解,得分率比较高;散文比较含蓄,其表达的主旨“不要以貌取人,应平等关爱”对儿童而言比较难发现、理解,得分率较低。从此,省监测所用的文学类文本基本都是童话故事,且篇幅控制在1100字左右。
3.适切提出信息加工要求
设置阅读部分的试题时,适当控制题目要求即信息加工要求也能在一定程度上控制难度。
文中“八岁的儿子”给你留下怎样的印象?请先用合适的词语概括,再从文中找出依据说明。(2019年我市小学五年级质量监测试题)
文中的“我”这位爸爸给你留下怎样的印象,请结合文本举一个例子加以说明。(2018年我市小学五年级质量监测试题)
这两题类型一样,都属于检查和评价文本内容,前者没有要求举一个例子,学生就会想着要全面概括这个儿子的形象特点,参考标准又要求学生从两个角度概括出这个儿子的主要特点(天真、可爱、有好奇心、探究欲;懂事、爱奶奶),难度较大,得分率为0.63;后者只需写出一个方面即可,难度较低,得分率为0.79。
题型也是控制难度,调整能力层级的好办法。一般来说,选择题的难度小于简答题,尤其是开放性简答题。2007年教育部组织的中小学生学业水平测试(三年级),三个文本全是选择题。我省这两年的小学语文四年级质量监测,基本是一个文本6道选择题,2道简答题。PIRLS测试(四年级),一个文本7道选择题,4道封闭性简答题,3道开放性简答题。我市小学语文五年级质量监测,基本是一个文本7~8道选择题,2~3道简答题。特别是在概括能力(即解释并整合观点和信息)的考查方面,为了降低难度,就以选择题的形式出现,如:
第八段中“人生问题”指的是( )
A.玮玮经常命令我做很多事
B.小孩一直把父亲当成众神之王
C.玮玮常常把电视占为己有
D.现代儿童以“小电视人”的方式成长
要回答这一道题,学生需要读懂整段话、整篇文章,但有了选项的指引,此题的得分率高达0.91。
4.科学调配认知过程维度间的比例
要比较清晰地区分不同年级试卷的能力层级,除了以上提及的情境设置,控制信息及信息加工难度之外,科学调配认知过程维度间的比例也可以控制信息加工不同要求间的难易程度。PIRLS的阅读测试比例框架可以给我们参考。两种阅读目的基本各为50%,四个阅读理解过程的占比呈菱形结构,具体见表2。
PIRLS评价的阅读目的和过程及其比例,在不同年份稍有变化,但总体保持菱形结构。也就是说,最难和最简单的理解过程比重较小,中间程度的理解过程比重较大。这样就能保证试题难度控制在中等难度状态。PIRLS2011设立新的评估体系,以照顾低水平学生的测试需要,“关注并提取明确陈述的信息”占到50%,“作简单、直接的推论”占25%,最后两个理解过程合起来占25%。这样的比例设置明显降低了难度。
我市2018年三年级、2019年五年级的测试都比较平稳,薄弱区域也能达到均分80左右,其比例設置如表3。
三、适当调整标准与学情间的差距,真正发挥监测的诊断功能
以能力为导向的测试变革,因为命题者的理解与实际操作存在差异,加之教学改革总是比较滞后,所以一时之间,带给师生的压力比较大。为了保持正常的教学秩序,稳步推进教学改革,我市在试题命制方面采取了适当调整标准与学情间差距的方式。表3与表2间的比例差别就是一个说明。其实2017年我市开展的五年级质量监测,试题难度较大,三大部分的占比分别为:积累与运用占20%,阅读占45%,习作占35%,其中高阶阅读理解过程占比也比较大。2018、2019两年的五年级质量监测提高了积累与运用部分的占比,分别为28%、26%,高阶阅读理解过程占比则下降。从表4可以看出三年来阅读部分各理解过程的比例调整轨迹。
从监测结果看,2017年的阅读部分市平均得分率为0.62,2018年的阅读部分市平均得分率为0.72,2019年的阅读部分市平均得分率为0.82。2019年这样的比例比较适合我市学情。当然我们的不足也很明显:低层次的理解水平占比偏大,高层次的理解水平占比偏小,尤其是解释、整合观点和信息层次,历来是我市学生的薄弱之处。
2018年的试题比例接近2019年,阅读部分低层级理解水平的比例也较大,成绩却不够理想,原因在于文本选择与学生背景经验距离较大。文学类文本选的是我国台湾作家林良的《小电视人》,虽然充满儿童情趣,但作者运用了一些台湾特色的口语表达,学生一下子不适应。信息类文本选的是文化遗产方面的资料,信息量较大,其中《世界遗产名录》的文化遗产项目入选标准,专业术语较多,造成阅读困难。2019年,文学类文本选的是梁晓声的《母亲养蜗牛》,也富有儿童情趣,虽然文中母亲的形象很特别,内涵丰富,较有难度,但是命题时我们改从儿子的角度人手,体会文中儿子的形象,既达到了理解文本的要求,也能检测出学生的水平。信息类文本选的是科技领域前沿的新发明《哈佛水下机器人的柔软抓手》,原文中一些拗口的专业术语表达适当改造后,学生也完成得比较好。
综上,根据学情适当调整试题与标准间的距离,能让我们更清楚自身存在的差距,更有信心地去接受挑战。
质量监测是一项非常具有挑战性的任务,面对监测热的情况,一线教师、教研人员更应冷静下来思考,如何解决监测的困难,真正引领教学改进。如果有了对知识的正确理解,积极将知识转化为能力,就无须担忧能力导向的质量监测;如果能掌握一定的能力层级划分技巧,自行命题时就能有质量;如果能主动依据标准,根据学情作调整,师生就均能身心愉悦地接受挑战,更上一层楼。