数学核心素养测评之初中试题及评分标准设计
2023-06-10胡典顺李俊岳
胡典顺 李俊岳
胡典顺 华中师范大学数学与统计学学院教授、博士研究生导师,华中师范大学数学教育教研室主任,湖北省中学数学教学指导委员会副主任委员;《数学教育学报》《数学通讯》编委,鄂教版高中数学教材(2019年版)副主编,中国国际文化交流基金会第三届“明德教师奖”获得者;曾以访问学者的身份,由国家留学基金委公派访问美国特拉华大学;在《课程·教材·教法》《中国教育学刊》《数学教育学报》《教育科学研究》等期刊上发表论文270余篇,出版《基于数学意义的数学教学改革研究》《整合技术的学科教学知识:从教师专业素养到教师教学实践》《中学生数学素养测评的模型建构与实证研究》等专著,主持多项全国教育科学规划项目和教育部人文社会科学研究规划基金项目。
《义务教育数学课程标准(2022年版)》在学业水平考试命题原则中阐述了考试评价与数学核心素养之间的关系。面对新课标要求,命题者需要从核心素养视角下的学业质量水平评价出发,规范命题行为,力求实现对核心素养导向的义务教育数学课程学业质量的全面考查。本文基于“WJ市义务教育核心素养监测”试题,阐述适用于第四学段的数学核心素养测评试题及评分标准设计。
一、试题案例
案例一:填数字
杨辉三角是中国古代数学的杰出研究成果之一,最早出现于中国南宋数学家杨辉于1261年所著的《详解九章算法》中。393年后,欧洲的帕斯卡也发现了这个规律。因此,杨辉三角也叫作帕斯卡三角形。杨辉三角中的数字排列如图1所示,其特征之一是:从第2行开始,每个数等于它“肩上”两数之和。
小周和小乐正在玩类似的填数游戏,规则如下:在表1的空格①至空格⑦中填上适当的数,使得从第二行起,每个数等于它“肩上”两数之和,且最终结果是45。
问题1 下面是小周和小乐分别给出的空格(1)和空格(2)中数字的答案,这些答案正确吗?对每个答案涂选“是”或“否”。
问题2 请你再写出两组满足游戏规则的数字。
问题3 请你根据问题1和问题2中满足游戏规则的情况,猜想空格①与空格②中的数字之间满足的规律,并给出解释。
案例一立足科学情境,主要考查“数与代数”相关知识。其中,问题1考查学生对题目中相关知识的认识,涉及运算能力、推理能力两大素养;问题2考查学生对知识的运用水平,需要学生具备一定的创新意识和推理能力;问题3聚焦抽象能力和推理能力,考查学生对相关知识的综合运用。3个问题涉及的思维过程分别为“数学表述”“数学运用”和“数学阐释”。
案例二:微信投票
某微信公众号为吸引粉丝关注推出了一个比赛活动,活动包含网上投票环节,得票数从高到低排名前五的参赛者将获得相应的奖品。参赛者可邀请自己的亲朋好友为其投票,投票需要先关注该微信公众号,再点击“投票”。在为期8天的投票活动中,该微信公众号的粉丝增长情况如表2所示。
问题1 在比赛活动之前,该微信公众号的粉丝数是( )。
A.4047 B.4226 C.4290 D.4469
问题2 网上投票环节使得该微信公众号每日的新关注人数大大增加。由表2可知,第1~第8天平均每天新关注人数增加了 __________,最多一天增加了 ____________(结果保留整数)。
问题3 请画出第1天到8天净增关注人数的折线图,并叙述净增关注人数的变化趋势。
案例二立足社会情境,题目以微信投票问题切入,主要考查“统计与概率”相关知识。问题1主要考查数据观念和运算能力,思维过程为“数学运用”;问题2同样考查数据观念和运算能力,思维过程为“数学表述”;问题3是一道开放性问答题,主要考查数据观念和模型观念,思维过程为“数学阐释”。
案例三:地砖密铺
在家庭装修中,地砖的铺设是一项重要工作。地砖密鋪又称地砖镶嵌,指用形状、大小完全相同的一种或几种地砖进行拼接,彼此之间不留空隙、不重叠地铺成一片。图2是地砖密铺的一种形式。
问题1 请你画出用正三角形地砖密铺的图形。
问题2 图3是用黑白两种颜色的正六边形地砖按一定规律密铺的。按此规律,第(4)个图案中有白色地砖_________块。
问题3 若按照问题2中的规律大面积密铺,你能猜想出黑白地砖之间的数量关系吗?请简要说明。
案例三以“铺地砖”引入,属于个人情境,主要考查“图形与几何”相关知识。问题1考查平面图形的知识,思维过程为“数学表述”,考查的数学核心素养为几何直观和应用意识。问题2考查学生能否根据平面图形找出相应的代数规律,思维过程为“数学运用”,考查的数学核心素养为几何直观和推理能力。问题3是一道开放性问答题,考查学生的推理能力和抽象能力,思维过程为“数学阐释”。
二、设计概述
1.设计理念
《义务教育数学课程标准(2022年版)》针对教材内容设计提出:“要拓宽视野,要反映数学在自然与社会中的应用”,“展现数学发展史中伟大数学家,特别是中国古代与近现代著名数学家”的成果,“以及他们的数学成果在人类文明发展中的作用,增强学生的爱国情怀和民族自豪感”。试题设计也应如此,以素养立意,设计如“填数字”“微信投票”“地砖密铺”等情境问题,能拓宽学生视野,更好地落实数学核心素养导向下学业质量水平测评的目标。
2.设计分析
我国数学核心素养测评注重考查学生的数学关键能力、思维品质以及情感、态度与价值观的综合体现。因此,本研究参照PISA2012测试,通过从情境领域、内容领域、过程领域、数学学科核心素养四个方面设计不同类型的测试题,从学生基本信息、数学学习基本情况、数学学习价值观、数学学习品格四个方面设计调查问卷,对初中生的数学核心素养水平进行监测。同时,由于小学阶段学生的核心素养表现侧重于意识,而初中阶段学生的核心素养表现侧重于观念,所以初中阶段数学核心素养监测更加注重考查学生理解和运用概念的能力水平。
与一般的学业水平考试相比,核心素养测评的特点主要体现在以下三个方面。
命题过程。素养测评的命题过程是在一个完全独立、封闭、高度保密的状态下进行的,命题人以及相关工作人员需要提前签订保密协议书,并且严格使用公开的质量控制文本。整个命题过程先后经历了明确试题测评目标、编写备选题目、专家审核并筛选备选题目、形成试题统计表、预测试、检验与修订试题、确定正式试题的工作环节,以确保所有的试题都得到充分的讨论和验证。
试题难度。得分率是反映试题难易度的关键指标。素养测评命题过程中,无论是准备提交的试题,还是试测后准备纳入“主测试题库”的试题,都尽量保证试题的难度与试题的能力要求之间存在正相关,尽量控制或减少非测试因素对试题难度的影响。此外,素养测评命题还注意避免可能由试题阅读量大所引起的学生解答困难的情况。
题型使用。素养测评命题十分注重题型对学生完成试题情况的影响。由于题目要充分显示学生在数学核心素养方面的水平层次,所以试题题型涵盖了选择题、封闭型试题和开放型试题。具体的题型依据测试的内容载体和能力要求综合选定。选定过程,除了依靠命题人的经验性主观判断,研究者还充分利用概化分析手段对小规模预测试后所得的数据进行分析,从而优化题型与内容和难度的匹配度。这样做有利于针对考核目标及能力要求,检验相应题型的功能,进而实现题型的优化。
3.评分标准
本测评项目旨在促进教育改革、改善教育政策,其评价标准的设置与以往一般的考试命題不同。分析学生在不同难度水平上的答题情况,能更好地对学生的分数做出解释,进而说明达到某个分数的学生可以做什么。
根据国际学生评估项目中国上海项目组划分精熟度水平等级的方法,研究者在学生监测成绩总分集中,先去除5%的学生最高成绩和5%的学生最低成绩,再将监测成绩从低到高分为0~6七个水平等级(每个水平等级对应一个分数区间),就得到测评项目的学生数学精熟度水平划分。其具体描述如下。
水平6:能基于对复杂问题情境的研究和建模,对所获得的信息进行概念化、概括并加以运用。即学生能进行高水平的数学思维和推理,他们运用领悟力和理解力,以及所掌握的符号化和形式化的数学运算和关系,提出新的方法和策略来破解陌生情境中的问题。
水平5:能在复杂的情境下简化并使用模型,识别限定条件并列出假设。即学生能选择、比较和评估适当的问题解决策略,解决与该模型相关的复杂问题。
水平4:能在可能包含限定条件或要求进行假设的复杂、具体情境下有效运用明确的模型。即学生能选择和整合包括符号性表征在内的不同表征方式,直接将其与实际情况建立联系,并在解决问题的过程中较娴熟地运用技能,较灵活地推理,表现出一定的洞察力。
水平3:能执行表述清晰的行动步骤,包括要求连续决策的步骤;能选择和运用简单的问题解决策略。即学生能够理解和使用基于不同信息来源的表征,并进行直接推理;能通过简短交流,阐述他们的解释、结果和推理。
水平2:在仅需要直接推断的情况下能够解释和识别条件情境。即学生能从单一来源中提取相关信息,利用单一的表征模式进行简单的直接推理,并解释结果的表面意思。
水平1:能回答熟悉的情境中包含所有相关信息且明确界定的问题。即学生能在明确的情境中根据直接指示找到信息,并按照固定程序执行那些显而易见的动作。
水平0:不具备基本的解决问题的能力。即学生无法建构问题情境与数学知识之间的联系,无法在信息源和多元表征间自由转换。
在拟定数学核心素养测试题的评分标准时,研究者更加关注学生核心素养水平的表现。试题命制后,研究者通过抽样测试收集不同水平学生的答案作为样例,并依托样例反思和修正试题的不足,调整试题的难度和区分度。这为阅卷教师通过对照样例中不同水平的具体表现,细致、客观地给出终结性评价提供了条件。
为了细化和标识同样分数下学生的不同策略选择,研究者根据试题的难易度,结合学生的作答思路,给出每道题的双位制编码。双位制编码的首位给出的是学生应得的分数;末位则按照学生在解决给定问题的过程中所使用的策略,或者按照阻碍学生得出正确解决方案的错误概念给出特定代码。以案例一中的问题3为例,按照以上步骤制定的评分标准如右表所示。
双位制编码为判断和分析学生在不同测试领域中的能力水平提供了有力的证据,有利于后期的数据分析和最终评估。需要注意的是,学生作答时如果出现新思路或者创造性方法,研究者应根据题旨增加合适的编码;如果出现与问题无关的作答思路,则无论正确与否,都不予给分。编码后,命题人根据样例为每种编码赋分,使编码与赋分一一对应,如上表中编码09和编码00可均赋0分、编码11~61可依次赋1~6分。这样做,不但能获得学生在试题上的具体能力表现,发现学生的认知特点,而且能使实际考核目标与测评框架中的相应内容及作答表现一致。
(李俊岳系华中师范大学数学与统计学学院硕士研究生)
[专栏文章系教育部人文社会科学研究规划基金项目“中小学核心素养测评的模型建构与实证研究(19YJA880012)”、中央高校基本科研业务费项目“新高考分省市命题分学科质量评价指标体系研究(CCNUTEI2021-13)”的研究成果]
责任编辑 刘佳