基于核心素养测评框架的新高考数学全国卷试题评价研究

2024-01-06首都师范大学教育学院唐明超邮编100048

中学数学教学 2023年6期

首都师范大学教育学院唐明超 (邮编:100048)

云南师范大学数学学院张勇 (邮编:650500)

1 问题提出

《普通高中数学课程标准(2017年版)》首次明确了高中数学核心素养的概念与成分,提炼出“情境与问题、知识与技能、思维与表达、交流与反思”等体现数学学科核心素养的四个方面,再根据核心素养的具体表现及其难度差异将高中数学学业质量划分为三个水平,依次代表学业水平考试、高考、大学自主招生考试的要求.历年高考试题的命制紧扣水平二,试题的呈现方式、考查内容、以及综合难度既决定了核心素养的不同水平层次,也是对核心素养内涵与具体表现的刻画.构建并完善一套既能体现数学学科核心素养的四个方面,又能突出函数、几何与代数、概率与统计、数学建模与数学探究等四条内容主线,还能评价核心素养各水平考查比重的测评框架具有现实意义,不仅能指导命题工作,还能服务于课堂教学.在核心素养测评框架的指导下,试题的命制要能针对性地考查学生的某个或某几个数学核心素养发展水平层次,整套试卷才能真正体现素养立意、能力并重的原则[1];一线教师使用测评框架对具体试题或试卷进行综合测评,便于掌握核心素养考查方式以及试卷的命题特点,间接反哺教学工作.

新高考数学试卷的命制顺应新高考改革总体要求,贯彻高考评价体系,参照《新高考过渡期数学科考试范围说明》确定考试范围,重点关注新旧两版课程标准中的相同内容[2].但是,试卷是如何体现以上要求的,不同年份的不同试卷对核心素养的考查有何异同,是否存在某种规律,对高中数学的教学与备考工作有何启示,这些都是广大师生极为关切的现实问题.所以,有必要对近三年的新高考数学全国卷进行系统的比较研究,聚焦核心素养考查情况,结合典型试题的命题分析,总结试卷的命题特点,解读试卷所承载的高考核心功能及其表现形式,为数学教学与考试命题提供参考.

2 文献综述

喻平给出数学核心素养评价框架之前,刘小慧等人对高考数学试卷中的核心素养考查情况做过分析,但局限于解题研究,仅宏观阐述试题的命题特点与教学建议,尚未建立素养评价框架,缺乏系统深入的实证研究.喻平[3]认为,虽然课程标准对数学核心素养做了相应的水平划分,但是对核心素养发展水平的评价需要更加明确的、可操作的统一标准.在综合比较布卢姆(Bloom)认知目标分类理论、PISA模型(2012)、彼格斯(Biggs)学业水平分类方法SOLO模型等三个理论优缺点的基础上,从知识与能力的辩证关系深度剖析数学核心素养的内涵,提出一个由知识理解、迁移、创新三个维度组成的数学核心素养测评框架,对日常教学与考试评价具有一定指导意义.

当然,喻平给出的数学核心素养测评框架也存在一些问题,虽然将知识学习过程作为评价数学核心素养发展水平的依据具有较好的理论基础和可操作性,但是缺乏对核心素养具体表现的进一步总结与提炼,对知识理解、知识迁移与知识创新各水平的评价标准没有进一步细化和阐述,导致一线教师使用测评框架对试题进行分析时容易出现理解错位,影响测评的信度和效度.俞梦飞,章飞[4]等人进一步丰富了喻平的核心素测评框架,对每个核心素养的具体表现都进行了凝练,从知识理解、知识迁移与知识创新三个维度进行细分,给出评价标准的内涵解析,据此对江苏卷高考试题进行评价研究,彰显出较好的操作性与实用性.李华,胡典顺[5]等人结合高中数学学科特点,深入解读喻平数学核心素养测评框架中三个水平的内涵与表征,运用测评框架对2019年高考数学全国卷进行测评,并对测评数据进行多元统计分析,归纳核心素养考查特点,给出命题与教学改进建议.

俞梦飞、李华等人对数学核心素养测评框架的完善都是基于具体研究工作的实际需要,各有优缺点.俞梦飞改进后的测评框架加入了核心素养的具体表现,呈现出三级评价指标,能够更加细致地评价试卷对核心素养各个具体表现的考查情况,更适用于同一地区、相同类型的试卷评价;对不同国家或具有不同结构特点的试卷进行测评可能会产生不必要的误差.李华等人则是沿用喻平的测评框架,对核心素养具体水平的划分标准给予说明,适用于不同类型的试卷分析.张玉环[6]等人综合比较了俞梦飞和李华的研究工作,采用李华的数学核心素养测评框架对中法高考数学试题进行比较研究,为研究不同国家高考试题的核心素养考查情况提供了参考范例.

3 研究设计

3.1 研究对象

选取2020—2022年6套新高考数学全国卷共172道试题作为研究对象.试题包含单项选择题、多项选择题、填空题与解答题,由于不同类型的试题赋分值不相同,为尽可能控制变量、消除误差,研究过程中总题量的统计以解答题中的每个小题为计数单位进行累加.其中,2020年首次使用新高考数学全国卷,两套高考试卷只有第18题与第21题不同、其余试题均相同.

3.2 研究工具

2017年版普通高中数学课程标准对六大数学核心素养的内涵、具体表现以及育人目标做了纲领性的阐述.为了能够根据核心素养的具体表现客观分析试题所考查的核心素养具体成分及其水平,需要对课程标准描述的核心素养具体表现进行深度解析,试图进行归类与提炼,用更浅显且容易被理解的文字将其表达出来.此处仅以数学抽象核心素养的评价指标构建为例,解读数学试题核心素养测评框架的生成逻辑.

数学抽象是学习主体对数量与数量关系,图形与图形关系的抽象,具体表现为获得数学概念与规则,提出数学命题和模型,形成数学方法与思想,认识数学结构体系[7].根据弗赖登塔尔的数学化观点,“获得数学概念与规则,提出数学命题和模型”反映的是对客观世界的数学化表达;“形成数学方法与思想,认识数学结构体系”是对数学本身的数学化加工;两个数学化过程呈层级递进式关系,由浅入深经历了认识抽象物,形成抽象物,抽象地思考三个阶段.这三个阶段很好地解释了数学抽象的本质,所以数学抽象核心素养的具体表现可以归纳为对抽象物的认识与理解,形成抽象物,抽象地思考问题三个要素.再参考喻平数学核心素养测评框架中对核心素养发展水平的划分依据,从知识学习的三个过程对核心素养的具体表现也作类似的水平划分.数学抽象核心素养的第一个具体表现是认识抽象物,水平划分如下.水平1:知识理解,评价依据:学生能够在既定的情境中用数学语言描述给定对象;水平2:知识迁移,评价依据:学生能够运用已有数学知识经验对研究对象开展探究;水平3:知识创新,评价依据:学生通过探究活动与已有知识结构建立联系,丰富认知.其余核心素养各具体表现的水平划分详见表1.

表1 数学试题核心素养测评框架

3.3 编码方法

试题的编码过程分为水平划分、赋分、小组讨论三个步骤.第一步,由包括作者在内的5位老师独立完成172道题的解析,严格对照表1所示的测评框架,给出每一道试题所考查的核心素养成分、具体表现以及对应的水平.第二步,根据水平划分结果和试题所占整套试卷的分数,综合考虑核心素养考查的主次顺序,合理划分核心素养具体表现在各个水平上的得分.第三步,对核心素养水平划分结果以及赋分值差距较大(大于1分)的试题进行综合研讨,以主流观点确定试题的水平划分结果,再请长期从事高考试题研究与省市统测命题的专家进行复审,最后取5位老师赋分的平均值作为核心素养具体表现各水平的最后得分.部分试题的分析与编码过程如下.

A. 1.0×109m3B. 1.2×109m3

C. 1.4×109m3D. 1.6×109m3

解析与编码例1以学生熟悉的南水北调工程为背景,考查四棱台的性质与体积计算.问题解答的关键在于能够根据实际情境抽象出数学模型,通过对模型的分析选择恰当的算法完成计算.重点考查数学抽象、数学建模与数学运算核心素养;虽然也涉及逻辑推理,但不作为主要成分可忽略不计.首先需要在具体情景中用数学语言描述给定对象的特征,进而作出立体图形得到四棱台,提炼数量关系明确计算目标,选择恰当的运算方法(体积公式)完成试题解答.涉及到数学抽象核心素养的认识抽象物之理解水平(A11)以及形成抽象物之理解水平(A21);数学建模核心素养的发现并提出问题之理解水平(C11)以及建立求解模型之理解水平(C21);数学运算核心素养的运用算法之理解水平(E21).考虑到数学抽象与数学建模为主要成分,可赋分如下:A11=A21=1分,C11=C21=1分,E21=1分.即使部分学生会使用棱锥体积相减进行转化求解棱台体积,导致步骤相对复杂,试题运用棱台体积公式进行计算是最佳选择,故测评过程只考虑后者.

4 研究结果

对照表1所示的测评框架,运用编码方法得出每一套试题在6个核心素养15个具体表现共45个水平上的初始得分.再从核心素养总体分布、各具体表现分布、各水平分布三个角度对数据进行分类汇总,计算出各要素的测评分数占试卷满分(150)的比重,运用直观比较与多元统计分析方法从不同角度对历年新高考数学全国卷的核心素养考查特点进行分析与总结.

4.1 核心素养总体分布情况

(1)直观比较

根据表2数据绘制的雷达图1中可以看出,数学运算核心素养在历年新高考全国卷中考查占比最大,其次是逻辑推理与直观想象,三者累计占比在历年试卷中均超过70%.2022年累计占比最大,超过80%.数学建模考查占比最小,数据分析次之,占比均低于10%,考查分数低于15分;说明试卷虽兼顾考查6大核心素养,但整体分布不均,对数学建模与数据分析素养的考查比重较小.按年份来看,历年逻辑推理与数学建模核心素养的考查比重Ⅰ卷均大于Ⅱ卷;历年数学运算与数据分析核心素养的考查比重Ⅰ卷均小于Ⅱ卷.按试卷类别看,Ⅱ卷考查数学抽象、逻辑推理、直观想象等核心素养的比重呈逐年下降的趋势,考查数学运算的占比呈逐年上升趋势;Ⅰ卷考查数学建模与数据分析的比重呈逐年下降趋势,考查数学运算的占比呈逐年上升趋势,对其余核心素养的考查占比略有波动,无明显变化规律.

图1 近三年新高考数学全国卷核心素养考查总体分布图

(2)相关程度对比分析

用SPSS22统计软件对历年试卷中的核心素养考查比重进行相关性检验,可以直观反映具体核心素养的考查分布特点.以试题编号为变量,计算Spearman等级相关系数均大于0.886,在0.05水平上显著,说明6套试卷的核心素养考查比重具有较好的相关性.其中,新高考Ⅱ卷的相关性整体好于新高考Ⅰ卷,反映出历年新高考Ⅱ卷对核心素养的考查比重比Ⅰ卷更稳定.以核心素养为变量,计算Spearman等级相关系数,发现数学建模与数学运算的相关系数为-0.806,逻辑推理与数据分析的相关系数为-0.719,在0.01水平上显著负相关;数学抽象与数据分析、数学建模、逻辑推理均成正相关,数学运算与其它核心素养均呈负相关.

4.2 核心素养各表现分布情况

(1)直观比较

从表3可以看出,数学抽象核心素养在历年试卷中的主要表现是抽象思考.逻辑推理的主要表现是演绎推理.数学建模的主要表现是建立求解模型.直观想象核心素养的考查兼顾数形结合与空间想象,但数形结合的比例整体大于空间想象.数学运算核心素养的主要表现是运用算法和设计算法,运用算法所占比例整体高于设计算法与理解算理.数据分析的主要表现是对数据的认识,较少考查数据处理.运用算法解决问题是历年核心素养考查中占比最大的表现维度,其次是演绎推理与设计算法.数学建模核心素养的发现并提出问题(C1)与检验和完善模型(C3)两个表现在历年试卷中的占比较小,部分年份没有涉及.说明试卷不仅对核心素养的考查比重存在显著差异,对核心素养各个具体表现的考查也存在显著差异.

表3 核心素养具体表现考查分布表

(2)受重视程度对比分析

为进一步分析核心素养具体表现在历年新高考数学全国卷中的受重视程度,对6套试卷的15个核心素养具体表现所占比重采用平均联接方法进行系统聚类分析,测量区间选择平方Euclidean距离,聚类结果以谱系图的形式呈现,详见图2.

图2 近三年新高考数学全国卷核心素养具体表现聚类谱系图

基于数据的分布特点与谱系图的基本特征,结合现实意义解读,可以确定聚类数为4.以C1,C3,A2,F1,A1,C2为第一类;以E1,F2,D1,B1,A3为第二类,D3,E3为第三类;B2,E2为第四类.说明每一类中的核心素养具体表现在历年试卷中的受重视程度具有很大的相似性,第四类最受重视,其次是第三类,第一类受重视程度最低,很好地印证了直观分析的结果.

4.3 核心素养各水平分布情况

(1)直观比较

从表4可以看出,历年新高考试卷对数学抽象核心素养的考查主要体现在迁移水平,占比明显大于理解与创新水平,说明新高考试卷突出综合性与应用性.逻辑推理的创新水平考查比重显著高于理解水平与迁移水平,说明新高考试卷具有较强的灵活性,具有打破试题的固化模式,淡化解题技巧,着重考查理性思维的趋势.数学建模核心素养考查比重较小,理解水平与创新水平所占比重相当,说明考查数学建模的试题不仅强调真实情景的创设,呈现方式也具有较好的创新性,既考查学生的信息加工与整合能力,也考查发现并提出问题的能力.对直观想象核心素养的考查聚焦迁移水平,其次是创新水平,理解水平考查比重较小,说明试卷更强调通过联想与作图来刻画相对复杂的数量关系,再根据图象特点与图形关系分析并解决实际问题;立体几何试题突出考查想图、作图、识图与用图的意识和能力,代数试题突出考查数形结合思想.数学运算重点考查理解与迁移水平,彰显学科特点,能理解运算的合理性与必要性,再根据问题解决需要设计相应算法并选择适当的公式或定理及其变形解决问题,突出试题的综合性与创新性.数据分析突出考查迁移水平,说明试题的命制更强调基于问题解决需要灵活选择合适的数据以及数据的处理方法解决问题,引导数学教学要加强对学生问题提出与解决能力的培养.

表4 核心素养各水平考查分布表

总体来看,除2022年Ⅰ卷外,5套新高考试卷考查核心素养的迁移水平比重均大于其它水平,说明重点考查知识迁移水平是命题趋势.相同年份,Ⅱ卷考查迁移水平的比重均大于Ⅰ卷,Ⅱ卷考查创新水平的比重均小于Ⅰ卷;说明Ⅰ卷更突出创新性与综合性,Ⅱ卷更突出基础性与应用性.

(2)关联程度对比分析

直观分析描述了核心素养各水平考查比重的大小关系,但是各水平所占比重在空间位置上的区分度以及关联程度却很难呈现.运用SPSS22软件对表4中的数据进行降维对应分析,绘制试卷与核心素养考查水平的对应分析联合图,由于数值并非频数,选择Euclidean距离和对称方法进行计算,结果见图3.为了使图式更清晰,便于直观测量比较区分度与关联程度,新定义了核心素养各水平的标签,抽象1表示数学抽象的水平1,即知识理解水平,依次类推.

图3 近三年新高考数学全国卷核心素养考查水平对应分析联合图

从图3可以看出,试卷分布整体较集中,核心素养各水平分布较分散,说明试卷的区分度较差,这与新高考改革稳步推进有关.2020年I卷与II卷相互靠近与2020年两套试卷只有两道试题不相同有关系.2020年II卷与2022年II卷相互远离,且离原点都较远,说明两套试卷的核心素养各水平考查比重与平均水平差距较大,考查特点也存在较大差异.从距离远近来看,同一年的两套试卷相互靠近,考查特点相似度更高;I卷的相似程度整体比II卷更好.从核心素养各水平的分布情况看,直观想象水平1,逻辑推理水平1,数学建模水平1,数学建模水平2分布集中,说明关联程度好;逻辑推理水平1与数学建模水平2在同一方向,说明考查特点相似度高,差异不显著.反之,距离越远,说明关联程度越不明显,考查特点差异越大.从学科特点与解题规律来看,直观想象的具体表现是空间想象与数形结合,与演绎推理紧密相关,解释了逻辑推理水平1与直观想象水平1关联程度较好的原因.

5 结论与建议

5.1 结论

借鉴并完善了俞梦飞等人的数学试题核心素养测评框架,对6套新高考数学全国卷的核心素养考查情况做了细致分析,完成了三方面的工作.一是细化了数学试题核心素养测评框架的具体表现与评价依据,并以具体操作实例呈现了基于测评框架分析数学试题的过程与方法.二是完成了6套新高考数学试卷的核心素养测评工作,并对数据进行统计.三是基于测评数据,运用直观比较与多元统计分析方法,对6套试卷的核心素养考查总体分布情况,核心素养具体表现的考查分布情况,核心素养各水平的考查分布情况进行多角度分析.得出以下结论,仅供参考.

(1)核心素养考查比重不均衡

新高考数学试卷兼顾考查六大核心素养,但是考查比重分布不均,存在显著差异.数学运算、逻辑推理、直观想象是历年考查的重点,数学运算占比最大,三者累计占比均大于70%.数学建模与数据分析历年占比均不足10%.Ⅰ卷更注重考查逻辑推理,Ⅱ卷更注重考查数学运算.Ⅰ卷考查数学建模与数据分析的比重逐年下降,Ⅱ卷考查数学抽象、逻辑推理、直观想象的比重逐年下降,考查数学运算的占比Ⅰ卷与Ⅱ卷均逐年上升.试卷对核心素养各个具体表现的考查也存在显著差异,考查运用算法解决问题是历年核心素养考查中占比最大的表现维度,其次是演绎推理与设计算法.数学建模核心素养的发现并提出问题与检验和完善模型两个表现在历年试卷中占比较小,部分年份没有涉及.此外,对核心素养各水平的考查也存在显著差异,历年考查迁移水平的比重均大于其它水平.相同年份,Ⅱ卷考查迁移水平的比重均大于Ⅰ卷,Ⅱ卷考查创新水平的比重均小于Ⅰ卷;说明Ⅰ卷更能突出创新性与综合性,Ⅱ卷更能突出基础性与应用性.

(2)核心素养考查具有相关性

结合多元统计分析结果可以认为,6套试卷的各核心素养考查比重具有相关性.其中,Ⅱ卷的相关性整体好于Ⅰ卷,反映出Ⅱ卷对各核心素养的考查比重较Ⅰ卷稳定.数学建模与数学运算,逻辑推理与数据分析在6套试卷中的考查分布呈显著负相关,说明数学运算与逻辑推理的考查比重很大程度上影响着数学建模与数据分析的比重,可以通过调整数学运算与逻辑推理的考查比重来强化对数学建模与数据分析的考查.数学抽象与数据分析、数学建模、逻辑推理成正相关,数学运算与其它核心素养均呈负相关,说明适当降低数学运算的考查比重可以提高其它核心素养的比重,使得整套试卷的核心素养考查分布更均衡.对核心素养各表现的聚类分析结果也表明,数学运算与逻辑推理在历年高考中最受重视,考查比重也最大.对核心素养各水平的降维对应分析结果显示,6套试卷的整体区分度较小,核心素养各水平的区分度较大.同一年的两套试卷相互靠近,考查特点相似度更高;I卷的相似程度整体比II卷更好.直观想象水平1,逻辑推理水平1,数学建模水平1,数学建模水平2分布集中,说明关联程度好,考查特点相似度高,差异不显著.

(3)试题命制特点具有相似性

历年新高考数学试卷的题型与题量均保持稳定,命题风格一致,彰显新高考改革特点,突出知识主干的考查,创新试题设计.多项选择题的设置增强了试题的层次性,提高了试卷的区分度;结构不良试题的考查,丰富了试题的探究价值,增强了试题的开放性与创新性,满足不同层次学生的实际需要.此外,存在性问题(2021年I卷18题)与半开放举例问题(2021年II卷14题)的设计都是新高考数学试题的命题特色.试题的命制遵循主干知识的生成与发展基本逻辑,强调数学基本思想,聚焦问题本质,考查学生对基本概念和原理的深度理解与深刻认识.贯彻高考评价体系,深化基础知识的灵活考查,发挥选拔功能,试题命制对标课程标准要求,整体体现出较好的基础性、综合性、应用性与创新性,通过增强试题的灵活性重点考查学生的理性思维.聚焦核心素养,考查关键能力,突出育人价值,新高考试题的命制继续强化真实情景的创设,围绕德智体美劳五个方面设计问题情景[8],既丰富了试题的文化内涵,也彰显了鲜明的时代特征,注重跨学科整合,凸显数学学科的应用价值.

5.2 建议

(1)加强核心素养考查比重的合理性研究

作为选拔性考试,试卷命制存在试卷容量与作答时间有限等限制因素,必然导致各核心素养具体表现及其水平所考查的比重存在差异.值得思考的是,当前的考查比重及其分布特点是否满足选拔需要,其选拔功能与教学导向功能是否达到理想水平,有无改进空间?研究结果表明,数据分析和数学建模核心素养考查比重与逻辑推理和数学运算呈负相关,且考查比重不足10%.如果通过改进命题技术,适当降低试题的运算复杂程度,减少推理步骤,加强对问题情景中信息提取与加工能力的考查,测评学生整合数据信息、探索数量关系、建立求解模型的能力,实现在没有改变试题数量与分值的前提下有效平衡核心素养的考查权重是否合理?在试卷命制之前,应该基于核心素养测评框架对双向细目表进行适当调整,明确具体试题所考查核心素养的成分、具体表现、水平层次以及考查权重.在试卷论证环节,对试卷所要考查的核心素养进行测评,及时调整比重,也是平衡核心素养考查比重的的可行方法.对难以设计试题或不方便确定评分标准的考查内容,如问题提出能力的考查,可以创新性地设计结构不良试题、开放性问题、以及存在性问题进行考查,新高考已经做了尝试,也取得了不错的效果,可以适当加大考查力度.

(2)深入开展高考试卷的多角度系统研究

当下对高考试卷的研究存在一定的局限性,主要体现在研究主体的行为差异、研究对象的单一、研究视角和方法的系统性不强、研究成果转化不足四个方面.研究主体主要包括一线教师(含职前教师)、教研员以及专门从事课程与教学论研究的高校教师(含研究生).一线教师开展试卷研究多着眼于探索高考命题规律,以期改进教学策略和复习备考工作,习惯性从具体试题的考查内容、考查方式、命题意图、解题策略等方面进行探索,实践意义较强但是理论深度不够.教研员的研究视角多局限于对试题的命题方式与命题原理解读,在提高自身命题能力的基础上指导一线教师如何开展针对性的教学活动.专门从事课程与教学论研究的高校教师习惯性地从课程、教材与教学的相关理论出发,聚焦各学段的具体教育教学现象或行为、以及学科的某个具体概念或问题开展理论阐释与理论探索.主体的研究行为和目的各有侧重,系统性不强,如何建立主体间的联系,构建多主体一体化的协同研究机制和研究团队是确保研究工作走深走实的基础.研究对象的单一性体现在对某类题型、某套或某几套试卷的对比研究,亦或是对不同国家或地区具体年份的试卷开展对比研究,这些研究工作的代表性以及在多大程度上反映了总体特征却值得商榷.研究视角和方法的系统性不强也是存在的突出问题.就该项研究工作而言,聚焦核心素养测评框架对新高考数学全国卷进行评价研究,揭示了核心素养考查情况,但是对试卷综合难度的测评与比较研究却鲜有涉及,同时也缺乏基于高考评价体系的试卷比较研究,自然无法开展核心素养考查分布特点、试卷综合难度、高考考查要求三者之间的关系研究.不同研究主体开展的不同研究工作可能产出不同的研究成果,但是研究成果的去向却是明确的,一是为命题工作提供参考,二是指导数学教学.成果转化渠道的构建与转化效率的提高就成为需要深入思考和探索的问题.总之,构建多主体一体化的研究协作体对加强高考试卷的系统研究,推进新高考改革,实现研究成果的有效转化都具有较强的现实意义.