高考数学试题综合难度的比较研究
2023-07-17覃淋彭甜甜熊永君
覃淋 彭甜甜 熊永君
[摘 要] 通过习题综合难度测量模型,对2021年高考全国甲卷、乙卷理科数学的综合难度进行比较研究,发现:①全国甲卷在“背景”“运算”“类型”三个因素的难度加权平均值高于全国乙卷,在“认知”“推理”“知识综合”三个因素的难度加权平均值低于全国乙卷.②两套试卷在“背景”“认知”“类型”“知识综合”四个因素上具有较高的一致性.③全国甲卷的综合难度略高于全国乙卷.
[关键词] 高考;数学试题;综合难度;比较
高考是我国规模最大、最为重要的选拔性考试,也是世界各国认可度较高的考试形式,是高校选拔新生的主要途径.自1977年高考恢复以来,我国高考伴随着国家经济、教育、文化、社会的发展不断改革与创新,其中不仅有命题形式、命题理念、技术、机制等方面的改进,也有试题本身在类型、数量、难易程度等方面的完善.尤其进入21世纪,实施基础教育新课程改革以来,高考数学试题日益凸显测评选拔、命题示范、知识延展、教学导向、立德树人等功能[1].
2014年,国务院印发《关于深化考试招生制度改革的实施意见》,标志新一轮考试招生制度改革正式启动. 2019年,国务院办公厅印发《关于新时代推进普通高中育人方式改革的指导意见》,指出:高考命题要以“普通高中课程标准和高校人才选拔要求为依据,优化考试内容,突出立德树人导向,重点考查学生运用所学知识分析问题和解决问题的能力……科学设置试题难度,命题要符合相应学业质量标准……建立命题评估制度,提高命题质量.”[2]2020年是我国全面建立新高考制度的第一年,这年高考是在出台新的课程标准,全面提出发展学生核心素养的背景下进行的.2021年更多地区加入了新高考行列,教育部教育考试院命制了6套试卷,分别为全国甲卷2套(文、理卷)、全国乙卷2套(文、理卷)、新高考Ⅰ卷1套、新高考Ⅱ卷1套. 《普通高中数学课程标准(2017年版2020年修订)》(简称《课程标准》)指出:“在高考数学的考试命题中,要关注内容与难度的分布……努力提高试卷的信度、效度和公平性.”[3]试题难度作为衡量试题质量的重要指标之一,高考数学试题的难度一直是教师、学生、家长和社会关注的焦点. 高考数学试题直接反映着中学数学课程内容,对高中数学教学具有重要的引导作用,“引导教学”是高考的核心功能之一. 《课程标准》指出:“命题应依据学业质量标准和课程内容……要充分考虑对教学的积极引导作用.”[3]《中国高考评价体系》明确指出“高考必须坚持引导教学”[4],“以考促教、以考促学”是高考的主要目的之一. 因此,对于高考数学试题难度的比较分析,有利于优化试卷内容,提高命题质量,实现“以考促教、以考促学”的目的,促进立德树人根本任务落实,形成更高水平的全面培养体系.
全国甲卷使用地区主要集中在我国基础教育发展相对落后的西南省份,全国乙卷使用地区较广,主要集中在我国基础教育比较发达的东部和中部省份,以及基础教育发展相对落后的东北和西北省份. 所以,对这两套高考数学试题的难度进行比较分析,对推进我国高中数学课程改革和教育公平有着十分重要的意义.本文利用习题综合难度测量模型,对2021年高考全国甲卷、乙卷理科数学的综合难度进行比较研究,发掘两套高考数学试卷的特色与优势,期望对我国高考数学试卷在命题等方面提供一些参考.
研究对象及研究工具
1. 研究对象
2021年全国甲卷理科数学,共有23道试题,其中单选题12道,60分;填空题4道,20分;解答题7道,80分. 乙卷理科数学共有23道试题,其中单选题12道,60分;填空题4道,20分;解答题7道,80分. 两套试卷结构完全一致.
2. 研究工具
鲍建生在美国学者D.A.Nohara提出的数学习题综合难度模型的基础上提出了包含“探究”“背景”“运算”“推理”“知识含量”五个难度因素的习题综合难度测量模型. 习题综合难度测量模型在教材例题难度、习题难度的研究中应用广泛. 本研究参考相应文献[5-8],结合高考标准化考试数学试题的特征,对已有习题综合难度测量模型进行改进,构建了一个包含六个因素的习题综合难度测量模型,并对各因素的水平作详细界定和划分,使得模型更加适合高考数学试题的特征.
先对各难度因素的内涵及水平的划分进行说明:
背景因素分为四个水平:无背景、个人生活、公共生活、科学情境. 其中,“无背景”是指无任何实际背景,直接考查数学知识的试题,这类试题在高考数学试题中大量存在. “个人生活”是指与学生个人生活息息相关的背景,即在个人生活中经常接触到的一些生活情境. “公共生活”包括学生没有亲身经历的,属于某些专业领域的情境;或公共常识的一类. “科学情境”这类试题常常以一定的科学知识为背景,如地理、天文、环境、自然资源、灾害、气象、生物学、医学、农业、健康、食品、物理、化学、计算机、工业技术等.
在运算因素方面,由于高考数学试题大部分都涉及運算,主要是数值运算与符号运算两种类型,故将运算因素分为五个水平:无运算、简单数值运算、复杂数值运算、简单符号运算、复杂符号运算. “简单数值运算”是指简单的加、减、乘、除及混合运算.“复杂数值运算”是指涉及指数、对数、三角函数等的运算,运算步骤超过三步. “简单符号运算”是指运算过程涉及简单的符号推导,如向量、二项式、三角函数的证明等. “复杂符号运算”是指运算过程涉及逻辑推理、证明、复杂的轨迹问题、参数方程等.这五个水平的难度依次上升.
在认知因素方面,认知心理学家将认知过程分为六个层次:记忆、理解、应用、分析、评价、创造. 结合高考数学试题的特征,本文将认知因素分为四个水平:记忆、理解、应用、探究. “记忆”是指对一些数学概念、公式、法则、性质等的记忆.表现特点为记忆性、机械性,主要是对陈述性知识的记忆,或是机械地实施数学常规解题程序,不需要解释. “理解”是指对数学知识、方法、过程的理解,会用自己的语言来阐述或解释数学概念,或对多个概念进行比较分析,建立知识间的联系. “应用”是指能够运用知识去解决一些数学问题,是对程序性知识的应用,需要数学问题解决者在某种程度上认知努力,要求学生有一定的运用数学知识去解决问题的能力. “探究”是指根据已有数学知识,能对问题进行深入分析和探究,能综合运用试题的各个条件解决问题,这类问题具有开放性、探究性等特点,解题思路一般不确定,方法不唯一.
在类型因素方面,数学试题是一个系统,包括四个要素:Y,O,P,Z (Y,O,P,Z分别指试题条件、解题依据、解题方法、试题结论[9]). 分析试题中四个要素的多少,可以将试题分为四类:标准性试题,这类试题中四个要素都是已知的;训练性试题,这类试题有三个要素已知,只有一个要素未知——一般来说是结论未知,其余三个要素已知,计算题一般都属于此类试题,高考数学试卷中这类试题较多;探索性试题,这类试题已知其中的两个要素,其余两个要素未知,有部分试题属于结构不良数学问题;问题性试题,这类试题只有一个要素已知,其他三个要素未知,其难度较大,属于结构不良数学问题,高考数学试卷中这类试题较少. 《课程标准》指出:要注意“开发一些具有应用性、开放性、探究性的问题”.结构不良数学问题具有较高的育人价值:①可以很好地发挥高考的选拔功能,帮助高校选拔符合要求的新生;②可以促进学生数学核心素养的养成和能力的提升.曾风靡一时的数学开放題就属于结构不良数学问题.从问题解决的角度来看,结构良好问题的初始状态、解决模式、目标状态都比较明确,结构不良问题这三个要素中至少有一个不明确[10]. 近年来,高考命题坚持素养导向与能力并重,出现了较多结构不良数学试题,例如2019年全国Ⅰ卷(理科)第4题、2020年新高考全国Ⅰ卷第17题、2020年全国Ⅰ卷(理科)第12题、2021年全国甲卷(理科)第18题、2021年新高考全国Ⅱ卷第22题.高考中的结构不良试题的主要特征有:①问题条件或数据部分缺失或冗余;②问题目标界定不明确;③具有多种解决方法或途径;④具有多种评价解决方法的标准;⑤所涉及的概念、规则和原理等不确定[11]. 这类问题具有以下育人价值:①可以激活学生的知识网络,体现了学生在问题解决中的中心地位;②对培养学生的元认知监控具有重要作用;③有利于培养学生数学思维的严谨性、灵活性和创新性;④对培养学生的非认知因素有重要意义[12].
在推理因素方面,借鉴鲍建生的划分,将推理因素分为“简单推理”和“复杂推理”两个水平. 知识综合因素分为“1个知识点”“2个知识点”“3个及以上知识点”三个水平.
习题综合难度测量模型见表1. 对习题综合难度各因素的水平进行划分后,利用加权平均的方法计算每一个因素的难度,具体步骤如下:
第一步,根据上述综合难度测量模型,对每一道试题相应进行赋值.如一道试题属于公共生活、简单数值运算、理解、训练性题、简单推理、2个知识点的水平,在六个因素中分别赋值:3,2,2,2,1,2.
第二步,计算. 根据上述赋值,分因素统计样本试卷中各因素处于不同水平的试题的数量,采用如下公式计算各难度因素的难度加权平均值:
统计结果及分析
依据习题综合难度测量模型、难度加权平均值计算公式,得到表2.
根据表2的结果,先对两套试卷在“背景”“运算”“认知”“类型”“推理”“知识综合”六个难度因素上进行比较分析,再从综合难度对两套试卷进行整体比较.
1. 背景因素
两套试卷在背景因素上的统计结果如图1所示.
由图1可知,两套试卷在背景因素方面的水平高低一致,“无背景”水平的试题占比最高,都以纯数学知识为条件进行考查. 甲卷以“个人生活”“公共生活”为背景的试题都只有1道,占试题总量的4.35%;乙卷没有以“个人生活”为背景的试题,以“公共生活”为背景的试题只有1道. 两套试卷具有“科学情境”的试题较少,甲卷占比8.70%,乙卷占比4.35%. 这说明两套试卷还是都注重基础知识的考查,而体现数学应用价值的具有生活情境、科学情境的试题不够.
2. 运算因素
两套试卷在运算因素上的统计结果如图2所示.
由图2可知,两套试卷对学生的运算素养的考查很全面,体现了基础性与综合性的考查要求. 实际上,数学运算素养历来都是高考数学的考查重点[13]. 两套试卷中属于“无运算”水平的试题都较少,乙卷中体现“简单数值运算”和“复杂符号运算”水平的试题所占比例均高于甲卷,其中“简单数值运算”水平的试题高出8.7%,体现“复杂数值运算”和“简单符号运算”水平的试题所占比例均低于甲卷. 从运算因素的加权平均值来看,虽然乙卷中体现“复杂符号运算”水平的试题所占比例高于甲卷,但在运算难度上低于甲卷.
3. 认知因素
两套试卷在认知因素上的统计结果如图3所示.
图3表明,两套试卷中都没有直接体现“记忆”水平的试题,这和高考的核心功能有关——高考的核心功能之一是“服务选才”,高考要立足服务国家、服务高校选才的基本点,为国家和高校选拔出符合要求的新生[4]. 从整体来看,甲卷在认知因素方面的“应用”水平高于乙卷,“探究”水平低于乙卷,但差距不大;两套试卷在认知因素方面的“理解”水平一致,“应用”与“探究”水平恰好相反,就认知因素而言,乙卷的难度高于甲卷.
4. 类型因素
两套试卷在类型因素上的统计结果如图4所示.
由图4可知,两套试卷中的“标准性题”和“问题性题”一样,都只有1道,占试题总量的4.35%. 甲卷中的“训练性题”所占比例低于乙卷,而“探索性题”所占比例高于乙卷. 这表明,两套试卷在试题类型因素方面相差不大.两套试卷中的试题主要集中在“训练性”和“探索性”水平. “训练性题”一般强调学生对基础知识和基本技能的掌握,是一些常规的数学题.这类试题对一般学生而言,只要弄懂教材中的知识点与例题,就可以解决.试卷中体现“探索性”水平的试题和体现“训练性”水平的试题相当,这说明高考重视学生对基础知识掌握的同时,要求学生具有一定的运用所学知识解决问题的能力. 两套试卷全面体现了基础性、综合性与应用性的考查要求.
5. 推理因素
两套试卷在推理因素上的统计结果如图5所示.
由图5可知,两套试卷在推理因素上差异较大,甲卷中“简单推理”水平的试题所占比例高于乙卷,乙卷中“复杂推理”水平的试题所占比例高于甲卷. 这表明,乙卷在推理因素方面的难度高于甲卷.
6. 知识综合因素
两套试卷在知识综合因素上的统计结果如图6所示.
由图6可知,甲卷中有95.65%以上的试题考查2个及以上知识点,乙卷中所有试题考查的知识点均为2个及以上.具体而言,甲卷中考查1个知识点的试题所占比例为4.35%,乙卷中考查2个知识点的试题所占比例高于甲卷,考查3个及以上知识点的试题所占比例一样. 这说明我国高考数学试卷具有一定程度的综合性,体现了综合性的考查要求. 这为高中数学教学指明了方向:教师在教学中应关注学生对不同知识点的整合,引导学生建立知识网络.
7. 综合难度
利用前面给出的公式,得到两套试卷六个因素的难度加权平均值雷达图(如图7所示),以及两套试卷的综合难度(如表3所示).
从图7可以发现:(1)在背景因素与运算因素方面,甲卷的难度明显高于乙卷;在试题类型方面,甲卷的难度略高于乙卷;在推理因素方面,乙卷的难度明显高于甲卷;在认知因素与知识综合因素方面,乙卷的难度略高于甲卷. (2)两套试卷的背景因素与推理因素的难度加权平均值比其他四个因素小很多,运算因素与认知因素的难度加权平均值比其他四个因素大很多,说明两套试卷都特别注重运算与认知方面的考查. (3)两套试卷在背景、运算与推理三个因素的难度加权平均值的差距均在0.1以上,在认知、类型与知识综合三个因素的难度加权平均值差异不大,表现出了较强的一致性. (4)通过对两套试卷六个因素的难度加权平均值的计算,发现甲卷各因素的难度加权平均值的极差为2.22,乙卷各因素的难度加权平均值的极差为2.26,说明两套试卷都没有较好地保持六个难度因素的平衡性,乙卷各因素的难度加权平均值雷达图倾斜程度高于甲卷.(5)甲卷的综合难度为L=2.4334,乙卷的综合难度为L=2.4327,依据习题综合难度测量模型,可以认为甲卷试题综合难度高于乙卷. 但两者难度相差不大,仅仅0.0007.
研究结论与启示
1. 研究结论
(1)在背景因素方面,两套试卷都以“无背景”水平的试题为主,体现“个人生活”“公共生活”与“科学情境”水平的试题所占比例较小. 其中,乙卷中“无背景”水平的试题所占比例超过90%,甲卷中“无背景”水平的试题所占比例超过80%,这说明两套试卷体现数学应用价值的具有具体情境的试题不够,这需要在问题情境的设计上更加自然与合理.
(2)在运算因素方面,甲卷中考查“复杂数值运算”与“简单符号运算”水平的试题所占比例最高,乙卷中考查“复杂符号运算”水平的试题所占比例最高. 此外,乙卷中考查“简单数值运算”水平的试题所占比例比甲卷高出许多,甲卷中考查“复杂数值运算”与“简单符号运算”水平的试题所占比例均高于乙卷. 可见,两套试卷都比较注重“简单符号运算”水平的考查,其中,甲卷更注重適中水平运算的考查,乙卷更强调高水平运算的考查.
(3)在认知因素方面,两套试卷都没有考查“记忆”水平的试题,这说明两套试卷都比较注重考查学生分析和解决问题的能力. 甲卷考查“应用”水平的试题所占比例高于乙卷,乙卷考查“探究”水平的试题所占比例高于甲卷.
(4)在类型因素方面,两套试卷中的试题主要集中在“训练性”与“探索性”水平,这两类水平的试题所占比例都超过90%,处于“标准性”水平的试题均只有1道,对学生的要求非常高的处于“问题性”水平的试题也只有1道. 这一方面体现了《课程标准》的命题要求“聚焦学生对重要概念、定理、方法、思想的理解和应用”,强调基础性;另一方面,通过设置结构不良问题,考查学生的实践能力和创新意识的同时,充分发挥高考数学的选拔功能.
(5)在推理因素方面,两套试卷差异较大,其中,甲卷中体现“简单推理”水平的试题所占比例超过70%,体现“复杂推理”水平的试题所占比例仅有26%;乙卷中体现“简单推理”水平的试题所占比例远低于甲卷,体现“复杂推理”水平的试题所占比例远高于甲卷,达到了43.48%.这说明“逻辑推理”素养是高考考查的重点[13],充分体现了《课程标准》对“逻辑推理”素养的要求.
(6)在知识综合因素方面,两套试卷在各水平的变化趋势一致——呈上升趋势. 两套试卷均以体现“3个及以上知识点”的试题为主,体现了高考数学考查内容和高考数学命题的综合性,在考查内容上既关注全体,又突出重点. 体现了综合性的考查要求.
2. 启示
基于上述对2021年高考全国甲卷、乙卷理科数学试卷综合难度的比较分析,结合我国高中数学课程改革的最新趋势,可以得到我国高考数学试题在命题等方面的几点启示.
(1)高考数学试题应注重设置合适的问题情境考查学生的数学学科核心素养.
数学概念、运算法则等最初都来自现实世界,是人类对现实世界的抽象反映. 问题情境可以帮助学生经历数学知识的形成过程,有助于学生将数学知识应用于现实. 命题时,选择合适的问题情境对考查学生的数学核心素养具有重要的导向作用,还可以引导高中数学教学. 设置具有现实情境、数学情境、科学情境等不同情境的问题,可以考查不同层次的学生、不同专业的学生各自的“数学现实”,帮助他们进一步理解“数学源于现实,存在于现实,并且应用于现实”这个深刻的价值内涵,体会数学与现实世界不同领域的联系,帮助他们通过自己的认知活动,构建属于自己的数学观,促进数学知识结构的优化. 鉴于此,高考命题应适当增加情境类试题,注重考查有利于学生数学核心素养培养的多元问题情境分析及解决的能力.
(2)在数学运算方面,两套高考数学试卷都很注重多层级运算水平的考查.
数学运算作为解决数学问题的基本手段,每一个人终身都会与数学运算打交道. 通过前述分析,可以发现两套高考数学试卷对“简单数值运算”“复杂数值运算”“简单符号运算”“复杂符号运算”等多层级运算水平都有所考查. 甲卷体现数学运算水平的试题主要集中在“复杂数值运算”与“简单符号运算”等适中运算水平的考查,乙卷对学生“数学运算”水平的考查呈递增趋势,占比最多的是高水平的“复杂符号运算”,高达26.09%.多层级运算训练对学生数学运算素养的提升、数学思维品质的发展等具有重要意义,但过分追求高水平运算而忽视整个运算水平的平衡性,可能导致“双基”异化,使得一些学校以学生在高考中取得高分为出发点,进行大量机械重复的解题训练,大搞“题海战术”,将中学数学教学异化为数学解题技巧训练.
(3)适当增加结构不良数学试题.
结构不良数学问题具有非常重要的教育价值,深刻体现着高考命题的原则——素养导向、能力为重.
首先,就立德树人来说,解决结构不良数学问题需要学生运用已有知识和经验构建解题认知体系,需要学生对问题不断分析、重构、表征、转化、监控、调整,直至问题被解决.在解决结构不良问题的过程中,学生数学思维的敏捷性、灵活性、深刻性、批判性、广阔性与创造性等都能得到进一步发展,学生的数学核心素养也能得到提升. 同时,由于结构不良数学问题具有解决方法的开放性、结论的不唯一性,能够帮助学生养成客观、全面认识问题的意识,树立辩证唯物主义世界观,成为德智体美劳全面发展的社会主义事业的建设者和接班人.
其次,测评选拔是高考的核心功能之一,结构不良数学问题能很好地体现高考数学的选拔功能. 结构不良数学问题具有较高的难度,对学生直观想象能力、推理能力、运算能力、抽象能力与创新能力要求较高. 结构不良数学问题立意于素养导向,考查学生的必备知识和关键能力,能很好地体现基础性、综合性、应用性、开放性与创新性的统一[14].
最后,“高考作为大规模高利害考试,对高中教学有着重要的引导作用”,高考数学试题是命题专家精心命制的,展现了命题专家的集体智慧,结构不良数学问题更是其中璀璨的“明星”. 结构不良数学问题适度开放,“有益于学生在不同层面发挥自己的数学能力,對中学数学教学有着积极的引导作用,可以引导高中数学在数学概念与数学方法上重视培养学生的数学核心素养.”[11]通过对高考数学试题题源的分析,可以发现很多试题的命题素材源于教材,甚至直接取材于教材上的习题以及公式或定理的证明[15],在一定程度上能够引导高中数学教学回归教材、回归数学本质,使师生重视数学知识发生、发展、完善的过程.对促进高中育人方式的改革,健全立德树人落实机制,完善德智体美劳全面培养的育人体系,扭转高中教育的功利化倾向有着积极的导向作用.
(4)高考数学试题应考虑各难度因素的平衡性.
两套试卷都没有保持好六个难度因素的平衡性,背景因素与推理因素的难度加权值比其他四个难度因素小很多,运算因素与认知因素的难度加权值比其他四个难度因素大很多. 对高考数学试题难度的影响,除了上述六个难度因素外,还有一些影响较小的难度因素,因此想要编制一套既能保持试题各难度因素平衡又可以科学考察不同层次、不同专业的学生的真实水平的试卷是一件极其困难的事情.
命制高考数学试题时,应综合考虑《课程标准》中的目标要求,学生数学学科核心素养的形成与发展,对学生的必备知识、数学思维、数学能力、创新意识的考查,对学生学习过程的评价,对高中数学教学的导向,以及社会发展对现代合格公民的要求等,应从每一个试题难度因素的科学性、综合性、有效性、可测性等方面综合考虑试题难度因素的平衡.
参考文献:
[1] 余小芬,刘成龙. 高考数学试题功能的分析[J]. 内江师范学院学报,2018,33(10):17-22.
[2] 国务院. 国务院办公厅关于新时代推进普通高中育人方式改革的指导意见[EB/OL]. http://www.gov.cn/zhengce/content/2019-06/19/content_5401568.htm,2019-06-19/2022-03-07.
[3] 中华人民共和国教育部.普通高中数学课程标准(2017年版2020年修订)[S]. 北京:人民教育出版社,2020.
[4] 教育部考试中心. 中国高考评价体系[M]. 北京:人民教育出版社,2019.
[5] 蔡庆有,邝庆秀,宋乃庆. 小学数学教材难度模型研究[J]. 教育学报,2013,9(05):97-105.
[6] 王建磐,鲍建生. 高中数学教材中例题的综合难度的国际比较[J]. 全球教育展望,2014,43(08):101-110.
[7] 许团,李秀萍,覃淋. 大陆和台湾高中数学教材统计习题难度比较[J].中学数学月刊,2020(01):51-55.
[8] 武小鹏,张怡. 中国与韩国高考数学试题综合难度比较研究[J]. 数学教育学报,2018,27(03):19-24.
[9] 戴再平. 数学习题理论[M]. 上海:上海教育出版社,1996.
[10] 任子朝,赵轩. 数学考试中的结构不良问题研究[J]. 数学通报,2020,59(02):27-32.
[11] 教育部考试中心.聚焦核心素养 考查关键能力[J]. 中国考试,2021(07):70-76.
[12] 马淑杰,张景斌,陈福印. 数学结构不良问题的育人价值——以高中结构不良数学问题专题复习课为例[J]. 数学通报,2020,59(10):40-45.
[13] 覃淋,杨琴. 基于数学学科核心素养的高考数学试题测评分析——以2020年全国卷Ⅱ高考数学试题为例[J]. 课程教学研究,2020(11):27-36.
[14] 刘海龙,徐辉,傅海伦. 结构不良数学问题的特征、应用及教学逻辑[J]. 教学与管理,2021(07):59-62.
[15] 覃淋. 2019年高考数学史试题分类评析与教学建议[J]. 中学数学研究(华南师大版),2021(01):6-9.