基于学科核心素养的普通高中历史学业水平考试命题设计
2022-10-18郭光明马秀谊
郭光明 马秀谊
本文为江苏省教育科学“十三五”规划2018 年度考试招生改革专项重点资助课题“基于学科核心素养的高中学业水平等级性考试命题改革研究”(K-a/2018/03)的研究成果。
中国学生发展核心素养是党的教育方针的具体化。为建立核心素养与课程教学之间的内在联系,充分挖掘学科课程教学对全面贯彻党的教育方针、落实立德树人根本任务、发展素质教育的独特育人价值,《普通高中历史课程标准(2017 年版2020 年修订)》(以下简称《课程标准》)基于学科的本质凝练了历史学科的核心素养,明确了学生学习高中历史课程后应达成的正确价值观念、必备品格和关键能力。[1]在此基础上,《课程标准》还基于历史学科核心素养不同水平的关键表现,划分了学业质量水平,并明确将其作为普通高中历史学业水平考试命题的依据。在这样的背景下,如何通过系统化的命题设计,对学生的历史学科核心素养进行科学有效的测评,让考试评价促进高中历史教学全面落实学科核心素养的育人目标,就成为普通高中历史学业水平考试亟待解决的现实问题。本文尝试从试卷蓝图设计、试题结构设计和评分标准设计3 个层面进行探讨。
一、学科核心素养测评的试卷蓝图设计
学科核心素养的考查包含多个维度的要求,并非若干素养测试题目的简单拼凑。只有根据《课程标准》,对各个维度的考查要求进行统筹安
郭光明/江苏省教育考试院命题中心副研究员。(南京 210024)
马秀谊/江苏省教育考试院命题中心副研究员。排,才能保证学科核心素养测评的系统性。
1. 学科核心素养考查的基本维度
(1)素养类别
《课程标准》基于历史学的本质,将历史学科核心素养概括为“唯物史观”“时空观念”“史料实证”“历史解释”和“家国情怀”5 个方面。[1]这些素养的内涵和表现各不相同。对学生而言,历史学科核心素养5 个方面的发展有时是不平衡的,某个方面的素养发展状况并不代表其他方面的素养发展状况。为引导学生形成全面的学科素养结构,学业水平考试命题应兼顾这5 个方面的素养考查,并根据各方面素养在历史学科中的地位、作用,合理确定其在一份试卷中的考查权重。
(2)素养水平
准确界定学生的历史学科核心素养水平是普通高中历史学业水平考试的本质要求。《课程标准》以历史学科核心素养及其表现水平为主要维度,将学业质量划分为四级水平,刻画了学科核心素养在各级水平上的具体表现,并规定了学业水平合格性考试和等级性考试对核心素养考查的不同水平要求。[1]学业水平考试命题应严格依据《课程标准》的规定,并遵循教育测量的一般规律,在区分不同性质学业水平考试的基础上,合理确定一份试卷的素养水平测试梯度。
(3)学科内容
系统的、结构化的学科知识、技能、观念和方法,是学生形成学科核心素养的基本前提。[2]《课程标准》围绕历史学科核心素养的落实,采用通史与专题史相结合的方式重组了课程内容,依次设立“中外历史纲要”“国家制度与社会治理”“经济与社会生活”“文化交流与传播”“史学入门”和“史料研读”6 个模块,并将各模块细分为若干专题。在此基础上,《课程标准》规定了学业水平合格性考试和等级性考试的不同内容范围。[1]要有效测试学生的历史学科核心素养,学业水平考试命题应当根据考试的内容范围,在理清历史知识体系的基础上,选取对评价历史学科核心素养具有重要意义和代表性的内容。
2. 试卷素养测试蓝图的设计方法
要在一份试卷中同时兼顾3 个维度的学科素养测试要求,必须考虑各维度之间的交叉关系,并采用双向细目表形式设计试卷素养测试蓝图,如图1 所示。
图1 试卷素养测试蓝图
图1 中,横向设置学科内容维度栏,纵向设置素养类别、素养水平维度栏。图的中部横向和纵向交叉的空格用于填写同时满足3 个维度要求的题数与分值。图的右侧设置素养分布统计栏,用以统计一份试卷中5 个学科核心素养所占的题数和分数。图的底部设置内容分布统计栏和水平分布统计栏,用以统计一份试卷中各内容领域、素养水平的题数和分数。图的右下角位置设置总题数统计栏和总分数统计栏。下面以普通高中历史学业水平等级性考试为例,说明如何按图1 设计试卷素养测试蓝图。
(1)分析《课程标准》中有关学业水平等级性考试的要求,在此基础上分别对试卷的总题数、总分数和试卷中不同素养类别、不同素养水平、不同内容模块的试题分值比例及其允许的浮动范围进行规定。假设规定如下:
试卷总题数为26~30 题,试题中考查不同素养类别、素养水平或内容领域的问题在统计时视为独立题数。试卷总分为100 分,其中,各素养类别的分值分别为“唯物史观”(15 分)、“时空观念”(20 分)、“史料实证”(20 分)、“历史解释”(30 分)、“家国情怀”(15 分),各素养水平的分值分别为水平1(10 分)、水平2(30 分)、水平3(40 分)、水平4(20 分),各内容模块的分值分别为中外历史纲要(20 分)、国家制度与社会治理(30 分)、经济与社会生活(30 分)、文化交流与传播(20 分)①,各素养类别、素养水平和内容模块的分值浮动范围均为5 分。
(2)设计“普通高中历史学业水平等级性考试试卷素养测试蓝图(示例)”,并分别在相应栏目中填写高中历史学科的各素养类别、素养水平和内容模块的具体名称。
(3)根据各素养类别的分值规定,初步确定其在不同素养水平上的分布。比如:“唯物史观”的分值为15 分,考查“水平2”的有1 题,3 分;考查“水平3”的有3 题,共12 分。其他素养以此类推。
(4)根据各素养类别在不同素养水平上的分布,初步确定试题拟对应的内容模块。比如:在考查“唯物史观”的试题中,考查“水平2”的1题拟对应“经济与社会生活”;考查“水平3”的3 题中,有2 题拟对应“国家制度与社会治理”,另1 题拟对应“文化交流与传播”。其他素养以此类推。
(5)根据上述素养类别、素养水平和内容领域的对应关系,在图的中部横向和纵向交叉的空格填写同时满足3 个维度要求的题数与分值。比如:在“唯物史观”“水平2”与“经济与社会生活”交叉的空格中,题数填“1”,分值填“3”;在“唯物史观”“水平3”与“国家制度与社会治理”交叉的空格中,题数填“2”,分值填“6”;在“唯物史观”“水平3”与“文化交流与传播” 交叉的空格中,题数填“1”,分值填“6”。其他素养以此类推。
(6)统计试卷总题数、总分数和各素养类别、素养水平、内容模块的分值,判断其是否符合原先的规定,如不符合,则予以调整,直至符合为止。
经过上述步骤,就可设计出如图2 所示的普通高中历史学业水平等级性考试试卷素养测试蓝图。通过该蓝图,可对高中历史学科5 种核心素养、4 级素养水平和4 个内容领域的测试比例及其交叉分布做到一目了然,进而实现对试卷素养测试结构的整体把握。
图2 普通高中历史学业水平等级性考试试卷素养测试蓝图(示例)
二、学科核心素养测评的试题结构设计
试卷素养测试蓝图是从总体上设定一份试卷中素养类别、水平、内容等维度的比例及其交叉分布,要将其落实到具体试题,必须按照蓝图的指引,对试题素养测试的诸多要素进行整合。
1. 试题素养测试的基本要素
(1)素养目标
素养目标是指试题准备测量考生哪方面的学科核心素养以及该素养的什么水平。只有对试题的素养目标有着清晰界定,才可能在情境设计、条件界定和试题设问等方面有明确指向。[2]
(2)内容领域
内容领域是指试题测试素养目标所依托的学科知识内容。离开学科知识,学科素养就是空中楼阁,更无法测试。
(3)试题形式
试题形式是指试题命制所采用的题型,可从不同角度进行分类。比如,根据解题过程的构建性可分为选择题和非选择题;根据试题答案的固定性,又可分为封闭性试题和开放性试题。研究表明,不同题型因答题要求的不同而具有不同的素养考核功能,有的适合考查记忆、识别、理解等基础层次的素养水平,有的适合考查应用、评价、创造等高级层次的素养水平。
(4)问题情境
问题情境是指试题测试某种素养时所创设的问题背景,是以问题或任务为中心构成的活动场域。[3]学生能否应对和解决陌生、复杂、开放性的真实问题情境,是检验其核心素养水平的重要方面。多维度地创设问题情境,考查学生在新情境下如何解决问题,有利于检测和评价学生的历史学科核心素养水平。[1]
(5)试题设问
试题设问是指试题要求考生解决的实际问题,其功能是将考生内在的学科素养外化为可观测的行为表现。为有效测试历史学科核心素养,试题设问应符合所测素养及水平层次的表现特征,并要求考生联系问题情境中提供的特定信息,运用历史知识、思想和方法等去解答问题,防止出现试题设问与所测素养、问题情境或学科内容脱节的情况。
2. 试题素养测试结构的设计路径
试题素养测试的诸要素之间既相互独立,又相互作用,只有做到各要素协调一致,才能充分实现试题的素养测试功能。笔者认为,可以在试卷素养测试蓝图指引下,根据各要素内在联系,设计如图3所示的试题素养测试结构。
图3 试题素养测试结构
现以一道试题为例,说明试题素养测试结构的设计过程。
(1)确定试题素养目标。为实现整个试卷的素养类别和水平测试合理分布,每道试题素养目标的确定必须以试卷素养测试蓝图为依据。根据图2 所示的素养测试蓝图,笔者首先假定要命制1 道考查“历史解释”水平2 的试题。在此基础上,为便于命题过程中具体把握和对照,可依据《课程标准》,对“历史解释”水平2 在试题中涉及的表现特征进行描述,如“能够选择、运用相关材料并使用相关历史术语对具体史实进行解释”。
(2)确定试题内容领域。为实现整个试卷的学科内容分布,每道试题内容领域的确定也必须以试卷素养测试蓝图为依据。依据图2,考查“历史解释”水平2 的试题共有5 道,其中,1 道考查“国家制度与社会治理”,3 道考查“经济与社会生活”,还有1 道考查“文化交流与传播”。以“国家制度与社会治理”的考查为例,因为内容模块的范围太宽泛,难以进行命题操作,所以可进一步假定试题内容只涉及其中的某个专题,如“官员的选拔与管理”。
(3)确定试题形式。试题设计应充分考虑素养目标与试题形式之间的适应关系,灵活采用不同题型实现学科核心素养的有效考核。本题考核的“历史解释”水平2 素养目标属于基础层次的素养,可假定采用的题型为选择题。
(4)设计问题情境。问题情境必须根据测试内容领域和试题形式进行设计。从本题考查的内容领域来看,问题情境应该聚焦于“国家制度与社会治理”中的“官员选拔与管理”,这方面可以选用的制度及史实资料非常丰富。假定选用中国古代的科举制度,以唐代的两则科举故事按选择题的要求设计问题情境如下:
唐代诗人刘得仁系皇亲国戚,其弟兄为达官显贵,而他“出入举场三十年,竟无所成”;唐宗室子弟李洞屡考不中,竟想去皇陵哭诉。[4]
(5)设计测试问题。试题设问取决于具体的试题形式和问题情境。根据选择题的结构及设问规则,本题可围绕上述问题情境所体现的科举制度公平性特征设计正确选项,再利用问题情境中人物的身份信息设计干扰选项,考查考生运用相关材料解释具体史实的素养。假定设问[4]如下:
两人的经历反映了唐代( )
A. 科举考试不重考生诗才
B. 选官制度阻断贵族入仕
C. 中央政府剥夺宗室特权
D. 科举取士体现公平公正
经过上述步骤,就形成了1 道具体试题的素养测试结构。(见图4)这既能使试题的素养目标和内容领域符合试卷素养测试蓝图的要求,又能使试题具有内在的素养测试功能。
图4 试题素养测试结构(示例)
三、学科核心素养测评的评分标准设计
基于学科核心素养测评的试卷蓝图设计与试题结构设计,分别从试卷和试题两个层面为全面有效测试考生的学科核心素养提供了方案,但这只是解决了学科核心素养的测试方法问题。要使测试结果准确反映考生的素养表现,还需进行评分设计,解决学科核心素养的评价标准问题。
传统的封闭性试题答案相对固定或结论唯一,评分标准较为简单,以答对要点、答对步骤或选对选项等为依据进行评分。然而,在基于学科核心素养测评中,为突出创新精神和自主探究等能力的考查,开放性试题采用得越来越多。这些开放性试题不是要求考生写出一个包含若干特定要点或解题步骤的答案,更不是要求考生在试题提供的选项中进行选择,而是要求考生通过对问题的综合分析和深层理解,创造性地解决问题,实质是对学科核心素养的一种综合考查。同时,开放性试题尊重考生的主体地位,承认不同的答案都可以具有合理性,对同样的试题材料,考生可从不同角度、不同层面解读,做出不同的假设与推论,形成富有个性的答案[5],为不同素养水平的考生充分展现其能力与思维特征提供了平台。
开放性试题的特点决定了其测量目标具有高度的复杂性,按传统的“踩点给分”或“按步骤给分”等评分标准,阅卷人员无法对开放性试题所测的考生素养表现做出准确的评价。这就需要针对开放性试题的特点,创新评分标准。笔者认为,可以尝试借鉴PTA 量表法,依据试题的测量目标设计开放性试题评分量表,如表1 所示。该量表法的理论假设是:任何一种行为表现,包括行为的和认知的,都会有一系列基本的要素,这些要素构成学生学习某些知识、技能或行为表现的基本单元,只要找出这些基本单元,并对学生在这些基本单元中的行为表现做出准确的评定,那么学生在完成这些具体任务时的总体特征就可以得到适当的评定。[6]
表1 开放性试题评分量表
现以一道开放性试题为例,说明如何运用开放性试题评分量表进行评分标准设计。
某一年的江苏省普通高中学业水平等级性考试历史卷的第22 题第2 问(分值为9 分)是一道史证题,该题以翁仕朝所处时代为背景,请考生根据试题提供的3 则材料(分别摘自王尔敏《儒学世俗化及其对于民间风教之浸濡》、20 世纪初翁仕朝授课教材和20 世纪30 年代翁仕朝手稿,限于篇幅,材料具体内容略),结合所学知识,就翁仕朝的家国情怀提炼观点,并从内涵和成因两方面进行论证。要求观点明确,史论结合,逻辑严密,表达通畅,280 字左右。[4]
该题只是根据材料设定了论题和基本答题要求,考生需要对史料进行解读与选择,准确引用并充分运用史实和论据,这样才能得到较高分数。可以看出,试题的开放性很强。该题评分量表设计步骤如下。
1. 分解目标要素
阅读试题可知,该题的设问为“根据试题提供的3 则材料,结合所学知识,就翁仕朝的家国情怀提炼观点,并从内涵和成因两方面进行论证”。由此分析,试题测试的素养目标为“史料实证”水平4,目标行为表现是“能恰当地运用史料对所探究问题进行论述”。根据该素养目标的行为表现,可将其分解为“论点”“论据及论证”和“表述”3 个要素。
2. 分配要素分值
根据上述3 个目标要素在解答问题过程中的思维量大小及重要程度的不同,分配各要素分值。如本题分值为9 分,可将各要素分值规定为“论点”2 分、“论据及论证”6 分、“表述”1 分。
3. 划分水平等级
根据命题者的设想及考生实际作答情况,对上述3 个目标要素的行为表现水平分别进行分级,并对每个等级做出清晰描述或界定。比如,将“论点”分为3 级:等级1 的表现水平为明确归纳出中心论点“翁氏家国情怀具有时代性”;等级2 的表现水平为中心论点含“家国情怀”,但不涉及“时代性”;等级3 的表现水平为中心论点偏颇,或缺少中心论点。
4. 设定等级赋分
根据目标要素分值及其水平分级情况,对3个目标要素的各级表现水平分别进行赋分。比如,“论点”要素的分值为2 分,其水平分为3 级,可以将“论点”要素3 级不同表现水平的赋分由高到低依次设定为2 分、1 分、0 分。
经过上述4 个步骤,即完成了如表2 所示的试题评分量表的设计。该评分量表以行为目标的要素分解和行为表现的水平分级为基础,通过对各要素行为表现的评价汇总达到对整个行为表现的评价,不仅充分体现了开放性试题的素养考核目标,而且开放性试题的评分具有了较强的操作性。
表2 开放性试题评分量表(示例)[4]
注释:
①《课程标准》规定,高中历史学业水平等级性考试以必修和选择性必修课程为考试内容,具体包括“中外历史纲要”“国家制度与社会治理”“经济与社会生活”“文化交流与传播”4 个模块。