2014年济宁市中考物理试卷与课程标准的一致性
2015-08-05马雪胡象岭鲍建中王亭亭
马雪 胡象岭 鲍建中 王亭亭
摘 要:运用SEC一致性分析方法对2014年济宁市中考物理试卷与《义务教育物理课程标准(2011年版)》中课程内容之间的一致性进行分析。结果表明,物理试卷与课程标准之间的Porter一致性系数为0.56,低于对应的参考值,两者的地形图的分布存在一定差异。从内容主题上看,物理试卷并没有完全覆盖14个内容主题,且在部分内容主题上的分布情况与课程标准的要求差距较大。从认知水平上来看,加大了要求达到理解水平的知识在试卷中的比例。总体来看,物理试卷与课程标准两者之间的一致性程度不够高。
关键词:中考;物理试卷;课程标准;一致性;SEC一致性分析模式
中图分类号:G633.7 文献标识码:A 文章编号:1003-6148(2015)7-0004-6
1 引 言
课程标准规定了学生在一段时间之后的学习结果,体现了标准制定者对学生学业成就的期望。这种期望应当成为学生学习的目标,因此,也应成为评价学生学业成就状况的最重要的依据,也就是说,对学生学业成就的评价应基于课程标准。而基于课程标准的学业成就评价的核心在于学业成就评价与课程标准的一致性。所谓评价与标准的一致性,就是指两者之间的吻合程度。评价必须与标准保持一致,以保证评价反映课程标准的要求,评价结果能够体现学生达成课程标准规定的期望的状况。那么,如何判断某一评价(如,初中学业水平考试)与课程标准的一致性呢?这需要借助关于一致性的分析框架来解决。
20世纪90年代以来,美国全面启动基于标准的教育改革。在这一背景下,探究学业评价与课程标准之间的一致性关系,成为美国教育领域重要的研究课题,研究者们提出了众多评价与课程标准一致性的分析框架,安德鲁·波特(Andrew Porter)和约翰·史密森(John Smithson)等人研制的SEC(Surveys of Enacted Curriculum)一致性分析模式[1-3]便是其中的一种,它已成为美国分析学业评价与课程标准一致性的重要程序和方法。
近年来,SEC模式被介绍到国内,并在分析中小学学业成就评价与课程标准的一致性方面得到运用,如,陈娴、张宁波等人采用SEC模式分析了中考物理试卷与初中物理课程标准之间的一致性[4,5]。采用该分析模式的首要任务是对内容主题与认知水平进行分类,建构合理的分析框架。陈娴、张宁波等人将内容主题划分为5个:能量、运动和力、电、波、物质的特性,将认知水平按照布卢姆教育目标分类方法划分为记忆、理解、应用、分析、评价、创造。我们认为,对考试与课程标准一致性进行分析,应以课程标准对内容主题、认知水平的划分为依据。因此,我们采用课程标准中界定的二级主题和认知水平将初中物理内容划分为14个主题,将认知水平划分为3个水平,形成了“14×3”的分析框架,并运用到2011—2013年济宁市中考物理试卷与课程标准一致性的分析中[6]。
本文运用SEC一致性分析模式,采用“14×3”的分析框架对2014年济宁市中考物理试卷(以下简称“物理试卷”)与《义务教育物理课程标准(2011年版)》(以下简称“课程标准”)中的“科学内容”(以下简称“课程内容”)的一致性进行分析,期望能对基于标准的中考物理命题提供参考。
2 研究方法
2.1 一致性分析方法
SEC一致性分析模式是从内容主题和认知水平两个维度构建一个分析框架,运用该框架分别对课程标准与试卷进行内容分析,形成两个结构相同的表格。为了便于比较两个表格,将表格中所有单元格内的值都转化为总和为1的比率值,形成两个比率表格。这样,就可根据两个比率表格的匹配程度来衡量试卷与课程标准之间的一致性。
衡量试卷与标准的一致性量化指标可用Porter一致性系数(P),其计算公式如下[1]:
P=1-■(1)
其中,n为单元格的总数,i代表某个特定的单元格,其取值范围为从1到n。Xi和Yi分别是两个比率表格对应的第i个单元格中的数值,它们都是从0到1的比率值。X1到Xn的总和为1,Y1到Yn的总和也为1。Porter一致性系数的数值介于0到1之间,当P=0时表示试卷和课程标准之间的差异最大;当P=1时表示二者之间没有差异,完全一致。
2.2 研究样本
本研究选取的样本是山东省济宁市2014年高中阶段学校招生考试物理试卷,该试卷包括四种题型:选择题、填空题、实验与作图题、计算题,总分是60分。该试卷包含考查实验探究的题目,这些题目既包括对纯粹的实验性知识(如,滑动变阻器的结构、实验数据是否有效等)的考查,也包括对物理概念、规律等知识的考查,我们将这类题目中考查物理概念、规律的部分列入统计范围,考查实验性知识的部分未列入统计。该试卷中的个别题目(考查环保措施),无需任何物理知识就可以解答,这种题目也没有统计。剔除少量纯粹的实验性知识题目、无物理知识载体的题目后,列入统计范围内的题目总分为53分。
2.3 研究过程
1)首先,对内容主题与认知水平进行分类,构建“内容主题×认知水平”的二维表格。
在课程标准中,课程内容包括“科学探究”和“科学内容”两部分,本研究对内容主题进行划分时只考虑课程内容中的“科学内容”部分。对内容主题的分类采用课程标准中的14个二级主题,这14个主题的序号与名称见表1。
对认知水平的分类采用课程标准中的分类方法,划分为3个层次:了解、认识和理解。
由此,得到一个“14×3”的分析框架,构建成“内容主题×认知水平”的“14×3”的二维表格。
2)其次,对课程标准中的“科学内容”进行内容分析,形成课程标准的“内容主题×认知水平”的二维表格。
由4名全日制研究生首先各自对课程标准中的“科学内容”进行内容分析,确定各知识点所属的内容主题和要求达到的认知水平;然后,对于有分歧的地方通过讨论、协商达成共识。
课程内容的每个二级主题下都包含若干条“内容要求”条目,每个“内容要求”条目都规定了学生需要掌握的知识点和学习该知识点需要达到的认知水平。分析课程内容时,将课程标准中的每一条“内容要求”条目根据其包含的内容分解成只包含单个知识点的细目,根据行为动词判断其要求达到的认知水平;若同一个知识点的“内容要求”条目中有高低不同层次的要求,要分别统计。经分析统计得到课程内容共有124个知识点,每一个知识点对应不同的认知水平。课程标准中各认知水平的知识点数目及比率如表1所示,其中,比率值由知识点数目除以知识点总数(124)得到。
3)再次,对物理试卷及其评分标准进行内容分析,形成物理试卷的“内容主题×认知水平”的 二维表格。
由2名全日制研究生和1名初中高级教师独立分析物理试卷中每一道题目所考查的知识点,确定其对应的内容主题、所占的分值以及学生完成该题目时需要达到的认知水平,然后对于有分歧的地方通过讨论、协商达成一致。
对试卷进行内容分析时,首先,要确定每个题目考查的知识点、认知水平及所占分值,然后,再确定所考查的知识点所属的内容主题。对于选择题,如果题干中明确指出了考查的知识点,可根据题干确定其考查的知识点;如果题干没有给出所考查的知识点,就要对每一个选项进行分析,确定其所考查的知识点和学生完成该题需要达到的认知水平。例如,该试卷选择题中的第二题:“小梦从山东省第23届运动会筹委会获悉,帆船比赛项目将在美丽的徽山湖举行。图1为本届省运会吉祥物宁宁参加帆船比赛项目的宣传画。下列说法中正确的是……”对于填空题,根据评分标准确定每个空所考查的知识点以及学生完成该空需要达到的认知水平。对于实验与作图、计算等综合性题目,根据评分标准确定每个小问题或每个解题步骤所考查的知识点、相应的分值以及学生完成该小问题或步骤需要达到的认知水平;有些实验题或某个实验题中的一部分实际上是以实验为背景考查相关的知识,根据其考查的知识内容确定其考查的知识点和认知水平。
物理试卷中各内容主题的分值及其比率如表2所示,其中,比率值由分值除以总分(53)得到。
4)在以上工作的基础上,计算Porter一致性系数,绘制地形图比较试卷与课程标准的一致性,绘制直条图分别从内容主题、认知水平两方面进一步比较试卷与课程标准的一致性。
3 研究结果
3.1 一致性系数
将表1和表2中的数据录入Excel表格,运用该软件的函数功能将Porter一致性指数的计算公式编辑出来,就可以直接用此公式计算出物理试卷与课程标准之间的一致性系数。计算得到物理试卷与课程标准的Porter一致性系数P为0.56。
当波特系数达到什么范围,才能说两者具有统计意义上的显著的一致性?本文采用美国学者Gavin的思路[7],利用matlab软件里的unidrnd函数[8],将124个知识点随机赋值到一个矩阵中,将53分随机赋值到另一个矩阵中,对两个矩阵标准化处理后计算出一个值,将这样的过程重复20000次,就可以得到关于P的正态分布(见表3)。
表3 关于P的正态分布的均值、
标准差和95%水平的参考值
■
在这个正态分布曲线下,要达到0.05水平的统计显著性,需要P≥0.6605。本研究计算得到的Porter一致性系数低于95%水平的参考值0.6605,说明物理试卷和课程标准之间不存在统计学意义上的显著一致性。
3.2 地形图
用地形图来表示课程标准(图1)和物理试卷(图2)在不同内容主题和认知水平上的权重。图中的1.1~3.6分别表示从“1.1物质的形态和变化”到“3.6能源与可持续发展”14个内容主题;白色区域表示权重小于0.02,黑点区域表示权重在0.02和0.04之间,水平虚线区域表示权重在0.04和0.06之间,左斜线区域表示权重在0.06和0.08之间,右斜线区域表示权重在0.08和0.10之间,网格区域表示权重在0.10和0.12之间,横线区域表示权重在0.12和0.14之间,竖线区域表示权重在0.14和0.16之间,黑色区域表示权重在0.16和0.18之间。
■
图1 课程标准地形图
■
图2 物理试卷地形图
把图1和表1联系起来,可以说明地形图是如何表示物理内容主题和认知水平的相对权重的。在表1中,我们可以看到,比率值落在0.08和0.10之间的是“1.1物质的形态和变化”“2.4电和磁”“3.2机械能”“3.4电磁能”四个二级主题里的“了解”水平,因此,图1中的右斜线区域就位于“1.1物质的形态和变化”“2.4电和磁”“3.2机械能”“3.4电磁能”四个二级主题和“了解”的交界处。
从图1和图2可以看出,仅有“2.2机械运动和力”“2.3声和光”“3.3内能”三个内容主题在“了解”水平上的比例与课程标准基本保持一致,两个地形图的总体分布存在较大差异,表明二者之间的一致性程度不够。
3.3 内容主题方面的比较
物理试卷与课程标准在内容主题方面的比较结果如图3所示。
■
图3 内容主题方面的比较
由图3可知,物理试卷对“2.3声和光”“3.3内能”“3.6能源与可持续发展”3个内容主题的考查与课程标准的要求基本吻合;对“1.3物质的结构与物体的尺度”“1.4新材料及其应用”“3.5能量守恒”这3个内容主题没有考查;“1.2物质的属性”“2.2机械运动和力”“3.1能量、能量的转化和转移”“3.4电磁能”这4个内容主题在试卷中所占的比例均高于课程标准中要求的比例,试卷强化了对这4个内容主题的考察; “1.1物质的形态和变化”“2.1多种多样的运动”“2.4电和磁”“3.2机械能”4个内容主题在试卷中所占的比例均低于其在课程标准中的比例,试卷弱化了对这4个内容主题的考察。
3.4 认知水平方面的比较
物理试卷与课程标准在认知水平方面的比较如图4所示。
■
图4 认知水平方面的比较
在课程标准中,要求认知层次为“了解”的知识点数目所占比例最大,其次是“认识”层次,“理解”这一最高层次所占的比例最小。而在物理试卷中,各认知层次所占的比例由大到小依次是“了解”“理解”“认识”。
由图4可知,试卷中考查到“了解”和“认识”水平的知识点的分值比例均低于物理课程标准的要求;而试卷中考查到“理解”水平的知识点的分值比例明显高于课程标准要求的比例。由此看来,在认知水平上,物理试卷与课程标准的一致性也不够。
4 结 论
本研究结果表明,济宁市2014年中考物理试卷和《义务教育物理课程标准(2011年版)》中的内容要求的一致性不够。二者的Porter一致性系数为0.56,低于对应的参考值0.6605;物理试卷地形图和课程标准地形图的分布存在一定的差异;二者在内容主题和认知水平上的侧重也有所不同。
一致性是衡量评价与课程标准匹配程度的依据,是体现国家课程标准执行力的指标,评价与课程标准具有高度的一致性,不仅能够引导评价目标回归课程标准的内在要求,保证评价活动指向学习内容标准,还能够引导教师努力遵循新课程所倡导的基本理念并实施教学。评价与标准一致性的高低是关乎国家课程标准能否得到落实,课程改革能否顺利推进的大问题,理应引起中考命题人员与考试管理部门的高度重视。之前的研究表明济宁市2011—2013年3年中考物理试卷与课程标准中课程内容之间的一致性系数分别为0.590、0.546、0.577[6],两者的一致性不高。本研究结果显示2014年该市中考物理试卷与课程标准的一致性系数为0.56,一致性依然不高。我们期望这些研究结果引起有关部门、人士的注意,提高该市物理试卷的设计水平。本研究为今后基于课程标准的中考物理命题提供了基于研究的证据和参考。
课程标准自身是影响评价与课程标准一致性的重要因素。当前,我国义务教育物理课程标准未能发挥课程标准应有的作用,具体原因可能不少,但课程标准自身存在的问题恐怕也难辞其咎。如,在物理课程标准中把认知水平划分为“了解”“认识”与“理解”三个层次,课程标准实验稿对“认识”是这样规定的:位于“了解”与“理解”之间。试问“认识”到底是什么?课程标准2011年修订版索性删除了对各个学习水平含义的界定。课程标准应包括内容标准与表现标准,内容标准规定的内容领域应该是具体、清晰的,表现标准应该是具体、明确、合理的,否则,课程标准就丧失了作为评价依据的作用。“基于标准的评价”的实现,其先决条件是课程标准应对课程内容加以具体化的目标描述。这一点应引起课程标准制定者的足够重视,我们期待课程标准尽快得到完善。
应该说明的是,本研究结果只具有参考价值。这是因为,首先,尽管一致性是评估试卷是否达到课程标准要求的重要指标,但是,一致性分析只是学业水平考试质量分析的一个视角,本文并不是对该市物理试卷质量的全面评价。其次,影响评价与课程标准一致性的因素很多[9],毫无疑问,评价自身的完善程度直接制约一致性,课程标准的合理性、明确性对一致性产生重大影响。除此之外,教育政策、课堂教学、学生成就也是重要影响因素。在研究过程中,我们深深体验到,课程标准是否“标准”是影响一致性的很重要的因素,课程标准的不明确性给我们的分析造成困扰。如前所述,课程标准中对“认识”这一认知水平并没有给出明确具体的界定,这就导致在分析试卷时难以确定某知识点考查到什么程度才可以判定为“认识”水平。课程标准中对知识点的描述过于笼统,导致在分析试卷的过程中难以确定一些知识点是否在课程标准所描述的内容范畴内。再次,SEC一致性分析方法存在一定的局限性。比如,对课程标准进行内容分析时,平权地看待内容标准的每一个条目(知识点),这样做未必合理;使用Porter一致性指数的计算公式只考察了两个比率表格的匹配程度,而没有判断试卷考查的每个具体知识点跟课程标准要求的认知水平的一致性;再如,本研究中对内容主题、认知水平的划分是否合理,剔除试卷中部分考查实验知识题目的做法对一致性会产生怎样的影响等,都有待进一步研究。还有,研究者对试卷进行内容分析时有一定的主观性。不同的分析者对同一题目所考查认知水平的确定,受分析者经验和水平的影响而有所差异。
参考文献:
[1]Porter, A. C. Measuring the content of instruction: Uses in research and practice[J].Educational Researcher,2002,(7):3.
[2]Porter, A. C., Smithson, J., Blank, R. K., Zeidner, T.. Alignment as a teacher variable[J].Applied Measurement in Education, 2007,(1): 27.
[3]Liu,X.F., Zhang, B.H., Ling, L.L., Fulmer, G., Kim, B., Yuan,H.Q.. Alignment between the physics content standard and the standardized test: A comparison among the United States-New York State, Singapore, and China-Jiangsu[J]. Science Education,2009,(5):777.
[4]陈娴,郏璨璨,陈宁.物理内容标准与考试之间的一致性研究[J].课程·教材·教法,2010,(7):67.
[5]张宁波.物理中考试题与内容标准的一致性研究[J].物理教师,2012,(8):1.
[6]孙永超,胡象岭,张永庆.济宁市2011—2013年中考物理试卷与课程标准的一致性分析[J].物理教师,2015,(2):7.
[7]Fulmer,G.W..Estimating critical values for strength of alignment among curriculum, assessments, and instruction[J]. Journal of Educational and Behavioral Statistics. 2011,(6):381.
[8]刘恩山,卢群,张颖之.2010年高考生物试卷与课程标准的一致性分析[J].基础教育课程,2010,(9):61.
[9]崔允漷,王少伟,夏雪梅.基于标准的学生学业成就评价[M].上海:华东师范大学出版社,2008.
(栏目编辑 赵保钢)