基于SOLO 分类理论的中考化学主观题分析
2021-05-24庄晓松
庄晓松
在义务教育教学改革不断深化的背景下,中考也正处于不断变革之中,中考既对学生提出了“量”的要求,也对学生学习的“质”提出了更高层次的要求。 而“质”的评判要比“量”的评价困难的多,那么,在各级各类考试中能否找到一种比较有效的方法准确考查并反映出学生学习的“质”呢?本文尝试以近四年(2017-2020 年)南通市中考化学试题的主观题为例,应用SOLO 分类评价理论对试题进行解构与分析,期望能为未来中考试题的命制提供一些参考。
一、SOLO 分类评价理论综述
SOLO 是 “Structure of the Observed Learning Outcome”的简称,意为可观察到的学习结果的结构。它是由澳大利亚心理学教授比格斯(J.B.Biggs)和他的同事在1982 年出版的 《学习质量的评价—SOLO分类法》一书中最先提出的,是一种以等级描述为特征的质性评价方法。比格斯认为,一个人回答某个问题时所表现出来的思维结构, 与这个人总体的认知结构是没有直接关联的。 也就是说一个人的总体认知结构是一个纯理论性的概念,是不可检测的;而一个人回答某个问题时所表现出来的思维结构却是可以检测的。因此,比格斯把学生对某个问题的学习结果由低到高划分为五个层次:前结构、单点结构、多点结构、关联结构和抽象拓展结构[1,2]。在此思想基础上,比格斯形成了SOLO 分类评价法。 他提出的思维分类结构是一个由简单到复杂的层次类型,是从点、线、面到立体、系统的发展过程,思维结构越复杂,思维能力的层次也就越高, 其焦点集中在学生回答问题的“质”,而不是“量”。
SOLO 分类评价法一般应用于试题难度预估。我国最先由高凌飚和李勇等人将SOLO 分类评价理论应用于高考物理试题的研究, 提出可借助SOLO 分类评价理论来确定高考物理试卷结构的观点。 近年来, 不少研究者运用SOLO 分类评价理论对高考试题进行横向和纵向分析。 赵雪和毕华林等人还根据SOLO 分类评价理论提出了高考化学主观题的SOLO 层次与试题的难度、区分度等具体技术指标间的关系。 但是,将SOLO 分类评价理论应用于中考化学试题的研究还比较少。
中考化学试题难度是否和高考试题一样也可以运用SOLO 分类评价理论进行横向和纵向分析? 中考试题SOLO 层次与试题的难度、 区分度等具体技术指标间是否也存在某种关系? 当前大部分地区的中考是两考合一的,要兼顾毕业和升学两大功能,是否基于SOLO 分类评价理论的分析能给予命题者一些启示?目前,上述问题在中考化学试题中的研究仍未见到。 基于上述问题,本研究采用SOLO 分类评价理论作为理论基础开发试题评估工具, 对2017-2020 年南通市中考化学试题主观题的试题能力结构进行探究。 通过将试题在各个SOLO 能力层次上的分值分布情况与试题的难度、区分度等实测数据进行比较,在前人对高考试题研究的基础上尝试发现中考化学试题SOLO 结构与试题难度、区分度间的关系,以期能够为中考命题难度、区分度的控制提供一些参考,满足两考合一的考试属性。
二、SOLO 分类工具的开发
(一)研究对象的确定
南通市中考化学试题满分为60 分,其中选择题10 题,每题2 分,共20 分;主观题5 题,共40 分。 南通市中考化学试卷始终以《义务教育化学课程标准(2011 版)》所要求的知识内容、基本技能、基本方法为考试内容,试卷的结构、内容一直保持高度的连续性和一致性,试卷的质量较高,其试题具有一定代表性。 另外,南通市每年参考人数在5 万左右,考生样本的数量较大,具有一定的研究价值。 选择题由于受题型限制,较难依据试题的答案来对学生的思维过程和思维方法进行深层次的评价,因此,本研究仅选取2017 年至2020 年南通市中考化学主观题为研究对象。
(二)中考化学试题SOLO 层次量表的构建
近年来, 南通市中考改革对初中化学学科提出的能力要求是:以初中化学知识和技能为载体,重点考查学生的信息加工和处理能力、实验和探究能力、问题处理和加工能力等。不难发现,南通市中考化学试题对学生能力考核的分类与SOLO 分类理论的相关层次存在一定相同点。
吴佳丹在将SOLO 分类理论应用于高考化学试题的能力结构研究时指出,鉴于“前结构水平”在具体的试题操作中无法体现和测量,因此可将高考化学试题的内部结构按照SOLO 分类理论的后4 个思维水平进行划分[3]。借鉴吴佳丹的方法,并结合南通市中考化学的考查要求,对中考化学试题的内部结构进行了划分(见表1),以获得对试题内部结构的整体认知。
表1 中考化学试题内部结构的SOLO 分类
从表1 四个层次分类的含义中可以看到, 前两个层次是基础知识的积累, 而后两个层次是理论思维的飞跃。而要实现思维能力的突破,却又离不开基础知识的积累。 与传统的评价法相比,SOLO 评价法力求准确评价学生思维能力所能达到的深度和广度,而这些是传统评价法无法达到的。
下面, 以2020 年南通市中考化学卷第24 题为例, 分析如何运用SOLO 理论对试题内部结构进行分类。
评析: 上述三小题中均是以学生比较熟悉的铁生锈的原理为问题背景材料。第(1)小题要求学生根据试管a、b、c 中的现象推断铁钉锈蚀的条件;第(2)小题要求学生根据试管c、d 中的现象判断铁钉在食盐水的环境下,影响铁生锈的因素;第(3)小题是在第(2)小题基础上的简单应用。 基于表1 的界定,第(1)小题属于SOLO 分类理论中的多点层次结构M,第(2)小题属于关联结构层次结构R,第(3)小题属于单点结构层次U。
评析:让学生根据题意书写Fe2O3与盐酸反应的化学方程式, 学生只需要根据复分解反应原理这一单个化学知识即可解答。 因此,此问题属于SOLO 分类理论中的单一结构U。
评析: 第一个问题根据所给示意图写出仪器X的名称, 此问题属于SOLO 分类理论中的单一结构U;第二个问题根据题意以及铁和硫酸反应的实验事实可以得出气体为H2, 此问题属于SOLO 分类理论中的多点层次结构M; 第三个问题需要学生设计实验验证“猜想2”,且试题要求实验中必须用到K3[Fe(CN)6]溶液、FeCl3溶液和铁钉,很明显此问题需要学生根据试题所给的信息运用逻辑和推理的方式,提炼出科学的假设或推论才能得到正确答案, 此问题属于SOLO 分类理论中的关联结构层次E。
(三)中考化学SOLO 分类工具的信度、效度分析
为考察本文提出的主观题难度评估工具的实际效用,通过问卷调查方式征求了6 位专家(含命题专家、中学优秀一线化学教师)对SOLO 分类效度标准的意见, 计算获得其评估工具中条目水平的内容效度指数I-CVI、随机一致性概率估计值(PC)以及对专家意见随机一致性进行校正后计算调整的Kappa值(记为K*),具体分析数据见表2。
表2 “SOLO 分类效度”专家评分及内容效度指数
由表2 可知,4 个条目的K* 值均大于0.74,均为优秀;I-CVI 值均大于0.78,内容效度较优。
本研究中, 请2 位教学一线的初中化学教师利用表1 对2017-2020 年南通市中考化学试卷中的主观题进行SOLO 能力层次的评定,并利用SPSS 23.0进行信度分析。 2 位评定者对4 年南通市中考试题主观题中的60 个设问点进行了评定。 并使用SPSS 23.0 对评分结果计算斯皮尔曼相关系数为0.964,在α= 0.01 显著性水平下达到极高相关, 说明上述表1中考化学试题SOLO 层次量表工具是可靠的, 在实际的试题分析中具有可操作性和稳定性。
三、中考试题的结构分析
(一)试题的稳定性分析
南通市化学中考试题的主观题部分总分为40分,约占全卷的67%,分别由物质构成的奥秘,化学在科研、科技、生产中的流程,化学在社会中的应用,实验探究, 计算5 道大题组成。 表3 给出了2017-2020 年南通市中考化学主观题在SOLO 层次上的赋分分值及在本题中的分值占比, 以及各层次分值占主观题总分值的比例。 表3 中的数据括号外面是分值,括号内是分值占比,单位为%。
表3 2017-2020 年南通市中考化学主观题在SOLO 层次上的分类统计
从表3 可以看出, 南通市2017-2020 年中考化学主观题中,U 和M 层次的题目占比大概维持在试卷总分的65%-80%之间, 占比较大;R 层次的试题较少,一般维持在20%(10%-27.5%)左右;E 层次的试题占比最小,2017 年和2018 年该层次的试题均为0,2019 年和2020 年分别仅占5%和7.5%。根据四年中试题在4 个层次上的赋分情况进行卡方检验,χ2=12.716,p=0.048<0.05,差异性显著;对2017 年、2019年以及2020 年三年的试题在4 个层次上的赋分情况进行卡方检验,χ2=2.125,p=0.547>0.05, 不存在显著差异性,说明2018 年的试题和2017 年、2019 年及2020 年的试题有差异,2017 年、2019 年和2020 年的试题之间无显著差异。
从实测难度系数来看,2017 年、2019 年和2020年的实测难度系数分别位0.72、0.68 和0.65,而2018年的实测难度系数为0.80,明显较另外三年简单。从主观题在SOLO 层次上的赋分占比来看,2017 年、2019 年和2020 年的赋分占比较接近,而2018 年的试题中仅U 层次的试题赋分占比就达65%,对于基础性知识的考查较另外三年明显偏多。
可见,南通市近四年的中考化学试卷基本将U、M 层次的试题分值保持在较高比例范围之内,E 层次试题保持在较低比例范围之内, 试题在一定程度上对课程标准中的核心知识的考查保持较强的基础性。同时,让各层次试题的赋分比例稳定在一定范围内,保证了考试的稳定性,这也与当前中考改革所提出的能力要求和目标基本是一致的, 体现了对学生能力水平考查的长期稳定。
(二)试题的难度分析
中考试题的难度一直是社会公众较为关心的议题, 从2017-2020 年南通市中考化学主观题的实测难度数据来看,南通市中考化学试题的难度适中,兼顾了升学和毕业。 尽管2019 年和2020 年的试题较前两年的试题的难度略有提升,但总体变化不大,试题难度较为平稳。
那么, 化学试题在SOLO 层次上的分类结果与试题的难度有着怎样的关系? 南京师范大学陶樱樱在基于SOLO 分类理论对江苏省高考化学主观试题进行研究后,认为U 与M 层次的分值比例之和与难度系数存在着一定的关系[4];赵雪和毕华林两位研究者在基于SOLO 分类理论对高考化学主观题的结构进行分析研究后也同样认为,U 与M 层次的分值比例之和与难度系数存在着一定的关系[5]。 即,U 与M层次在试卷中的分值比例之和越大, 其试卷的难度系数也就越大。
利用表3 中的数据,运用SPSS 23.0 进行数据分析,以试题在U、M、R、E 各层次上的赋分比例为自变量(分别记作x1、x2、x3、x4), 实测难度系数为因变量(记作y)作多元线性回归分析。 分析结果表明,x1的VIF(variance inflation factor,方差扩大因子)值远大于30,说明x1与x2、x3、x4之间存在共线性的关系。x2、x3、x4在自变量α=0.05 的显著水平下对因变量y 均显著(p 值分别为0.012、0.009、0.044),且x2、x3、x4与y 之间存在显著的线性回归模型, 回归方程为y=0.897-0.296 x2-0.276x3-0.803x4,说明增大M、R、E 层会使试题的难度增加,使试题的难度系数减小。通过比较它们的系数可以发现,E 层次上试题赋分比例的改变对难度系数的影响要大于M 层和R 层上的试题的赋分比例。如果采用逐步回归法,可获得一元线性回归方程:y=0.559+0.358 x1,表明增大U 层试题的赋分占比,整个试题的难度会降低。 其实,二者并不矛盾,因为增大U 层试题的赋分占比,意味着降低其他各层次的占比,2018 年试卷U 层的试题占比达65%,实测难度系数为0.80,试卷的难度较另外三年明显偏低。
从2017-2020 年南通市中考化学主观题试题各层次统计情况来看,R 层次的试题主要集中在第14题实验探究题和第15 题以实验为背景的计算题,可见南通中考较为重视化学实验, 对化学实验的能力要求较高; 第11、12、13 题主要以U、M 层次试题为主,考查学生的基础知识和对基础知识的简单应用,试题的背景在教材中都有迹可循, 能在教材中找到原型,有利于引导初中化学教学遵循课程标准,回归教材,避免知识的无限放大,在一定程度上减轻了学生的学业负担。 2017 年和2018 年试题中E 层次的试题占比均为0, 而2019 年和2020 年试题中E 层次的试题分别占5%和7.5%,适当降低了U 和M 层次试题的占比,这也是当前“两考合一”背景下寻求毕业和和升学平衡点的积极探索。 尽管U 和M 层次试题有所下降,但是U 和M 层次的试题还是控制在较高占比,使整个试卷具有较强的基础性,难易度适当,符合当前初中毕业和升学两考合一的基本属性,符合初中化学作为启蒙学科的基本特征, 有利于引导初中化学在教学中依据课程标准重视基础知识和基本技能。
(三)试题的区分度分析
在关注试题难度的同时, 区分度也是命题者需要关心的另一个指标。由于缺乏相关的数据,因此无法计算出2017-2020 年南通市中考化学主观题的区分度。 不过,赵雪和毕华林两位研究者在基于SOLO分类理论对高考化学主观题的结构进行分析研究后发现,随着试题能力层次离散程度的减小,试题的区分度总体上呈现出增大趋势[6]。 依据这一研究结论,可利用前文表3 先计算出每一道题的离散度。 具体计算方法是:先求出2017-2020 年所有主观题在U、M、R、E 四个层次上赋分占各题满分比例的平均值,再计算每道试题在各层次上实际赋分比例与均值之间差值的绝对值之和。 以2017 年第11 题为例:2017-2020 年所有主观题在U、M、R、E 四个层次上赋分占各题满分比例的平均值分别为:44.22%、33.52%、20.36%、2.41%;而第11 题在各能力层次上实际赋分比例与均值之间差值的绝对值分别为:39%、17%、20%、2%, 则该题的总离散度为78%,记为0.78。 利用同样的方法计算了其余19 题的离散度,具体计算结果如表4 所示。
从表4 可以看出,2017 年的第11、15 题,2018年的第13、15 题,2019 年的第14、15 题,2020 年的第15 题离散度较大,这几题的区分度有可能较小。
2017 年的第11 题和2018 年的第13 题在U 层次的赋分分别达83.33%和87.50%, 且这两题在R和E 层次上的赋分均为0 分, 也就是说这两题的结构层中U 的比重较大, 可以较好地区分出能力差的学生,但可能会降低对整体学生的区分度。 2019 年的第14 题在R 和E 层次的赋分分别占36.36%和18.18%,合计54.6%。 尽管高层次的思维能力题有利于区分出能力较高的学生, 但也可能会降低对整体学生的区分度;2017 年至2020 年的第15 题是以实验为背景的计算题,R 层次题的赋分分别占57.14%、57.14%、57.14%、71.43%,U 层次试题的赋分分别占14.29%、42.86%、28.57%、14.29%。 一方面,R层次题赋分占比较大有利于区分出具有较高层次思维能力的学生, 但可能会降低对全体学生的区分能力;另一方面,U 层次试题赋分较高,虽有利于区分出思维能力较低的学生, 但同样也可能会降低对全体学生的区分能力。
表4 2017-2020 年南通市中考化学主观题的离散度
中考不同于高考,既要考虑到毕业功能,也要考虑到升学的选拔功能, 通过考试区分出不同能力的学生, 命制试题中需要调整好各层次试题的赋分比例,对命题者而言难度的确非常大。另外需要注意的是, 南通市中考各层次的试题在5 道主观题中的分布并不均衡,如2017 年的第11 题和2018 年的第13题在U 层次的赋分分别达83.33%和87.50%, 这样会使较难题和容易题相对比较集中在某一道题中,这可能在一定程度上影响整个试题的区分度, 需要引起命题者的注意。
四、本研究的意义及存在的局限性
运用SOLO 分类理论开发出试题的评价工具,对2017-2020 年南通市中考化学主观题的能力结构进行解析和探讨。 通过对各SOLO 层次上的分值比例与试题难度、区分度等进行定量比较研究,构建了各SOLO 层次上分值比例与试题难度的线性回归方程。中考试题通常是由各个地区自行命题,命题质量往往参差不齐,本研究是为中考试题寻找适宜的、既能较好地满足毕业功能、 又能较好地满足升学功能的试题结构的一个有益尝试。
另一方面,本研究还存在一定的局限性,主要如下:(1)本研究选择近四年南通市中考化学试题中的主观题作为研究对象,共只有20 道试题,试题的样本数量明显存在着不足;(2)因为缺乏相关的数据无法计算出试题的区分度, 只能根据已有文献的研究结果对试题进行区分度分析;(3) 考查本文提出的SOLO 分类评估工具的实际效用,虽然征求了6 位专家对SOLO 分类效度标准的意见, 但是仍然存在着一定的主观性和经验性;(4)本研究所采用的难度是整题的实测数据,而不是每个知识点的数据,这同样可能在一定程度上会影响结构层次和难度系数等的关系。