基于Rasch模型的中学化学守恒观测评研究
2020-08-12王禹超陶勇陕光王后雄
王禹超 陶勇 陕光 王后雄
摘要: 化学守恒观是中学化学基本观念的重要部分,对其发展进行了水平构建,基于Rasch模型开发和优化了测评工具,实施了测验并进行了数据分析。研究显示工具具有良好的信效度。大样本测试数据表明: 性别不会带来化学守恒观发展的显著差异;高一高二高三年级学生的化学守恒观发展水平具有显著性差异,且在具体水平表现上各具特点。
关键词: 化学守恒观; Rasch模型; 测评
文章编号: 10056629(2020)06002607 中图分类号: G633.8 文献标识码: B
守恒观是《普通高中化学课程标准(2017年版)》中明确提出的化学基本观念之一[1],近年来相关研究的热度增加,其中较受关注的是测评研究[2]。但是,已有的测评研究方法单一,共同点是: 以经典测量理论为依据进行测量建构、以横向指标为依据搭建内容框架[3]。项目反应理论克服了传统经典测量理论的“样本依赖性”和“工具依赖性”,逐渐成为心理与教育测量的主流理论[4],其中更是以Rasch模型最受欢迎。因此,有必要探索基于Rasch模型构建的、纵向发展性指标下的化学守恒观测评研究。
1 理论基础
1.1 基于Rasch模型的测量建构
项目反应理论的深层理论基点是潜在特质理论和项目特征曲线,用于拟合项目特征曲线,最常用的函数形式就是累计正态分布函数和累计逻辑斯蒂(Logistic)分布函数[5]。当只有一个参数时,便是Rasch模型[6],将其数学表达式经过一系列数学变化[7],可将被试的能力水平和项目难度都放在logit这个相同的度量尺当中。且被试能力的高低与项目难度无关,项目难度的判断也不依赖于被试的水平。
1.2 威尔森四基石测量框架
为了能够设计出符合Rasch模型测评工具的开发方法,威尔森提出了“四基石”模型(如图1)[8]
结构图是指心理结构,其存在的意义是揭示该特质(化学守恒观)由低到高的发展水平[9]。项目设计即试题设计,目的是测量无法直接观察的心理特质。结果空间是被试对项目所作反应在结构图中的对应。根据被试在各项目中的反应可推断被试心理特质即化学守恒观所处的发展水平,同时也能反馈各项目在设计时对应的水平和评分方式是否合理。测量模型是结果空间和心理结构的具体联系,此处即Rasch模型。
1.3 中学化学守恒观发展水平的理论构建
1.3.1 中学化学守恒观的定义
中学化学守恒观的内涵是学生在学习化学的过程中、对化学守恒知识有了一定理解后所树立的有关“化学守恒”的思想,具体表现为将“化学守恒关系”运用在进一步的化学学习与实际问题解决过程中的观念意识和能力。其研究的具体范围包括中学化学涉及守恒的相关知识[10]。“观念”的特点在于对实践的指导作用,对中学生来说最大的实践就是利用所学知识进行问题解决,因此化学守恒观的异同和发展水平的高低最终会体现在利用守恒观解决问题的能力上。这是将化学守恒观像能力一样划分为由低到高的纵向发展水平(而不只是横向区分)的依据。
1.3.2 中学化学守恒观的学习进阶
化学守恒观具有自身的独特性,它是基于个体对“化学守恒”在头脑中的认知建构特点作为基础来指导问题解决的,也就是说学生体现出的化学守恒观水平,取决于学生对化学守恒的认识深度和问题情境的难度。对应地,学习进阶及测评中的各测试项目应当综合体现化学守恒知识深度和问题情境难度的不同,作为不同发展水平的参考依据。例如“质量守恒定律”这一知识,从浅到深可分为: 对化学反应前后物质质量变化的感性认识→对化学反应前后物质质量变化的定量认识→对化学反应前后物质质量变化的微观认识(原子守恒);再如,“电荷守恒”: 原子结构内部正负电荷相等→溶液中离子所带正负电荷总量相等,后者在综合了对“化学平衡”即“弱电解质电离”和“盐类水解”后认识深度又有增加;而问题情境中的守恒类型和数量的不同也影响着问题解决的难度——个体化学守恒观的水平体现。因此中学化学守恒观的学习进阶构建需要综合考虑守恒知识的认识深度、问题情境难度等因素。
在充分分析中学化学守恒知识发展的基础上,参考了修订的布鲁姆教育目标分类学[11]和高中化学课程标准中核心素养发展的内在逻辑,并且考虑了上述分析的因素,构建了如图2所示的中学化学守恒观学习进阶。
(1) 认识化学守恒关系。这一水平指学生要知道较为基本的守恒知识,主要涉及宏观层面。如质量守恒、元素守恒、能量守恒(能量守恒定律、化学反应吸收或放出能量)、化合价守恒等。处在这一水平的学生应当知道这些守恒关系的存在,并能在特定化学问题情境中进行分辨和判断。
(2) 理解化学守恒原理。处在此水平的学生对化学守恒要由直观、形象的认识深入到较为本质的理解。如化学反应的质量守恒,在上一水平时只是知道化学反应前后总质量没有变,这一水平就要理解其实质是原子守恒,是因为在化学反应中原子重新组合,本身没有发生变化,所以才使得前后的质量没有变、元素种类没有变。再如能量守恒,不只明白“化学反应会吸收或放出能量”,而且知道其原因是化学键断裂吸收能量和生成新化学键放出能量。另外,这一水平关键在于能夠自主地对明确的认识对象有自发的“守恒”认识意识。如,面对一个化学反应,即使没有任何说明,不管该反应陌生还是熟悉,都能认识到应当满足原子守恒、质量守恒、电荷守恒等,如果是氧化还原反应就要满足电子转移和化合价升降守恒,如果是离子方程式还要满足电荷守恒等。
(3) 运用化学守恒关系解决简单化学问题。在理解各种化学守恒关系的基础上,能够在实际化学问题中综合使用各种关系,如利用原子守恒、电荷守恒和电子转移守恒的相互关系书写陌生的氧化还原反应的化学方程式;能在实际的化学问题情境中灵活地判断和应用守恒关系,在复杂的物质转化、数量关系中抓住关键的不变量,解决现实问题。与上一水平相比,不但能自发认识到问题情境中存在的守恒关系,还要能利用相应关系来解决问题。
(4) 在复杂化学问题中综合运用化学守恒。这一水平守恒观最大的突破是结合了溶液中的各种离子平衡问题,即要解决围绕或涉及“质子守恒”“物料守恒”和“电荷守恒”等的各种化学问题。之所以是“突破”,是因为纳入化学平衡移动原理后,很多问题的思考都存在更大的“相对性”。如,可逆反应不会进行彻底,反应物总会有“相对地”剩余;水溶液中的氢离子和氢氧根离子有不同的“来源”和“去路”,各种来源和去路的综合决定了最终两者在溶液中的存在状态和量的多少。当处于水平四时,应当在面对化学问题时有以下表现: 固有的化学守恒知识的掌握、各种化学守恒知识在复杂情境中的综合运用,运用多种守恒对问题或现象进行解释,能够在复杂情境中灵活地选择不同守恒原理综合地、适时地进行应用。
2 中学化学守恒观测评工具的开发
2.1 开发程序
工具开发的整体流程如图3所示。“心理结构模型”即“中学化学守恒观学习进阶的构建”,工具质量分析是以Rasch模型各数据要求为根据进行的;在试测前请了几位中学化学老师、化学教育专业研究生和来自被试总体的中学生进行试做,根据其对试题的反馈进行调整后才进行一轮试测。一轮试测后对工具进行了改进,包括剔除部分项目、改变题型、改善测试项目的难度分布等。二轮试测所得的工具各项指标良好,大样本测试与二轮试测的工具相同。
2.2 项目设计
根据中学化学守恒观由低到高的四个发展水平,最初设计了包括选择题、填空题和解答题在内的不同难度题目共28道。因为要考察不同年级学生守恒观的发展状况,所以三个年级采用了相同试题;考虑到知识水平的不同(主要区别在于高二学习化学平衡后,对电荷守恒、物料守恒、质子守恒等的探讨),在编制题目时各题目尽可能地建立在三个年级相同的知识基础之上;同时考虑到知识与能力的相互关系、守恒知识深度对守恒观水平的巨大影响,不回避因年级不同造成的知识差别。
结合两轮试测(试测样本选择见表2)的数据表现,对部分项目进行了删改,最终得到如表1所示的项目构成,共15道题目,例析如下。
例1 若(NH4)2SO4在强热时分解的产物是SO2、 N2、 NH3和H2O,则该反应中化合价发生变化和未发生变化的N原子数之比为( )
A. 1∶4B. 1∶2C. 2∶1D. 4∶1
该题属水平2,“理解化学守恒关系”。题目涉及的是一个陌生反应,唯一的信息就是题目所给的生成物、反应物和反应条件,解决此题需要根据各元素化合价判断各微粒电子转移数目,再根据电子转移守恒得到的电子的S与失电子的N的数量关系。解决过程中应用的是微观层面的化学守恒关系。
例2 加热条件下,NH4NO3完全分解产生气态混合物(1mol硝酸铵产生3mol气体分子),其密度是相同条件下氢气密度的( )倍。
A. 96B. 40
C. 13.3D. 无法确定
该题属水平3,“运用化学守恒关系解决简单化学问题”。硝酸铵分解较为复杂,对学生来说难以自行写出方程式,不得不通过“守恒”进行解决。此处运用的守恒關系应当涉及包括原子、电子等多个对象在内的守恒关系,但由于写不出具体方程式,则需利用质量守恒结合题目括号中的信息直接判断生成气体的摩尔质量;同时,由于问题指向在相同条件下的密度,因此需要理解气体平均摩尔质量与密度的关系,属于简单化学问题,因此该题处在水平三——既有对守恒关系的自主判断和综合运用,又有对化学问题的解决。
3 研究过程与结果
3.1 样本选择
两轮试测及大样本终测的样本构成如表2,抽样过程采用了整群抽样与随机抽样结合的方式。试测是在湖北省某重点高中进行的,一轮试测随机抽取了高二年级一个班级,二轮试测随机抽取了三个年级各一个班的所有学生;大样本测试在湖北省某重点高中及山西省某重点高中,抽取了两所学校的高一、高二、高三分别一个实验班和一个平行班,共计12个班的学生。最终实发试题600份,回收有效试题543份。
3.2 数据分析
采用Winsteps3.72.3进行数据分析,以检验工具质量(是否符合Rasch模型预期);之后采用SPSS 22.0分析测试结果,以探求高中生化学守恒观发展规律。
3.3 工具质量检验
工具已经经过了两轮的试测,其中既包括广泛的数据考察也包括深入的具体分析,并根据出现的不同问题做出了相应调整,本身是基本符合Rasch模型的质量要求的。当把样本量进一步扩大,工具是否依然能稳定地保持良好质量,需要进一步检验。因此大规模测试依然要根据获得的数据进行信、效度等的检验,以此来确保研究的可靠性。
3.3.1 总体统计
如表3所示是通过软件分析所得到的相关数据。将项目平均难度设置为0.00,得到的被试能力估计值为0.65,说明被试能力略高于整个测试的难度。但相比前两轮试测可知被试能力的估计略有下降,这是符合期待的——大规模测试的样本不再局限于各年级的实验班,而是下至高一普通班上至高三实验班(一般可认为前者水平最低后者水平最高),因此被试整体的化学守恒观水平一定会有所下降。被试的误差和项目误差分别为0.65和0.12,项目误差非常低,被试的误差虽然相比来说稍大但还是在可接受范围之内,也即整个数据的误差较小,由此得出的结论将比较可靠。被试和项目的Infit及Outfit的MNSQ值分别为0.99,1.00,1.07和1.07,四个数字均非常接近理想值1.00;被试的ZSTD值(无论Infit还是Outfit)都非常接近理想值0,而项目的相应值则与理想值稍有偏差,但都还处于比较合理的范围之内。被试的分离度为2.05,指的是最低水平和最高水平被试之间的差距,与前两轮试测相比(分别为1.29和1.78)有进一步的扩大;项目的分离度也有所扩大,考虑到此次的样本更具代表性,如此的分离度更加接近真实值。被试数据估计的信度为0.81,比较接近理想值,且与前两轮试测相比(分别为0.63和0.76)有进一步的提高;项目的信度为0.99,非常接近理想值1。经上述分析可知,工具的总体质量指标表现较好。
3.3.2 其他指标
其他指标指单维性、项目
被试对应(怀特图)、项目拟合等。单维性是整个测试非常重要的效度指标,它能够证明工具真的在测试该能力,而不是更多地受其他因素影响。测试的15个项目全部在单维性许可范围之内,证明测试的单维性良好。项目被试对应是将项目难度与被试能力放在同一标尺中进行比较,从结果来看,各项目的难度和分布均匀分散、没有扎堆,被试的水平分布基本符合“中间多两边少”的普遍规律。具体的项目拟合度上,除了极少数项目(S3和S6)外,大部分项目的ZSTD值都在许可范围之内,项目的误差较小、点测量相关较高。总之,通过Rasch模型的数据分析软件检验,根据化学守恒观水平编制的工具在各信效度指标上表现良好,符合Rasch模型要求,研究工具可靠,测得的结果可用于进一步的分析。
3.4 研究结果
3.4.1 年级差异整体分析
表4为三个年级化学守恒观水平(Rasch模型定义下的,单位为logit分)的描述性统计结果。高一、高二、高三三个年级的均值分别为-0.64, 1.00和2.22,化学守恒观水平有较明显的随着年级上升而上升的趨势;整体的极小值出现在高一年级,为-4.97,极大值出现在高二和高三年级,为4.69,符合常规的认知: 高一水平最低,高三水平最高,高二可能有部分学生接近或达到高三水平;整体的全距为9.66,说明能力分布比较广,最大的全距出现在高二年级,也比较符合常理(高二属三个年级的中间水平,上限可及高三的水平,下限可至高一水平)。
通过方差分析对比三组平均数差异的显著性,以确定化学守恒观水平是否与年级有关。表5的方差齐性分析结果显示,Levene统计值的相伴概率(sig.)为0.32,大于显著性水平0.05,因此可以认为三个年级的方差具有齐性;F值为346.963,相伴概率0.032小于显著性水平0.05,说明三个年级至少其中一个与其他有统计上的明显差别,也有可能3个年级都有显著差别。因为各组方差具有齐性,所以采用LSD检验。
表6显示,高一、高二和高三之间的两两比较的相伴概率均为0.000,说明具有显著差别,即三个年级在化学守恒观发展上具有显著差异,有明显的发展水平变化。
*均方差的显著性水平为0.05
3.4.2 各水平的具体比较
通过计算各项目所对应的难度值,可得到相同水平项目的平均logit分(水平1至水平4分别为-2.29、 -0.543、 0.815、 1.44),进一步分析和划分可得到各水平范围对应的logit分数范围,如表7。
根据不同化学守恒观水平的分数范围,统计每个年级的水平分布,如表8。其中显得“不合常理”的数据是合计的水平3比例过低。具体来看,主要是由于高二的分化现象突出造成的,其中既有学习程度比较好的达到水平4的学生,也有很多尚处在水平2的学生,反而水平3的人数相对较少;而高三学生已经大部分都达到了水平4,水平3人数较少;高一学生中处在水平2的人数最多,只有约2%处在水平3,因此合计的总数据中水平3的人数明显少于水平2和4。
4 研究结论与启示
4.1 关于化学守恒观测评的工具
以IRT的数据模型之一——Rasch模型为理论基础,基于Wilson四基石测量框架、按照建立心理结构模型→设计测试工具→试测→工具质量检验与调整→再试测的流程,进行了测验工具的开发和完善。经过两轮试测和一次大样本测试的考验,最终得到了在项目和被试信度、误差、分离度、单维性检验、项目被试对应、数据模型拟合、点测量相关等多种数据指标上符合模型预期的质量良好的工具。
4.2 关于高中生化学守恒观的发展特征
中学生化学守恒观的发展水平随年级发展有显著差异。从研究结果看,高一至高三的发展水平变化并非匀速: 高一处在水平1向水平2的过渡阶段(或者说平均水平大致介于水平1和水平2之间);高二学生的分化比较明显,一部分正在由水平3向水平4发展,但还有相当于一部分可能由于微观部分的知识遗忘、化学平衡的理解不足等原因导致守恒观的稳定性受到影响而处在水平2;高三学生已经大部分达到了水平4。结合不同年级的教学方式进行分析: 高一高二是新授课阶段,往往以新知识的落实为重点,因此观念的水平很大程度上受到知识多寡的影响,体现出不稳定而在曲折中发展的特点;高三是复习阶段,学生通过巩固和练习、知识的综合应用等提高了解决守恒问题的能力——发展了化学守恒观。
4.3 关于化学守恒观的教学思考
测试结果中有趣的一点是,在“电子转移守恒”的考察中,高一学生的测试结果明显优于高二学生,此现象可以解释为高一刚刚学过这部分内容,而高二学生因长久不接触而产生了遗忘。但是,根据对化学守恒观的剖析,其是一种基于事实而发展的抽象思维,是“不会遗忘的”、在脑中根深蒂固的存在,这样的遗忘意味着知识对守恒观水平的影响巨大。
对于化学守恒观来说,随着研究对象和守恒认识过程的不断变化,守恒思维随之发展,其本质是观念在不同的情境中能够得到应用、应用观念解决不同情境下的守恒问题。从中应当获得启发: 学校教育要重视学生素养、观念、能力的发展,教师教学时要把注意力放在真实、复杂情境中的问题解决,在问题解决的过程中发展思维、养成观念,同时巩固知识,这样才能让学生形成超越具体事实的、逐渐在头脑中稳定的守恒“观念”。
参考文献:
[1] 中华人民共和国教育部制定. 普通高中化学课程标准(2017年版)[S]. 北京: 人民教育出版社, 2018.
[2] 王禹超, 王后雄. 中学化学守恒观研究现状的分析与思考[J]. 化学教学, 2019, (6): 27~32.
[3] 龚伟, 王祖浩, 钱智涌. 高中生“化学守恒”思维水平状况的调查分析[J]. 化学教育, 2012, 33(6): 49~52.
[4] Merrell, C. & Tymms, P. Rasch analysis of inattentive, hyperactive and impulsive behavior in young children and the link with academic achievement [J]. Journal of Applied Measurement, 2005, 6(1): 1~8.
[5] 罗照盛. 项目反应理论基础[M]. 北京: 北京师范大学出版社, 2012.
[6] Rasch G. Probabilistic models for some intelligence and attainment tests [J]. Education Research, 1981, 3(23): 232.
[7] 邓阳. 科学论证及其能力评价研究[D]. 武汉: 华中师范大学博士学位论文, 2015.
[8] Mark R Wilson. Constructing Measures: An Item Response Modeling Approach [M]. Mahwah. NJ: Lawrence Erlbaum Associates, 2005.
[9] 韦斯林. 应用Rasch模型构建基于计算机建模的中学生物质结构认知测量的研究[D]. 上海: 华东师范大学博士学位论文, 2010.
[10] 王禹超. 中学化学守恒观及其测评研究[D]. 武汉: 华中师范大学硕士学位论文, 2019.
[11] 洛林?W. 安德森, 等. 蒋小平, 等译. 布卢姆教育目标分类学: 分类学视野下的学与教及其测评[M]. 北京: 外语教学与研究出版社, 2009.