西北地区高中生化学实验认知能力测评研究
2020-04-10李娜娜熊正友莫尊理
李娜娜 熊正友 莫尊理
摘要:化学学科核心素养的培养与发展是中学化学教育的主要目标,学生化学实验认知能力的提升是其关键所在。本研究选取西北地区1049名高一学生作为被试样本,采用改编测试工具对学生的实验认知能力进行测查,借助Winsteps软件进行单维Rasch模型运算结果表明,该地区化学实验教学现状不容乐观,学生化学实验认知能力水平处于1-2之间。根据研究结果对化学实验教学中存在的问题进行探讨并提出对策,以期西北地区学生的实验认知能力得到更好的发展。
关键词:实验认知能力;Rasch模型;西北地区;测评分析
文章编号:1008-0546(2020)04-0007-07
中图分类号:G632.41
文献标识码:B
doi: 10.3969/j.issn. 1008-0546.2020.04.002
化学实验能力是对化学实验的认识和探究化学物质的组成、结构、性质及其变化规律的能力,包含操作、观察和认知等成分。其中化学实验认知能力是学生运用表象和概念进行推理、分析、综合,抽象、概括、判断等认识活动的过程[1]。《普通高中化学课程标准》(2017年版)中明确提出,让学生认识到化学实验是研究和学习物质及其变化的基本方法,是科学探究的重要途径之一[2]。为了了解西北地区化学实验教学现状、检验学生化学实验认知水平,本研究在项目反应理论的基础上,结合威尔森(Wilson,2008)开发的四基石模型[3],对西北地区学生进行化学实验认知能力测评,用Winsteps软件对原始数据进行单维Rasch模型分析。根据研究结果得出相关结论揭示该地区学生化学实验认知能力水平现状、探索影响化学实验认知能力水平的因素并提出相应的对策,对西部地区学生实验认知能力的发展提供借鉴和参考。
一、测评对象和内容
1.测评对象
本研究共进行了三次测验,第一次小样本测试目的是检测测试工具的质量。测查对象来源于甘肃省天水市秦安县的H中学86名高一学生和陇南市成县的G中学98名高一学生,共计184人。根据Rasch模型分析测量结果后,修改优化测试工具趋于质量良好,进行第二次大样本测验。选取西北地区不同层次5所学校的1049名高一学生为测试样本。被测高一学生已经学完人教版化学必修(1.2)化学实验相关内容。最后采用编制的问卷,对西北地区不同所学校的50名高中化学教师及参加化学奥赛的不同学校各个年级的156名高中生进行随机抽样调查。
2.测评内容
结合普通高中化学课程标准及中学生认知发展特点,制定了如表l所示的化学实验认知能力学习进程。
二、测评工具的开发
1.测评工具的开发流程
如图1所示[4]。
2.开发测评工具
基于Rasch模型原理,威尔森提出了测量建构“四基石模型”。四基石模型包括如图2所示的四个流程,如表2所示。
基于Wilson的测量建构“四基石”框架,结合2017年版《普通高中化学课程标准》及实验认知能力学习进程,在第一轮测试中,本研究共开发了18道单项选择题和2道反应建构题,共计26个项目。单项选择题,每道题有4个选项,且只有一个选项符合题意。采用SOLO分类评价法对反应建构题进行赋分。项目与能力水平對应关系如表3所示。
3.基于Rasch模型的测评工具质量检测
常用的测验理论主要有两种,分别为经典测验理论(Classical Tesl Theory,简称CTT)和项目反应理论(Item Response Theory,简称ERT)。ERT在心理学界和教育测量与评价中应用广泛,因为CTT存在两大不可弥补的缺陷:一是样本依赖(Sample-dependent),二是测验工具依赖(Test-dependent)。当我们把相同的测评工具分给两组能力水平截然不同的被试去测时,会得出差别很大的难度指标(水平高的学生认为测试工具没有难度,而水平低的学生会觉得项目难度太大)。ERT能有效克服上述两种缺陷,它主要指导项目筛选和测验编制。ERT假设被试的心理结构中具有某种“潜在特质”,教育研究者可以通过编制相应的项目问卷来测查被试的这种潜在特质,利用被试在测验中所获的分数来解释、预测被试在项目上的反应。
本研究运用的单维Rasch模型采用项目难度这一参数。单维RasCh模型能将测验的原始分数值转化成Logic值,将学生的化学实验认知能力水平与试题难度放在同一把尺子上进行比较[5]。第一轮测试的总体结果如表4所示。
由表4可知,学生的Rasch分值为1.32>0,说明学生的能力水平整体上高于项目的难度。项目的分离度与信度分别为5.39和0.97,均在良好的范围内;被试的分离度为1.01,说明测查工具未能很好地将不同能力水平的学生分离开,被试信度为0.50,需要提升。误差反映了参数估计的精确性,被试能力估计的标准误差为0.57,而项目难度估计误差较小,为0.26。项目的ENFET MNSQ和OUTFET MNso值均在0.5~1.7之间,处于可接受的范围之内;项目ENFET ZSTD值和OUTFET ZSTD值大部分在-2~+2之间,但EOI、E07、E15、E22和E24这几个项目的取值超出了范围,需要修订,尤其是EOI和E02这两个项目,大部分统计量均远离了合理的取值范围。此外,在项目难度估计方面,有几个项目的“异常性”较为突出,以E14和E20为例,E14应属于实验认知能力的第三水平,但其难度估计值却比第四水平的E15大;E20属于第三水平,其难度估计值却和第一水平的E3相当。因此,接下来的研究中需要对项目加以修订。总的来说,大部分项目的拟合统计量都在可接受的范围内,反映了测评工具具有较好的信效度。
三、测评过程及数据分析
1.测评过程
对第一轮测试中质量不佳的项目进行优化,选定20个项目作为最终的测试题目。在第二轮大样本测试中,选择了西北地区重点高中418和非重点高中631共计1049名学生作为被试,进行测评。
选择测验水平1、4的两个项目进行示例分析。
例I(E2)下列对事故的处理方法中,不正确的是()
A.在实验室中如遇到电线着火,我们应先关掉电闸
B.不小心将稀盐酸溅到眼睛里,应立刻用大量水冲洗,边洗边眨眼睛
C.不慎将少量浓硫酸溅到皮肤上,应立即用水冲洗,然后涂抹10%的NaOH溶液
D.发现实验室中有大量的可燃性气体泄漏时,应立刻开窗通风
说明:这道题属于水平1,即学生对实验室中常见安全事故的应对能力。在实验室中如不慎将少量浓硫酸溅到皮肤上,应立即用大量清水冲洗,然后应该涂抹的是3%~5%的NaHCO3溶液,而非10%的NaOH溶液,主要考查对实验中的事故处理,化学实验安全的理解。
例2(E20)三草酸合铁酸钾晶体K3[Fe(C204)3].3H20可用于攝影和蓝色印刷。某小组将无水三草酸合铁酸钾在一定条件下加热分解,对所得气体产物和固体产物进行实验探究。请利用实验室常用仪器、用品和以下限选试剂完成验证和探究过程。限选试剂:Imol/L硝酸、浓硫酸、20% KSCN、O.lmol/L CuSO4、O.lmol/L KI、3% H202、O.lmol/L NaOH、O.lmol/L盐酸、澄清石灰水、蒸馏水、氧化铜。
(1)各小组同学查阅资料后发现固体产物中,铁元素不可能以三价形式存在,而盐只有K2CO3。如何验证固体物质中有钾元素的存在并解释实验现象。
(2)固体产物中铁元素存在形式的探究。
①提出合理假设:假设1:假设2:假设3:
②设计实验方案验证假设
说明:本题属于水平4,即测查学生实验方案的设计、评价与优化能力。实验认知能力的最高要求是学生具备一定的实验设计能力,即能够依据实验原理及实验目的做合理的假设,选择不同的试剂,设计不同的实验方案验证铁元素的存在形式。本题开放性较强,测查学生高层次的化学实验认知思维,能够区分不同学生实验能力水平状况,实验认知能力越高的学生,做出假设和设计实验方案的能力越强。
2.数据分析
(1)评分者信度
在对非选择题进行赋分时,可能会掺杂评分者的主观性。采用Kappa系数考查评分者的一致性,当Kappa系数在0.75~1之间时,表明不同的评分者在赋分时有着较好的一致性。表5的数据反映了不同评分者在对同一道题目赋分时具有较高的一致性,说明本研究对于学生在非选择题上的评分是可靠的。
(2)大样本测试的总体结果
第二轮大样本测试的总体结果如表6所示。
由表6可知,学生的Rasch分值为-1.41<0,表明测试T具的难度高于学生的能力水平;项目误差为0.05小于被试误差,说明模型对于项目难度的估计是可靠的;四项拟合指标均在规定范围内。被试的分离度1.86,接近2,信度为0.79;项目的分离度为13.04,与之对应的项目信度为0.99,远远大于2。这些数据表明本研究使用的测试工具有良好的信度,能够有效测查西北地区高中学生化学实验认知能力的水平。
(3)项目一被试对应情况
Rasch模型可以将原始分值转化为Logit分,将被试能力水平与项目难度放在同一量尺上比较。项目一被试对应图称为怀特图(Wright map),通过怀特图[6],可以清晰地知道项目难度与学生能力水平的对应情况(如图3所示)。
图3中间的竖线是Logit刻度尺,刻度尺左侧表示被试能力水平分布情况,图中每个“#”代表12个被试,每个“.”代表1-11个被试,被试能力水平从下到上逐渐上升;刻度尺右侧表示项目难度分布情况,项目难度从上到下逐渐降低。由图3可知,EOI难度最低,E20难度最大,大部分项目都有被试与之相对应(项目与被试相对应时,表明被试学生正确回答该道题目的的概率为50%),有小部分项目其难度相对被试而言较大,没有被试与之对应。
(4)项目单维性情况
单维性是RasCh模型的基本假设之一,其反映的是某一项目是否只测查被试的某种单一“潜在特质”,本研究中的“潜在特质”即实验认知能力[7]。项目的单维性越高,说明测查工具有着较好的信效度。由图4可知,大部分项目的标准残差相关系数值(Standard-ized Residual Contrast Loading)在-0.4~+0.4之间,具有较好单维性,能够有效测查该地区高中学生的化学实验认知能力。但有几个项目(A-E20,B-E14,C-E5,a-EI,h-E7)的标准残差相关系数值在-0.4~+0.4之外,说明这几道题目可能除了测查学生的实验认知能力以外,还测查了其它化学学科能力。
以E14为例:下图是4种碳架的烃,其中判断正确的是()
A.a和d不是同分异构体
B.b和c中所有的原子都在一个平面上
C.a和d都能发生加成反应
D.bcd都能发生取代反应
此题属于E3(理解实验原理进行实验操作)维度下的测查,要求学生通过搭建球棍模型学习有机物分子结构的性质及规律。测试后进行学生访谈,得知在作答这道题目时,他们不仅考虑了如何搭建相应的球棍模型对4物质进行分析,还考虑了“同分异构体”“加成反应”等具体概念性知识,有的学生在作答这道题目时,习惯性地思考了球棍模型所代表的分子式等,这些因素都可能导致该题目的单维性不佳。
(5)项目拟合、标准误差及点一测量相关性情况
第二轮大样本测试的项目拟合、标准误差及点一测量相关性情况如表7所示。20个项目的难度范围在-1.24~I.OOLogit之间,E20难度最大(对应的Mea-sure值为1.00),EOI难度最小(Measure值为-1.24)。标准误差在0.04~0.07之间,都在0.10以下,反映了项目的难度是可靠的。分析具体项目与模型的拟合情况时,以Infit MNso作为主要参考。除了EOI、E02、E03、E20外,大多数项目的Infit MNSQ值在0.7~1.3之间,对应的Infit ZSTD值在-2~+2之间,其中EOI和E20这两道题目的Infit MNso值及Infit ZSTD值均远离合理的取值范围,可能是学生在作答过程中出现猜测行为,使得能力水平较低的学生答对了难度较大的题目,与模型不符合[8],而能力水平较高的学生在作答时可能因为粗心,概念模糊等原因,将题目答错。整体测评数据与模型有较高的拟合度,点一测量相关性系数在0.07~0.73之间,没有负值,且大部分数值大于0.3,反映了项目与模型之间具有良好的一致性。
由单维性数据、数据一模型拟合检验及点一测量相关性系数等因素分析,该测评工具具有较好的信效度。表8是各个水平层级的Measure均值,当学生的Measure分值小于等于-0.624时,可推测该学生处于实验认知能力的第一水平之下;当学生的Measure分值在-0.624~-0.13时,可推断该学生处于实验认知能力的第一水平;当学生的Measure分值在-0.13~-0.07之间时,可推知该学生处于实验认知能力的第二水平;当学生的Measure分值在-0.07~0.638之间时,可推知该学生处于实验认知能力的第三水平;当学生的Measure分值高于0.638时,可推断该学生处于实验认知能力的第四水平。由表8可知,四种水平层级对应的Measure均值从Levell到Measure4逐渐增加,说明了本研究所确定的水平层级是科学的、可行的。
(6)总体分析
根据化学实验认知能力划分标准,统计西北地区1049名高一学生的化学实验认知水平的总体表现如图5所示。
从图5可以得,被测学生的化学实验认知水平处于水平1及以下(38.32%)和水平2(30.58%)学生较多,即学生对实验仪器及基本操作的辨别和描述能力较高,基本具备了实验事实的综合分析与加工处理的能力。15.76%的学生处于第3水平,即能够理解实验原理进行实验操作,10.34%的学生处于第4水平,即具备了一定的实验方案的设计、评价与优化的能力。总体来看,大部分学生“理解实验原理进行实验操作”和“实验方案的设计、评价与优化”的能力薄弱。
四、西北地区高中化学实验教学现状的调查分析
1.问卷调查的目的
为了进一步说明当前西北地区化学实验教学的现状和学生的化学实验认知水平,并对测查的结果进一步追因調查。采用编制的学生和教师问卷进行随机抽样调查。调查对象为甘肃省参加化学奥林匹克竞赛的不同学校各年级156名高中生生和50名带队化学老师。
2.问卷的调查结果分析
教师问卷调查结果分析表明,多数老师意识到化学实验教学的重要性和必要性(63.8%的教师认为做化学实验是必须的)。但由于课时不足(40.5%)、实验器材缺少(30.2%)、精力不够(10.8%)、领导重视不足(18.5%)等原因,化学实验教学开展不顺利,学生实验素养提高缓慢。同时目前对实验的评价测评方式单一,大多数停留在纸笔测验(51.0%),考查知识技能,忽视能力与核心素养的培养和测评。
学生问卷调查结果表明,大多数同学(58.8%)认为实验操作的考查有利于激发学习兴趣,提升实验认知能力,少数学生(10.6%)不希望考实验操作,因为做实验麻烦,操作时会紧张。调查发现学生的实验能力各不相同,实验认知能力较弱的是设计实验方案的能力(95.5%)和分析数据、解释现象的能力(96.3%),较强的能力是收集实验资料(93.4%),合作与交流的能力(92.5%)。对于实验测评方式,常采用为笔试和口试,这与教师问卷的结果十分吻合。目前西北地区化学高考中还没有考查学生的实验操作技能,将实验操作纳入高考考查范围内,是提升学生化学实验认知能力的有力抓手,当前的实验考查方式有待完善。
五、结论与启示
(l)本认知能力测评和调查研究能有效地了解高中生化学实验认知能力状况。西北地区高中生实验认知能力水平总体不容乐观,第二轮大样本测试研究结果表明,学生的Rasch分值为-1.41小于0,学生的能力水平明显低于项目难度,重点中学学生的化学实验认知能力高于普通学校学生,整体处于第1-2水平之间。反映出学生化学实验知识薄弱,动手操作的机会较少,没能很好地激发学生的学习动机和养成良好的实验素养;学校的实验设施条件不佳,化学教师难以正常开展实验教学,实验教学手段过于单一,有待提升学生实验探究的兴趣。
(2)本测评和调查研究为化学实验认知能力提供对策。首先,学生要夯实化学学科基础知识,完善自身知识结构,明确实验内容、目的和要求,形成良好的实验习惯。其次,教师要研究化学实验课堂和学生实验探究心理,改进教学方法和手段,强化学生的认知结构,有针对性的实验教学,提高学生的化学实验认知技能。最后,学校要不断更新、完善实验仪器设备,为化学教师开展实验教学创造条件,增设化学实验探究课程,加强化学教师的实验素养,实施合理的化学实验考核方式,将课改要求落到实处。学校、教师及学生自身都是影响高中生实验认知能力发展的重要因素。学生的主动性是其实验认知能力提升的内因;教师和学校是影响学生实验认知能力发展的外因,只有内因和外因相互融合才能更加有效地培养高中生的化学实验认知能力。
(3)本测评和调查研究对改进化学实验教学方法,发展学生化学学科核心素养有一定启示。从问卷调查中可以得出,高中化学教学中普遍存在重理论知识轻实验创新的弊端,有关实验内容多以满堂灌、画实验、背实验、幻灯片式实验的教学方式呈现,忽视了化学实验教学价值。通过测试学生实验认知能力和问卷调查,既可以让学生了解自身的不足,也为化学实验教学方式的改进提供了理论依据。
当然,本研究存在的局限性有待进一步思考和解决,首先,部分项目的单唯性不佳,数据与模型拟合度有待提高。其次,任务情境的真实性不够,要保证测评的有效性,设计的项目任务必须能测出评价的目标。最后,化学实验认知能力的测试对象单一,今后对西北地区如西藏、新疆、青海、宁夏等地区学生的化学实验认知能力需做进一步分析研究。
参考文献
[l]王祖浩,杨玉琴.基于Rasch模型的“化学实验认知能力”测验工具编制及测评研究[J].化学教育,2012(9):99
[2] 中华人民共和国教育部.普通高中化学课程标准(2017年版)[M].北京:人民教育出版社,2018
[3]M.Wilsom.Cognitive Diagnosis using IRT[J].Journal of Psy-chology,2008, 216(2): 74-88
[4]赵景方,杜斌,韩波,闫春更,周青.高中生化学学科核心素养的测评研究——以“宏观辨识与微观探析”为例[J]化学教学,2019(5):17-21+38
[5]王磊,支瑶.化学学科能力及其表现研究[J].教育学报,2016,12(4):46-56
[6]郭习佩,薛亮,古丽茹·吐尔逊,冯珏.基于Rasch模型对学生推理能力进行测评的研究[J].化学教学,2019(4):18-24
[7] 王磊.基于学生核心素养的化学学科能力研究[M].北京:北京师范大学出版社,2017
[8]王桂桃.高中学生的化学平衡学习进阶研究[D].西安:陕西师范大学硕士学位论文,2017