APP下载

中学生物理实验操作能力测评系统的设计与应用研究

2016-09-07殷建华解问鼎

中国电化教育 2016年12期
关键词:物理评分实验

殷建华,解问鼎

(1.西南大学 教育学部,重庆 400715;2.苏州市教育质量监测中心,江苏 苏州 215004)

中学生物理实验操作能力测评系统的设计与应用研究

殷建华1,解问鼎2

(1.西南大学 教育学部,重庆 400715;2.苏州市教育质量监测中心,江苏 苏州 215004)

实验操作能力是中学理科课程核心素养的重要组成,是新课程要求培养的重要能力。实验操作能力主要体现在真实的实验操作过程当中,只有通过对真实的实验过程进行考查,才能真正反映出学生的实验能力情况。然而,现有的实验操作能力测评形式依然拘泥于纸笔测验,关注容易评价的、确定性的知识。该文以物理实验操作能力测评为例,通过开展相关理论与实践研究,建构物理实验操作能力测评系统模型,利用教育信息技术手段设计和开发中学生实验操作能力测评系统,并通过专家系统等智能化测评技术的引入,实现对实验操作能力的真实、有效和智能化测评。

实验操作能力;测评系统;计算机辅助测评

一、研究背景

学生实验操作能力的培养是素质教育和基础教育课程改革的重点环节。对于物理课程而言,培养学生的实验操作能力是提升学生科学素养的必由之路[1]。然而,目前对物理实验操作能力单一的纸笔测验方式造成了“纸上学实验”和“做题练实验”的现实。虽然纸笔测验的成绩可以间接地反映学生的实验操作能力,但这种反映是不全面的,有时甚至是不真实的,这就直接导致在物理教学实验能力培养中出现各种各样的问题。因此,如何更客观、真实地评价学生的实验操作能力是一个亟待探索的重要课题。

没有真实的实验操作能力评价,就难以实现真正的实验操作能力培养。破解这一矛盾,亟需一种真实有效的评价方法和工具。在信息技术推动下,教育信息技术手段为实现实验操作能力的计算机辅助测量与评价提供了可能。将现代教育技术与物理实验操作能力评价进行结合,可以创建理想的实验教学与评价环境,改变传统的教学与评价模式,解决教学中存在的问题或困境。

二、物理实验操作能力测评的瓶颈与破解思路

(一)实验操作能力测评面临的主要问题

1.实验操作具有过程性与瞬时性特点,评分难度较大

传统的实验操作测评需要评分员对学生的实验操作过程进行现场观察评分。评分员需注意力高度集中,才能捕捉学生操作细节。另外,对评分人员有较高的实验素养要求,否则难以在短时间内捕捉并判断学生的关键操作情况。同时,评分人员观察的位置、角度等因素,也会影响评分结果,甚至还会干扰学生的实验操作,现场评分难度较大。

2.评判过程无法重复,评分信度低

实验操作测评不能要求学生重复多次实验,评分过程也无法重现,评判结果缺少必要证据支持。一旦评分结果出现争议,就很难进行处理。有些实验操作测评采取“一对一”甚至“多对一”的评分方式提高测试信度,但实施效率较低、成本较高,一般只在参与测评人数较少的竞赛中使用。

3.评分标准不精确,评分存在主观随意的问题

实验操作测评一般通过学生对关键过程、关键环节的处理来判断其对实验的掌握情况。由于评分员无法完全实现对操作过程的全面精确观察,评分标准一般只会规定学生需进行何种操作,无法准确描述操作的精确程度。同时,对实验的过程性数据也难以做出要求,仅能对实验结果和实验现象作规定,这就造成了大量的实验操作细节被忽略。另一方面,评分人员的责任心、精神状态等,对评分结果的准确性和稳定性会产生一定的影响,评分的客观、公正性难以保证。

(二)实验操作能力测评“困境”的破解思路

计算机辅助评价的出现,为现代教育技术与学科的融合打下了基础,也给实验操作能力测评带来诸多启示。计算机辅助测评可以胜任大范围群体的测评,考试服务人员数目较少,组织工作相对简化;可以引入更复杂、更准确的测评手段,有利于更有效地测量被试的知识和能力水平;测试的时间和地点不再严格要求同时和同地[2][3]。

具体来说,在配备标准实验测评环境的实验室中,利用计算机辅助测评技术分割实验操作与评分之间的“时空”联系,首先通过多角度的视频录像,准确记录学生实验操作的过程,然后通过“计算机阅评”的方法实现对实验操作的在线评分。通过引入“多人评分”和“专家复核”的机制,提高评分者间信度,并通过计算机程序自动监控评分者内部信度,确保评分的前后一致性。

然而,这种方法虽然保证了实验操作评分的可重复性,但相当于实施了“一对一”实验操作评分,增加了评分人员的工作量。那么,如何才能提高实验操作评分的效率?笔者认为“智慧学习”视角为解决这一问题提供了思路。智慧学习环境的感知性、适应性、多向交互性特征可以为综合评价学习成果提供灵活的支持[4]。通过带有“时间轴标记”功能的交互视频技术和数字实验的计算机信息采集、分析和辅助评分技术,辅助测评系统自动感知实验操作过程,并将分析结果反馈给评分者,评分者便可以根据需求对具体操作环节进行评分,提高评分的效率;同时,系统可以通过分析评分员状态数据,自动地适应评分员的工作节奏;通过建立实验操作测评专家系统,将评分要点作为提示信息加入到交互视频中,提高计算机辅助测评的有效性。最后,数字化实验室的引入,可以运用多种传感器收集实验过程中的过程性数据,并通过后台分析学生实验操作的准确程度,辅助评分者做出更精准的判断,减少评分员在客观数据评判上花费的时间。

三、中学生物理实验操作能力测评系统的设计与开发

(一)相关理论基础

1.实验能力结构模型的相关理论

物理实验能力是复杂的心理认知结构的具体表现,一般认为物理实验能力包含物理思维、科学观察和操作技能等几个方面的因素,但是这些因素并不是独立存在的,各种能力的有机结合成为物理实验能力[5]。因此要对这一综合性的能力进行评价,必须依赖具有一定维度的物理实验能力评价模型。在各种物理实验能力的模型中,实验操作能力处于核心位置的认识是统一的。实验能力是多维度、多因素、多品质的综合性能力也是共识[6]。通过对相关实验能力模型的梳理,笔者认为乔际平提出的实验能力结构模型层次清晰,结构分明,比较有利于对实验能力进行考核和评价[7]。

2.计算机辅助测评理论

计算机辅助评价即把计算机用于测评的过程,计算机可以为教学测评提供模块化、快速、准确、客观的评价,并且能够对结果进行自动统计分析[8]。

计算机辅助评价的优点有:(1)应用范围广:包括了技能、知识和实际操作能力等诸多方面;(2)自动化程度高:对于客观题可以实现自动化评分和统计,大大提高效率;(3)客观性强:对答题者信息的保密性强,除了客观题的自动评分外,主观题也实现了异地评分和多人评分,提高了评分的客观程度;(4)时间、空间相对自由:借助网络可以实现测评的同时异地或异时异地,自由度大大提高,组织形式也更便捷[9]。

3.专家系统

专家系统是一种模拟专家解决问题的计算机程序,是一个智能计算机程序系统。通过把大量的某个领域专家水平的知识与经验转化成计算机数据或算法,利用人类专家的知识和解决问题的方法处理该领域的问题。通俗来讲专家系统就是一个具有大量专门知识与经验的程序系统[10]。

(二)实验操作能力测评框架模型的建立

通过分析课程标准中对实验能力的具体要求,笔者从学科能力、内容领域、表现水平三个方面建构实验能力的测评框架。能力维度包括实验设计能力、实验动手能力、实验观测能力、实验数据处理能力与实验解释能力。与乔际平的实验能力模型相比,笔者在实验能力模型中增加了“实验解释能力”这一维度。实验解释可以看作是实验设计的逆过程,强调对物理原理和方法的逆向运用,是逆向思维的体现。实验解释能力中包含了对实验过程和现象的表征,是以语言表征能力为外显的能力。基于课标要求,结合中学物理实验领域与表现水平的要求,本研究的实验操作能力测评模型如下页图1所示。根据实验能力测评框架,建立实验操作评价指标体系。

(三)实验操作能力测评系统功能设计

1.系统的功能定位与需求

测评系统的定位是能够独立完成对学生实验操作能力的测评工作,弥补传统实验操作考试缺乏有效测评的问题,实现实验操作能力测评的数字化、标准化、可测量。系统的必须满足以下需求:(1)对实验操作过程的科学量化功能;(2)对实验操作能力的评价功能;(3)测评组织管理功能;(4)数据库维护功能;(5)测评结果的存储、统计、分析及辅助评价决策功能。

图1 面向过程的实验操作能力测量与评价框架模型

2.系统功能模块结构

为了实现系统的这些功能,将系统分解成如下子系统:试题库管理子系统、智能组卷子系统;能力量化子系统(评分系统)、能力评价子系统、考试管理子系统、测评结果统计分析子系统、云端管理子系统。

试题库管理子系统:用于管理维护实验操作能力测试试题数据库。实验操作试题库的属性分为“试题基本参数”和“测评参数”两部分。基本参数包括实验操作题的编号、名称、知识点、难度、区分度、使用次数、最近使用时间、测试对象等;测评参数包括试题的能力维度构成、实验方案、评分细则、常见错误提示、实验仪器、实验方法、实验参数、误差范围、实验技巧等。

能力量化子系统:包括考试界面及考生信息录入模块、考试模块以及阅卷模块。考试模块负责呈现试题信息,并录制保存学生实验操作视频。阅卷模块是教师完成学生实验能力评分的模块,教师根据实验视频中的提示信息对实验操作进行评判,同时教师评分的结果和评分时间轨迹也会被同步记录保存下来,以便对评分质量进行分析,监控评分过程。

实验能力评价子系统:负责呈现实验能力的评分结果,并结合实验能力结构模型对学生的实验能力进行综合评价,生成实验能力评价成绩单。依据评分细则列举学生在实验操作过程中的失分项目,及其对应的实验操作环节,供学生和教师针对性地发现学生实验能力培养中的薄弱环节。

云端(网络)管理子系统:负责实验考试的远程组织、管理与阅卷的功能,将考生考试信息备份上传到网络服务器上,以便开展异地统一阅卷。

在测评系统中,实验操作试题库及其管理系统、智能组卷子系统、实验能力量化子系统和结果统计分析子系统是专家系统中密切联系的功能模块。其信息传递关系结构如图2所示。

图2 测评系统信息关系结构图

(四)实验操作能力测评系统关键技术实现

实验操作测评系统主要利用交互视频技术+数字化实验平台+计算机辅助测评系统,实现对中学物理实验操作的“实测机评”。交互视频技术是实验操作过程的采集阶段,数字化实验平台是系统的实验工具,计算机辅助测评系统是实验能力评价工具,也是实验测评系统智能化的核心构成。

1.交互视频技术

交互视频就是指通过各种信息技术手段将交互体验融入到线性视频的一种新型视频。测评系统用到的交互技术主要包括实验视频的关键操作标记和视频播放时的定位、变速播放、回看等。对于数字实验,实验仪器的每一次使用都会触发数字实验平台软件产生数字信号,将这些信号产生的时间记录下来就能得到一个时间轴,将不同的信号进行梳理和分类,就能根据每个实验的特征和操作规范,分析出在这个信号产生前后对应发生的关键操作,从而实现对关键操作的识别与标记。

2.视角与独立时间轴

实验操作的录制应该是多视角的,同时有多个摄像头从不同的角度记录实验操作,并通过屏幕录制记录数字实验平台的使用情况。同时,实验视频播放与控制的时间轴要独立于视频之外,以便配合从不同的角度观看时,同步定位实验操作。关键操作在时间轴上进行“帧”标记,同时加入与时间轴标记对应的操作评分细则作为评分参考依据,如下页图3所示。

3.实验测评数据库

实验测评系统的“智能化”主要体现在把人的实验经验转化成数字信息,使软件系统像专家一样“解”物理实验,通过建立详细的实验测评数据库(包括:实验操作观察与量化评分量表、操作细则、规范、注意事项、易犯错误、数据范围、能力表征等)使得对实验操作没有专门研究的评分人员也可以在系统的提示下客观的对实验操作进行评分,降低对评分人员的专业要求。

图3 交互视频录制与播放示意图

四、中学生物理实验操作能力测评系统的应用实例

实践阶段选择“验证牛顿第二定律实验”作为应用案例。通过具体实验操作过程来测评学生的实验能力,验证实验测评系统的有效性与可行性。

(一)实验研究

1.验证牛顿第二定律实验的能力考查点归纳

实验设计:(1)如何运用控制变量法,探究加速度与力、质量的关系;(2)选择什么器材、设计什么方案进行实验;(3)用什么方法测量小车加速度。

实验操作:(1)打点计时器的使用;(2)天平的使用规范;(3)斜面小车的调节和使用。在具体的仪器使用技巧中,包含了实验动手能力的考查项,例如实验操作顺序、实验仪器使用规则、实验关键操作和技巧等。

实验观测能力:(1)摩擦力平衡是否到位;(2)天平读数是否准确。

实验数据处理能力:(1)物体受力的计算;(2)加速度的计算;(3)用图像法处理实验数据。

实验解释能力:(1)通过实验数据呈现的图像规律解释实验结果;(2)将实验结果总结成物理结论,即牛顿第二定律。

2.考场布置

三个摄像头分别从俯视角度、左前视角、右前视角进行拍摄,确保对实验操作区域的全覆盖。

3.测试安排

测试环节选择5位被试参与,实验操作时同时进行“录像”和现场评分。现场由两名评分人员自由选择位置观看学生的实验操作情况并评分。实验结束后一个月左右,同样两位评分人员利用辅助评分软件再次对学生实验操作进行评分。

(二)测试分析

评分人员通过调取5位被试的测试视频资料,依据评分标准和相关提示进行评分。

1.结果分析

(1)计算机辅助方法与传统方法的评分差异

在计算机辅助评分方法中,计算机评分要比传统评分更加严格,失分率更高。分数差出现在熟练程度的评判上,计算机辅助评分由于固定视角观看实验操作,不太容易感觉到学生实验操作时的情绪、心态等心理状态,在变速播放时也不容易判断学生的熟练度。在对学生操作熟练程度的评判上计算机辅助评分稍弱于传统方法。

计算机辅助评分在实验细节的记录和再现能力方面有明显优势。如,C被试在计算机评分与传统评分最大分差为4分。从C的数据可以发现,两位评分人员在传统方法中均未发现C被试“用手操作游码”的错误操作,而在计算机辅助测评中发现了这一问题。同时,C被试在测量小车的质量时也出现了错误(也可能是书写错误导致),这一错误在其他被试实验时均已发生,甲、乙两位评分人员现场评分均未发现该问题。通过计算机辅助测评录像,评分人员发现了这一数据与其他被试测量数据之间的差别较大,发现了该错误。

(2)计算机辅助方法的优势

除了细节记录和再现能力外,计算机辅助测评在实验效果观察中也有较大优势。例如:在被试进行平衡摩擦力的操作时,评分员现场通过肉眼观察只能看到被试进行了该步骤的操作,但很难判断出差异。通过实验视频中对数字实验平台的屏幕录像,评分员可以清晰看出被试在平衡摩擦力时是否达到理想的实验效果。值得注意的是,在计算机辅助评分和传统评分方法中都可能出现误判的情况,但是对存在争议的评判,计算机辅助评分方法可以进行有效补救。

2.辅助评价举例

根据统计出的五位被试在实验能力方面每个评分项的得分情况,教师就可以结合学生的总分、平均分、位比、失分率等数据对学生或学生整体的实验能力情况进行诊断分析,利用数据完整地刻画出学生的实验能力发展情况。如利用可视化工具将实验数据制作成极区图、折线图、面积图、散点图等数据图像。以雷达图为例:如下页图4所示,将A、C被试的得分情况生成雷达图(图中各维度能力得分已转化成该维度得分率)。

从雷达图中可以看出A、C被试能力发展的差异。虽然A、C在总分上相同,但C被试的能力发展情况要比A被试均衡;A被试在实验解释能力上存在欠缺;C被试实验设计能力和实验观测能力上有待提高;A、C被试的实验数据处理能力发展较好。

图4 A、C两位被试成绩雷达图

(三)实践环节小结

通过实践证明,本研究设计的实验操作能力测评系统的方案是可行的,能够解决现有实验操作测试的问题。专家系统的应用使测评系统实现了基本的智能化,能够大大提高测评的效率,节约实验考试的人力成本。信息技术辅助下的实验能力测评能够达到预期效果。

五、结束语

从实验操作测评实践的效果来看,测评系统实现了预定的目标,具有较高的可行性。测评方法是具体可操作的,测评结果也有较高的可信度,能够达到对实验能力测评的客观、科学性要求。同时,通过传统观察测评与计算机辅助测评两种方法的比较,证明了计算机辅助评价在实验能力测评中的优势。虽然测评系统仍需进一步改进完善,测评系统软件仍需进一步优化,但测评系统和方法的科学性、有效性已经得到了检验,为进一步推进深入研究、实现实验操作能力测评系统的应用与推广奠定了基础。同时,在实验操作考试的基础上,本测评系统还可以用于学生日常实验活动记录和管理,有效保障日常实验教学活动的质量。

[1] 陶洪. 物理实验论[M].广西:广西教育出版社,2007.

[2] 黄荣怀,刘黄玲子等. 计算机辅助评价的发展趋势[J].电化教育研究,2002,(5):15-21.

[3] 马光仲,蔡旻君.计算机辅助评价发展的回顾与思考[J]. 电化教育研究,2010,(4):49-53.

[4] 吴洪燕. 智慧学习视角下个性化在线学习系统设计与应用[J].中国电化教育,2015,(6):127-131.

[5] 续佩君. 物理能力测量研究[M]. 广西:广西教育出版社, 1999.

[6] 于海波,王双维.物理实验能力的认知分析及相应教学策略的探讨[J].物理通报,2000,(5):33-35.

[7] 乔际平. 物理学科教育学[M].北京:首都师范大学出版社,2000.

[8] 姜振凤,刘力.基于计算机辅助评价的主观题自动评测研究[J].重庆师范大学学报(自然科学版),2013,(2):74-78.

[9] 蔡旻君. 计算机辅助教育测量与评价[M].北京:中国水利水电出版社,2010.

[10] 史忠植.高级人工智能[M].北京:社会科学出版社,2006.

Design and Application Research on the Measurement System of Students’ Ability in Physics Experiment Operation

Yin Jianhua1, Xie Wending2
(1.Faculty of Education, Southwest University, Chongqing 400715; 2.Suzhou Education Quality Monitoring Center,Suzhou Jiangsu 215004)

As an important component of the key competences of middle school science courses, the experimental operation ability is required by the new curriculum. The experiment operation ability is mainly re fl ected in the operation process, only by testing the real experiments process, can we truly reveal the students’ ability. However, the current measurement form of experimental operation ability, concentrate more energy on easy, doubtless knowledge, and still limited to paper-pencil tests. In the research, we take the physics experiment operational ability assessment as an example, construct the measurement system model based on some related research. In order to implement the veritable, e ff ective and intelligent of the measurement, we utilize such as expert system information and intelligent measurement technology in education to develop students’ experimental operation ability measurement system.

Experimental Operation Ability; Measurement System; Computer Assisted Assessment

G434

A

殷建华:在站博士后,中学高级教师,研究方向为教育监测与评价 (63236528@qq.com)。

解问鼎:硕士,助理研究员,研究方向为课程与教学论(353697581@qq.com)。

2016年8月10日

责任编辑:赵兴龙

1006—9860(2016)12—0073—05

猜你喜欢

物理评分实验
记一次有趣的实验
只因是物理
VI-RADS评分对膀胱癌精准治疗的价值
“互联网+医疗健康系统”对脑卒中患者HAMA、HAMD、SCHFI评分及SF-36评分的影响分析
我给爸爸评分
处处留心皆物理
做个怪怪长实验
Castleman disease in the hepatic-gastric space: A case report
三脚插头上的物理知识
NO与NO2相互转化实验的改进