APP下载

基于医学影视媒介的词汇附带习得形成性评价的实证模型

2019-09-10李天颐傅洪波吴迪

现代信息科技 2019年6期

李天颐 傅洪波 吴迪

摘  要:本研究从教学实践出发,针对形成性测试,提出一种可应用于教学的实证模型。该模型以贝叶斯方法为指导,结合先验概率和后验概率对教学行为的结果做出统计评估。该模型相应的统计数据来源于日常测试。统计指标是所谓的吸收概率指标,它由测试的难度系数转化而来。在统计推断过程中,还有效地结合了矩阵处理。该统计模型,可行性和操作性强,为大量的教学研究提供了思路和工具。本研究以医学英语影視化词汇教学课堂为例,以该模型为工具展开了实证研究。

关键词:形成性测试;统计模型;医学英语词汇教学

中图分类号:TP3-05;TP274      文献标识码:A 文章编号:2096-4706(2019)06-0024-03

Abstract:Based on teaching practice and formative testing,this study proposes an empirical model which can be applied to teaching. Under the guidance of Bayesian method,the model makes statistical evaluation of the results of teaching behavior by combining the prior probability and the posterior probability.The corresponding statistical data of the model are derived from daily tests. Statistical indicators are so-called absorption probability indicators,which are transformed from the difficulty coefficient of the test.In the process of statistical inference,matrix processing is also effectively combined. The statistical model has strong feasibility and operability,and can provide ideas and tools for a large number of teaching research. This study takes the medical English film-based vocabulary teaching classroom as an example,and carries out an empirical study with the model as a tool.

Keywords:formative test;statistical model;medical English vocabulary teaching

0  引  言

目前看电影学习英语已成为中国“二语习得”者最受欢迎的附带学习方式之一,教师在课间或课堂上播放英文电影也成为大学英语教学的常态,医学英语作为医学生了解最新医学动态的重要工具同样也有丰富的医学英语电影资源库,如何有效利用这些医学英语视频,同时如何测评采用了医学视频资源的课堂教学效果及学生的学习效果,是国内外学者亟待解决的问题。

传统的终结性评价,一般由总结性考试产生,一方面其考核形式单调,无法体现学生在学习过程中的主体地位,另一方面,反馈周期过长,教学组织者无法及时调控教学,学生学习成绩的提升效果也不明显。而由形成性考核产生的形成性评价,既可实现对学习者和学习过程的全面监测和反馈,同时也实现了对教学过程的监测和反馈,便于教学组织者及时调控教学过程,提升教学质量,因此,形成性评价逐渐成为教学评价体系中不可缺少的重要手段和当前的教研热点[1-4]。

形成性评价主要依托形成性测试。形成性测试主要对学习者的课程学习成果进行阶段性考核,考核范围针对课程中的一个单元或一个部分,考核内容多样化(作业、项目、课题、论文、实操、测试),形式灵活(线上或线下,单选,多选结合等),甚至还有各类考核的内容选择模式及相应评价模式等[5-7]。

但我们分析认为,形成性考核方式虽然多样化,但传统的教学测试,仍然是最常用和最经济的手段,其客观性、公平性和可靠性都有一定的保障。因此,现阶段相应的研究和实践工作仍然是不断地完善这种主流的形式,通过文献调研发现,国内外这方面的相关研究报道几乎为空白,因此,本研究拟在此问题上做出的相应的探索。

1  模式的特征与运行

1.1  对知识体系进行划分

首先,我们传授的课程的知识体系一般是具有系统性的,而形成性测试,作为阶段性考试,其考试内容往往是针对课程中的一个单元或一个部分,因此,我们根据教学进程,对知识进行有计划的划分,并对该划分的单元组织开展阶段性核查。这种划分其实也意味着对形成性测试完成了相应的计划与管理。

而为了更好的对划分结果进行管理,我们引入知识矩阵,此矩阵元素为一个知识单元,元素及角标,比如a23,表示第2章第3节知识单元。矩阵元素中一些章长短不一,我们取最大值节数为矩阵列数。针对大量知识单元的测试结果处理后则可形成测评矩阵。矩阵的引入,一方面可以以类似表格的方式清晰、有序地组织教学及匹配形成性测试,另一方面可进行一定的矩阵处理,为前文提及的数据管理和后续处理,提供数学工具。

1.2  引入“吸收概率”

测评结果可以是原始的得分,但形成性考核灵活,时长、题型、得分设定也不一,这造成数据背景差异,而一定数量的学习者测评结果也有一定分布差异。对此,我们引入难度系数并转化为最终的测评结果。难度系数本身是一个常见的测试分析指标,其本义只为反映试题的难易程度[8],即考生在一个试题或一份试卷中的失分程度。如满分50分的试题,考生平均得分36分,则难度系数为36/50=0.72。

至此,认识“难度系数”定义后,我们可以创造性地把其再定义为所谓知识“吸收概率”,即表示整个学习群体对所学知识的吸收程度或掌握程度(或呈现的准确率),同时也可反映教学者的教学效果,但前提条件是,形成性测试题主要考察学习者对教学知识的“重现准确度”,避免复杂的技巧型和综合型能力考试。这样,“难度系数”被赋予新的内涵。针对不同知识单元测试结果的“难度系数”矩阵,也可理解为“吸收概率”矩阵(见图1,矩阵E),矩阵元素既代表学习群体在各个知识单元的获取概率、又同时反映了教学效果,为整个教学提供了一个简明的定量指标,当然也为统计模型提供了统计指标。

教学的实施为函数f(或称为教学作用),其作用于知识矩阵A,作用结果为E(此处即为吸收概率矩阵)。

1.3  建立统计评测及推断

(1)矩阵组织下的数据,显然便于找到相应知识单元的学习效果信息,也可以挖掘整体的学习概况。而吸收概率的引入,当然也更直观的评价了教与学的质量。比如,利用上述吸收概率矩阵,简单求算术平均,立即得出整个课程体系的平均“吸收概率”。当然还可讨论标准差等一系列统计参数,深入挖掘背后的统计信息,全方位的了解教与学的关系。

(2)利用上述测评吸收概率矩阵,实现不同教学行为的统计检验给你分析。我们既可以观测某阶段的学习或教学效果的差异,也可以对整体差异展开统计的假设检验,单因素的Z检验、T检验、秩检验、游程检验,多组分的方差分析[9,10]等,可对相应的教学因素带来的差异开展统计评价和实证研究。另外,我们设定的固定的知识矩阵,其测量对象也是固定的,不同的教学作用,产生对比结果,正好形成配对统计检测。

(3)局部分析上,可通过观察矩阵的相应元素测评结果的联动性,发现知识单元和整体的相关性,甚至知识单元之间的内在关联。

2  实例分析

依从上述的统计模式,我们在相应的教学研究中,对同一个老师的两个平行班级(A1、A2班)的医学英语词汇教学,进行了对比性研究,實验周期为九周,每周一次连堂四节课医学英语课,每次课观看医学英语视频时长为45分钟。两个班级的差异在于一个班级A2观看的是趣味性较高的医学英语视频,另一个班级A1观看的是趣味性较低的医学英语视频,但A1班和A2班分别观看的九部医学题材影片难度均相同。同时分别使用相同测试题对教学效果进行了形成性测试,测试题主要考察医学词汇习得,授课内容的重现准确度。其中A1班对应的吸收概率矩阵A1,A2班对应吸收概率矩阵A2,测试单元为九章。

我们分别做了下列计算和统计处理。

2.1  整体的平均吸收概率

由式可算得A1班平均吸收概率为0.703,A2班平均吸收概率为0.714,有一定的差异,A2班平均吸收概率略高,但从数值上看不明显。

2.2  统计检验

本检验是观察同一组样本在处理前后的平均值的差异,由于数据是配对的,所以采用配对T检验,检验结果概率仅为0.07%。这意味着,两者平均值统计差异是明显的,超过99.93%概率是不同的。

2.3  局部分析

全局上统计检验差别是明显的,我们也可以进行局部对比分析。我们发现,两个班级的吸收概率在刚开始的时候数据差别不大,也就是教学前期差别不明显(前5次测试,平均吸收概率值皆为0.66,T检验无明显差异),但后期差别逐渐显现。这很可能是趣味值高的电影能够吸引学生的注意力,引发学生的学习兴趣,使学生学习更加专注,从而转化为学生的学习动力。随着学习的深入,学习效率的差异最终导致了吸收概率的差异。

在教学反馈交流中,学生也提及医学英语视频有助于他们对课堂听讲的内容进行补漏,加深对医学知识的理解和对医学英语词汇的记忆。资源匹配性和趣味性医学影视资源使学习者的效率有了一定提升。高趣味性影视组A2班在形成性测试中,测试表现自然更为理想。当然,形成性测试结果的反馈,让我们也随后终止了实验,让两个平行班级,同时分享相应的教学资源。

由以上的实例,我们不难发现,以矩阵来组织数据,不仅可以形成良好的数据匹配和索引,而且利用矩阵处理,能够方便快速的搜寻、提取数据,比如提取理论性教学与应用性教学等章节的数据进行对比分析。而统计的关键,所谓的统计指标“吸收概率”,其计算简易,能直观地显示教与学的效果,与形成性测试可谓相得益彰。

3  结  论

综上所述,本研究设计出一个比较系统的匹配形成性测试的统计处理模型,通过矩阵对数据进行有效组织,通过相应的统计指标,可快速的完成对形成性测试数据的统计分析与推断。整个模型的数据处理简单,操作简练,使用的统计方法成熟。这不仅是对医学英语词汇教学形成性评价做出的有益探索,更是对大量的教育、教学理论以及不断涌现的教育、教学的改革和探索,此模型提供了由形成性测评结果来验证的现实性,为提升教育、教学研究的科学性、可测性、实证性提供了崭新的途径和思路。

参考文献:

[1] Theofanos M,Quesenbery W. Towards the design of effective formative test reports [M].Usability Professionals’ Association,2005.

[2] Lam R. Formative Use of Summative Tests:Using Test Preparation to Promote Performance and Self-Regulation [J].The Asia-Pacific Education Researcher,2013,22(1):69-78.

[3] ZOU X,ZHANG X. Effect of different score reports of Web-based formative test on students’ self-regulated learning [J].Computers & Education,2013,66:54-63.

[4] 郭茜,楊志强.试论形成性评价及其对大学英语教学与测试的启示 [J].清华大学教育研究,2003,24(5):103-108.

[5] 方圆.基于CDS自我评测的形成性评价探索 [J].教育科学(全文版),2016(6):00181.

[6] Roberts T S. The Use of multiple choice test for formative and summative assessment [M].Australian Computer Society,Inc.2006.

[7] Wise S L,Plake B S,Pozehl B J,et al. Providing Item Feedback in Computer-Based Tests:Effects of Initial Success and Failure [J].Educational and Psychological Measurement,1989,49(2):479-486.

[8] 艾小伟,王有远.基于统计学习的试题难度系数修正算法 [J].计算机工程与应用,2008,44(36):227-229.

[9] 盛骤,谢式千,潘承毅.概率论与数理统计第3版 [M].北京:高等教育出版社,2001.

[10] L.沃塞曼.现代非参数统计 [M].北京:科学出版社,2008.

作者简介:李天颐(1978.07-),女,汉族,湖北人,讲师,硕士,研究方向:应用语言学、多媒体辅助外语教学和比较文化研究。