APP下载

统计学理论在试卷质量分析及学习效果评价中的应用
——以高等数学课程为例

2022-03-28王雪

太原城市职业技术学院学报 2022年3期
关键词:区分度生源学习效果

■王雪

(武汉交通职业学院,湖北 武汉 430065)

考核评价是教学中的重要环节[1]。科学合理的考核评价在教学中起着至关重要的作用。一方面,评价教师的教学能力和教学效果,利于教师开展教学反思、改进教学方法、提升教学质量;另一方面,评价学生的学习效果,利于学生查漏补缺,提高学习效果,提升学生的自信心和自主学习能力。高等数学采取过程性评价和终结性评价相结合的评价模式,终结性评价以全校统考、闭卷形式开展。因此,试卷质量在考核评价中起着决定性作用。广大教师应在考试结束后,根据考试数据资料针对试题做统计分析,给出客观准确的试卷质量分析报告,提高试卷编制质量。又因为目前高职院校生源呈多元化现象,不同生源学情差异较大,且部分同学认为男、女生也存在数学学情差异。故教师还应针对不同性别、不同生源的学生开展学习效果评价,给出科学合理的评价。

一、试卷质量分析

试卷质量分析以2020—2021第一学期高等数学课程期末考试试卷为例,主要从数据收集、总分的描述性统计、可视化分组、试题区分度、信度、效度等六个方面展开论述。

(一)数据收集

以2020级富士康(1)班高等数学期末考试成绩为例,介绍数据收集方法。在Excel表格中的第一行依次输入学号、姓名、性别、班级、专业、题号、题目类型、总分、平时分,然后依次输入每位学生的试卷得分信息及平时成绩,保存文件,命名为试卷质量分析。

(二)描述性统计分析

要了解一个班级学生的整体学习效果,最科学的方法是对班级学生考试成绩进行描述性统计分析[1]。

1.SPSS软件操作步骤

用SPSS打开试卷质量分析文件,点击“分析”→“描述性统计”→“频率”,在频率对话框中把“总分”选到右边的变量框中,单击“统计”,依次勾选“集中”“离散”和“分布”模块各选项前的方框,单击“继续”→“确定”。

2.结果报告及分析

通过以上操作得到结果:全班共有28人,平均分为66.89分;最高分为94分;最低分为36分;全距为58分;标准差为13.028;方差为169.729;偏度为-0.271;峰度,-0.074。由于偏度小于0,且接近0,说明分数分布稍呈负偏态分布,峰度小于0,但非常接近0。因此,班级成绩近似服从正态分布,此次考试成绩能较好反映学生的学习效果。但是平均分66.89分,只达到及格水平,且最高分和最低分之差58分,学生学情差异较大。由此说明,全班同学数学成绩不够理想,需要继续努力,且个别同学在数学学习上出现较大困难,老师需要开展个性化辅导。

(三)可视化分组分析

教师从整体上了解学生的分数及分布后,还需要详细了解每个分数段的学生占比及人数,从而能更有针对性地开展后续教学工作。

1.SPSS软件操作步骤

单击“转换”→“可视分箱”,把“总分”选到右边的可视分箱变量框中,单击“继续”,在分箱化变量框中输入新变量名称“分组”,在“网格区域的值”下方的第 1、2、3、4 框中,分别输入 60、70、80、90;在右边的“上端点”选项中点击排除,点击“生成标签”→“确定”,完成分组,分组结果显示在“分组”变量下方。

依次单击“图形”→“旧对话框”→“饼图”→“定义”→“个案百分比”,把“总分分箱化分组”选到右边“分区定义依据”框中,单击“确定”,得各分数段人数占比,如图1所示;在上述操作中勾选“个案数”,可得到各分数段的人数。

图1 分段人数统计

2.结果报告及分析

小于60分的学生有7人,占25%;60—69分之间的学生有9人,占32.14%;70—79分的学生有8人,占28.57%;80—89分的学生有3人,占10.17%;90分以上的学生有1人,占3.57%。教师在今后的教学中,应给予低于60分的7位同学更多的关注和鼓励,并开展必要的课后辅导,提高他们的学习能力和自信心。

(四)试题区分度分析

试题区分度分析一般采用的方法是:把班级总分按从低到高的顺序排列,将总分排在前27%的同学分为一组,称为低分组;后27%的同学分为一组,称为高分组[2];检验两组学生在各个题目上得分是否有显著差异,有差异则说明区分度良好,否则,区分度不好。

1.SPSS软件操作步骤

(1)把全班同学分为低分组、中间组和高分组。点击“数据”→“个案排序”,把“总分”选到排序依据框中,点击“确定”。因为班级人数为28人,27%的人数为7人,按从分数低到高的顺序,第七位同学的分数56分为低分组的上界,倒数第七位同学的分数78.9为高分组的下界。利用可视化分组,此处的分界点为56和78.9,定义标签值分别为1、2和3,单击“上端点”框中的“包括”。实现把全班同学分为低分组(≤56分)、中间组(56~78.9分)和高分组(>78.9分)。

(2)从数据中筛选出高分组和低分组的数据,并命名为高低分组。单击“数据”→“选择个案”→“如果条件满足”,输入表达式“高低分组≌2”,勾选“将选定个案复制到新数据集”,命名为“区分分组”,单击“确定”。

(3)对高低分组数据进行独立样本T检验,判断每个题目的区分度[3]。打开“区分分组”数据文件,单击“分析”→“比较均值”→“独立样本T检验”,把第一题直到第二十二题全部选到右侧“检验变量”框中,把“区分分组”选入分组变量框中,点击“定义组”,在组1中输入“1”,组 2 中输入“3”,点击“继续”→“确定”,可输出每个题目的区分度结果报告。

(4)按同样的方法,把判断题、选择题、填空题、应用题、总分选入检验变量框中,得出每类题目及总分的区分度结果报告。

2.结果报告分析

(1)单个题目的区分度结果分析。第10题、第21题、第22题的分析报告如表1所示。其他题目高分组、低分组之间没有显著差异,此处不再一一分析。

表1 部分题目得分独立性检验结果

由表1可知,针对第10题,高低两组同学得分的方差不等,t的结果看第2行,t=-2.828,双尾检验概率P=0.03<0.05,由假设检验理论知,高分组与低分组同学在第10题得分上存在显著差异,第10题区分度很好;依据表中数居及上述分析方法可知,高分组与低分组同学在第21题、第22题得分上也存在显著差异。综上得出第10题、第21题、第22题三个题目的区分度非常好,而其他题目高分组、低分组的得分之间没有显著差异,区分度不明显。

(2)每类题目的区分度结果分析四类题目的方差齐性检验的概率P>0.05,即高分组与低分组在每类题目的得分上方差齐。判断题的双尾检验概率P=1>0.05,说明判断题的区分度不好;其他三类题目的双尾检验概率P<0.05,故其他三类题目的区分度很好。

(五)试题信度分析

信度是指量表或测验的可靠性或稳定性[4]。信度分析用于检验总量表和量表各层面的可靠性或稳定性。信度分析常用的方法为α系数检验法,α称为内部一致性系数值,当α在0.6到0.7之间,试卷尚佳,但需要增列或修改题项;当α在0.7到0.8之间,试卷佳(信度高);当α在0.8到0.9之间,试卷甚佳(信度很高);当α在0.9以上,试卷非常好(信度非常高)。

1.SPSS软件操作步骤

单击“分析”→“标度”→“可靠性分析”,把判断题中的五个小题选入“项”对应的框中,选择“模型”中的“Alpha”,点击“确定”,按照同样的方法可得到选择题、填空题、应用题及所有试题的α值。

2.结果报告分析

四类题目及所有试题的α值分别为0.718、0.764、0.856和0.837。因此判断题需要稍加修改语句;选择题、填空题可以接受,但还可以改进;应用题及整个试卷试题的信度很高,但还不是最理想的。

(六)试题效度分析

效度是指测量结果的有效性。针对科学测验,可以用与此相关的其他学绩资料作为效标检验的关联度[5]。这里采用教学过程中的平时成绩作为效标,计算期末考试成绩与平时成绩的相关系数r[3]。|r|越接近1,说明期末成绩与平时成绩的相关性越高,即试题的效度越高。

单击“分析”→“相关”→“双变量”,把平时成绩和总分选入变量框中,单击“确定”,得到r=0.691,r的检验概率P=0.001<0.05,由相关分析理论知,平时成绩与期末考试成绩之间呈中度线性相关。故期末测试结果是有效的,能较好地检验学生的学习效果,但还可以改进以提高试卷效度。

二、学习效果评价分析

(一)男、女生数学学习效果评价分析

采取独立样本T检验,对男、女生的数学学习效果做评价分析。操作步骤在试题区分度分析中已详细阐述。得出如下结果:男生平均分为64.67,女生平均分69.46分,女生平均分比男生平均分高4.795分;平均值等同性 T检验结果 t=-0.970,自由度 df=26,P=0.341>0.05,由假设检验理论知,男、女生的平均成绩没有差异,也即是男、女生在数学学习效果上没有差异。

(二)不同生源数学学习效果分析

高职院校生源类型主要有技能高考、普高、专本衔接三种类型,由于三类生源是相互独立的,现采取随机抽样的方法,从三类生源中分别随机抽取19、18、17位同学,利用方差分析中一维方差分析理论[3]对三类生源数学学习效果做科学分析。

1.SPSS软件操作步骤

打开不同生源期末考试成绩数据文件,单击“分析”→“比较均值”→“单因素ANOVA检验”,把“总分”选入因变量列表框中,“生源类别”选入因子列表框中,点击“选项”,勾选选项对话框中的描述和方差齐性检验复选框,点击“继续”→“确定”,整理结果见表2。

表2 单因素ANOVA检验结果

2.结果报告分析

方差齐性检验的F=0.898,P=0.414>0.05,故三类生源的考试得分方差齐,符合一维方差分析的条件。又单因素ANOVA检验的F=49.920,P=0.001<0.05,根据方一维方差分析理论知三类生源的期末考试成绩之间存在显著差异。点击“单因素ANOVA检验”对话框中的事后多重比较按钮,比较究竟哪两类生源的数学成绩存在差异。由比较结果知,技能高考生源的数学成绩明显低于普高和专本衔接生源的考试成绩,而普高生源的考试成绩也明显低于专本衔接生源的考试成绩。

三、改进建议

(一)提高试卷质量方面的改进建议

需要修改判断题题目难度,提升试题区分度;建议进一步修改个别题目的语句表述,尤其是判读题,使试题更通俗易懂,提高试卷可靠度;平时成绩与期末成绩之间呈中度线性相关(0.4<r<0.7),需要修改个别试题的考核内容,提高试卷效度。

(二)提高学习效果方面的改进建议

告知学生,男、女生在数学学习效果上没有明显差别,鼓励广大女同学积极学习数学,提高她们的自信心;建议采取分层教学,针对技能高考类生源,适当降低授课知识难度,注重培养学生数学知识的应用能力;针对专本衔接生源可以适当补充本科教材涉及的内容及习题;改革考核评价模式,针对三类生源单独编制三套试卷;给基础差的同学施以个性化辅导,激发学生学习动力。

文章结合实例,利用统计学相关理论,选择恰当的统计分析方法,介绍SPSS软件操作步骤,并对计算结果给出解读,进而对试卷质量和学习效果做出客观公正的评价分析,并针对试卷编制、教学效果等方面存在的问题提出改革建议。因此,本文有一定的推广价值,可供广大教师借鉴学习。

猜你喜欢

区分度生源学习效果
疫情期间线上学习效果评价分析
“百词斩”对于大学英语四级词汇学习效果的实证研究
新形势下提升传统本科专业生源质量的思考和认识
基于学习性评价原则提高研究性学习效果的研究
农村生源不是“摇钱树”
莲心宝宝有话说
浅谈试卷分析常用的几个参数及其应用
图形推理测量指标相关性考察*
浅观一道题的“区分度”
图表