独立样本t检验在学生学业质量评价中的应用
2016-09-06杨建芹
杨建芹
(大连教育学院 学习质量监测中心,辽宁 大连 116021)
独立样本t检验在学生学业质量评价中的应用
杨建芹*
(大连教育学院 学习质量监测中心,辽宁 大连 116021)
文章介绍了差异性比较的一种科学的检验方法以及具体的应用案例。
独立样本t检验;学业质量评价;差异性比较
考试测验作为教育教学评价的一种手段,已经被广泛地应用于学校的日常教学评价与大规模人才选拔考试中。在考试成绩统计与分析中,平均分是衡量一个学校或班级教学的主要考核指标,但目前平均分差异性的比较还存在一些问题。一些从事成绩分析与管理的教师在作成绩对比分析时,通常简单地根据各学科考试分数的高低评价教师的教学业绩,不做统计检验就得出结论,这种评价是不科学的。在学业质量评价过程中,两个平均分的差异是“显著”还是“不显著”,只有进行科学地统计检验,才能客观地分析两个均值间的差异。
一、两个不同群体考生考试平均分比较的原理和方法
对学校两个不同班级的考试平均分进行比较,可以采用独立样本t检验进行统计分析。比较两个独立样本的平均分,就是确定两个样本平均分差异是由抽样误差引起的,还是两个总体平均分的确存在差异。
在假设检验中使用独立样本t检验之前,有三个前提假设必须满足:一是每个样本的观察值必须是独立的;二是样本来自的两个总体必须是正态分布的;三是样本来自的两个总体必须有相同的方差。[1]一般情况下,对于大样本(通常指样本容量大于或等于30)而言,前两个前提基本都能满足。当有理由怀疑总体不是正态时,作为补偿,应当选用相对较大的样本。第三个前提又叫方差的同质性,这个前提非常重要,因为违背这个前提,不能对独立测量实验数据进行任何有意义的解释。
二、独立样本t检验应用实例
为了验证两个考生群体的平均分差异是不是显著,可以利用两个独立样本t检验进行统计推断,如果满足独立样本t检验的三个前提假设,接下来可分五步进行。第一步,建立零假设和非零假设;第二步,确定意义水平α(考试数据分析解释中,一般选择α=0.05,少数情况下选择0.01);第三步,计算检验统计量的值;第四步,对于自由度为df的t统计检验量,利用计算机获得概率p值;第五步:判断结果。如果用统计软件SPSS,这一比较过程会更加便捷。下面通过例1来说明,根据SPSS的输出结果如何判定独立样本t检验的第三个前提假设是否满足,以及对独立样本t检验结果的解读。通过例2进一步说明独立样本t检验在学生成绩差异性比较中应用的必要性。
1.班级学业成绩差异性比较
例1:在一次高三模拟考试中,某学校的高三四班(66人)和七班(67人)理科数学的平均成绩分别为101.34分和95.52分,有些人认为两个班级平均成绩相差5.82分,差异显著,这样的评价是否科学?
分析:由于四班和七班的数学成绩可看成是两个独立的样本,且测试成绩可近似认为服从正态分布,由此可知,前两个前提条件都是满足的,利用SPSS进行分析可得到独立样本t检验结果,如表1所示。
在Levene's Test for Equality of Variances(Levene方差齐性检验)和Equal variances assumed(假设方差相等)下显著性水平Sig=0.08>0.05,表示两个样本的方差是齐性的,这表明独立样本t检验应用的第三个前提条件也是满足的。因为方差是齐性的,由表1的第一行可得,显著性水平Sig=0.101>0.05表明检验不显著,即该学校高三年级四班和七班的成绩没有显著差异。两班的平均成绩差异可能是由偶然的随机因素造成的。我们通常认为的成绩相差五六分就差异显著是不科学的。因为影响学生成绩的因素较多,不能简单地比较考试成绩平均分的高低,还需要判断两个班平均成绩的差异是由偶然的随机因素造成的,还是由平时的课堂教学效果造成的,亦或是教师的教学质量引起的。
表1 独立样本t检验结果表
2.学校学业成绩差异性比较
例2:对大连市某个区的四所学校某次物理考试成绩进行差异显著性检验,独立样本t检验分组统计表和结果表汇总在表2中。
表2 不同学校物理考试成绩基本统计量和t检验相关结果
由表2第一组数据可知,编码为18和19的两所学校平均分相差1.754分。由独立样本t检验结果可知,校正t=1.763,校正自由度(df)=644.054,显著性水平Sig=0.078>0.05,表明检验结果不显著,两所学校的中考物理成绩没有显著差异。而由第二组数据可知,编码为93和68的两所学校平均分相差1.743分。校正t=2.345,校正自由度(df)=476.094,显著性水平Sig=0.019<0.05,第二组的两所学校的中考物理成绩有显著差异。由表2的数据可以看出,第一组的两所学校和第二组的两所学校同样是平均分相差两分,但第一组的两所学校中考物理成绩并没有显著性差异,而第二组的两所学校中考物理成绩却有显著性差异,第一组的两所学校的成绩差异可能是由偶然的随机因素造成的,而第二组的两所学校的成绩差异可能受到诸如成绩分布状况的影响,单单比较两个数值的大小是没有意义的。
由以上的两个例子可以看出,在评价学生的学业质量状况时,尽管平均分是一个非常重要的指标,而且比较起来也很直观,但直接比较并不科学,我们应该借助于科学的统计方法,综合考虑影响成绩的诸多因素,来客观地分析两个平均分之间的差异。而不能仅凭感觉来对不同学校,不同班级的学生成绩进行简单排名。
[1]刘红云.应用心理统计学[M].北京:北京师范大学出版社,2015:172-173.
[责任编辑:知然]
On Application of Independent Sample T Test in Quality Evaluation of Students'Academic Achievements
YANG Jian-qin
(Study Quality Monitoring Center,Dalian Education University,Dalian,116021,China)
This paper introduces a scientific test method for difference comparison and provides specific application cases.
independent sample t test;quality evaluation of academic achievements;difference comparison
G424.74
A
1008-388X(2016)02-0052-02
2016-01-18
杨建芹(1981-),女,山东临沂人,小学高级教师。