有效利用网上阅卷数据评价学生学业质量
2011-12-27赵娟,常双
赵 娟,常 双
(大连教育学院 学习质量监测中心,辽宁 大连 116021)
有效利用网上阅卷数据评价学生学业质量
赵 娟,常 双*
(大连教育学院 学习质量监测中心,辽宁 大连 116021)
伴随网上阅卷的迅速普及,如何有效利用网上阅卷数据成为当前重要的研究课题。在学业质量评价中,通过建立各层面常模、关联各组数据、汇集多年数据等方式都可以帮助我们有效利用数据,进而对学生的学业质量进行更全面和更深入的评价。
数据;学业质量;评价;常模
随着计算机技术的发展以及社会对考试公平性要求的提高,网上阅卷已经成为人们推崇的阅卷方式,并得以迅速普及。与传统阅卷相比,网上阅卷除了具有高效性、保密性、公正性等特点,还能够为人们提供更加丰富和详实的数据信息。比如,借助传统阅卷,我们一般能够收集到学科总分和大题分数,而借助网上阅卷,我们可以收集到任意采分点的信息。那么如何有效利用丰富的数据信息评价学生学业质量呢?下面我们就以大连市中考数据分析为例谈一下数据的分析处理及学生学业质量评价。
一、建立各层面常模,获得学业质量评价的相对标准
大连市中考是常模参照与标准参照相结合的考试,我们可以把学生的得分与预估的达成标准进行比较,但现有情况下,人们对达成标准尚未形成共识,所以我们更多的是把个别小团体的分数与整个团体的平均水平加以比较。建立各层面的常模也就是为学业质量评价提供一个相对的标准。如表1:
表1 大连市2010年初中毕业生学业总分及各学科分数基本统计量
有了上表中的常模数据信息,我们就可以评价不同地域、不同区市县、不同学校在大连市初中毕业生这个整体中所占的相对地位。借助平均分和得分率的比较,可以确定个别小团体的学业水平是高于大连市平均水平,还是低于大连市的平均水平。借助中位数的比较,可以确定小团体中上50%学生学业成绩的下限,下50%学生学业成绩的上限,这一上限、下限是否高于大连市的平均水平。借助标准差和差异系数的比较,可以确定小团体学生学业发展的均衡性是否好于大连市的平均水平,借助于及格率、优秀率、全科及格率可以比较小团体学生成绩的分布与大连市全部学生整体成绩分布的不同。通过以上比较,可全面描述小团体的学业状况,推断小团体学生学业能力的优势和劣势。
同时,我们可以建立某一地域的常模,地域内的区市县和学校也就有了地域性的比照标准,依次类推,还可以建立某一区市县的常模、某一类学校的常模等等。
另外,我们还可以建立某一学科内各项能力、各项内容的各层面常模,甚至每一小题、每一个采分点的各层面常模。例如,在物理学科,我们可以建立理解、应用、分析综合,实验能力几个分项能力的常模。
二、关联各组数据,进行学业质量的比较分析
借助孤立的一组数据,我们只能对学习质量状况进行描述,难以进行评价,因为任何的评价都需要一定的参照点。借助常模,我们可以把各群体的状况与相对标准做比照。我们也可以关联不同地域、不同区市县、不同学校的数据,评价不同群体在学业质量方面的差异,如表2、图1。
表2 大连市不同地域初中毕业生物理成绩的基本统计量
图1 大连市初中毕业生在物理学科上得分分布
通过数据的关联,借助表2,我们可以对三个地域学生的学业水平进行比较分析。借助于平均分和得分率的比较,可以确定三个地域中哪一地域的学业水平最高、哪一地域最低。借助标准差和差异系数的比较,可以确定哪个地域学生物理学业能力发展的均衡性最好,哪个地域最差。借助中位数,可以确定三个地域上50%学生学业成绩的下限是否相同,下50%学生成绩的上限是否相同。借助及格率可以确定三个地域物理达到合格水平学生比例的差异。借助优秀率可以确定三个地域物理达到优秀水平学生比例的差异。
图1更详尽地展示了三个地域学生物理成绩分布的差异。箱体的中线实际上是中位数。箱体上沿是75百分位数,借助于此,可以比较三个地域下75%学生成绩的上限。同理,箱体的下沿是25百分位数,中间竖线上端的横线是95百分位数、下端是5百分位数。
通过多方面的比较,我们可以从相对的角度把握三个地域学生各方面的学业表现。
我们还可以关联各特殊群体的数据,比较各特殊群体之间在学业质量上的差异,找到优势和差距。如表3。
表3 大连市2010年薄弱与非薄弱学校初中毕业生各学科的差异
表3数据表明,薄弱校与非薄弱校的差距,主要来源于外语学科,其次是理化和数学,语文学科的差距相对小。
另外,我们甚至可以关联同一群体学生在不同学科或同一学科的各知识点、各分项能力上的数据信息,把握学生在学业质量上的优势和劣势。
图2 大连市某地域学生化学各知识组块得分分布比较
借助于图2中的中位数,可以确定学生在化学学科“物质构成的奥秘”组块的水平最高,而且与其他组块相比,上50%学生在这一组块上的离散度小,学生的分数比较集中,同时还能看出,至少有5%的学生获得满分。“身边的化学物质”和“物质的化学变化”两个组块内容的中位数接近,但“物质的化学变化”组块的离散度明显大于“身边的化学物质”,学生两极分化的状况较为明显。“物质构成奥秘”与“化学与社会”两组块中间箱体部分的分布比较接近,但这部分学生在“物质构成奥秘”组块的成绩高于“化学与社会”。借助于图2还可以进行很多方面的分析。借助这些分析可以把握学生在不同知识组块的学业状况,查找优势和劣势,探讨改进措施,进而提高学生的学业成绩。
三、汇集多年数据,评价学业质量的纵向发展
网上阅卷数据的丰富性和准确性也为我们研究和评价学业质量的纵向发展提供有力的实证信息。我们可以借助标准分这一统计参数,评价某一小团体随时间的推移在整体中地位的变化。标准分是以总体平均分为参照点,以标准差为单位的地位量数。如果多次考试的考生总体特征基本一致,借助于标准分就可以评价小团体学业质量的纵向发展。如图3。
图3 某区2005-2010年初中生学业水平的发展变化
图3数据显示,相对于大连市的平均水平,某区市县整体学业水平2005-2008年之间处于波动状态,2008-2010年连续明显上升。2005-2008年之间各学科学业水平基本呈现下滑趋势,虽然2007年成绩略有提高,但2008年又有所下滑(除语文学科)。而2009-2010年,该区市县各学科成绩连续两年显著上升。
也可以借助差异系数,评价某一群体学生的学业能力发展均衡性随时间的推移所发生的变化。如图4。
图4数据显示,某区市县总分差异系数2006-2010年之间基本呈下降趋势,说明该区初中毕业生整体学业能力发展均衡性在不断提高。其中语文学科成绩的离散度最小且相对稳定。外语学科的离散度和波动最大,说明语文学业能力发展的均衡性最好,外语最差。数学、物理和化学学科的离散度处于中等水平。从近几年差异系数的变化看,该区初中毕业生语文学业能力发展均衡性基本保持稳定,且略有提高。外语学业能力发展的均衡性2006-2007年上升,2007-2008年下降,2008-2010年上升。其他学科基本呈现学业能力发展均衡性逐年提高的态势。
图4 某区2006-2010年初中毕业生学业能力发展均衡性变化
网上阅卷为我们提供更丰富、更详实的数据信息,描述学业质量的统计参数有多种,数据整理、统计分析的方法也多种多样。在学业质量评价过程中我们要致力多层面、多侧面地挖掘分析的角度,有效利用网上阅卷的数据信息,进而更全面、更深入地评价学生的学业质量。
On Effectively Using Online Paper Marking Data to Evaluate Students’Academic Quality
ZHAO Juan,CHANG Shuang
(StudyQualityMonitoringCenter,DalianEducationUniversity,Dalian116021,China)
With the rapid popularization of online paper marking,how to effectively use online paper marking data has become an important research subject.In the evaluation of students’academic quality,building up the norm at all levels,associating sets of data,bringing together data of years can help us effectively use data and evaluate students’academic quality more comprehensively and deeply.
data;academic quality;evaluation;norm
G424.79 < class="emphasis_bold">文献标识码:A文章编号:
1008-388X(2011)04-0024-03
2011-05-03
赵娟(1966-),女,辽宁抚顺人,教授。
阅文]