学生中考成绩预测初探
2015-12-27陈欣,贾萍
陈 欣,贾 萍
(1.大连教育学院学习质量监测中心,辽宁大连116021;2.大连市第三中学,辽宁大连116021)
学生中考成绩预测初探
陈 欣1,贾 萍2*
(1.大连教育学院学习质量监测中心,辽宁大连116021;2.大连市第三中学,辽宁大连116021)
文章以一所普通高中为样本,针对学生中考成绩进行线性回归分析,得到预测方程。期望可以帮助学生借助试测成绩预测中考成绩,提高报考的准确度。
线性回归;中考成绩;预测
初中毕业生能否进入符合自己学业水平的高中,很大程度上取决于考试前对中考成绩预测的准确程度。成绩预测通常都是建立在对学生平时学业表现判断的基础上,但这种判断大多是凭经验进行,准确程度依赖于判断者的专业水平和阅历,因此其结果有时与学生的中考成绩差距较大。利用统计学方法定量分析学生成绩具有一定的客观性和科学性,因此我们可以依据学生平时的成绩数据,利用线性回归的方法对中考成绩进行预测,力求满足考生和家长的迫切需求,为他们提供更加有效的报考依据。
线性回归分析是研究多个变量之间关系的回归分析方法,在很多领域都有着广泛的应用。它的基本思想和主要功能是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以通过统计分析设法找出最能代表它们之间关系的数学表达形式;根据一个或几个变量的值,预测或控制另一个变量的取值,并且可以判断这种预测或控制能达到什么样的精确度。利用线性回归对中考成绩进行预测,就是找出相关度较高的测试成绩与中考成绩之间的近似表达式,对模型进行修正后借助表达式预测学生的中考成绩。
一、线性回归预测
大连市中考成绩一般由两个部分组成:统一时间进行的笔试成绩和分散进行的等级测试成绩。由于学生中考等级测试成绩差异较小,因此我们需要预测的是包含语文、数学、外语、物理和化学成绩的中考笔试成绩。作为预测依据的测试成绩也是同样的范围。
1.预测模型初建
我们应首先建立线性回归方程:y=b0+b1x1+b2x2+…+bkxk,其中b0是回归常数,bk(k=1,2, 3…n)是回归参数,xj(j=1,2,3…n)是自变量。在公式中因变量y是我们想要预测的学生的中考成绩,自变量应选择对因变量有显著影响并密切相关的因素。一般来讲,学生的各种测试成绩与中考成绩的关联度相对较大,结合大连市的实际(初中阶段与中考相似度较高的仅有两次试测),我们尝试以两次试测成绩作为自变量来预测因变量,期望可以得到较为可靠的回归方程。
我们选择某普通高中高一新生241名,收集他们的中考成绩和两次中考试测成绩用于分析。由于选定了两个自变量,因此首先尝试进行多元线性回归分析,分别对中考试测一成绩与中考成绩、中考试测二成绩与中考成绩以及两次试测成绩间进行相关分析,将数据导入统计分析软件SPSS17.0,得到的显著性分析结果如表1所示。表中Sig意为显著性,Sig值是t统计量对应的概率值,要求小于给定的显著水平,一般是0.05、0.01等,Sig越接近于0越好。此例中Sig值均为0.00,表明中考试测一和试测二成绩与中考成绩都显著性相关。再结合散点图进行分析,中考试测一和试测二成绩与中考成绩都呈现出近似线性的规律,可以用于进行线性回归分析。但由于两次试测间的相关系数高于与中考成绩的相关系数,并且存在共线性,不符合进行多元线性回归的条件,因此对中考成绩的预测更适合进行一元线性回归分析。我们将回归方程确定为y=b0+b1x1,考虑到预测的准确程度,我们选择与中考成绩相关性更高,距离中考时间更近的试测二成绩作为因变量。
表1 显著性分析表
2.线性回归分析结果
将学生试测二成绩和中考成绩数据导入软件,得到的分析结果如表2和表3所示:表中的Sig值均为0.00,表明模型的回归极显著。将表3中得到的回归方程的系数带入得到预测方程:y=465.35 +0.05x。
表2 方差分析表
表3 回归方程系数表
3.回归系数检验
虽然得到了方程,但是分析过程并没有结束,还需要对初步的方程进行检验和调整。我们可以做回代检验,进行预测效果验证。将样本241名学生的试测二成绩带入回归方程,得到的成绩与中考成绩相对照,误差值的平均值为3.85。与600分的满分值相对照,十分接近学生中考的实际成绩。样本中预测误差值不超过5分的有167人,占总人数的69.3%,说明预测方程有效。
二、预测模型的使用与推广
1.预测模型的使用
在分析过程中我们发现样本试测一成绩与试测二成绩的相关系数为0.78,而且两次试测成绩对学生中考成绩都有显著性影响,说明试测的稳定性、一致性和有效性较高。规范的试测程序、高质量命制的试题保证了试测的高信度和高效度,为预测学生的中考成绩提供了有力的依据。虽然我们得到的预测模型误差较小,但在使用时还要注意以下两个方面的问题。
(1)回归方程预测中等学业水平学生中考成绩的准确性相对较高。分析时选择的样本为同一所高中的学生,他们录取的中考成绩很接近,这也使得分析的过程受到一定的限制。因此,我们分析得到的结论有一定的针对性和时效性,只对样本所在的群体产生作用。由这样的样本数据得到的回归方程在预测中等学业水平学生的中考成绩时准确性会相对较高。同时预测的准确性还会受到试测难度的影响,若是用作自变量的试测难度与案例中相差较大,利用案例中得到的回归方程预测学生中考成绩误差自然也会较大。
(2)应进行特殊值分析。在进行回归方程的预测效果检验时,我们发现一些样本预测的结果与实际差异较大。例如,某学生中考预测成绩为490分,而中考实际成绩为500分,相差了10分。查询他试测一的成绩为449.5分,试测二的成绩为491.5分,发现他的成绩始终处于上升的趋势。我们可以继续对其进行深入分析,落实到学科上观察他的成绩变化趋势,看是否因为某学科的进步而带来了总成绩的提高;也可以通过调查分析成绩提高的具体原因,看他提高成绩的方法是否具有普适性、能否推广。
2.预测模型的推广
相对于中考的大样本,我们用于建立回归方程的样本较少、限制条件较多。只有更大的样本容量才能使预测模型更有代表性,预测的准确程度更高。除此之外,我们还可以引入其他的自变量,比如课外学习时间、补习班学习情况等因素,进行多元线性回归分析,找出对学生成绩影响较大的因素。如果我们继续收集样本学生的高中阶段成绩数据,还可以利用积累的数据对学生进行“增值评价”。借助客观多角度的评价,学生可以更全面地了解自己,更准确预测自己的成绩以及未来的发展。
[责任编辑:知然]
Preliminary Study on the Prediction of Students’Senior High School Entrance Examination Results
CHEN Xin1,JIA Ping2
(1.Study Quality Monitoring Center,Dalian Education University,Dalian,116021,China2.Dalian No.3Middle School,Dalian,116021,China)
This paper takes an ordinary high school as the sample,carries on the linear regression analysis of the students’high school entrance examination results,and gets the forecasting equation.The author holds the expectation that the paper can help students predict the test results by using usual grades and help them improve the success rate of applying to universities.
linear regression;senior high school entrance examination results;prediction
G632.474
A
1008-388X(2015)04-0051-02
2015-09-15
陈欣(1979-),女,辽宁抚顺人,讲师。