基于时间序列成绩分析的班级发展状态研究
2022-04-29李香林
李香林,王 梅
(吕梁学院 数学系,山西 离石 033001)
0 引言
学生成绩是研究高校学生发展的常用指标,李岩使用高校学生的学习成绩,结合决策树算法成功的找到了影响学生成绩的主要因素[1].曾旭研究员使用聚类算法对学生的成绩进行分析将学生分为不同的类簇,对不同的类簇进行分析研究,掌握学生的学习情况[2].陆汝飞基于大数据挖掘理念,将多元统计方法引入高校成绩分析[3].从课程教学、研究、管理等多个角度对各类数据集合进行计算和综合分析[4],做出比较合理的教学决策可以改善和提高教学质量.学习成绩受学习动力、专业难度、课程设置、老师因素、生源地、周围环境等诸多因素,这些影响因素错综复杂,利用结构性分析预测成绩往往比较困难.将历年的学生成绩数据进行时间序列建模,对分析影响班级发展状态有一定的指导意义.
1 数据来源
吕梁学院数学系信息与计算科学和数学与应用数学两个专业,简称专业一和专业二,四个班级156人.1—6学期共76门课程.
2 分析方法
两个专业学生以数学大类培养,前四学期的课程一样,上课教师无明显差别,班主任、教学制度、教学环境、任课老师无区别,成绩分析有对比意义.成绩的结构性分析较困难,其他因素无大的区别情况下,成绩具有时序性,故采用简单平均法.
2.1 初始状态分析
高考成绩均分为专业一407.1分,专业二406.54分,两个专业学生高考成绩接近.为了观察地区性质对学生成绩的影响,观察学生省份分布,专业一的学生分布在5个省,专业二的省份分布在11个省,专业二的省份分布较广,但区域类别相差不大.统计学生所在地市分布,专业一的城镇学生占39%,农村学生占61%,专业二的城镇学生占26%,农村学生占74%,专业一的城镇占比高于专业二.
2.2 成绩变化趋势
按专业取1-6学期期末成绩的平均分,变化趋势如图1所示.从图可以看出,两个专业学生在第一学期时成绩与高考成绩趋势一致,专业一略高于专业二,但显示出下滑的趋势.经过第二学期后,大三学期开始,专业一明显表现出好于专业二,且专业一学生比专业二学生发展更平稳的良好态势.
图1 两个专业成绩对比图
3 基于时间序列的成绩预测
3.1 ARIMA时间序列模型
时间序列的分析是建立在客观事物发展规律的基础上的,通过之前真实数据的变化趋势,利用统计分析得出之后变化趋势的结论.通常情况下,时间序列分析的方法对短期预测更为准确.
经常用到的自回归积分滑动平均模型(ARIMA模型)[5],结合了自回归(AR)、差分(I)、移动平均线(MA)三种方法.ARIMA模型预测过程包括:
(1)对序列的平稳性进行识别.根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律.
(2)对非平稳序列进行平稳化处理.如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零.
(3)模型识别.根据偏相关函数和自相关函数的拖尾或截尾确定模型AR、MA、ARMA.
(4)参数估计.检验是否具有统计意义.
(5)假设检验.诊断残差序列是否为白噪声.
(6)利用已通过检验的模型进行预测分析.
3.2 建模过程
3.2.1 数据处理
观察两个专业四个班成绩的折线图图2和图3发现,成绩不是平稳的,考虑为非平稳的时间序列,因此需要对时间序列进行平稳化差分处理.
图2 专业1两个班级的成绩对比图
图3 专业二两个班级的成绩对比图
3.2.2 模型识别
由二阶差分序列可知,偏相关系数拖尾,自相关系数不明显,如图4,可以认为拖尾,所以采用ARMA(p,q)模型拟合.
图4 二阶差分后的自相关图
3.2.3 参数估计
对于ARMA(p,q)中参数p,q进行确定,算出阶数小于5的所有ARMA(p,q)模型.由最小BIC(1,0)=4.39准则可知,选择AR(1)模型进行拟合最合适.
利用模型进行参数估计,估计方法为最小二乖法,估计结果拟合模型为:
在所有的时间序列模型中ARMA(1,2)最优,所以选择ARIMA(1,2,3)模型进行参数估计.
3.2.4 模型检验
图5 ARIMA(1,2,3)残差的显著性检验
3.3 成绩预测
利用ARIMA(1,2,3 )模型对第七学期成绩进行预测,结果如表1,预测成绩与实际成绩对比如表2所示.
表1 第七学期成绩预测
表2 真实成绩与预测成绩对比
第七学期成绩以实践性、综合性为主,体现学生的综合能力.从表2可以看出预测成绩与真实成绩对比,表现出一致的趋势,专业一好于专业二.具体地,2班好于1班,4班后期发展稍好于3班,差距不大.
4 班主任综合评价
毕业时,班主任从班级制度、班级管理、班级学风、班级事务四个方面对两个专业和四个班级进行了综合评价,班级管理和班级学风建设是影响学生成绩的主要因素.专业一的班级管理和班级学风相对于专业二较好,所以专业一的成绩高于专业二.整体而言,班级2较为优秀,班级1优秀,班级4良好,班级3偏差,与表2的预测趋势一致.
5 结论
在高考成绩、班主任、教学制度、教学环境、课程、任课教师无差别,学生结构、专业课程一定的条件下,第二学期成绩集体处于下滑过程,从第三学期开始,两个专业都开始一致性回升,专业一成绩趋势明显好于专业二.班级管理、班级学风成为影响成绩的主要因素,这二者的形成主要在一年级,所以一年级是非常关键的时期,抓管理、抓学风是最主要的工作.三年级开始专业课程不同,有稍微的区别,分析其原因可能是专业课程特点不同造成,这可以利用其它方法进一步研究.