基于大数据的成绩可视化分析与研究
2021-06-08杨彩侯峰
杨彩 侯峰
摘 要: 从海量的大数据中挖掘出潜在的有价值的信息并进行可视化分析已成为研究的热点。文章根据成绩大数据,从班级、课程等多维度进行成绩可视化分析,为教学管理者提供学生学习情况分析服务。经研究发现,成绩的可视化分析不仅能为管理者提供精准的教学支持,还能使学生及时发现学业问题。
关键词: 大数据; 多维度; 可视化分析; 精准; 教学支持
中图分类号:TP391.9 文献标识码:A 文章编号:1006-8228(2021)01-54-03
Research on the big data based visualized analysis of achievement
Yang Cai1, Hou Feng2
(1. Information Management Center, Zhengzhou University of Light Industry, Zhengzhou, Henan 450000, China;
2. School of Energy and Power Engineering, Zhengzhou University of Light Industry)
Abstract: Mining potential valuable information from massive big data and making visualized analysis has become a research hotspot. According to the achievement big data, this paper makes visualized analysis on students' learning achievement from the dimensions of class, curriculum and the others, so as to provide teaching managers with the analyzing service of students' learning situation. It is found that the visualized analysis of achievement can not only provide precision teaching support for managers, but also enable students to find problems in learning timely.
Key words: big data; multi-dimensional; visualized analysis; precision; teaching support
0 引言
“大數据”是指大量的结构化和非机构化的数据,它无法用常规的软件进行处理,需要新的处理手段来处理这些海量的、高速增长的数据[1]。
大数据技术主要包括海量数据的获取以及数据统计分析和挖掘两部分内容[2]。大数据在各行各业发挥着重要作用,而如何利用大数据技术来提高高校教学管理者的教学管理水平是高校面临的一个重大课题。运用大数据技术可以挖掘出现实生活中不易察觉的较为深层次的信息,通过这些信息,进而为人们提供决策支持[3]。
大数据技术[4]可运用在学生成绩的分析过程中,通过大数据技术,可快速准确地对学生成绩进行可视化分析,从而对学生的学业提供帮助及指导。同时,根据可视化分析,可为教学管理者提供教学管理依据。截至到目前,将大数据技术运用在学生可视化成绩分析的学者越来越多,其已成为学习方法评价的有效手段。以往的学习成绩分析往往是根据传统的统计知识进行简单的统计图分析,或者采用常见分析工具SPSS、SAS等进行分析[5]。本文依据大数据技术,从班级、课程等多维度进行成绩的相关性、词云分析等其他指标分析,通过一系列的可视化分析进而为教学管理者及学生提供服务基础。
1 数据准备
1.1 数据抽取
本文所采用的数据选取某高校一个学院全部本科生的期末成绩作为基础数据集。从教务系统中抽取某学院在2018-2019学年第二学期的期末考试必修课成绩数据信息,数据信息包括:学生基本信息表、班级信息表、课程成绩信息表。其中,涵盖了该校某学院的15级、16级、17级、18级学生,共1227个学生,24个班级,30门课程,46名教师信息。学生课程成绩基本信息主要包括各个考试科目的平时成绩、期末卷面成绩,总评成绩等信息。
1.2 数据预处理
对抽取的数据进行探索分析,发现抽取的数据集存在缺失值数据,数据缺失的原因一方面可能是授课老师还未在教务系统中录入学生成绩,另一方面可能是在数据抽取过程中而导致的缺失,缺失值往往不能忽略处理,而处理缺失值最常用的方法有三大类:删除记录、数据插补和不处理[6]。本文采用拉格朗日插值法对抽取的缺失值数据集进行差值处理,补全缺失数据。
2 数据可视化分析
本文实验采用BI分析平台,从各个维度对学生成绩进行分析,具体分析内容为:分别以学院的班级、课程为指标对平时成绩、期末卷面成绩、总评成绩进行可视化分析;另外,对总评成绩的不及格率按照课程为粒度做词云分析,通过分析进而为学生学业提供指导建议,为教学管理者提供决策支持。
2.1 分析不同班级成绩评定情况
通常,课程的总评成绩包括平时成绩和考试成绩两部分,一般情况下总评成绩是二者的加权之和。用[total]表示总评成绩,[tp]表示平时成绩,[tk]表示考试成绩,[wp]和[wk]分别表示[tp]和[tk]的权重,其中[wp+wk=1],那么,总评成绩的公式表示如下[7]:
[total=wp*tp+wk*tk]
为了更直观的分析课程成绩评定特点,本文引用了学生成绩评定指标,用[pk]表示,用平时成绩与期末考试成绩的比值作为评定指标的依据,如以下公式所示:
[pk=tptk]
若[pk=1],表示平时成绩与考试成绩基本相同;若[pk>1],表示平时成绩明显高于考试成绩,若[pk<1],表示平时成绩明显低于考试成绩,[pk]越小,表示平时成绩越低于考试成绩[7]。
将学生的平时成绩、期末考试成绩、总评成绩进行归一化处理(即将平时成绩、期末考试成绩、总评成绩除以一百),在引入学生成绩评定指标时,分析不同学生班级的成绩评定情况,如图1所示。
从图1可看出,每个班级的成绩评定指标基本都大于1,说明平时成绩普遍高于期末考试成绩,且大多数班级的成绩评定指标介于1.4至1.6之间,还有少部分班級的成绩评定指标介于1.2至1.4之间。从归一化的成绩亦可反映上述问题,平时成绩的趋势线高于总评成绩高于期末成绩。图1可以清晰的反映每个班级的成绩评定指标规律。
2.2 基于雷达图分析不同课程的成绩分析趋势
以每个课程的成绩作为样本画雷达图,得到雷达图如图2所示,从雷达图的横纵轴两个维度进行分析,横向比较不同课程成绩的分布区域,了解每门课程的教学状态;纵向可看出平时、期末、总评成绩的走势,便于任课老师针对性的开展教学工作。
从图2可以看出,虽然平时成绩高于总评成绩,但是总评成绩的走势基本和期末成绩的走势保持一致,说明期末成绩在总评成绩中占据重要部分,学生在注重平时成绩的同时,更应该重视期末成绩。
2.3 以课程为粒度分析期末卷面成绩和总评成绩间的关系
以课程为粒度比较不同课程间的总评成绩和期末卷面成绩间的关系如图3所示。其中,横轴是课程期末卷面成绩,纵轴是课程总评成绩,对两者进行相关性分析,用实线标示二者之间的关系。同时,分别标示出期末卷面成绩和总评成绩的最低值、平均值、最高值及及格线。
从图3的对角实线可以看出,总评成绩随着期末成绩的增大而增大,即总评成绩与课程期末卷面成绩呈线性相关性,因此,教师可以此鼓励学生重视期末成绩。根据图5中期末成绩和总评成绩的及格线可发现,期末成绩不及格而总评成绩及格的课程,如图3中三角形状标示的课程,针对这部分课程,教学管理者可考虑,看该课程是否存在放水可能。对于总评成绩和卷面成绩在均值以下或以左的课程表示这些课程的成绩低于全部课程的整体均值水平,针对这些课程的教学管理者也应重点关注,教学管理者甚至可采取相应的措施来提升这些课程的成绩。
2.4 基于词云的课程不及格率分析
假设某班级学生总人数为[Ni],其总评成绩不及格的人数为[Bi],那么该班级总评成绩不及格率[Pi]可用公示表示如下:
[Pi=NiBi]
以班级为粒度将总评成绩不及格率用词云进行呈现,如图4,其中字体越大越明显的班级表示不及格率越高,字体越小越不明显的班级表示不及格率越小。
从图4可直观的反映出,字体较大较明显的即为不及格率较高的班级,对于不及格率相对较低的班级字体较小。通过词云可视化分析,教学管理者针对不及格率较高的班级可有的放矢的采取教学管理策略,积极采取应对措施,提高教学质量。
3 结束语
本文通过对学生成绩可视化分析,教学管理者可找出班级低于平均分的班级,对这些班级负责人进行适当提示,班级负责人采取给学生谈话、做思想工作等措施,形成良好的学习氛围;教学管理者还可找到课程低于平均分的任课老师,可采取某些激励措施,争取提高其所代课程的成绩;还可以使教学管理者更好的了解学生的学业情况,使学生的学业管理工作顺利开展。同时,让学生对自己的学业情况有所了解,能促进学生及时、积极的应对学业问题。对于教学管理者如何制定长期有效的措施来促进教学和学生的学业发展还需要进一步研究。
参考文献(References):
[1] 刘祥鹏.基于学生过去的学习成绩预测并改善未来学习成绩的大数据服务[J].科技展望,2015.27.
[2] 陆万万.一种基于大数据的案件信息智能分析系统[J].计算机应用与软件,2018.9:153-156
[3] 吴雪峰,马路.数据挖掘技术及在制造业的应用[J].计算机应用与软件,2017.10:77-83
[4] 何琰.大数据技术在审计中的应用[J].郑州轻工业学院学报(社会科学版),2016.17(3):67-71
[5] 余水发,张惠锋,傅海婷等.基于统计图表的学生考试成绩可视化分析[J].教育教学论坛,2015.8:77-79
[6] 黄炎,王紫玉,黄方亮.数据挖掘技术在高校学生成绩分析中的应用与研究[J].兰州文理学院学报(自然科学版),2016.29(3):64-68
[7] 苑俊英,陈海山,常超等.高级语言程序设计课程成绩分析[J].教育现代化,2019.17:86-90
收稿日期:2020-08-24
基金项目:河南省科技攻关项目(202102310232)
作者简介:杨彩(1990-),女,河南南阳人,硕士,初级工程师,主要研究方向:教育信息化、数据挖掘、计算机技术。