APP下载

基于决策树算法的成绩优秀率分析与研究

2015-04-29樊敏

计算机时代 2015年12期
关键词:成绩分析优秀率

樊敏

摘 要: 目前的成绩分析仅限于简单的统计,只对成绩的优劣评价,而没有深入分析并给出具体的针对性的建议。为此提出利用考试系统中原始成绩数据,将这些数据进行了重组、转换等一系列的预处理,构建了符合算法要求的数据模型,并采用决策树算法对考试成绩进行数据挖掘。通过对成绩的分析,构造了成绩等级的决策树,利用提取的决策树规则来指导教学改革和改善教学环节,以促进学生成绩优秀率的提高,进而提高教学质量。

关键词: 成绩分析; 决策树算法; 优秀率; 考试系统

中图分类号:TP301 文献标志码:A 文章编号:1006-8228(2015)12-70-03

Analysis and research on the excellent rate of score based on decision tree algorithm

Fan Min

(Shanxi Medical University Fenyang College information department, Fenyang, Shanxi 032200, China)

Abstract: At present, the score analysis is limited to simple statistics, only for the evaluation of the pros and cons of the results, but no in-depth analysis and specific targeted recommendations. In this paper, the original score data from the exam system is pre-processed, such as reorganization and transformation. Then a data model is constructed to meet the requirements of the algorithm, and the decision tree algorithm is used to carry out data mining on the exam results. Through the analysis of the results, the grade decision tree is constructed and used to guide the teaching reform and improve the teaching process, so as to improve the students' excellent rate of score, and improve the teaching quality.

Key words: score analysis; decision tree algorithm; excellent rate; exam system

0 引言

考试成绩是学生在校期间表现优劣评价的重要指标之一,同时也是教学质量高低的体现。对高校学生成绩调查发现,平均及格率为90.5%,而平均优秀率(85分以上为优秀)不足10%。为了提高学生成绩优秀率,需要对学生成绩数据进行分析,从数据中发现有价值的信息,用以指导教学实践及教学管理,从而促进教学质量更快更好的提高。

1 现状分析

目前学校对学生成绩的管理只是对成绩数据进行存储、排序,以及计算及格率、统计平均分等,没有对学生成绩优秀或不及格成绩数据进行深入挖掘和分析,所以,考试系统对教学的指导意义不明显[1]。本文探讨通过数据挖掘技术对这些数据进行分析,从更深层次挖掘出隐藏在数据背后未知的有用信息[2],对这些信息进行有效地利用,以期能有针对性地为教学提供帮助,对教师教学水平的提高起到积极作用。

2 数据准备

考试系统中生成的成绩明细清单有每个考生每道考题的得分情况,且题目具有章节属性,这间接反映了学生对各章知识的掌握情况。挖据这部分数据可以得到各章节得分情况及其对总分的影响。如果能够明确学生对各章节掌握情况及其对总成绩的影响,教师就能够对相关章节的内容进行针对性地教学和练习。

本文选取了考试系统中某门课程的成绩数据进行数据挖掘。该课程共6章内容,试卷满分为100分。在考试系统的题库中试题具有“所属章”属性,考试系统自动评卷后会生成成绩明细表和成绩表,分别保存学生每道题目的得分和总分,表结构分别为成绩明细表(考号,题号,……,所属章,分值,得分)、成绩表(考号,……,总分)。

对于缺考或休学的学生,得分都为0,没有参考价值,属于噪声,所以应删除这些信息。考试系统中的数据不能直接用于数据挖掘,需要建立适合决策树算法的模型,将原有的数据进行转换。利用SQL语句得到章得分率表:

SELECT 学号,所属章,章得分/章分值 AS 得分率FROM (SELECT学号,Sum(分值) AS 章分值, Sum(得分) AS 章得分FROM 成绩明细表 GROUP BY学号,所属章) INTO DBF 得分率。

利用章得分率和成绩表创建交叉表查询得到的考生得分率表如表1,由109条记录组成。将表1中的得分率转换为0或1,得分率>=0.85用1表示,否则用0表示。总分>=85用“优”表示,总分<85用“否”来表示。离散化后的数据如表2。

3 数据挖掘

3.1 信息熵计算

其中|S|表示数据集S的总数,|Ui|表示类别Ui的例子数[3]。

在数据处理后的训练集109条记录中,总分取值为“优”的有39个,取值为“否”的有70个,根据熵的计算公式得到:

从分析结果得出:该课程中第三、四、五章是重点,其中第三章是关键的章节,结合该课程,第三章的内容是第四、五章的基础,所以第三章的教学最关键。在教学中应分别给予这三个章节合理的学时。

4 结束语

本文以某门课程的成绩分析为例说明了在考试系统中进行成绩分析的步骤和算法,使得成绩分析不局限于简单的统计分析。通过数据挖掘手段,分析出潜在的、影响成绩的因素。利用分析结果有针对性地进行教学改革,调整教学环节,使教学效果得到明显提高。利用本文算法可以分析成绩的各个分数段的影响因素,这种方法有较强的适用性和实用性。

参考文献(References):

[1] 刘爱民.基于关联规则的学生成绩分析系统的设计与实现[D].

吉林大学硕士学位论文,2014.

[2] 田伟.基于数据挖掘的高校学生分析与管理[J].牡丹江教育

学院学报,2015.3:99-113

[3] 安淑芝等.數据仓库与数据挖掘[M].清华大学出版社,2005.

[4] 博则恒.数据挖掘决策树技术在学生成绩分析中的应用研

究[J].广东技术师范学院学报,2015.2:113-117

[5] 李岚.基于数据仓库的学生成绩分析与研究[D]. 北京交通大

学硕士学位论文,2014.

猜你喜欢

成绩分析优秀率
运用分层教学提升初中数学教学的优秀率
高职院校定向培养士官军事体能现状分析
提高中考体育优秀率的策略
人生优秀率
关于高校学生成绩评分体制的思考
纸飞机飞起来,心情放松起来
学生成绩分析系统
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
高职院校移动互联自主学习考试平台的设计与实现
试卷质量分析在《医学免疫学》课程教学中的应用与思考