APP下载

决策树在学生成绩影响因素分析中的应用

2017-10-13明巧英刘淑婷西安翻译学院西安710105

微型电脑应用 2017年9期
关键词:平时成绩决策树课程设计

明巧英, 刘淑婷(西安翻译学院, 西安 710105)

决策树在学生成绩影响因素分析中的应用

明巧英, 刘淑婷
(西安翻译学院, 西安 710105)

学生的学习成绩是评估教学质量的重要依据,但影响学生成绩的因素很多。利用数据挖掘的核心技术之一决策树,找出影响学生成绩的潜在因素,并有针对性地采取措施,有利于提高教育教学质量。

决策树; 成绩分析; 解决对策

Abstract: Students’ achievement is the basic index for the evaluation of teaching quality. However, it may be subject to a lot of influencing factors. Implementing Decision Tree, one of the core technologies of Data Mining, this paper aims to explore the potential factors affecting students’ achievement, taking targeted measures to improve education and teaching quality.

Keywords: Decision Tree; Achievement Analysis; Coping Measures

0 引言

随着社会的发展,高校的招生规模也不断的扩大,除了学生数量增加外,影响学生成绩的因素也在增加。在我国目前的教育行业中,学生成绩是衡量学生对所学知识掌握程度的重要标准,因此不可忽视。所以说对学生成绩的影响因素的分析尤为重要,利用一定的技术分析学生的日常行为、教务管理系统中的数据等,获取其中隐含的有价值的信息,找出课程成绩和各种相关因素之间的内在联系,利于教学相关部门、教师正确制定相关措施,利于教学质量的提高,最大程度地增强教学效果。

1 决策树

本文主要介绍数据挖掘中的决策树技术在学生成绩影响因素分析中的挖掘分析,全面了解影响学生成绩的因素,帮助教师教学,给教学管理者提供决策依据。数据挖掘就是对数据库或巨大的数据集进行分析,挖掘出未知的、隐含的、用户感兴趣的和有潜在价值的信息及规则,能为用户提供决策的依据。决策树技术是数据挖掘的核心技术之一,树中的非叶节点对应着数据集中的某属性,叶节点则对应着分类的结果。从根节点开始到任一叶节点为止,对应着一条分类规则,因此整个决策树就对应着一组析取表达式规则,可以If-Then形式表现。总之,决策树以树型结构表达最终的分类结果,便于使用者理解。

2 决策树技术在学生成绩影响因素分析中的应用

2.1 确定分析对象

以笔者2015—2016学年第二学期所授的《网页设计》课程为例,分析的对象是电子商务专业2015级的学生。主要挖掘学生的非智力因素、课程测试成绩、课程设计等方面的数据,通过分析数据,依据分析结果,使教师能及时地采取有效的教学方法指导教学,提高教学质量。

2.2 数据的采集

本研究的数据主要有两个来源:一部分是回收统计调查问卷的结果;另一部分是学生的考核成绩、课程设计完成情况(来自于教务管理系统),如表1~表3所示。

2.3 数据的处理

数据收集完成以后,需要处理才能进行挖掘,主要是因为在这些数据中可能含有噪声(无效的或置信度低)数据,处理噪声数据后,才能建立出高准确率的数据模型。

在调查问卷中,为了方便被调查者作答,文字描述用选项的方式来表现(即选择ABCD项),而此时又需要把这些选项重新用文字描述表示出来(即将收集来的ABCD选项还原为“是”、“否”等文字)。

学生成绩表中的缺考、休学等记录,要进行清理删除,因为这种情况属于数据缺失,是无效的,清理后确保表格数据的完整性。

表1 问卷调查的部分题目

表2 课程测试的部分数据

表3 课程设计的部分数据

根据实际情况,把学生成绩的评价指标分为四个等级,优秀:85分以上,含85;良好:70—84;合格:60—69;不合格60分以下。

2.4 构建决策树模型

分别以末考成绩、平时成绩、课程设计、问卷调查分析结果为根结点,计算其信息增益,信息增益中末考成绩最大,所以以末考成绩作为根结点构建学生成绩分析决策树,如图1所示。

2.5 决策树模型分析及解决对策

决策树最大的优点是可直接提取分类规则,并以IF…THEN的形式表示出来。观察图1的决策树,把其转换成如下的分类规则:

规则1:IF末考成绩=“优秀”AND平时成绩>=“良好”AND课程设计>=“良好”AND问卷分析>=“合格”THEN总成绩=“优秀”;

图1 学生成绩分析决策树

规则2:IF末考成绩=“优秀”AND平时成绩>=“良好”AND课程设计=“合格”AND问卷分析>=“良好”THEN总成绩=“优秀”;

通过规则1和2发现:基础知识和非智力因素都比较好的学生,只要平时刻苦努力,该门课程的综合成绩自然是优秀。

规则3:IF末考成绩>=“合格”AND平时成绩=“不合格”AND课程设计>=“合格”AND问卷分析>=“合格”THEN总成绩>=“合格”;

通过规则3发现:基础知识和非智力因素都比较好的一部分学生,由于平时的自我管理松懈,导致成绩平平。对这部分学生应加强平时的教育管理,可使其更优秀。

规则4:IF末考成绩=“不合格”AND平时成绩>=“合格”AND课程设计>=“合格”AND问卷分析<=“合格”THEN总成绩=“不合格”;

通过规则4发现:这类学生基础一般,动手能力较好,学习踏实认真,但是心理素质差,学习方法不当,导致综合成绩不合格,对于这类学生首先要进行心理素质的教育和锻炼,其次要帮助学生改变学习方法。

规则5:IF末考成绩=“不合格”AND平时成绩>=“合格”AND课程设计=“不合格”AND问卷分析=“不合格”THEN总成绩=“不合格”;

通过规则5发现:这类学生平时的学习态度是值得肯定的,但由于基础和多方面的非智力因素差,导致综合成绩不合格,解决办法是平时多鼓励学生,有针对性的做一些训练。

3 总结

数据挖掘是深层次的数据信息分析方法,是一种决策支持过程。本文建立了学生成绩分析决策树模型,提出了影响学生成绩的分类规则,利用这些规则,可以帮助教师有针对性地教学和管理学生,以达到提高教学质量的目的,为培养合格的人才打下坚实的基础。

[1] 商俊燕,陆兵,柏倩然.决策树C4.5算法在学生成绩分析中的应用[J].微型电脑应用,2015,31(04):43-43-44.

[2] 李巧君,李伟.数据挖掘技术在学生成绩分析中的应用研究[J].微型电脑应用,2015,31(04):35-35,36.

[3] 雷燕瑞.数据挖掘技术在高职成绩分析中的应用[J].软件,2013,34(12):70-171.

[4] 王平霞,郝志廷.决策树技术在高职院校学生成绩分析中的应用研究[J].电脑知识与技术,2013,9(13):2960-2963.

TheApplicationofDecisionTreeintheInfluencingFactorAnalysisofStudents'Achievement

Ming Qiaoying, Liu Shuting
(Xi'an FanYi University, 710105)

TP311

A

2016.11.30)

“决策树技术在高职类学生成绩分析中的研究及应用”课题(16B01)

明巧英(1981-),女,西安人,讲师,工程硕士研究生,研究方向:数据挖掘. 刘淑婷(1984-),女,西安人,讲师,工程硕士研究生,研究方向:网络工程.

1007-757X(2017)09-0039-02

猜你喜欢

平时成绩决策树课程设计
关于工科专业课平时成绩的思考
高校体育专业术科课程平时成绩评定方法的探究
龙凤元素系列课程设计
一种针对不均衡数据集的SVM决策树算法
中秋明月
让平时成绩回归本真
决策树和随机森林方法在管理决策中的应用
播音与主持艺术专业的平时成绩评定与构成——以河南工业大学为例
基于决策树的出租车乘客出行目的识别
基于Articulate Storyline的微课程设计与开发