APP下载

应用型本科院校IT专业数据挖掘课程建设

2014-04-29李忠李姗姗

计算机时代 2014年11期
关键词:数据挖掘教学效果

李忠 李姗姗

摘 要: 针对国内应用型本科院校数据挖掘课程内容差异问题,分析了不同专业的培养目标,从数据挖掘三大功能出发,给出了IT类专业数据挖掘课程的内容体系和学时安排;分析了防灾科技学院最近两届学生数据挖掘课程的教学效果,结论为:合理的理论内容设置和实验训练,配合恰当的教学方法,可以提高学生的学习兴趣,激发学习热情,提高实际动手能力,从而达到人才培养目标。

关键词: 数据挖掘; 课程内容体系; IT专业; 教学效果

中图分类号:G642 文献标志码:A 文章编号:1006-8228(2014)11-65-02

Course construction of data mining course for IT specialty in application-oriented university

Li Zhong, Li Shanshan

(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)

Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.

Key words: data mining; course content system; IT specialty; teaching effectiveness

0 引言

毋庸置疑,我们正处在信息时代。根据国际互联网管理机构2012年发布的数据,每天全球互联网流量累计达1EB(即10亿GB),这意味着每天产生的信息量可以刻满1.88亿张DVD光盘[1]。要想在如此浩瀚的数字海洋里寻找有用的信息,简直是大海捞针!因此数据挖掘技术应运而生。大概十几年前,微软创始人比尔·盖茨就预言,数据挖掘技术将是未来计算机发展的重要方向之一,事实也的确如此。

数据挖掘技术诞生于20世纪80年代末,是统计学和计算机科学的交叉学科,涉及数据库技术、统计学、机器学习、神经网络、模式识别、知识发现、专家系统、信息检索、高性能计算、可视化以及面向对象程序设计等若干学科知识,在商业、金融、保险、体育、勘探、生物技术等领域获得广泛应用。也正因为该课程涉及的内容宽泛,要求知识面宽广、数学基础扎实等,前几年主要在研究生阶段开设。但是随着信息技术的快速发展,本科生能力要求提高,知识传授的重心下移,很多高校已在本科阶段开设数据挖掘课程,以提高大学生解决实际问题的能力,进而为课程设计和毕业设计打下必要的基础[2]。

1 国内高校本科数据挖掘课程开设现状

通过院校实地交流,结合网络搜索,我们已经收集了十几所高校的数据挖掘课程教学大纲,开设专业包含有计算机类专业、经济统计类专业、电气自动化类专业、生物技术专业等,各专业根据自己的人才培养目标制订教学大纲、教学计划、考试大纲等,其内容存在很大差异。其中985、211高校主要以英语授课,采用国外原版教材,课程内容涉及算法、编程较多;而一般院校多采用中文教材,根据专业不同,内容也有很大差异。

经济统计类专业开设数据挖掘课程,要求学生了解什么是数据挖掘,以及如何用数据挖掘来解决实际问题,了解如何通过几种数据挖掘技术建立数学模型,了解主流数据挖掘系统的特点,能够安装、使用,要求能够熟练使用典型的挖掘工具对实际数据进行分析,具备从数据资源提取信息与知识并进行辅助决策的基本能力。

自动化专业开设数据挖掘课程,要求学生了解数据挖掘概念、原理、过程,学会利用数据挖掘技术处理问题,了解有关数据挖掘算法原理,熟练运用数据挖掘技术建立数学模型,要求能够熟练使用数据挖掘软件解决问题。

计算机专业开设数据挖掘课程,要求学生了解数据挖掘概念、原理、信息处理过程,了解不同数据挖掘算法的原理并编程实现,学会利用数据挖掘技术建立数学模型以解决实际问题,熟悉数据挖掘成果的表达,要求熟悉几种典型的数据挖掘软件功能特点、使用方法、安装等,了解不同软件的优缺点和适用面向,具备从大量数据中获取有价值的信息的能力。

可以看出,统计类专业主要要求学生具备数据挖掘软件的使用能力,并根据挖掘结果进行辅助决策;IT类专业要求学生掌握数据挖掘有关算法的原理、处理过程,并要求编程实现算法,这无疑增加了很大难度。按照ACM SIGKDD课程委员会对数据挖据课程的建议,数据挖掘课程应重视长久的科学原理和领域概念。显然,IT类专业的数据挖掘课程教学大纲更符合ACM SIGKDD课程委员会的建议。

2 IT专业数据挖掘课程内容设计

一般情况下,数据挖掘课程在本科的高年级段开设,大部分放在第七学期,也有少数高校放在第六学期。这个时候,IT类专业的大学生已经修完数据结构、数据库原理、程序设计语言、面向对象程序设计等多门专业基础课程,对于程序设计、数据库系统开发等具有足够的认识和使用能力,具备了开设数据挖掘课程所需要的前导知识。国内普通本科的数据挖掘课程学时设计存在很大差异,如南京工程学院设置32课时,其中课堂授课22学时,实验设计10学时[3];郑州航空管理学院仅设置16学时,其中授课10课时,实验教学6课时[2]。在内容安排方面,也存在很大差异。南京工程学院计算机专业开设的数据挖掘课程包括概述、数据挖掘过程与挖掘软件、关联规则挖掘与序列模式挖掘、分类、聚类分析、Web挖掘等六部分内容;烟台大学计算机专业开设的数据挖掘技术课程内容涵盖概述、数据仓库与联机分析、关联分析、分类技术、聚类分析、时间序列模式挖掘、Web挖掘技术等[4];郑州航空管理学院的数据挖掘课程包括概述、决策树、聚类分析、关联分析、数据筛选等内容[2];漳州师范学院计算机科学系开设的数据挖掘课程内容涉及数据挖掘基础知识、数据预处理、数据仓库与OLAP技术、关联和频繁模式分析、分类与回归、聚类和孤立点分析、时序数据和序列数据的挖掘、文本与Web数据挖掘、数据挖掘可视化、典型数据挖掘系统、数据挖掘的社会影响等内容[5]。

数据挖掘技术主要应用在三大领域,也就是三大功能:分类(预测)、聚类分析和关联分析,因此在课程内容设置时,应考虑实用性,在三大功能基础上布局各章节。笔者在近三年的数据挖掘课程教学实践中,分别采用了西南财经大学的《数据挖掘教程》、中国科技大学的《数据挖掘导论》作为主讲教材,参考了范明等人翻译的《数据挖掘导论(完整版)》、Jiawei Han and Micheline Kamber著《Data mining Concept and Techniques》、范承工等著《大数据:战略·技术·实践》等,对课程内容进行了总结,提出了针对于应用型本科IT类专业48课时的数据挖掘课程内容体系,如表1。

从表1可以看出,数据挖掘课程理论授课32学时,实验安排16课时,在充分进行数据挖掘算法原理、实例介绍基础上,让学生在实验室里对数据挖掘的三大功能进行模拟训练,提高学生的实际动手能力和分析问题解决问题能力,这也完全符合应用型本科人才培养目标要求。另外,考虑到数据仓库与联机分析部分内容已经在数据库原理与应用课程中学习过,因此我们在内容设置时不再考虑。

表1 数据挖掘课程内容体系

[章节题目\&主要内容\&理论课时\&实践课时\&第一章 数据挖掘概述\&介绍有关概念、应用领域、挖掘过程、SEMMA模型等\&2\&0\&第二章 数据预处理\&介绍数据采集与存储、数据质量评价、数据整理、数据计划分等;\&4\&2\&第三章 数据分类与预测\&介绍决策树原理与应用、贝叶斯分类方法、人工神经网络方法、K-近邻方法、遗传算法、支持向量机方法,等\&8\&4\&第四章 关联分析\&介绍相关概念、先验算法、Apriori算法等\&6\&4\&第五章 聚类分析\&聚类分析概述、K-均值算法、层次聚类方法等\&6\&4\&第六章 异类挖掘\&异类挖掘概述、基于统计的异类挖掘、基于时序的异类挖掘、基于空间的异类挖掘,等\&4\&2\&第七章 大数据挖掘\&大数据概述、大数据挖掘算法、大数据挖掘过程,等\&2\&\&]

3 教学效果分析

理论授课以工程项目驱动方式,在阐述基本概念、算法原理基础上,采用实际的工程项目介绍数据挖掘课程相关算法的应用和过程,很好地吸引了学生的注意力,教学效果良好。以最近两届学生为例,采用调查问卷方式,从基本算法掌握、编程能力提高情况、考试成绩、就业意向等四个方面进行考查,汇总结果如表2。

表2 教学效果调查汇总表

[调查

栏目\&基本算法

掌握情况\&编程能力

是否提高\&考试成绩档次\&是否愿意从事数据挖掘相关工作\&项目\&较好\&一般\&有\&无\&80以上\&60-80\&60以下\&是\&否\&2012届

情况\&32\&44\&54\&22\&22\&36\&18\&24\&52\&42.1%\&57.9%\&71.1%\&28.9%\&28.9%\&47.4%\&23.7%\&31.6%\&68.4%\&2013届

情况\&72\&48\&94\&26\&78\&39\&3\&44\&76\&60%\&40%\&78.3%\&21.7%\&65%\&32.5%\&2.5%\&36.7%\&63.3%\&]

说明:每届学生的第一行为人数,第二行为所占百分比。

从表2可以看出,2013届学生无论从考试成绩,还是编程能力提高、基本算法的掌握情况等方面,都较2012届学生好,尤其是不及格率大幅下降,优秀率大幅提升,对学生提高学习兴趣、激发学习积极性大有好处。从就业意向看,愿意从事数据挖掘方面工作的学生也有提高,说明学生通过数据挖掘课程的学习,逐渐对该技术产生兴趣。

4 结束语

就数据挖掘技术课程而言,对于IT类专业学生的要求应不同于经济统计类专业学生,前者更应注重算法理解、设计,以及程序实现、成果表达等,后者则偏重于模型建立、软件应用等。因此在课程内容设置、学时安排等方面应有所不同。IT类专业学生将来的工作主要以程序设计、软件开发为主,因此数据挖掘课程内容更广更深,学时也相应较多,培养目标要求也更高。合理的课堂内容设置和实验训练,配合适当的教学方法,可以很好地提高学生的学习兴趣,激发学习热情,增强分析问题解决问题的能力,让学生产生从事数据挖掘工作的意向,达到人才培养目标要求。

参考文献:

[1] 张艳.大数据背景下的数据挖掘课程教学新思考[J].计算机时代,

2014.4:59-61

[2] 李志勇,王翔,喻军.信息管理专业数据挖掘课程教学探讨[J].管理工

程师,2012.8:66-68

[3] 徐金宝.对应用型本科生开设数据挖掘课程的尝试[J].计算机教育,

2007.7:27-30

[4] 谭征,孙红霞,王立宏.普通院校本科生开设数据挖掘课程的教学研

究[J].福建电脑,2011.10:38-40

[5] 周忠眉.数据挖掘课程大纲的建设[J].漳州师范学院学报(自然科学

版),2005.1:88-90

猜你喜欢

数据挖掘教学效果
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
用信息技术增强初中篮球教学效果
数据挖掘技术在中医诊疗数据分析中的应用
关于提高开放电大“统计学原理”教学效果的探讨
一种基于Hadoop的大数据挖掘云服务及应用
如何提高高中声乐教学效果
提高病理学教学效果的几点体会
加强焊接教学质量提高焊接教学效果的探讨
数据挖掘的分析与探索