APP下载

理论创新驱动的数据挖掘课程教学改革

2017-05-12邵俊明杨勤丽

计算机教育 2017年4期
关键词:多元教学理论创新数据挖掘

邵俊明+杨勤丽

(1.电子科技大学 计算机科学与工程学院,四川 成都 611731;

2.电子科技大学 资源与环境学院,四川 成都 611731)

摘 要:针对当前数据挖掘课程教学中工程应用与理论创新的脱节问题,分析数据挖掘课程本身的特点和当前教学现状,从提高本科生创新能力的人才培养模式角度出发,提出在教学内容的前沿性、教学方式的多元性及实验教学的多梯度性改革,达到因材施教、工程应用与理论创新的有机统一,有效提高学生的学习兴趣及学习效果。

关键词:数据挖掘;理论创新;多元教学;多梯度实验

0 引 言

在当前大数据时代背景下,如何从海量数据中挖掘并提炼出对人们真正有用的知识,是大数据研究的难点问题,同时也是目前数据挖掘面临的关键和核心问题[1]。数据挖掘作为当前计算机专业的一个前沿课程,是一个综合性的交叉课程,也是重要的学术研究方向,其内容涉及多方面基础理论学科和应用性强的技术领域,是提高计算机专业学生应用实践能力和理论创新能力的载体课程,在整个计算机专业的学习中具有极为重要的地位。

1 教学现状

数据挖掘作为一门同时具备应用性和学术性的课程,早期属于计算机专业研究生培养的专业课程,但随着数据挖掘在各个领域的广泛应用,现已成为计算机专业本科培养的专业选修课之一。目前,数据挖掘课程在教学内容、教学方法和实验教学模式上存在诸多不足之处。

(1)教學内容陈旧。目前的教学内容一般根据某本数据挖掘教科书进行讲解,由于数据挖掘技术的快速发展,一本教科书往往很难全面概括数据挖掘的内容、方法和技术。

(2)基础理论算法与实验教学脱节。当前的教学路线往往是使本科学生从了解和掌握数据挖掘的基本任务开始,然后讲授数据挖掘的各种基本算法,最后上机实验。这一教学方式侧重于以应用为主,主要目标在于培养计算机工程的应用人才。然而,由于基础理论算法与实验教学分开讲解,使得学生缺乏对使用数据挖掘解决实际问题的能力。

(3)理论创新意识的缺乏。在当前的本科教学中侧重工程实践能力的培养,忽略理论创新的培养。在数据挖掘课程中,理论创新是指学生对所学的数据挖掘算法有自己的见解,能有意识地思考目前数据挖掘面临的问题并提出新的数据挖掘算法。

(4)实验教学僵化。当前的实验教学往往是固定的几个算法验证性实验,对于不同学习能力的人而言,实验教学往往很难达到理想的效果。

目前,对日新月异的科技发展、以科技创新和技术升级为核心特征的激烈国际竞争,我国自主创新能力较为薄弱的问题已经越来越成为信息化发展的瓶颈[2],这也给数据挖掘教学带来巨大挑战,即教师如何在教学过程中提高学生的理论创新能力?

2 教学方法的改革

2.1 教学内容的前沿性与统一性

作为一门新兴的前沿课程,该门课程内容、方法和技术仍处于发展和探索阶段。通过固定的教材去系统地传授数据挖掘的内容显然是不太合理的。因此,与传统学科不同,数据挖掘教学内容需要进行更新,并根据学生的接受能力进行甄别筛选。同时,要求任课教师在不断发展的新技术与相对稳定的教材中寻找一条贯穿整个教学内容的主线,在讲课的过程中,结合数据挖掘研究进展,配合自己的研究成果,把最新的技术融入到课堂中。此外,由于数据挖掘是多学科的交叉课程,内容涉及统计学、算法、数据库、机器学习、模式识别、可视化等,而本科生的知识体系薄弱,在短时间难以透彻理解各部分内容。因此,教学过程中教师应合理设计教学大纲和方案,有机地统一教学内容,让学生对数据挖掘有一个整体的了解。建立不同数据挖掘任务之间的相互关联,同时以项目讲解的方式将数据挖掘涉及的数据预处理、聚类分析、分类预测、噪声检测、关联规则挖掘等有机结合在一起。

2.2 理论创新的多元教学

针对现有本科生教学中理论创新意识的缺乏,尝试进行多元化教学模式,主要从以下4个方面展开。

(1)区分教学内容的难易度,将教学内容分为基础内容与进阶内容。在讲授中注重基础内容的原理性,并有意识地让学生接触一些前沿性的理论拓展知识。比如在讲解分类算法时,首先专注几个经典的分类算法,如K—最邻近、决策树、朴素贝叶斯和支持向量机等。同时,在此基础上,给学生讲述目前分类的一些前沿方法,如集成学习、深度学习和迁移学习等。

(2)以问题为驱动教学。在讲解聚类算法时,可以通过“物以类聚,人以群分”的思想展开,具体介绍K—MEANS和DBSCAN两个具有代表性的聚类算法,让学生思考数据挖掘不同算法提出的原因、基本思想和优劣性,初步引导学生的自我思考、自我学习的创新思维能力。同时,针对数据具有的高维性,让学生进一步思考“高维诅咒”问题及在此问题上展开的子空间聚类的研究。

(3)建立“教研统一”研究式教学方法,利用教师现有科研促进和服务于教学,探索形成“科研嵌入”理论教学内容。将教师在自己的研究与教学内容进行有机结合,丰富教学内容,拓宽学生视野,提高学生实践能力和创新能力,实现科研成果融入教学。这样既提高了学生学习知识的兴趣性,又培养了潜在的科学素养。此外,在整个教学环节中布置两个任务,一是让学生进行数据挖掘的文献调研(主要涉及数据挖掘的历史、现状、面临的挑战及当前的行业应用),二是在课程结束后进行主题研究报告,每个学生选择自己感兴趣的一个主题进行,研究报告的目的是让学生深入理解所学内容,为后续的科研工作打下基础。

(4)教学模式由传统“填鸭式”向“互动式”教学转变。通过研讨方式引导学生去思考,激发学生的求知欲,充分调动其学习的积极性和主观能动性。通过具体实例,让学生知道算法的应用场合,提高学习兴趣和效率。

2.3 多梯度实验教学

实验教学是使学生在实践环节将数据挖掘课程中学习的理论算法应用于实践,帮助学生理解和掌握知识,提高动手能力。传统的上机实验往往是侧重几个经典算法的实现,如KMEANS、KNN、ID3决策树和LOF算法等。然而,数据挖掘是一门工程应用性较强的学科,这种算法验证实验很难让学生体会到数据挖掘的实际应用,因此,从基础能力培养、工程应用及创新研究3个方面设计多梯度实验。

首先,按照由浅入深的原则设计2个经典算法实现,如KMEANS和 ID3决策树。这个实验为算法型实验,主要是帮助学生通过实验更好地了解所学算法,学生也可以自己选择聚类分析和分类预测的任意两个算法进行实现。

其次,设计一个简单综合型实验,比如垃圾邮件的分类系统,要求学生完成从数据收集、数据预处理到整个系统的实现。主要考查学生综合运用数据挖掘知识,解决实际问题的能力,注重工程能力的培养。

最后是创新算法的实验设计,比如子空间聚类算法的实现。这个实验注重部分学生创新能力的培养,尤其是致力于以后从事科学研究的学生。学生可以根据自己的爱好,选择算法型实验和综合型实验,也可以选择算法型实验和创新算法设计实验。多梯度实验的目的主要是希望针对不同学生的学习兴趣及将来的发展方向,给出合适的实验教学。实验的整体难度由易到难,层层深入,有利于学生实践能力和创新能力的培养。

3 结 语

当前,数据挖掘正处在快速发展的过程中,各个领域的大量应用使得对数据挖掘这门课程的工程应用能力要求越来越高,需要学生具有更好的创新能力,因此,数据挖掘课程的教学也同样需要调整教学内容和教学手段来紧跟其发展的步伐。基于此,我们提出在课程内容的前沿性、教学模式的多元性及实验教学的多梯度性上进行改革,从而达到在培养学生工程实践能力的同时,提高其创新思维能力。

基金项目:电子科技大学“互联网+”课程建设教改专项。

第一作者简介:邵俊明,男,教授,研究方向为数据挖掘、机器学习及在交叉学科的应用研究, junmshao@uestc.edu.cn。

参考文献:

[1]涂新莉, 刘波, 林伟伟. 大数据研究综述[J]. 计算机应用研究, 2014, 31(6): 1612-1616.

[2]应必娣. 培养学生创新能力的教学改革[J]. 实验室科学, 2015(3): 228-230.

(编辑: 郭田珍 )

猜你喜欢

多元教学理论创新数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
让我们有效迁移,多元而教
马克思主义新闻理论的坚守与创新
新形势下马克思主义理论创新的路径研究
基于R的医学大数据挖掘系统研究
论述初中英语多元教学法的实施
《电动力学》课程多元教学信息平台的构建
邓小平南方讲话关于生产力问题的理论创新
2015~2016年中国国际政治学研究热点述评