基于案例和悬念的数据挖掘教学模式设计
2018-12-01熊才权
邓 娜,林 松,熊才权,肖 亮
(1.湖北工业大学 计算机学院,湖北 武汉 430068;2.海军指挥学院 战略教研室,江苏 南京 210016)
0 引 言
在大数据时代,各行各业都积累了海量的数据,如何从中发现隐含的丰富信息是亟待解决的问题,而数据挖掘就是解决这个问题的一大利器。为了培养学生对大数据的敏锐嗅觉以及分析处理海量数据的能力,湖北工业大学计算机学院面向大四软件工程专业学生开设了数据挖掘与数据仓库这门选修课程。历届学生的选课统计情况表明,学生对该课程的兴趣较为浓厚,选课率通常在90%以上,但是由于各方面的因素,此课程的教学过程中存在若干问题。
1 数据挖掘课程教学现状
数据挖掘是一门交叉学科,涉及数据库、机器学习、人工智能、统计学等多门学科的知识和方法,解决大数据时代数据庞大但信息紧缺的问题,研究如何从海量数据中发现其中隐藏的模式和信息,为生产生活提供决策支持[1]。
数据挖掘知识体系清晰固定,研究方法成熟,是一门非常适合本科计算机专业学生学习的课程,但是由于学时限制、排课时间等,目前该课程教学过程中存在以下问题。
(1)由于是专业选修课程,数据挖掘课程理论学时只有22学时。授课教师要在22学时内完成该课程所有主要内容的教授,进行教学内容设置、教学进度安排、教学环节设计等,无疑是一种挑战。
(2)由于授课对象是大四学生,他们面临着毕业设计、实习、考研、就业等事务,时间紧张,选课时的浓厚兴趣和学习积极性到了真正上课时常常大打折扣。选课率高,但到课率低成为历届学生的一个共性问题。
2 数据挖掘课程教学思考
(1)如何在较短的理论学时中完成主要内容的教授以及如何抓住学生的兴趣点,这两个问题的解决需要授课教师探寻一种新的教学模式,使学生保持当初选课时的浓厚兴趣,实现“少”而“精”,在较“少”的学时内掌握课程的“精华”。
(2)数据挖掘课程主要教学内容包括数据预处理、关联规则挖掘、分类挖掘、聚类挖掘、时序挖掘等[2],章节内容既相互关联,又相对独立。内容相互关联体现在:数据预处理是其他挖掘任务不可缺少的前期工作,而聚类挖掘有时又是数据预处理运用的一种手段。此外,分类挖掘和聚类挖掘都是将数据对象划分为不同的类别,区别在于分类挖掘是监督式学习,聚类挖掘是无监督式学习。教学内容的相对独立性体现在:实际应用时,一般情况下,只面向一种类型的挖掘任务。
(3)跟软件工程专业其他的专业课程(如软件工程、软件体系结构设计、软件需求工程等)相比,数据挖掘课程更倾向于是一门工具类课程,学习这门课程的最终目的是将各种类型的挖掘任务应用到实际生活中,对各行各业的海量数据进行分析和挖掘,因此,这门课程的操作性和实用性较强。本着“授人以鱼不如授人以渔”的教育理念,教师应当思考怎样有效地让学生理论结合实际,将课程中的理论知识应用到真实数据中,解决现实生活中的问题。
3 基于案例和悬念的教学模式优势
传统的数据挖掘教学模式是以理论教学为主,着重于概念、公式、算法等的讲解。这些理论知识过于枯燥,很难吸引学生,即使学生掌握了理论知识,在遇到实际问题时,如何应用理论知识,也是学生较为薄弱的环节。案例教学是一种以案例为基础、以问题为核心进行教学过程组织的教学模式,有利于提高学生分析和解决问题的能力以及培养学生的创新意识[3]。在案例教学过程中,教师为每一章节单独设置案例,案例贯穿每一章节始终。教师提出案例问题,引导学生思考,使学生在对案例进行思考和寻求解决方案的过程中掌握概念、公式、算法等理论知识。由教师挑选的案例贴近实际问题,可以为学生以后的实践打下基础,“纸上得来终觉浅,绝知此事要躬行”,当学生面临真实数据需要分析挖掘时,由于已经有了案例的铺垫,他们能较容易地进行知识迁移,将案例映射到实际问题中。
在整个教学过程中,为了保证学生都能保持较高的兴趣和求知欲,教师可以在引入案例时设立悬念[4]。悬念需要由教师围绕着案例精心设计,与章节主题紧密相关。通常情况下,用一些看似相互矛盾的问题或者意想不到的问题作为悬念能起到良好的效果。数据挖掘本身的任务就是从数据中发现一些无法预料但又客观存在的模式和规律,因此,对于数据挖掘课程而言,有比较充足的素材可以用来设立悬念。通过悬念的设立,整个教学过程中学生带着问号学习,可以大大提高学习兴趣。
4 数据挖掘课程教学示例
4.1 案例及悬念问题设计示例
表1为数据挖掘课程中与重要挖掘任务相对应的各个章节所设置的案例及悬念问题,数据挖掘课程的相关案例及悬念问题设置均以此为模板。
表1 数据挖掘课程章节案例及悬念设计
4.2 教学过程设计
以分类挖掘之贝叶斯挖掘一章为例,详细说明基于案例和悬念的教学过程设计。贝叶斯挖掘是分类挖掘中的一种经典挖掘方法,利用统计学中的贝叶斯理论,将分类问题转换为条件概率问题。如果单纯从统计学概率计算公式着手教授本节内容,学生会觉得很枯燥,学完之后,对贝叶斯理论如何运用到分类挖掘中可能不会理解得很透彻。在基于案例和悬念的教学模式中,教师可以选择一个非常贴近生活的案例——预测是否会购买电脑,来设计教学过程。
预测是否会购买电脑案例设计的具体内容:原始数据集中存储着不同人的收入、年龄、是否是学生、信用等级等信息,以及他们最终是否购买电脑的事实。相应的悬念问题是对于一个测试对象,已知他的个人相关信息,预测他是否会购买电脑,教学过程见表2。
整个教学过程被分成7个环节。
(1)案例展示。直接向学生展示案例的原始数据集,提出悬念问题。该案例非常贴近学生的生活,学生很能产生代入感,他们会不由自主地思考:自己也具备案例数据中的那些属性(收入、年龄、是否是学生、信用等级),那么自己购买电脑的决定跟这些属性相关吗?如果相关,这么多的属性,到底哪个或哪些属性起决定性作用?教师提出的悬念问题让他们迫不及待地想去探求问题的答案。
表2 贝叶斯挖掘教学过程安排
(2)案例分析。教师引导学生分析案例数据集,包括数据集的特点、悬念问题与数据集的关系等。在本案例中,带领学生观察数据集的属性列以及各个属性的取值范围,引导学生思考悬念问题与数据集的关系。
(3)理论回顾。本案例底层的数学模型建立在统计学的贝叶斯理论之上,学生已经在概率论课程中学过该理论。为了帮助学生进一步回忆知识点,这一环节可以采用推演的教学形式将贝叶斯理论重新复习一遍。
(4)映射案例与理论。通过前面的案例分析和相关理论的回顾,指导学生在案例和理论两者之间建立桥梁。案例中为预测一个测试对象是否会购买电脑,将这个分类问题转换为条件概率问题,利用贝叶斯定理,比较两个条件概率的大小关系。
(5)解决悬念问题。通过条件概率问题的解决,间接地解决悬念问题。
(6)举一反三。为了检验学生是否透彻理解贝叶斯分类挖掘方法以及考查学生举一反三的能力,用另一个全新的案例,让学生在课堂上自己动手做一做,教师就学生的完成情况进行点评。
(7)总结。总结贝叶斯分类挖掘的步骤,帮助学生理清思路。归纳该分类方法的特点和不足,由于贝叶斯定理建立在属性独立的前提条件下,因此,需向学生强调贝叶斯分类方法使用场景的局限性。
5 结 语
数据挖掘课程中章节相对独立且实用性强的特点使其非常适合使用案例式教学法,将案例和悬念结合起来设计教学环节,可以激发学生学习积极性和提高教学效果。下一步研究工作是探索数据挖掘课程实践环节有效的教学模式。