基于改进的BOPPPES模型的数据挖掘教学方法及案例分析
2022-12-16牛彩云李卫丽尹晓晴
牛彩云,李卫丽,尹晓晴
(1.中南林业科技大学物流与交通学院,湖南 长沙 410073;2.国防科技大学系统工程学院,湖南 长沙 410073;3.国防科技大学交叉前沿学院,湖南 长沙 410073)
0 引言
数据挖掘课程涉及高等数学、机器学习、统计学、数据库、人工智能等学科领域知识,是一门交叉性和综合性强的课程,广泛应用于如信息检索、商务智能、知识发现、医学信息处理、管理模式分析、自然灾害预测等领域。数据挖掘课程内容包括数据预处理、算法(聚类、分类、关联规则分析、离群点检测、回归分析等不同数据挖掘任务下的算法)及有实际应用型的案例分析,其知识点多且分散,重要程度相当,章节之间独立性强,且有一定的理论深度[1]。
坚持以学生为本。形式各异的教学过程的共同重点是“教学反馈”,以是否能够提高学生学习效率和学习深度为评价标准,最终实现“教学同步、情感共鸣”的教学效果。BOPPPS模型是由北美地区高校教学技能培训机构Instructional Skills Workshop(ISW)提出的一种有效的注重教学互动和反思的闭环反馈的课程设计模式,旨在提高教师的授课技能,本质上是对以学生为中心的教与学的实践[2]。由于数据挖掘课程的学习对实践应用性要求特别高,除了在案例引入环节满足引入更贴近生活应用背景的案例外,本文还进一步提出了改进的BOPPPES模型,即在原模型基础上增加了“拓展(Extension)”这一要素,通过课前和课中的学习外在课后进一步以项目驱动的方式以实际问题为案例背景动手实验,旨在进一步培养学生能够学以致用地将课堂知识拓展到解决实际问题上来,更多地锻炼并提升学生的应用实践能力。
1 数据挖掘案例教学研究现状
案例式教学是数据挖掘课程教学设计的基本构成内容,针对不同数据挖掘任务给出相应的案例,以加深学生对相关概念的理解。然而,目前教材所提供的案例数据普遍存在着一些诸如数据源过于陈旧、分散、单一等问题[3]。
目前,许多学者对数据挖掘相关课程的案例教学进行了探讨和研究,并提供了相关的教学改革建议和具体解决方案。卫志华等人面向新工科背景下大数据人才培养的要求,提出了面向数据挖掘课程的综合性实验设计的举措[4]。覃凤萍等人针对数据挖掘课程提出了“问题引导+案例”的教学模式[5]。贾媚媚等人主要针对数据挖掘实验课程的教学方式和案例设计进行探索和改进,并提出了一些具体的解决方案,如算法实现(数据挖掘软件同编写算法代码相结合)、从竞赛中选取贴近实际问题的案例等[6]。
2 基于BOPPPES模型的数据挖掘案例设计
针对数据挖掘课程提出的BOPPPES教学模型,可从教学理念、教学目标和教学方法三个方面来理解其内涵:在教学理念上,教师关注的重点应该是学生“学到了什么”,而不是自己“教了什么”;在教学目标上,必须按照认知规律,设定清晰、具有可检性的目标,便于学生评估自己掌握知识的程度;在教学方法上,强调参与式教学,力求学生能在课堂上充分发挥主观能动性,独立思考、创造新思维。
(1)B(问题导入)。教师根据课程内容选取贴近实际生活的案例,在吸引学生的注意,诱导学生产生强烈的学习动机和明确的学习目的。
(2)O(学习目标)。教师向学生清楚表达本节课的学习目标,便于学生掌握学习的重点、难点以及对知识的熟练程度。
(3)P(前测)。课前摸底主要是为了掌握学生对先导知识的掌握程度,从而对所教授知识有合理规划。
(4)P(参与式学习)。参与式学习是BOPPPES教学模型最核心的理念,贯穿于教学过程的全过程,所开展形式多样,如分组讨论、角色扮演、动手推算、专题研讨、案例分析等。
(5)P(后测)。课后测验是判断学生是否达到预期的重要环节,也是对教师教学效果的评价,在课后或者教学过程中都可以及时地测验学生掌握知识情况。根据评估结果,学生可以及时了解自己对知识的掌握程度,教师可以反思并调整教学设计,使教学目标更易实现。
(6)E(拓展)。在原BOPPPS模型的基础上增加“Extension(拓展)”这一要素,其目的在于重视锻炼学生们的实践能力,学会“学以致用”来分析和解决实际问题。
(7)S(总结)。总结主要是归纳一节课的知识点、理清知识脉络、引出下次课的内容或追溯上次课内容。与传统的教学模式不同,BOPPPS模型强调总结应该是学生自己对知识的归纳。因此,总结过程中,教师主要起引导的作用,由学生自己总结本次课的知识点和重要内容,评估自己的学习效果。
3 数据挖掘案例分析
基于BOPPPES模型的教学需要教师与学生共同参与完成,更加注重学生的参与和反馈,整个教学活动安排和分配如表1所示。
表1 教学分配表
在基于BOPPPES模型的教学设计中,教学实施过程是根据课程设计里面的教学目标、重难点等内容,通过多媒体演示、板书设计和互动式教学等环节进行的教学活动安排。
3.1 环节一:B(案例导入)
该环节是数据挖掘教学内容的基础,通过新冠疫情数据的案例引出本堂课的授课内容,该导入模式有助于启发学生学会思考分析问题的能力。并回顾聚类分析的内涵和涉及的分析要素。
疫情的发生和流行具有地域性特点。针对2019年爆发的公共卫生事件,利用GIS(地理信息系统)结合k-means聚类分析方法对疫点的空间分布特征按空间亲疏关系进行分类,实现在空间上对疫点的划分,确定各疫点划分子集的边界。使防疫工作人员掌握疫情在空间上的分布情况和模式,针对不同地区采取不同的防制措施,提前做好防护准备工作,合理有效配置卫生人力和物力资源等。从而为疫情防控部门提供科学决策依据,合理有效配置防控资源,有效预防与控制疫情的扩散、提高疫病防治管理水平提供了技术手段。
通过空间聚类算法对所监测范围区域内的疑似病例、确诊病例、病例接触者的距离、位置、关系等疫点数据进行分析,有助于揭示疫情的扩散规律,进而在疫情监测和防控方面起到积极作用。
3.2 环节二:O(教学目标)
在教学目标上,主要是针对教学内容对学生提出了知识目标要求和能力目标要求。详细地,教学内容包括:kmeans聚类算法处理流程;“肘方法”确定k值;改进算法:k-summary算法。因此,要求学生掌握k-means算法处理流程,以及对算例能够手动实现算法;了解k值确定的问题,以及改进的k-summary聚类算法;通过案例讲解引导学生逐步建立使用聚类方法解决现实问题的能力,并提高学生的思维能力。
3.3 环节三:P(前测)
该环节主要是检验学生对先导知识的掌握情况,以便对教学过程进行灵活调整,并最终实现该课程的教学目标要求,采用教师引导式提问进行师生互动来实现。如在案例导入环节,引导学生回顾聚类分析的内涵和所涉及的分析要素;在k-means算法实现流程演示完成后,对其中涉及的样本与质心之间相似度计算问题,通过提问方式让学生回顾度量样本间相似性的几个度量指标(如闵可夫斯基距离、欧氏距离、曼哈顿距离、切比雪夫距离、余弦系数、相关系数等)。
3.4 环节四:P(参与式学习)
该环节是基于BOPPPES模型课程设计的核心部分,实际上要求学生参与式学习贯穿于课前、课中和课后的所有阶段。除了在前测环节教师通过提问方式考查学生掌握先导知识的互动外,在授课过程中对学生进行启发式提问(初始簇中心对聚类结果是否有影响?是否存在最优的簇个数k),并在理论知识讲授完后,让学生自由讨论并总结k-means算法的优、缺点以及对于疫情数据聚类分析应用场景的理解。
3.5 环节五:P(后测)
该环节以随堂作业方式让学生对课后习题手动实现k-means聚类算法全过程,以便能够及时检验学生对所学知识的掌握情况,并起到及时巩固所学知识的作用。
3.6 环节六:E(拓展)
该环节是对原BOPPPS模型不可或缺的补充,主要采用项目驱动方式以小组为单位在课后完成该任务,其目的在于能够将所学知识活学活用,逐步培养和锻炼解决实际问题的能力,也符合数据挖掘课程的应用性特点。以课堂引入的新冠疫情为聚类分析的问题背景,根据教师提供的疫情数据,小组成员分工协作完成并提交新冠疫情数据聚类分析报告,还需制作PPT进行项目答辩工作。
3.7 环节七:S(总结)
该环节随堂总结和系统总结两部分:①教师在课堂上可以通过思维导图模式有助于学生在总结所学新知识的基础上能够很好地联系到先导知识,从而对所学知识进行系统的归纳整理。图1显示了课堂所学新知识(k均值聚类算法及其改进)和先前知识(聚类分析概述和相关知识)联想记忆模式;②在完成拓展环节要求的项目报告和答辩的基础上,教师和学生对所学知识做出一个系统的总结和反思。
图1 聚类分析相关知识脉络总结
4 评价方式
基于BOPPPES模型的教学设计,除了在教学实施过程提出锻炼学生动手能力的具体措施外,还通过增加“拓展”环节来凸显应用实践的重要性。因此,对学生的评价方式主要包括:①基础参与式评价,主要是教师在教学实施过程中(课堂教学)通过对学生提问的方式来考查学生对先导知识的掌握情况,以及对新学知识归纳总结的情况,考察的是学生学习态度以及思维能力等,并对其进行初步评价;②拓展式评价,主要体现在课后项目驱动的小组实验完成情况,遵循多角度、全方位评价准则,如背景知识的搜集考察的是学习态度,编程代码来实现算法考察的是动手能力,PPT答辩考察的是逻辑思维能力,针对细化的项目实验指标对学生进行打分。
5 结语
教师在授课过程中,重视学生的参与程度,强调“教学同步、情感共鸣”的教学效果,使得学生在教学过程中掌握知识的同时培养和引导其解决实际问题的思维方式,并进一步提高学生实践能力。首先,在案例选取方面,考虑跟学生生活紧密相关的真实场景,以疫情数据为例引出所学知识;其次,在教学方法方面,特别是在教学过程中采用多种教学手段如多媒体演示、板书等,通过增加学习趣味性达到吸引学生的目的;然后,在案例分析工作安排方面,基于工作量的客观现实和团队协作精神的培养需求双方面的考虑,决定采用项目驱动方式并以小组形式展开具体工作,包括案例背景知识搜集、算法实现、结论分析等项目报告和答辩PPT;最后,在项目实验评价方面,考虑学生的纵向和横向对比,采用项目报告、编程代码、答辩等成绩的加权平均作为最终成绩。