新工科研究生“数据挖掘”课教学改革探索
2021-05-06孟凡奇孙昊晨王敬东
孟凡奇 孙昊晨 王敬东
摘 要:“新工科”是教育部为应对大数据时代工程教育面临的新机遇、新挑战而提出的,是“卓越工程师教育培养计划”的2.0版。为了使研究生培养契合大数据时代的人才需求,文章以“数据挖掘”课为例,依据新工科建设指导思想,分析现有教学环节中存在的不足,提出“结合行业背景、采用混合教学、注重案例演练、提高实践能力”的教学改革思路,确立“评价—讲解—演示—练习”四步循环的课内外混合教学模式。该模式符合东北电力大学的电力特色及生源质量情况,使学生的学习兴趣与实践能力得到显著增强,也为其他院校开展研究生新工科建设教学改革提供了参考。
关键词:新工科建设;大数据;数据挖掘;教学改革
大数据时代的到来给社会各个领域带来的影响是极其深刻的,从计算机系统结构到工业生产、商业运营,再到人们思考问题的方式,都在因大数据而改变[1],这也给包括研究生在内的大学工程教育带来前所未有的机遇和挑战[2]。为了应对这一挑战,教育部于2017年下发了《关于推荐新工科研究与实践项目的通知》,遴选612个首批新工科研究与实践项目。自此,新工科进入全面实施阶段[3]。
数据挖掘作为发现大数据价值的有效手段,在新工科建设背景下,已经成为高校研究生,特别是计算机相关专业的研究生最受欢迎的一门课。以东北电力大学为例,最近三年,“数据挖掘”一直是计算机类课程中选课人数最多的,每年大约有70名来自计算机、通信、电气、经管等专业的学生选修此课程。因此,以“数据挖掘”课为对象探讨新工科研究生课程教学改革具有代表性和说服力。
本文依据新工科建设指导思想,结合东北电力大学电力特色及生源质量等实际情况,以“数据挖掘”课为例,分析现有教学环节中存在的不足,并探索提高新工科研究生培养质量的教学新模式,为其他高校开展研究生新工科建设教学改革提供参考。
一、現有不足分析
(一)脱离行业背景,教学效果不佳
在大数据时代,不同行业的数据从产生到应用、从形态到特征都存在差异,例如:电力行业产生更多的是监测系统采集到的结构化气电参量数据,而电商行业产生更多的则是非结构化的用户评论文本与商品图像等数据。这就要求数据挖掘不能脱离行业背景[4]。但实际情况是,选修“数据挖掘”课的研究生来自多个专业,授课教师却容易忽略学生专业背景之间的差异。一方面,授课内容没有与学生熟悉的行业结合,使得“数据挖掘”课不经意间变成了一门脱离行业背景的纯算法理论课,学生往往会因为与实际情况联系不上而听得一头雾水,教学效果较差。另一方面,不同专业学生的计算机基础知识和能力水平差异很大。但由于选修此课的大多数学生是计算机专业的,教师在讲课的过程中更容易受到这些基础本来就相对较强的计算机专业学生的影响,而忽略其他专业的学生,这使得其他专业学生的学习更加艰难。
(二)教学模式陈旧,学习氛围不浓
在授课环节,一方面由于学校将大部分研究生课程放在第一学年集中完成,因此不仅课程多,而且学时短。再加上研究生还有来自实验室的科研任务,导致研究生学习压力很大,容易产生学习焦虑。另一方面,授课教师往往采用类似本科生同专业学生一起上课时的教学模式,致使授课内容与学生研究方向脱节,课程枯燥、缺乏吸引力。久而久之,课堂的学习氛围必然变差。
在考核环节,普遍采用“平时成绩+考试成绩”或者是“平时成绩+演讲+考试成绩”的考核方式。无论是哪种考核方式,期末考试成绩占最终成绩的比例一般都在70%以上。由于期末考试只考察理论,因此很多学生会采用考前临阵磨枪、死记硬背的方式。再加上“平时成绩”与“演讲成绩”经常沦为教师调节总成绩高低的工具,学生就更加不重视日常学习,导致平时努力学习的氛围就更加不浓厚了。
(三)缺少案例演练,实践能力不高
数据挖掘是用于发现隐藏在大数据背后巨大价值的技术手段,自带很强的实践属性[5]。而且,数据挖掘并不是孤立的,前面需要数据理解和准备,后面需要模型评价和部署。然而,现有的教学环节侧重于理论,缺少系统性的案例讲解和演练[6]。加上东北电力大学计算机相关专业录取的研究生很多是跨专业的,专业基础参差不齐,因此学习该课之后,学生数据挖掘的实践能力并未明显提高,难以为研究生后续开展科研实践提供有力支持。
二、教学改革探索
针对以上不足,本文提出新工科研究生“数据挖掘”课教学改革的基本思路,可概括为“结合行业背景、采用混合教学、注重案例演练、提高实践能力”。其中,提高实践能力是课程的核心教学目标。教学改革首先要纠正以往重理论轻实践的错误,把实践能力放到更加重要的位置,以使学生能够满足大数据时代卓越工程师的要求。
(一)结合行业背景
首先,教师要在第一节课,采集选课学生的专业、研究方向、计算机基础、对“数据挖掘”的了解以及对课程学习效果的预期等信息。我们的做法是,利用移动学习工具(超星学习通)制作一个调查问卷。在第一节课课间,教师引导研究生安装超星学习通APP并完成调查问卷。
其次,在第二节课上课之前,分析学生的调查问卷,了解学生学习“数据挖掘”的真实需求,进而确定更加具体的、与行业背景紧密相关的授课内容(案例)。我们的做法是:根据专业与研究方向情况,确定行业背景;根据计算机基础等其他情况,确定重点难点内容。以东北电力大学为例,调查发现,选课学生的研究课题,超过80%都是电力行业背景。因此东北电力大学的“数据挖掘”课,毫无疑问地以电力行业为主要背景。
最后,通过文献计量分析(如Citespace)了解各行业数据挖掘的主要应用场合和采取的主流算法,以便确定教学重点和难点。以电力行业的数据挖掘为例,通过关键词演化分析可知,电力行业数据挖掘主要应用于以下几个方面:(1)设备运行状态评估与预测;(2)负荷预测;(3)故障诊断。同理,通过文献计量分析还可以知道电力行业数据挖掘采用的主流算法。依据之前调查所得的学生的计算机基础情况,再结合算法难易程度以及课时安排,便可确定教学重点和难点。
(二)采用混合式教学
确定了课堂授课的主要行业背景之后,需要考虑如何兼顾少数其他专业的学生。由于课堂时间是有限的,而不同专业学生的计算机基础差距又比较大,因此,仅靠课堂授课很难达成教学目标,必须转变思路。我们的做法是:采用课堂内外紧密融合的混合式教学方式,课堂上以电力行业背景为主,采用演示、讲解、讨论、上机、测验等多种教学方法,激发学生的学习兴趣。课下通过超星学习通,有针对性地为学生发送学习资料。例如,为经管专业的学生发送与财务报表、网络购物有关的数据挖掘算例;为计算机基础较好、学习兴趣浓厚的学生发送数据挖掘高阶算法案例与教程等。
考虑到学生课外自主学习缺乏监管,为了能将课堂内外紧密融合,需要改革课程评价方式,加大过程考核力度。以东北电力大学为例,教师会依据之前发送的学习资料以及布置的课外学习任务,在课堂上以问答、上机、演讲、随堂测试的形式进行检验。这部分成绩作为过程考核成绩,占最终成绩的50%。这就会督促学生认真开展课外自主学习。需要说明的是,过程考核的成绩都是当堂公布的,目的是通过“即时反馈”增加学生学习的成就感、获得感,提高其学习兴趣。对于教师而言,这种做法还能够及时了解学生对知识的接受情況,便于灵活调整授课内容和形式。
(三)注重案例演练
以往的“数据挖掘”课,由于忽略行业背景以及学生计算机基础的差异,授课内容更偏向理论知识,这与大数据时代新工科建设的理念背道而驰。社会需要的是“卓越工程师”,动手能力必须要强。为此,在上文提到的混合式教学中,案例演示与上机练习是非常重要的环节。我们每一节课所讲授的知识都有电力行业的案例,每一节课所讲授的算法都要求上机练习。选取的案例包括电力负荷预测、电力设备故障诊断以及用户推荐系统等,涵盖了选课学生的所有专业,涉及到从数据理解到模型部署的全部数据挖掘过程。
三、总结
大数据时代的新工科建设为研究生培养指明了方向。为了培养符合新时代社会需求的卓越工程师,本文对研究生“数据挖掘”课的教学改革进行了探索,提出了“结合行业背景、采用混合教学、注重案例演练、提高实践能力”的改革思路,采用了课堂内外紧密融合的混合式教学模式。该模式具有“评价—讲解—演示—练习”四个循环步骤,即每节课首先通过问答、测验等多种手段,检查学生的课外学习效果并当堂作出评价,然后将暴露出的问题与本节课的重点难点结合并进行讲解,接着通过案例演示加深学生对本节课内容的理解,最后是课上集中上机练习和课下自主学习。
上述混合式教学模式的效果比较明显,主要表现在以下几点:首先,学生的学习积极性较前几级学生有大幅提高,请假、旷课、迟到的比例显著降低;其次,学生的数据挖掘实践能力显著提高,绝大多数学生能够编写并调试“分类”“聚类”“关联分析”等常用数据挖掘算法代码;最后,学生查阅文献、自主学习的能力和意识也都有提升,有利于终生自主学习习惯的养成。因此,可以认为,本文对研究生“数据挖掘”课程教学改革的探索是成功的,可以作为其他高校开展新工科研究生课程教学改革的参考。
参考文献:
[1]孙会峰.2019中国大数据产业发展洞察暨中国大数据产业发展白皮书发布[J].软件和集成电路,2019(9).
[2]黄河燕.新工科背景下人工智能专业人才培养的认识与思考[J].中国大学教学,2019(2).
[3]吴爱华,杨秋波,郝杰.以“新工科”建设引领高等教育创新 变革[J].高等工程教育研究,2019(1).
[4]王慧芳,曹靖,罗麟.电力文本数据挖掘现状及挑战[J].浙江电力,2019(3).
[5]刘波,蔡燕斯,钟少丹.大数据背景下数据挖掘课程实践教 学的探索[J].高教学刊,2019(18).
[6]王建新.数据挖掘课程中数据思维的培养方法探索[J].计算机教育,2019(8).