机器学习课程教学的实践探索
2019-01-06蒋良孝
蒋良孝
摘 要:机器学习在众多领域有着广泛的应用,使得开展机器学习教学变得更加迫切,但目前国内对机器学习课程教学没有太多的经验。在考虑学生和科研工作实际需求的基础上,文章摸索出一套合理的机器学习教学目标与内容、教学方法与特色、教学评价与考核方法。
关键词:机器学习;教学实践;教学特色
中图分类号:G642.4 文献标识码:A 文章编号:1671-0568(2019)27-0013-03
2016年3月9日至15日,谷歌人工智能围棋程序阿尔法狗AlphaGo以总比分4比1战胜世界围棋冠军李世石。 2017年5月23日至27日,又在浙江乌镇的围棋峰会上,以总比分3比0完胜我国世界排名第一的棋手柯洁。2017年1月6日,《最强大脑》第四季引入人机大战模式,百度人工智能机器人小度作为特别选手参赛,在比赛中战胜了“最强大脑”队长王峰。
随着摩尔定律带来的芯片计算能力和存储能力大幅提升以及大数据时代的来临,不仅让谷歌人工智能围棋程序阿尔法狗AlphaGo和百度人工智能机器人小度一炮走红,也将人工智能研究推向了一个新的高潮。
2017年7月8日,国务院印发《新一代人工智能发展规划》宣布:举全国之力,在2030年一定要抢占人工智能全球制高点。同时,为了实现这个目标,党中央、国务院正式下文:即日起,从小学教育,中学科目,到大学院校,通通逐步新增人工智能课程,建设全国人才梯队。2018年4月2日,作为落实国务院《新一代人工智能发展规划》的具体举措,教育部印发《高等学校人工智能创新行动计划》中明确指出:要加快机器学习等新一代人工智能核心关键技术研究。
机器学习的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。目前,被广泛采用的机器学习定义是“利用经验来改善计算机系统自身的性能”。由于“经验”在计算机系统中主要是以数据的形式存在,因而机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此受到越来越多的关注。
笔者所在的中国地质大学(武汉)计算机学院目前共有计算机科学与技术、数据科学与大数据技术、智能科学与技术、空间信息与数字技术、信息安全及网络工程六个本科专业。在最新修订的2019年版本科人才培养方案中,六个专业都设置了相应的“机器学习”课程,主要面向全校对机器学习感兴趣的本科生,既包括计算机、软件工程、电子信息、自动化等信息相关专业的学生,还包括应用数学、经济管理、地球物理、环境地质、化学工程等非信息专业的学生。因此,笔者作为这门课程的主讲教师和课程负责人,在现有教学经验的基础上,如何讲好这样一门既有广泛需求又有一定难度的课程,需要认真地思考、总结和实践。
一、教学目标与内容
开设本课程的目的是使学生了解机器学习的基本方向;掌握机器学习的基本算法;掌握运用WEKA平台实现机器学习算法的方法;了解机器学习的有关研究思想,从中学习开拓者们求解问题的部分方法;通过实验进一步体会有关学习算法的用法和性能,切实提高机器学习算法的编程应用能力;能查阅适当的参考文献,将所学的知识与自己未来研究课题相结合起来。
为了实现这些目标,在充分参考现有经典机器学习教材的基础上,课程组设计了以下教学内容和课程大纲:本课程将以数据挖掘中的分类任务为例,首先讲解分类模型的评估,然后讲解一批经典而常用的机器学习技术。具体的章节安排如下:第1章:绪论。讲解机器学习的定义、与数据挖掘的区别与联系、本课程的授课思路与内容安排,以及本课程所使用的教材及参考书。第2章:讲解模型评估的方法、指标,以及比较检验。第3-9章:讲解机器学习的基础技术:以线性回归开始,讲解线性学习;以K均值聚类收尾,讲解无监督学习;中间包括支持向量机学习、神经网络学习、决策树学习、贝叶斯学习及最近邻学习。第10-13章:讲解机器学习的进阶技术:具体包括集成学习、代价敏感学习、演化学习及强化学习。具体的课程大纲如表1所示。
二、教学方法与特色
明确教学目标与内容、教学团队与分工后,就需要精心设计教学方法,把课程讲好、讲精彩、讲出自己的特色。
1.高度重视学生动手能力的培养。任课教师手把手教会学生运用国际开源机器学习实验平台WEKA进行机器学习算法实现的方法;通过实验进一步体会机器学习算法的用途和性能,切实提高学生的机器学习编程实践能力。
2.以解决实际问题为导向。让学生了解机器学习的有关研究思想,并从中学习开拓者们求解机器学习问题的部分方法;掌握课程教学内容的应用价值和前景,激发学生的学习兴趣,实现从“要我学”到“我要学”学习方式的转变。
3.根据学生的特点和兴趣组建不同的课程学习团队。培养学生的人际沟通、团队协作能力,增强学生的综合素质,让学生在实际应用中领悟机器学习理论知识的精髓,为科研和学科竞赛储备人才和队伍。
4.科教结合。鼓励教学团队的任课教师从自身的科研领域提炼出与课程教学相关的研究问题,组建学习团队,促进科研为教学服务,切实提升教学质量和学生科研成果产出的质量和数量。
三、教学评价与考核
对于机器学习这样一门高度重视动手能力培养的计算机专业选修课程而言,课堂理论知识教学固然重要,但更重要的是课外实践,使学生的实践动手能力得到提高,能够解决实际应用的问题,编写出真正有用的机器学习算法。为实现这个目标,课程组设计了八道课后实践训练与考核实战题,主要用来巩固复习课堂上所讲授的机器学习算法理论,同时掌握运用国际机器学习开源实验平台WEKA实现机器学习算法的基本方法和步骤;通过实验进一步体会有关机器学习算法的用法和性能,切实提高机器学习算法的编程应用能力:①Linear Regression回归算法的实现及实验测试(10分);②Logistic Regression分类算法的实现及实验测试(10分);③SMO分类算法的实现及实验测试(15分);④BP分类算法的实现及实验测试(15分);⑤ID3分类算法的实现及实验测试(15分);⑥NB分类算法的实现及实验测试(15分);⑦KNN分类算法的实现及实验测试(10分);⑧K-Means聚类算法的实现及实验测试(10分)。
最后,要求选课学生提交基于WEKA平台实现的java代码文件和用Explorer在任何一个数据集上测试结果的截图,一起作为考核评分的依据。
机器学习是一门新兴且非常重要的计算机及相关专业的选修课,在图像识别、智能医疗、市场分析、金融投资、欺诈甄别、环境保护、科学研究等许多领域获得了广泛的应用,取得了十分可观的社会效益,显示出了良好的应用前景。如何在大学中讲好这门课程,切实提高学生运用机器学习技术解决实际问题的实践能力,是每一名任课教师需要认真思考的问题。本文从教学目標与内容、教学方法与特色,到教学评价与考核,完整地描述了这门课程的所有环节。经过笔者多年的努力,这门课程目前已在爱课程中国大学MOOC平台进行了2次开课,选课人数分别达到12913和12671,第3次拟于2019年8月1日开课,目前已有2702人预选参加,得到了其他高校学生和社会学习者的广泛好评,并且成功入选首批湖北省本科精品在线开放课程。未来的工作主要包括进一步补充和完善课程教学内容,提出新的教学方法,并根据学生的反馈改进教学评价与考核的内容及评分标准。
参考文献:
[1] 蒋良孝,李超群.基于团队学习的研究生创新能力培养[J].计算机教育,2017,(11): 55-57.
[2](新西兰)伊恩·H.威腾.数据挖掘 实用机器学习工具与技术(原书第4版)[M].李川,等译.北京:机械工业出版社,2018.
[3] 周志华.机器学习[M].北京:清华大学出版社,2016.
[4] 于剑.机器学习 从公理到算法[M].北京:清华大学出版社,2017.
[5](美)Tom M.Mitchell机器学习[M].曾华军,等译.北京:机械工业出版社,2003.
责任编辑 易继斌