APP下载

“线上—线下”教学模式下大数据专业机器学习金课建设研究

2022-01-07孙开伟杜雨露段小林

软件导刊 2021年12期
关键词:机器竞赛课程

邓 欣,孙开伟,王 进,杜雨露,段小林,张 浩

(重庆邮电大学计算机科学与技术学院,重庆 400065)

0 引言

随着大数据技术的快速发展,人们的思维、生产和生活方式正在发生着深刻改变。大数据技术与各行业深度融合,在社会生活的各方面得以广泛应用并起到了重要作用,产生了巨大的社会效益和商业价值。近几年来,我国大数据市场营收规模不断增加,大数据相关的各类市场前景非常广阔,社会对大数据人才的需求显得尤为迫切[1]。同时,大数据行业的应用在不断变化,企业所需求的人才种类也随着市场的变化不断演变,因此各行各业对大数据人才培养提出了更高要求。此外,《国家中长期人才发展规划纲要(2010-2020 年)》明确指出要培养和提升交叉学科人才,尤其是在信息技术、生物技术、大数据智能和能源资源等领域中培养出既精通数学理论知识,又掌握信息技术并能熟练应用的复合型人才。由此可见,大数据人才培养已纳入国家人才发展规划。

近年来,数据科学与大数据技术专业(本文简称为“大数据专业”)发展迅速。据统计,在2016-2021 年五年间全国691 所本科院校获批新增大数据专业[2-3]。大数据专业是融合了统计学、数学和计算机3 个学科的交叉专业,如何让学生综合运用多学科知识与核心技术以解决大数据相关理论和工程实际问题是培养大数据专业人才的关键。因此,对于大数据专业学生培养,就是要根据其多学科交叉融合的特点,培养学生跨学科的理论功底和实践能力、培养学生被动学习到主动学习的自主学习能力。这些能力正是当下以及未来社会发展对大数据专业人才的要求,这是高校在制定人才培养方案时必须充分考虑的问题。因此,要根据社会需求设定专业要求,根据专业要求培养学生的理论功底和实践能力。

在大数据专业的众多核心课程中,机器学习课程所讲授内容是数据分析的核心技术,该课程不仅是该专业的必修课程,而且越来越多的高校将其作为本科计算机学科下其他专业的限选或选修课[4-6]。但是该课程难度较大,本科生要熟练掌握基础知识和重要算法编程,他们与研究生相比有一定欠缺。同时,机器学习课是一门融合了多个学科且理论性较强的专业课,学生在学习该门课之前必须学习高等数学、概率与统计、矩阵论、高级语言程序设计等多门先修课程,对学生的知识广度、深度和实际应用能力要求较高。因此,对本科生进行机器学习课程的理论讲解和实践指导具有很大挑战性。针对本科生的理论知识和动手能力,如何将数学理论知识和编程实践能力结合在一起,提高学生学习兴趣、增强学生实际动手能力和创新能力,是目前该门课程教学中需要解决的问题。

针对以上教学中面临的实际问题,本文首先分析机器学习课程教学现状,列举出当前教学方式和考核方式等方面存在的不足;其次,针对该课程的一些薄弱环节提出新的建设内容,包括“线上”“线下”融合的教学模式、以赛促学教学模式等;再次,根据所提出的建设内容进行教学实践,从而将所提出的方法应用于实际教学;最后,对实际教学效果进行总结,证明本文所提出的教学方法在实践中的有效性。

1 机器学习课程教学现状

机器学习课作为一门较新的课程,近几年受到了广泛关注,越来越多的专业开设了这门课。该课程是一门多学科交叉课程,包含了概率、统计、凸优化方法、数学建模和程序设计等多学科知识。其教学目的首先是使学生理解和掌握机器学习算法的思想和基本原理;其次,使学生能根据算法模型进行编程并实现;最后,要求学生根据实际问题采用合适的机器学习算法进行工程实践。该门课对培养学生的数学应用能力和编程能力非常重要,但在实际教学过程中却面临诸多不足,主要表现为以下几点:

(1)教学方式较为传统。该门课目前主要的教学方式是教师作为教学的主体,即教师台上“广播式”地讲,学生在座位上被动地听,也即传统的“填鸭式”教学[7]。由于机器学习这门课所涉及的概念、定义和公式较多,学生听课时很容易感到枯燥和厌烦,甚至听久了有排斥心理,导致其集中精力的时间不长,容易分心走神,在很大程度上降低了教学效果。此外,该门课的算法涉及大量的理论公式,容易导致学生虽然能理解其原理,但是却不知道如何在实际中加以应用[8-9]。因此,如果学习时间长,学生容易对该门课的理论缺乏兴趣,失去学习热情。此外,教师在课堂上大多使用电子课件进行讲授,容量大、速度快,使得学生对所学内容记忆不深刻,对该门课程的认识不到位,对于课程能否有助于学生的后续发展有所疑虑,从而导致学生的抵触情绪。

(2)课程考核方式较为单一。目前,该课程考核主要以期末理论考试为主,因此多数学生平时在课后很少复习理论知识,等到了期末时再花半个月的时间进行突击复习以应付考试。在实践方面,虽然该门课在课后题配有上机实验练习题,但是时常发生相互抄袭的现象。此外,由于该门课的实验课是安排在理论课之后,主要实验内容是对基本算法进行实现,实验模式大多是以单个学生为主,学生不组成团队,不利于培养学生的团队协作能力和有效的学术沟通能力,与计算机学科类的工程专业认证所要求的团队协作能力和解决复杂工程能力的培养要求不相符。该课程实验课所涉及的内容相对较简单,学生常常以调用程序得到结果为目标,不能让学生看到近年来所学内容广泛的应用场景和未来广阔的应用前景。

(3)基础知识容易被遗忘。大多学校针对本科三年级学生开设,而一些基础知识,如高等数学、数理统计和高级语言程序设计等基础课程在一、二年级已经学完。在学习该门课时,很多基础知识已被学生遗忘,学生需要花一定量的时间进行复习,降低了学习效率。学生在之前学习编程语言时掌握的熟练程度不一样,导致较差的学生在实验时无法自如编写程序完成实验,特别是涉及凸优化方法和矩阵运算时,学生在理论理解和编程上比较吃力,加剧了学生的抵触情绪,也容易导致代码抄袭现象发生。

(4)教学内容多且难度大。机器学习课程主要讲述各种机器学习算法,包括线性回归、决策树、神经网络、支持向量机、贝叶斯方法、KNN、K-Means 等,其中每一种机器学习算法都是大数据专业学习中必不可少的基础[10]。在课堂讲授过程中,一般只讲授必学单元的基本知识点和公式的推导过程。由于内容多、学时相对有限,对于各知识点在实际生产生活中的应用与拓展,难以有足够的时间进行讲解,常常导致与工程型人才培养目标有较大差距。

2 课程建设内容

针对机器学习课程教学现状的不足,为提高教学质量,学校对该门课程进行了“线上—线下”混合式金课建设。课程的金课建设采用了多种教学模式,同时结合其特点融入“课程思政”的内容,在教学过程中着力体现教学方式的灵活性。通过“线上—线下”混合式的教学模式,使学生在理论知识学习和实践应用方面拥有全新的认知。通过对教学方式的不断改进,使教学内容逐步完善,从而促进学生对理论知识的理解、掌握和实践应用。首先,通过线上资源学习、线下课堂授课方式营造活跃的线上线下学习氛围;其次,采用线上线下同步实践教学方式,提高学生应用能力;再次,鼓励学生参加各种实践活动,例如参加计算机行业认证、大数据竞赛等,让学生在掌握理论知识的基础上,锻炼其解决复杂问题的综合能力。课程内容建设主要为以下几方面:

(1)线下金课教学。机器学习课是大数据专业的重要课程之一,需要学生具备一定的数学理论知识。在教学过程中,传统的课堂教学模式主要是教师讲解,学生被动接受,难以让学生体验到课程的趣味性,较容易使学生分心而跟不上授课节奏,从而产生畏难情绪以至于失去兴趣和信心。为了避免这种情况的发生,在线下教学活动中增加了师生互动环节。互动环节的增加,需要教师在课前投入更多的精力备课,设计合适的互动议题;需要教师在授课过程中对课堂的掌控游刃有余,在适当时使用严肃或者幽默的语言、在黑板上进行严谨的推导,采用肢体语言等方式吸引学生注意力;需要教师采用启发式教学方法,在课堂上以学生为中心,让学生在学习过程中参与教学,成为教学的主人翁,达到和教师默契配合的效果。课后要留充足的时间给学生进行自学和思考。因此,打造线下金课教学模式,有助于提高课程授课质量,促进师生间的沟通。

(2)线上金课教学。机器学习课是一门新兴的课程,其所对应的配套教材较为匮乏。可采用当前较为流行的慕课等线上学习资源,让其作为“线上—线下”教学的主要形式之一,对推动课程改革起到关键作用[11-13]。授课教师可以充分借鉴和学习慕课所提供的在线教学资源,熟悉相关教学情况,不断完善和提升教案与教学内容,不断夯实自身教学水平。在教学中增设慕课等在线教学内容,可以使有限的教学资源更加丰富,使学生在课前和课后更加灵活地安排学习时间,便于他们更好地进行预习和复习,提高学生学习兴趣和课程教学质量。因此,要熟练使用慕课等线上资源,就需要教师利用更多的时间去研究教学各环节,了解和关注学生在学习过程中的状态,才能更好地打造线上金课。课程资源建设分为线下资源建设和线上资源建设。线下资源建设主要由教师备好理论课讲授内容,包括PPT、视频、教案、综合实践项目等;线上资源建设要求教师寻找合适的慕课平台,熟悉线下内容的缺失部分,将线上内容当作线下内容的补充,利用线上资源作为学生课前预习的材料和课后复习巩固的资料等。除现有的网络免费公开课外(慕课、网易公开课、国内外著名高校公开课),本项目还将针对学生特点建设自己的线上学习平台,并在以下3 个网站上线:www.educoder.net(头歌科技)、www.4paradigm.com(第四范式)、www.kesci.com(和鲸科技)。其中,为培训学生参加大数据竞赛而建设的在线课程体系的在线资源在“头歌科技”网站上已经使用了两年,学生可通过该平台进行课下的线上理论学习和实践编程。通过在该平台上练习,学生在以后的竞赛和工程项目表现上较为突出,取得了良好效果,该平台的线上学习内容如表1 所示。

Table 1 Learning material on online platform表1 线上平台学习内容

(3)以赛促学的金课教学。机器学习课是一门实践性较强的课程,除理论学习外还要鼓励学生积极参加各种竞赛和科创活动,接触来自于实际生产生活中的最新技术和前沿问题,引导学生激发创新意识,增强理论知识的实际运用能力,达到学以致用的目的。作为一个较为有效的教学手段,以赛促学是要积极组织学生参与竞赛。为了使学生踊跃参加竞赛,需要有一定的竞赛激励机制鼓励其积极报名[14]。在实施过程中,将与专业契合度高的知名大数据竞赛成绩作为一部分实践课程考核成绩,学生可以用获奖(国家级奖励)或者竞赛排名(前2%以上)抵扣一部分实践学分。在学习过程中,鼓励学生学习该门课的同时参加各种竞赛,进一步提高学生主动探究、分析和解决问题的能动性、实际动手能力和团队合作能力。此外,鼓励学生参与的竞赛要规模大、知名度高、奖金金额较高、组织保障到位,从而保证学生有良好的参赛体验,让其在参赛中有所收获,从而提高学生在专业领域的竞争力及职业素养。

3 教学实施

按照金课要求,课程教学要以学生为中心,充分体现高阶性、创新性和挑战度。机器学习课程采用大班授课,案例式教学。实际案例要针对理论知识选择难度适中的案例。根据实际情况,从Sklearn 自带的简单数据集,例如鸢尾花、乳腺癌、糖尿病、波士顿房价数据集等开始,鼓励学生组成2~3 人的团队进行算法验证和数据分析,要求学生持续记录开发进程,记录不同机器学习算法所得到的结果。学生可以使用现有的开源软件机器学习工具,例如Keras、PyTorch 等。使用这些工具可以减少学生代码书写量,学生只需要调用相应的工具包便能实现,可以使学生将更多的时间投入到对问题解决思路的思考中去。授课内容较简单的部分可以采用翻转课堂方式,教师在课堂上负责引导学生,而学生作为教学的主体把控整个课堂教学过程。这样更能调动起学生的积极性、发挥学生的想象力、培养学生的创造性思维。本门课所采用的教学方法可表现为以下几方面:

(1)案例驱动式教学。案例驱动式教学,就是对知识点的讲解通过实际例子引入从而归纳出相应的概念和观点。教师在课堂上主要讲解各理论的数学原理,教会学生梳理各算法思想和计算过程,抓住算法的优劣等性质,掌握其实际应用场景。例如,在对朴素贝叶斯分类器进行讲解时,教师首先给出垃圾邮件检测案例,在该案例中,首先通过人工标注每封邮件是否为垃圾邮件,然后通过这些标注好的邮件对朴素贝叶斯模型进行训练,最后对新来的邮件进行预测。该案例中,学生可以分析垃圾邮件的特点,围绕机器学习处理该问题的步骤以学习特征的权重,并引出课堂教学内容。

(2)讨论式教学。教学过程要颠覆传统的“填鸭式”灌输知识方式,注重培养学生分析问题和解决问题的能力。分析问题时,可以让学生尝试利用已有知识提出解决方案,组织学生讨论方法的可行性等。例如,对于决策树分类器,让学生尝试不同的划分选择方法,进而掌握“信息增益”“增益率”和“基尼指数”的区别,并针对不同的“减枝方法”分析“预减枝”和“后减枝”的分类效果,进一步理解决策树的各种参数设定对分类效果的影响。

(3)教学全过程考核。单一的期末考试不能真实反映学生系统性的学习效果,因而将这门课的考核贯穿到教学全过程,从而对学生的综合能力进行考察。除期末考试外,综合考虑学生在课堂教学中的积极性,将平时课堂讨论纳入平时成绩,细化课后实践,将课后项目成果也纳入总分。最终,学生成绩包括多个教学环节的综合评定,如表2 所示。

Table 2 Methods for score evaluation表2 学生成绩评定方式

(4)基础知识强化。针对学生对一、二年级所学基础知识有所遗忘的现象,对于难度较小的知识,教师可以在课前布置需要复习的内容;对于难度较大的知识,需要教师在课堂上进行讲解复习,帮助学生理解和消化。此外,教师可以通过QQ、微信等通信工具创建学习群,可以将相关文字和视频资料上传供学生下载学习。教师可在群中针对学生提出的问题进行解答,这样学生便不会因为问题不断积累却得不到及时解答从而丧失学习兴趣,最终放弃该门课的学习。

4 教学成果

学生通过“线上—线下”教学模式对该课程进行学习后,加以竞赛和项目实践,达到“程序设计+软件开发+数据工程”的教学目的,使学生掌声理论知识并拥有实践能力。同时,学院组织实施了“CSA 云行”工作室进行课外计算机能力训练,将“CCF CSP”认证列入专业培养方案,将学科竞赛纳入实践课程“多选一”考核范围等措施,形成了“课内教学+课外训练+学科竞赛”三位一体的实践教学模式,课内外协同,全方面、多维度强化学生工程能力培养。此外,学院也协同学校学工部门开展课外工程能力训练、学科竞赛指导,建立了专业教师技术负责、辅导员流程管控、研究生及高年级学长助教团队分组指导的课外训练项目运行管理机制,保证了5~8 人的小组互动研讨式课外实践教学模式有效落地,探索出了一条工程实践教学改革新路,走在了全国高校前列。

在教学中,推行实践教学全过程学业评价,交流效果、线上测评、实验报告、技术答辩、带队成效等多维度考核手段并重。针对课程项目独立制订查重扣分标准和查重代码库,全面引入MOSS 系统进行实验项目代码查重;在“数据工程”方向的实践课程群全面引入阿里云天池、Data-Fountain 等国内权威大数据竞赛平台线上测评体系,实现了对学生实践课程学习效果的客观指标评价,从评价体系上保障了“科赛一体”实践教学的全面开展。

在教学中,坚持“程序设计+软件开发+数据工程”领域创新创业实践活动,鼓励学生专业竞赛超过100 余人次,在代表国内高校最高水平的大数据算法竞赛“中国高校计算机大赛——大数据挑战赛”中,获得冠军2 次(蝉联2019年、2020 年冠军)、季军1 次,在国内大数据与人工智能领域最具影响力的赛事“CCF 大数据与计算智能大赛”中获得冠军3 次、亚军2 次、季军2 次,大数据算法竞赛水平位居全国前列。学生积极参与教师科研和工程课题,20 余项成果被多家企事业单位采用,产生了良好效益。并且,教学成果多次受各种媒体报到。2020 年9 月,重庆日报、新华网、重庆市教委官网、南岸区人民政府相续报道了重庆邮电大学蝉联“中国高校计算机大赛——大数据挑战赛”冠军的情况;2020 年11 月19 日,重庆日报报道重庆邮电大学获得“2020 华为云重庆软件创新大赛”唯一的一等奖;2021 年4月24 日,腾讯网、搜狐新闻、上游新闻等媒体报道了“2021华为开发者大会”,指出与华为合作打造的“智能基座”产教融合协同育人基地在大数据智能创新研究和人才培养方面一直走在国家前列。

5 结语

本文针对大数据专业机器学习校级金课建设,分析了该门课当前教学方式方法上的不足之处,针对不足提出了新的课程建设内容,即构建线上实践教学平台,通过线下讲理论、线上实践练习、课后课赛结合的方式对该门课进行建设。实际教学效果表明,依托线上实践平台,学生不仅能对理论课上所学的理论知识进行更深入的理解,还能对各种理论算法加以实际应用,并在实践过程中进行团队协作,从而达到了使学生动脑、动手又动口的学习效果。通过该门课的学习,学生不仅在学业考试上取得好成绩,在参加与机器学习相关的各类竞赛上非常踊跃,并且大量获奖。这充分说明依托线上实践平台打造机器学习金课能充分激发学生的兴趣与积极性,真正使学生在教学中占主体地位。

猜你喜欢

机器竞赛课程
机器狗
2020丝绸之路数学竞赛
机器狗
数字图像处理课程混合式教学改革与探索
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
未来机器城
我看竞赛
创新思维竞赛(3)
无敌机器蛛