APP下载

内蒙古高校研究生机器学习课程教学方法探索

2023-06-21吉亚图刘志强

内蒙古财经大学学报 2023年3期
关键词:机器课程体系人工智能

吉亚图,师 磊,刘志强

(1. 内蒙古工业大学 信息工程学院,内蒙古 呼和浩特 010080;2.内蒙古财经大学 大数据应用服务中心,内蒙古 呼和浩特 010070)

2021年3月13日,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》正式发布(以下简称《纲要》)。在《纲要》发布的六十五章内容中,含有“智能”“智慧”的相关表述多达58处[1],其中围绕核心技术突破、社会经济发展、教育人才培养等方面,人工智能均是重点领域。人工智能主要致力于计算机图形图像,自然语言处理与语音识别等领域,其基础与核心都是机器学习[2]。机器学习的相关算法也在工科类的各学科中都有或多或少的渗透和应用。在内蒙古地区,信息化建设对于国家安定统一,民族团结有重要作用。在人工智能渗透各学科和行业背景下,少数民族地区的机器学习领域的相关专业发展迫在眉睫,相关专业的人才培养也需要格外注重。

机器学习课程与计算机专业知识基础密切相关,因此适时调整和增加计算机类专业方向对机器学习课程的学习和应用,可以更好地适应人工智能的发展要求。人工智能发展国家战略下培养计算机相关专业学生的目标是具有计算机基础知识、机器学习及深度学习等专业知识、实践能力强、职业素养高,能够胜任图像、文本及语音识别领域研究的高素质人才[3]。

目前,内蒙古高校计算机学科研究生课程主要是计算机类选修课程[4],包括:算法分析与计算复杂性理论、面向对象方法与技术、数据挖掘以及一系列课程。这些课程内容比较传统,核心内容严重同质化[5],教学内容已不能满足人工智能时代人才培养的要求,将直接影响目前科学研究和就业形势下研究生的理论实践能力、科研能力和就业机会。机器学习技术的发展和应用给计算机相关专业人才培养带来了新的要求与挑战,然而在人工智能大趋势下新建立的一些相关的热门课程与市场需求存在严重脱节现象。因此,机器学习课程应紧跟先进技术的步伐,不断进行专业课程的创新型研究,重视实践类课程和教材的研发,适时调整人才培养和专业教学计划,以期满足工作岗位的实际要求。

本文针对内蒙古高校研究生机器学习课程中存在的问题,结合已开设的研究生基础课程特点,探索机器学习课程教学改革方法。方法主要探讨如何完善课程体系,如何优化评估标准等内容,旨在为计算机相关专业研究生了解和掌握机器学习的相关知识,并在学习理论知识的同时掌握使用方法,探索如何培养学生将计算机和人工智能技术应用于交叉应用领域。

一、现状与问题

在内蒙古地区高校中,《机器学习》课程在近两年才被设定为专业选修课,面向计算机类、电子类、通信类、数据科学类专业开设。学时一般设定为32—48学时,包括理论与实践。课程讲授的内容包括回归方法、决策树、支持向量机、贝叶斯方法、聚类、神经网络。课程的设立旨在让研究生在掌握基本机器学习算法的同时能够结合最新的落地应用更好地运用所学习的算法。然而由于《机器学习》课程都是在最近几年纷纷被内蒙古高校设立,因此在实际的教学和实践中存在很多问题,这些问题或与本身课程设计有关,或与教学方式有关,都无法满足新工科背景下人工智能发展对人才教育的要求。本文根据实际教学过程探索如下遇到的问题。

(一)对于教学设计方面

将课程内容按照传统的计算机类课程的学习逻辑进行金字塔式累积设计对于学生的学习门槛非常高,这是因为《机器学习》课程的内容依赖的前序课程较多,且每个依赖的课程都是独立的一门核心课程,如图1所示。

图1 《机器学习》课程依赖关系

因此,本文提出一种逆向追查教学设计方法,秉持遇到问题-查询问题-解决问题-应用问题的逻辑思想设计课程中各种算法的教学内容。

(二)对于课程内容方面

由于《机器学习》课程在内蒙古地区的高校目前还属于专业选修或限选课范畴,因此一般对于研究生的教学计划安排的课时数较少。复杂的算法知识和严格的实践内容在较短的授课周期内要求对一些知识内容进行取舍,因此如何取舍内容和合理安排授课逻辑是当前开展《机器学习》课程的一个重要问题。本文对机器学习课程中一些关键知识点做了关联设计,使教学过程能够在涉及一个知识点基础上拓展到其他知识点,这样既节省了授课时间也增强了课程内容的逻辑连贯性,使学生更容易接受。

(三)对于授课方式方面

由于机器学习十分依赖数学知识,因此在整体的授课过程中比较枯燥,调动学生学习情绪比较困难,趣味性不足[6]。此外,学生的数学基础各不相同,导致对课程内容的理解程度有较大的差距,在讲授内容时效果参差不一。本文借助目前一些已有的开源机器学习和深度学习平台在每个算法内容讲解时结合前沿的落地项目或身边的应用设计对应的实践演示,并将每个部分的扩展和延伸作为互动式课堂和翻转课堂的讨论内容加深学生的印象。

(四)对于考核方式

一般课程的考核主要以传统的期末理论考试为主,即对平时成绩和期末考试成绩分配一定的比例。这种考核方式对于《机器学习》这种实践性较强的课程存在诸多弊端。首先,由于存在课时量少的问题导致理论知识的教授有限,因此单纯地考察理论知识是不合理的。其次,平时成绩的考核也很难设定标准,作业和理论的考核存在抄袭和借鉴的问题,达不到敦促学生深入思考的目的[7]。再次,鉴于机器学习和深度学习对开发环境的严苛要求,单纯的实践作业对教师评判具有挑战性,不同的代码模块需要教师布置多个运行环境。最后,学生存在期末突击和死记硬背的现象,有时往往能取得合格甚至不错的成绩,但丧失了课程教学的实质。本文作者结合实际的授课效果提出了一种混合考核方式,尽可能地全面评估学生对知识点的掌握情况,在考核的同时起到敦促作用。

二、 改革方法探索

机器学习已成为当前具有代表性的高技术研究课题,综合涉及数学、机械科学、电子学、仿生学、控制论、计算机技术、人工智能、系统工程等多个学科领域[8]。基于人工智能技术研发新的研究生课程,机器学习主要致力于计算机复杂计算方面,包括数据处理、图像视觉处理、自然语言处理与语音识别等领域,其核心都是机器学习基础算法[9-11],因此机器学习系列课程对于研究生教育很有必要。

计算机科学与技术学科经过多年的发展,其课程体系已经比较成熟,形成了各自的特色教学。因此,本文的研究内容是针对《机器学习》课程在原有课程体系上进行补充和完善。

(一)逆向追查教学及学习方法,采用增加模式补充完善课程体系

《机器学习》课程涉及的前序课程较多。其中,《高等数学》课程为《机器学习》中的逻辑运算、理论算法学习以及算法推演提供计算方式和方法。《线性代数》课程为《机器学习》中的矩阵变换过程提供逻辑判断和分析。《概率论》为《机器学习》中的整体数值运算提供矩阵和概率的具体计算方法。《人工智能》作为机器学习的原理性课程为《机器学习》课程的学习提供原理上的实现方法。《数据结构》作为计算机的核心课程与《机器学习》相得益彰,《数据结构》中的数据逻辑结构能够帮助学生从数据的角度理解《机器学习》过程,而《机器学习》的内容能够从训练的角度为《数据结构》的学习提供算法结构理解。此外,通常在《机器学习》课程中“深度学习”可以视为机器学习的一种延伸,或被视作一种实现机器学习算法的工具。然而在教学过程中遇到依赖的前序课程知识如果依次复习则需要花费大量的时间用于复习旧知,这会造成本就紧张的课时不足以支撑正常内容的讲解,且对于已掌握前序知识的学生会浪费较多的课堂时间。

针对以上问题,本文通过在教学中不断地进行尝试,探索出一种课堂教学中逆向追查方法,该方法结合五星教学法[12]实现串联激活旧知和示证新知过程。区别于五星教学法的地方在于逆向追查方法在聚焦问题后颠倒激活旧知和学习新知的顺序,在示证新知过程中将激活旧知设定为课前准备或聚焦问题的翻转课堂中。该方法不仅能够满足后续应用新知过程和融会贯通过程,还能通过翻转课堂等方式调动学生的积极性,且将该节知识点的核心内容从逻辑上与前序课程内容关联,使学生更有兴趣学习。

此外,在设计课程的过程中,以岗位和科研需求为导向,以培养技能型人才为目标,合理安排理论教学内容和课时,着重开发教学案例和内容,明显区别于其他课程教学设置。主要以成熟学习架构和平台为引导,使学生能够直接地利用现有技术开展自身的课题研究,帮助研究生利用机器学习手段在各个研究领域快速应用数据处理方法。

(二)整合课程内容

对于学时设置较少的案例,如32—48学时,需要在有限的教学周期内重新设计教学内容和合理安排授课逻辑是本文的另一个探索内容。对《机器学习》中一些关键知识点做了关联设计,使教学过程能够在涉及一个知识点基础上拓展到其他知识点。

将《机器学习》中主要的14个课程内容划分为三大类八个子内容,具体划分架构如图2所示。

图2 改进的《机器学习》课程模块划分结构

首先根据算法类型将核心内容划分为线性与非线性算法、类别算法、模型构建。线性与非线性方法中主要以几种回归类方法作为主要授课内容,该部分授课内容帮助学生在掌握回归算法的同时建立拟合逻辑,授课内容主要包括线性回归、逻辑回归、非线性回归、其他衍生拟合算法。类别方法主要以分类和聚类方法为主要授课内容,该部分授课内容帮助学生掌握类别方法的同时建立利用大数据建立分布式计算思想,监督学习或无监督学习思想,授课内容主要包括决策树、森林、集成学习、KNN、支持向量机、聚类算法等。模型构建方法主要以数据特征学习过程为主要授课内容,该部分内容帮助学生在掌握以特征学习为主线模型构建基础上学习利用深度学习策略进行大数据学习,该部分授课内容主要包括特征工程、深度学习原理、规则关联等。

(三)增加课程中的实践教学

传统的专业课程已经比较成熟,经过了实践的考验,也已得到了学生的认可。尽管如此,还要针对性地进一步优化,使得课程体系的理论实践比达到更优,提升课程教学实施的效果。单纯的理论教学会使学生的学习过程感到枯燥,对于《机器学习》这类应用较强的课程适当地添加实践教学不仅能完善课程内容,更能帮助学生进一步增强动手能力,同时增加课程学习的趣味性。目前较为常用的机器学习平台如Kaggle比赛平台、百度公司的飞桨Paddle、阿里云平台、深度云平台等。对于以实验验证为目的的科学验证较为友好,不仅为用户提供成熟的开发平台,还为用户提供免费的GPU算力时间。虽然提供的免费时间有限,但足以支撑课程教学过程中的实践设计。此外,更重要的是这些平台对于本地开发环境的要求十分简单,且能够提供丰富的API文档,对Windows和Linux操作系统非常友好。因此,学生在课上无需像往常一样针对不同的模型和安装依赖花大量时间修改计算机环境。此外,教学过程中通过简单的搜索就可以找到海量的开发项目,能够帮助学生动手实现课程内一些基本算法,并可以进一步转化为落地项目。

借助上述开源平台在每次课程的教学过程中结合理论知识的学习,学生能够自然地从五星教学过程中的“示证新知”阶段过度到“应用新知”阶段。

(四)考核方法

针对上述改进的教学过程,合理的考核方式是衡量教学过程质量的重要指标之一。因此,笔者结合实际的授课效果提出了一种混合考核方式,尽可能的全面评估学生对知识点的掌握情况,在考核的同时起到敦促作用,具体如表1、表2所示。

表1 《机器学习》课程评价设计

表2 《机器学习》课程评价细则

(五)其他方面的课程优化

虽然新工科背景下机器学习成为了多数工科专业的选修课程,但其课程内容依托于计算机技术背景,因此计算机专业人才培养具有先决条件。同时,《机器学习》是一门综合性学科,既需要有扎实的数学和数据理论基础,还需要一定的算法研究基础,因此还要注重课程的整体性和层次性设置。在专业基础课上除了《微积分》《线性代数》《概率与统计》等基础数学课外,还要有数据分析等对《机器学习》很重要的内容,以及矩阵运算、监督学习和非监督学习的应用数学基础。根据以上研究思路,教学过程的优化方案主要包括优化现有课程体系,增设教学实践课程以及优化教学过程三个部分。

1.优化现有课程体系

以计算机科学与技术学科为例,课程培养方案中只有一门人工智能课程,没有机器学习和深度学习相关课程,在人工智能发展国家战略下,应优化现有课程体系,增加强化学习、深度学习等相关课程,使学生了解强化学习、深度学习的最新应用,完善知识体系。虽然人工智能课程教学的最终目标是培养实践技能,但基础理论仍非常重要,主要包括熟悉机器学习的基础概念和常见技术架构;熟悉深度学习原理,并了解深度学习典型框架;熟悉分布式系统和分布式计算原理。

2.增设教学实践课程

在课程体系设计中,实践课程应该占有一定的比例,除本文探索的在理论授课中融汇实践教学外的方法外,增加机器学习、深度学习等相关实践课程来锻炼学生的动手能力。课程设计可以根据人才培养目标和教学计划安排机器学习、深度学习应用等模块。

3.优化教学过程

根据对教学设计和课程建设方面的要求,整体的教学过程设计如图3所示。

图3 《机器学习》课程教学设计闭环结构

三、落实方法

第一,文献研究法:学习借鉴国内外有关文献资料。

第二,行动研究法:开展“计算机类”学科学生课程体系研讨会,优化现有课程体系,改善考核测试方式。

第三,案例分析法:在逐渐使用改革后课程体系的过程中不断地反思成功与失败,得出纵向结果及原因分析。

教学方法如图4所示。

图4 《机器学习》课程涉及的教学方法

具体的,针对《机器学习》课程中现存的问题,本文拟制定如下研究方法:

1.改革人才培养模式,使学生的综合能力和综合素质得到提高。以计算机类、电子类和大数据类专业研究生为研究对象,通过课程建设,培养学生的科研能力,在探讨式、项目式教学过程中,提高学生发现问题、分析解决问题的能力,全面提高学生创业能力。通过《机器学习》教学内容的建设,培养学生团队协作的精神。通过科研训练、参与教师的科研项目等方式,使学生能够更多地了解社会的需求,增强学生实践动手能力,提高学生就业的竞争力和创业能力。

2.在课程体系设计中,实践课程应该占有一定的比例,增加机器学习、深度学习等实践课程在工科中的应用,尤其在人工智能及涉及机器学习算法的相关课程来锻炼学生的动手能力。课程设计可以根据人才培养目标和教学计划安排深度学习、强化学习、基础算法应用等模块进行展开。

3.各高校在《人工智能》和《机器学习》教学方面普遍存在教学内容和教学方法的问题。在教材选择上,大部分高校的课程教学内容仅讲述《机器学习》的基础算法知识,对于在具体工程应用上的实际方法和知识都没有深入的探讨。此外,教学方法和教学手段单一,实践教学环节薄弱。实验课时一般为4—8学时,相对较少,在课程建设中是较容易被忽略的一环。因此,需要把握教学内容建设并实施教学方法的研究。在师资队伍的建设方面,特别需要提升年轻教师的专业知识,增强教学水平和教学过程管理。对于实践教学环节的设置与实施问题,针对现阶段慕课微课等主流教学手段,如何在有限的科研和教学经费条件下,制作出高效的教学计划,以及鼓励和引导教师积极参与教学,引导学生积极参与课程。通过此项改革研究建立一套符合研究生教育特点的评估体系和机器学习课程模块的评估标准,以评估引导教学,突出对研究生能力的培养。

四、 结语

本文围绕科技兴国人工智能战略目标对新工科人才培养的需求,分析了实际教学中研究生《机器学习》课程教学中存在的问题,从课程建设、课程内容、课程设计、落实方法方面探索一些针对研究生培养的《机器学习》课程的改进,旨在将课程教学的重心从理论算法学习转移到理论与实际结合授课的过程上,帮助学生更好地理解知识要点,并能够促使学生主动思考和动手解决实际问题,从而培养学生的实际解决问题能力,满足新工科背景下对工科专业尤其是计算机类专业研究生的要求。具体从以下四个方面对课程进行改革。首先,逆向追查教学及学习方法,采用增加模式补充完善课程体系。结合五星教学法实现串联激活旧知和示证新知过程。区别于五星教学法的地方在于逆向追查方法在聚焦问题后颠倒激活旧知和学习新知的顺序,在示证新知过程中将激活旧知设定为可签准备或聚焦问题的翻转课堂中。其次,整合课程内容。本文对机器学习中一些关键知识点做了关联设计,使教学过程能够在涉及一个知识点基础上拓展到其他知识点。再次,增加课程中的实践教学,借助上述开源平台在每次课程的教学过程中结合理论知识的学习,学生能够自然地从五星教学过程中的“示证新知”阶段过度到“应用新知”阶段。最后,考核方法,本文结合实际的授课效果探索了一种混合考核方式,尽可能地全面评估学生对知识点的掌握情况,在考核的同时起到敦促作用。

猜你喜欢

机器课程体系人工智能
机器狗
机器狗
2019:人工智能
人工智能与就业
未来机器城
以创新课程体系引领学生发展
数读人工智能
民法课程体系的改进和完善思路*——以中国政法大学的民法课程体系为例
下一幕,人工智能!
加强青少年中医传统文化教育的必要性及其课程体系构建