人工智能专业课程教学的探究与实践
2024-08-03付志鸿黄洋
摘要:在人工智能技术的发展和理念下,高等教育向智能化方向发展,这势必会引起教育教学改革的潮流,人工智能专业更是如此。文章立足于人工智能专业中的核心课程——“机器学习技术”,探索了该课程的教学实践;通过线上线下混合式、以问题为导向的项目案例化教学方式,解决了传统教学中教学方式单一、应用实践较少且简单的问题。这种教学方式能够使得学生更容易掌握算法的原理,极大地提升了学生的知识应用能力。
关键词:机器学习;人工智能;教育教学
中图分类号:TP181;G642.0文献标志码:A
0 引言
近年来,人工智能(Artificial Intelligent,AI)技术的发展推动了我国各行各业相关领域的应用和产品的发展,涉及交通、安全、教育、军事和公益等多个方面。人工智能的本质是让机器模拟人类的思维,使得机器能够自主学习,从而具备人类的智能。2024年全国两会中,“人工智能+”被首次写入政府工作报告,这意味着人工智能有望成为新质生产力的重要引擎。当前,这种“人工智能+”的模式已经渗透到各行各业,例如:语言、图像、视频等领域,并且在计算机视觉、自然语言处理等领域已经展现出其强大的技术应用优势。
机器学习是人工智能的一个子模块,也是实现人工智能的一个核心手段,它能使软件应用程序在预测结果方面变得更加准确。机器学习算法的核心是使用历史数据作为输入来预测新的输出值[1]。当前,国内外许多领先的公司,例如:百度、阿里巴巴、腾讯、微软、Google、IBM、英伟达等,都将机器学习作为其运营的核心部分,机器学习已成为许多公司的重要竞争优势。目前,非常火爆的ChatGPT(Chat Generative Pre-trained Transformer)也是基于机器学习发展而来。ChatGPT是一款自动问答式的聊天机器人,与普通的聊天机器人不同,ChatGPT生成的回答非常接近于人类的回答,而不是生搬硬套的答案。ChatGPT能够理解提问的前后逻辑关系,回答结果逻辑清晰,层层递进,并非简单地理解字面意思。同时,ChatGPT的响应速度也非常快,只需等待几秒,其功能非常接近人类日常交流。在ChatGPT的带动下,许多公司也推出了同类型的竞品。2023年,百度公司推出类ChatGPT的应用——文心一言(ERNIE Bot);不久之后,阿里巴巴也推出“类ChatGPT”项目——通义千问;Google公司推出了“预训练语言生成模型”——巴德(BARD);复旦大学自然语言处理实验室推出国内第一个对话式大型语言模型——MOSS。如果说之前的AI是第一代,那么由ChatGPT带来的人工智能变革可以被称为是AI2.0。
人工智能技术专业旨在培养政治理想信念坚定、积极践行社会主义核心价值观的高素质人才。为满足我国人工智能产业对人工智能应用人才的需求,本文将专业知识和职业资格认证相结合,构建了专业的理论教学和实践能力培养体系。人工智能技术专业主要的课程有“Python程序设计基础”“Python Web开发”“Java程序设计基础”“Android应用程序开发”“计算机视觉技术应用”“深度学习技术”“机器学习技术”“自然语言处理技术”和“人工智能综合实训”等。本文主要以“机器学习技术”这门课程为例来阐述人工智能专业课程的改革探索与实践。
1 “机器学习技术”课程介绍
“机器学习技术”这门课程是针对人工智能领域内数据标注师、人工智能训练师、模型部署及运维工程师而开设的课程,也是提升学生掌握人工智能技术的一门专业核心课程。该课程集数据采集、数据清洗、模型搭建、模型训练、模型调优、模型部署于一体,通过本课程的学习,使学生能够掌握人工智能的整体开发技术及流程。由于课程跨学科性强,综合应用要求高,对学生挑战难度大,如何教授该课程使学生易于理解是一件非常有挑战且有意义的事情。
“机器学习技术”课程的教学主要围绕着一些基础经典算法展开,例如:线性回归、贝叶斯、随机森林、K-means聚类等,主要介绍这些算法的思想、流程,重点在于这些算法的使用、调参和优化等。
通过学习本课程,学生可以掌握Jupyter Notebook(PyCharm)开发工具及scikit-learn机器学习库的使用,理解经典的机器学习算法及数据处理的思想,具备使用scikit-learn进行数据处理的能力。同时,在学习的过程中,该课程培养了学生发现问题、分析问题、解决问题的能力,使学生具备了良好的职业道德、职业素养和创新意识,为学生从事专业化的机器学习技术开发工作奠定基础。
2 “机器学习技术”的教学实践
“机器学习技术”课程的设计与教学主要体现在合理设计教学方法,利用各种教学方法和手段使复杂的算法通俗易懂,实现课程的培养目标。
2.1 课程所使用的技术介绍
“机器学习技术”课程的主要目标是使学生能够使用工具掌握常用的机器学习算法,以理解日常生活中遇到的人工智能场景。课程中主要使用开源的第三方机器学习库scikit-learn。该学习库包含了大量的有监督和无监督的学习算法,也提供了许多算法使用教学示例。scikit-learn中的算法实现过程仅需简单的函数调用即可,对初学者友好,很容易上手学习。
scikit-learn主要包括6类算法,分类结构如图1所示,具体如下。
(1)分类:标识对象所属的类别。应用范围包括:图像分类、垃圾邮件检测等,类别中主要包含支持向量机(Support Vector Machine,SVM)、随机森林和最近邻(K-Nearest Neighbor,KNN)等经典算法。
(2)回归:预测与对象关联的连续值属性。应用范围包括:房价和股票价格等数据的预测,类别中主要包含线性回归等经典算法。
(3)聚类:自动将相似对象归为一组。应用范围包括:客户细分、分组实验成果等数据的聚类,类别中主要包含K-means、Spectral clustering和Mean-shift等经典算法。
(4)数据降维:减少要考虑的随机变量的数量。应用范围包括:可视化、提高效率等。类别中主要包含特征选择、非负矩阵分解等。
(5)模型选择:比较、验证和选择参数和模型。应用范围包括:通过参数调整优化模型、改进精度等。类别中主要包含了网格搜索和交叉验证等经典算法。
(6)预处理:特征提取和归一化。应用范围包括:转换输入数据,例如文本,以供机器学习算法使用。类别中主要包含数据的预处理和特征的选择等算法。
2.2 课程项目案例
课程包括4个大项目案例,涉及3个典型常见的模块:回归、分类和聚类。项目具体安排如下。
2.2.1 线性回归模型
线性回归是机器学习中的一个非常经典的回归模型。通过线性回归模型的使用,可以帮助学生理解如何利用机器学习的方法和思路来解决简单现实生活中遇到的实际问题。
项目案例引入我国居民消费水平数据。通过收集改革开放以来我国居民的食品花费、平均工资等数据,根据数据特征选用线性回归模型,并对模型进行检验及分析。学生通过模型预测的数据与真实值的比较来调整模型的参数以达到最优。
2.2.2 随机森林模型
随机森林是机器学习中的一个分类集成算法,结构如图2所示。随机森林是由许多不相关的决策树组成的[2],核心思想是将问题交由多颗决策树共识完成,以提高预测的准确性和稳定性。教师通过调用scikit-learn框架中的随机森林算法来构建随机森林模型,引导学生掌握算法所蕴含的思想,培养学生精益求精、严谨治学的科学态度[3]。
2.2.3 贝叶斯模型
贝叶斯模型是机器学习中的一个经典分类算法。项目案例中利用一则和新冠肺炎疫情相关的时事新闻,引出新冠核酸检测中初筛和复核的问题。项目案例引导学生从贝叶斯模型出发,思考为什么新冠肺炎病毒的确诊需要经过多轮的检测。假设某个人初次检测获得阳性,从贝叶斯模型出发算出其真得病的条件概率并不高,因此需要进行二次检测,甚至三次或四次检测才能确定其是否得病。通过真实案例,学生切实感受到机器学习模型能够为实际生活中遇到的问题现象提供的科学理论依据。
2.2.4 K-means聚类算法模型
K-means是机器学习中的一个非常经典的聚类算法,流程如图3所示。聚类即将相似的对象聚为一组,遵循物以类聚、人以群分的思想。聚类算法的应用非常广泛,涉及教育、军事、工业等许多领域。聚类算法将具有相似特征的目标划分成同一个类别,可以对图像进行分组。案例通过对给定的数据进行聚类,通过聚成不同个数的类别为例来讲解K-means的原理,让学生掌握聚类算法。
2.3 合理设计教学方法
2.3.1 项目案例化的教学思路
项目案例化教学方法与传统的学习方式不同,传统的学习方式首先需要学生学习所有的基础知识,然后再接触真正的项目案例应用,这种方式会让学生产生挫败感。而项目案例化教学的方法是让学生直接接触项目应用,先从简单的项目开始,激发学生的兴趣,再去讲解实现的步骤,然后是算法的原理,最后是对算法的复现、调优。这种由浅入深的项目化教学能够激发学生的学习兴趣[1]。因此,“机器学习技术”课程采用项目案例化的教学方法,更适合学生学习本课程。
2.3.2 构建以问题为导向的案例教学
合理地设计问题案例能够巧妙地导入知识点的学习。合理的问题案例不仅能将晦涩难懂的专业知识形象化,更好理解;还能够由浅入深逐步瓦解大问题,同时,激发学生的学习兴趣,引导学生主动思考、主动探索。“机器学习技术”课程中的学习内容对于数学基础较差的学生而言颇具困难,课程中的教学方法是以问题为导向,引入大量的项目案例,通过大量的实操和正确的案例引导,使学生在掌握课程知识点的同时,树立正确的三观。
2.3.3 借助线上超星云课程平台实现线上线下同步教学
传统以课堂为主的教学方式逐渐已经不能满足当前的学习形式。当前的学习模式需要借助线上平台的配合教学,这种线上线下的混合式教学,能够极大限度地利用学生的学习时间,提高学习的效率,将课程学习延伸到课堂外。线上线下混合式教学模式结构如图4所示。教师在超星云平台上提前建设好“机器学习技术”课程的资源,针对课程中的每个知识点设置好任务点,让学生提前或者进行课中(后)学习,以检查学生的学习情况,以便随时调整课程的教学方法及进度等。同时,超星云课程平台上的课程资料及学生学习的过程都可以永久保存,学生可以随时复习,同时,教师也能够根据超星云平台上的数据进行课堂分析以调整教学方式。
3 结语
“机器学习技术”课程对学生的知识门槛要求相对较高,传统的授课和学习方式对于多数学生而言,效果并不是很好。本文通过介绍人工智能专业及机器学习技术课程,探索出一条适合大部分学生进行机器学习教学的方法。本文通过大量的项目案例,使学生掌握基础的机器学习算法;对各种算法利用参数进行调优,以达到模型求解的最优,从而实现课程的培养目标,满足人工智能专业的社会需求。
参考文献
[1]李阳.机器学习课程教学的规划分析[J].集成电路应用,2022(6):90-91.
[2]车剑.基于机器学习的输送带纵向撕裂视听融合检测方法研究[D].太原:太原理工大学,2021.
[3]兰小艳.高职院校机器学习课程的探索与实践[J].太原城市职业技术学院学报,2022(2):153-155.
Exploration and practical on course teaching of artificial intelligence specialty:
taking the course “Machine Learning Technology” as an example
Abstract: Under the development and concept of artificial intelligence technology,the education in higher colleges is developing towards more intelligent which causes a trend of reforming the education and teaching. It applies all the more so in artificial intelligence specialty. This paper explores the practical of teaching on the core course of “Machine Learning Technology” in artificial intelligence specialty. Through exploration on the online and offline blended and case-based projects which using problem-oriented teaching model, it solves problems on traditional teaching method which is too single and the applications are too few and simple. This teaching model make students easier master the principle of algorithm and greatly improve students’ ability to apply knowledge.
Key words: machine learning; artificial intelligence; education and teaching