基于AI Studio平台的《数字图像与计算机视觉》课程改革
2022-10-20高赟王津吴昊杨旭涛
高赟,王津,吴昊,杨旭涛
云南大学信息学院,云南昆明,650504
0 引言
当前全世界已迎来了第四次工业革命,其利用信息化技术促进产业变革,开启了智能化时代。此次变革引发的不仅仅是产业经济的转型,也给人工智能相关的教育变革带来了契机。教育部在发布了《高等学校人工智能创新行动计划》之后,接着在人工智能领域布局了人工智能和智能科学与技术两个新专业,各高校相关专业的人才培养方案和人工智能相关课程也随之改革,以进一步提升高校人工智能领域科技创新和人才培养。在此背景下,我们也对云南大学人工智能相关课程改革进行了探索。在参加“全国高校深度学习师资培训班(第12期:计算机视觉)”后,受到教育部高等教育司产学合作协同育人项目的资助,笔者基于百度的人工智能学习与实训社区AI Studio平台和飞桨开源深度学习平台对数字图像与计算机视觉课程进行了改革。
数字图像与计算机视觉从信息处理的层次研究视觉信息的认知过程,研究视觉信息处理的计算理论、表达与计算方法。该课程旨在让学生掌握视觉信息的基本处理方法,提高学生的工程实践素质和能力,培养工程实践型专业创新人才。不少高校都对图像处理相关课程的教学改革进行了探索,相关报道如下:提出线下教学模式与基于“互联网+”的线上教学模式相结合的一体化教学模式;为了激发学生学习的主动性和积极性,提出了一种案例驱动教学方案;探索了学生综合素养导向的研究型教学与实践模式;进行了以教师为主导、学生为学习主体的课程教学模式改革。这些都侧重于教学方式或教学方法的改革,并未涉及课程内容的改革。有文献则对本科和硕士阶段图像处理课程的差异性进行了研究,提出一体化的课程分级教学模式。另有文献报道了从教学内容和教学模式两方面对数字图像处理课程进行的改革,其主要内容为加大了图像分析和图像理解的内容比例。这两篇文献表明在图像处理相关课程中引入前沿技术对后续科学研究和工程应用的重要性。
云南大学数字图像与计算机视觉课程传统教学中,在教学方式、教学内容、教学实践等环节存在着诸多问题,本文将从教学方式、教学内容、教学实践三个角度对该课程现状进行分析,并对具体改革方式进行阐述。
1 课程现状及问题分析
1.1 教学方式
在教学方式上,本课程采用纯线下课堂教学的方式进行。与其他线下课程方式[1]具有一样的通病,学生在具体课程内容未知的情况下很难做到课前预习,因此具体课程教学环节的效果也会大打折扣,在课后巩固环节也没有对应的学习资料,当学生在某个知识点存在疑问时也无处提问和讨论。尤其在近两年全球疫情的特殊时期下,单纯线下方式教学也难以灵活适应突发情况。因此,为了使学生能够做到课前预习、授课环节效率高、课后巩固、提问与讨论,并能应对特殊时期下的突发情况,该课程的教学方式需要转变[1]。
1.2 教学内容
在教学内容上,本课程在以往授课中只是讲授教材相关的理论内容,课程内容很少会引入计算机视觉领域的前沿技术或教师科研工作的最新成果,也导致学生掌握的知识与未来的工作或研究是脱节的。然而,随着人工智能技术的不断发展,计算机视觉技术也在不断快速发展,用于图像或视频处理的深度网络模型也在不断优化,因此必须在原有课程内容基础上引入计算机视觉领域的前沿技术,才能使学生更好地了解计算机视觉领域的技术现状与趋势,从而满足后续开展科学研究或从事工程应用的需求[2]。
1.3 教学实践
在教学实践方面,本课程以往的实践环节主要通过MATLAB离线编程来实现。然而,随着人工智能时代的带来,计算机视觉前沿技术部分大多采用机器学习或深度学习方法实现。在教学实验室开展MATLAB离线编程主要存在以下问题:科学研究或工程应用大多采用Python编程实现机器学习或深度学习算法,学生采用MATLAB平台实践无法与后续科研工作或工程应用项目需求接轨;深度学习网络的训练过程需要配置深度框架和GPU计算资源,实验室离线编程环境批量配置深度框架较为复杂,提供GPU计算资源也极度增加了硬件成本,大多数高校教学实验室从经费上都很难配置相应软硬件环境。
2 教学方式改革
本课程的教学方式从以往的“纯线下方式”转换为“基于AI Studio的线上线下混合式教学方式”。AI Studio平台是百度人工智能学习与实训社区,可以提供线上线下相结合的灵活授课方式。通常情况下课程理论部分采取线上线下混合式教学方式,当遇到疫情等特殊情况时,可以快速转到纯线上授课。
本课程在AI Studio平台开设的界面如图1所示。对于课前预习环节,AI Studio平台课堂提供了课程材料上传功能,教师可以在课前1~2天上传课程预习资料和课件。学生可以在课前通过AI Studio提前下载课件对课程内容进行预习。在理论教学环节,学生可以带着预习过程中发现的问题来听讲,有针对性地对重点难点问题进行学习和讨论,在促进课堂互动的同时提高授课效果[3]。同时,教师还可以在具体课节中插入“项目”,很方便地完成教学实践案例的线上讲解,如图1中虚线框所示,以课节4和课节11为例分别插入了相应的教学实践“项目”。在课后巩固环节,学生可以在线上学习课程相关资料,也可以在平台课程讨论区与教师、助教、同学进行提问与交流。教师也可以借助该平台完成课程的其他考核环节,如课后作业、随堂测试、期末考试等。相比纯线下的教学方式,基于AI Studio平台的授课方式更为灵活,也激发了学生自主学习兴趣。
图1 AI Studio平台本课程界面及插入“项目”示例
3 教学内容改革
本课程的教学内容从“传统的教材式理论教学”转换为“经典理论+计算机视觉前沿技术”。在经典理论方面,课程内容主要涉及数字图像基础、图像变换、图像增强、图像恢复、图像压缩编码、图像分割和图像描述。这些内容是经典的图像处理方法和计算机视觉技术,也是适应计算机视觉领域快速发展的重要基础[4]。在前沿技术方面,借助百度公司提供的丰富教学资源、飞桨深度学习框架及免费算力,课程内容主要涉及与图像视频处理相关的机器学习基础、深度学习基础、及基于深度学习的计算机视觉技术。视觉技术具体包括目标检测技术、目标分割技术、图像标题生成技术、视觉内容生成技术、视频分类、动作识别等。该课程内容的改革不仅使学生更好地掌握了传统的经典理论,也学到了计算机视觉领域前沿技术,并能够动手编程实践完成经典的计算机视觉算法,其促进了教学与研究的结合、知识学习与产业需求的接轨。
4 教学实践改革
本课程的教学实践改革从“MATLAB离线编程实践”转换为“基于AI Studio平台的Python+飞桨在线编程实践”。在机器学习与深度学习技术的推动下,Python编程已成为计算机视觉技术具体实现的一种主流方式[5]。AI Studio教学平台集成了便捷的Python编程功能和飞桨开源深度学习框架,更重要的是,该平台还提供免费GPU算力和技术支持。在课堂实践教学环节,专门增加了AI Studio平台与飞桨深度学习框架的概述与使用入门课节,以使得学生系统了解AI Studio平台和飞桨深度学习框架的使用方法。教师可以借助该平台在线讲解并详细剖析图像处理具体实现原理,并通过目标检测和图像分类等实践案例使学生具体掌握PaddlePaddle的调用方法,通过深度模型调优的实践作业进一步强化学生对PaddlePaddle框架的掌握。通过实践案例讲解,学生不仅可以更加具体地掌握抽象的图像视频处理技术,还可以学习AI Studio平台使用Notebook进行Python编程的方法,使用飞桨框架实现深度学习网络编程的方法,也将为学生在未来的学习或研究中奠定重要的深度学习框架基础[6]。
以计算机视觉部分布置的实践作业“中药材识别模型调优”为例,36位同学提交了作业且提供了模型校验准确率,其成绩分布在75~100分之间。成绩散点图和分布比例如图2所示,成绩呈正态分布,80~90分之间的学生比例占77.78%,其教学效果较为理想。
图2 成绩散点图和分布比例
5 结语
在人工智能领域迅速崛起的时代背景下,笔者对云南大学数字图像与计算机视觉课程的改革进行了研究和论述。在教学方式上,本次改革采用百度的人工智能学习与实训社区AI Studio作为教学平台,提供了线上线下灵活的授课方式,且便于学生课前预习、课后巩固、提问与讨论。在教学内容上,在传统课程内容的基础上,结合计算机视觉领域科学研究的最新进展引入了该领域的前沿技术。在教学实践上,将传统MATLAB离线编程方式改革为在线Python+飞桨在线编程实践的方式,在降低高校软硬件成本的基础上使学生实践能力与未来科学研究或工程应用需求接轨。虽然本课程改革取得了一定的成效,但是我们接触AI Studio平台和飞桨在线编程的时间并不长,本课程改革的方案在未来教学中仍需要进一步探索和完善。