“深度学习”研究生课程双语教学的思考与实践
2021-08-24秦晓飞
[摘 要] 国家人工智能发展战略的实施及深度学习技术的火热,引发了研究生对“深度学习”课程的学习热潮。深度学习技术日新月异的变化和大量前沿英文资料的涌现,使得“深度学习”课程的双语教学势在必行。系统阐述了“深度学习”研究生课程双语教学的课程内容设计、讲授方式、考核方式、教学效果的反馈和评价等。授课过程采用教师讲授和学生互动相结合的方式进行,设计了算法应用示例演示与复现、文献翻译与交流、课堂提问与分组讨论、项目类作业与讨论、开放畅想等环节,以提高学生的参与度和教学效果。
[关键词] 深度学习;双语教学;文献阅读能力;知识更新
[基金项目] 2019年度上海市经信委人工智能发展专项“面向宇航员行为意图理解的多模态人机交互技术研究”(2019-RGZN-01077);2018.01—2020.12上海理工大学研究生实践基地建设项目“上海理工大学‘光学工程全日制专业学位研究生联合培养基地”(10-18-115-003)
[作者简介] 秦晓飞(1982—),男,河北石家庄人,博士,上海理工大学高级工程师,主要从事智能控制和人工智能算法研究。
[中图分类号] G642.0 [文献标识码] A [文章编号] 1674-9324(2021)27-0013-04 [收稿日期] 2021-03-03
一、引言
随着人工智能技术的广泛应用和快速发展,社会各个行业对人工智能人才的需求越来越迫切。据不完全统计,2019年我国人工智能相关人才缺口超过500万[1]。资本的涌入和人才的短缺使得社会上人工智能人才的薪资水平急剧提升,同时人工智能技术为我们的工作和生活带来了翻天覆地的变化,这激发了高校学生学习人工智能技术的极大热情。人工智能技术主要分为三个学派,即以“专家系统”为代表的符号主义;以“自适应控制”为代表的行为主义;以“神经网络和深度学习”为代表的连接主义[2]。自1956年达特茅斯会议正式提出人工智能框架以来,人工智能技术经历了3次浪潮,现在正处在第3次浪潮,掀起这次浪潮的主要技术就是深度神经网络,即人们常说的深度学习技术。
深度学习技术目前处于快速发展的阶段,相关技术日新月异。根據谷歌学术的统计,全球深度学习相关论文近几年的年增长率约50%,2020年约有3万篇关于深度学习的论文发布。这些最新的文献资料大部分是以英文呈现的,因此开展“深度学习”研究生课程的双语教学,提高学生对英文文献的阅读能力,保持学生对相关技术的知识更新速度显得尤为重要。
二、“深度学习”研究生课程双语教学背景
虽然自2018年以来,国内已经有几十所高校开设了人工智能本科专业[3],但目前在校的很多研究生由于本科阶段没有学过相关课程,对深度学习基本概念了解较少。深度学习技术的热潮和社会对相关人才的迫切需求造成现阶段研究生对“深度学习”课程高涨的选课热情。以笔者作为主讲教师在上海理工大学开设的“深度学习”研究生课程为例,近两年每年选课人数都超过了100人,以至于不得不分成两个班教学。同时,本课程面向全校研究生开放,因此选课学生来自多个不同的专业。比如2019年选课学生中有30%来自控制专业,24%来自计算机专业,20%来自生物医学专业,13%来自仪器仪表专业,13%来自机械、电气、管理等专业。2020年选课学生中有40%来自计算机专业,24%来自生物医学专业,21%来自控制专业,15%来自仪器仪表、电气、管理等专业。选课学生不同的专业知识背景,以及较短的学时限制,使得“深度学习”研究生课程双语教学方案需要进行精心的设计与思考。
三、“深度学习”研究生课程双语教学内容设置
本课程以斯坦福大学吴恩达(Andrew Ng)教师在网易公开课开设的“深度学习工程师”课程内容为基础,介绍了深度学习的基础知识和工程经验。分五部分讲授:(1)神经网络和深度学习,此部分学习神经网络和深度学习的基础与案例;(2)改善深层神经网络,此部分学习前沿的深度学习方法,学会搭建自己的神经网络,并学习网络上经常出现的各种问题的解决方法;(3)结构化机器学习,此部分学习诊断机器学习系统中的错误,介绍部分工程经验,训练属于自己的AI系统;(4)卷积神经网络,此部分学习搭建卷积神经网络并将其应用于计算机视觉识别;(5)序列模型,此部分学习搭建循环神经网络并应用于自然语言处理和音频识别等序列数据场合。这五部分内容由浅入深,循序渐进,但各章节之间的内容又有一定的独立性。各部分内容之间的关系如图1所示。
“深度学习”课程的教学目的是通过教学与课后作业,使学生掌握以下知识:神经网络、深层神经网络的基本概念;神经网络中的计算过程和推导;工程实践中的常见问题和对策;卷积神经网络基本概念和应用示例;循环神经网络的基本概念和应用示例。通过学习此课程,学生在后续的科研工作中能够对更高级的深层神经网络触类旁通,快速应用。
“深度学习”课程是一门27学时的研究生课程,具体教学内容与安排如下:(1)深度学习概论1学时;(2)神经网络基础2学时;(3)浅层神经网络2学时;(4)深层神经网络2学时;(5)深度学习实用技巧2学时;(6)优化算法、超参调试与深度学习框架3学时;(7)机器学习策略3学时;(8)卷积神经网络3学时;(9)卷积神经网络在计算机视觉中的应用3学时;(10)序列模型3学时;(11)课程总结与讨论3学时。
由于“深度学习”课程广泛的教学内容和快速的知识更新速度,因此不能采用单一的固定教材,同时为了兼顾中英文双语教学的需求,给出如下书目作为教学参考书和教学过程的阅读材料。
(1)Ian Goodfellow & Yoshua Bengio,Deep learning;(2)Michael Nielsen,Neural Networks and Deep Learning;(3)Francois Chollet,Deep Learning with Python;(4)周志华,《机器学习》;(5)李航,《统计学习方法》;(6)邱锡鹏,《神经网络与深度学习》。以上书目都是行业内广泛认可的经典教材,有的内容细致深刻,有的内容深入浅出,为本课程的双语教学实践提供了充分的参考内容。另外,目前上海理工大学已经得到了华为公司“沃土计划”的支持,以后课程内容还将加入华为昇腾AI处理器、昇腾全栈应用、MindSpore框架、ModelArt开发工具等内容,因此梁晓峣著的《昇腾AI处理器架构与编程》、陈雷著的《深度学习与MindSpore实践》等华为智能计算技术丛书也会成为课程的参考书目。