APP下载

数据科学导论课程设计与实践

2022-07-20何丰

中国信息技术教育 2022年14期
关键词:导论课程教学

摘要:为适应数字经济时代数据科学人才培养的需求,嘉兴学院信息科学与工程学院开设了面向非计算机专业的“数据科学导论”课程。作者在总结近三年教学实践的基础上,重点介绍了课程内容设计、线上线下混合式教学方法、课程思政的开展,总结了教学成效。

关键词:数据科学;导论;课程;教学

中图分类号:G434  文献标识码:A  论文编号:1674-2117(2022)14-0081-03

“数据科学导论”课程作为数据科学的一门入门课程既可以作为计算机或大数据等计算机类专业本科生、研究生的专业基础课程,也可以作为通识课程为其他需要学习数据科学方法和工具的非计算机学科专业开设。该课程可以把非计算机类专业学生引进数据科学的大门,使学生具备利用数据科学工具(如Python)和技术(典型的机器学习和数据挖掘方法)去解决各自专业领域中数据分析问题的能力,提高学生的科研能力和就业竞争力。

“数据科学导论”课程设计

在笔者所在学校2018版人才培养方案制订中,“数据科学导论”的定位是院选通识课,供学生作为公选课选修,共计16课时。因此,“数据科学导论”课程教学团队必须面对两个棘手的问题:一是来自不同专业学生的学习基础不一样,有的学生有C语言学习经历,或自学过Python,而有的学生只学习过“大学计算机”课程;二是由于是通识课,课时数有限。“数据科学导论”这门课涉及面太广,知识点太多,教学内容不好取舍。所以,笔者所在教学团队对“数据科学导论”这门课程的设立及内容进行了调研,在此基础上依据课程的资源约束(包括课时及师资)进行了课程的设计。

1.“数据科学导论”课程调研

教学团队通过调研发现,近年来,“数据科学导论”课程在国外著名高校均有开设[1],如加州大学洛杉矶分校的“数据科学导论”课程只需学生具有数学特别是概率统计的基础,没有其他先决条件,适用于本科生。斯坦福大学的“数据科学导论”课程在内容设计和教学设计上,照顾到没有计算机基础的学生,适用于本科生。华盛顿大学的“数据科学导论”课程是以一系列相对独立的专题讲座的形式讲授的,前后两次课堂内容并不一定连续,适用于研究生或者高年级本科生。考虑到“数据科学导论”在塑造数据科学思维以及培养数据科学人才等方面的重要作用,国内高校如中国人民大学、清华大学、东华大学、浙江大学等也开设了“数据科学导论”课程。[2]

2.课程内容的模块化设计

笔者所在教学团队经过多次讨论,把“数据科学导论”课程定位为入门课程,目的是培养学生浓厚的兴趣,内容上要取舍,学习难度上要降低,一些较深入的内容可以在学生有需要后采用多种方法继续学习。同时,要设计一些实际的案例,要求学生结合实际数据进行上机实践,切实培养学生的应用能力,把理论讲解和动手实践有机结合起来。为完成以上教学目标,教学团队将教学内容模块化,把课程整个教学体系分为两个大的部分,一部分是基础知识部分,另一部分是应用提高部分。具体内容如下页表所示。

基础知识部分包括模块1、2、3、4、5。其中,模块1概述数据科学的知识结构与分析流程,简介数据科学的关键技术与分析工具。模块2除介绍Python的基础知识如容器、流程控制、函数外,还要介绍Python中的模块及其使用方法。模块3~5讲解Python中最常用的数据分析库Numpy、Pandas、Matplotlib等。

应用提高部分包括模块6、7。其中,模块6将数据统计分析的方法与前面学习的内容相结合,力求将所学内容应用到实践中,如销售数据分析、景区游客量统计、水污染数据处理等。模块7的内容取材于教学团队中教师各自的科研项目积累,如人脸识别、推荐系统、社交网络分析、自然语言处理等,这个模块主要目的是培养学生对数据的感觉和兴趣,让学生迅速获得對数据价值的认识。

课程实践

1.基于SPOC的线上线下混合式教学

对于课程教学过程中自始至终都要使用的Python语言和工具包,大部分学生没有接触过,小部分学生虽有一些Python基础,但达不到熟练运用的程度。所以,要让学生意识到在短时间内掌握Python的基础知识是可行的,这也是教学团队遇到的第一个教学难点。为此,在近几年的教学中,笔者均采用了基于SPOC的线上线下混合式教学方法。采用SPOC进行“数据科学导论”课程教学具有以下优势[3]:一是授课教师可以将准备的课程资源上传到SPOC平台。由于课程资源的访问不受时空的限制,SPOC可作为课前预习和课后实践的平台,方便学生有针对性和选择性地进行学习。二是SPOC平台的后台数据收集和分析功能为授课教师和学生提高教学和学习能力提供了重要的辅助手段。通过学习行为监控,教师可以全面了解学生的学习效果,学生可实时查看课程学习情况和进行学习成效的检测,便于随时把握课程进度,明确不足的知识点,进行针对性的学习。此外,笔者在建设好教学内容的基础上,做好教学过程的精细设计,通过课前、课上和课后三个主要教学环节的合理衔接,发挥教师、学生和教学平台的最大作用,提高学生在知识传授过程中的主动性和主体性,提升“数据科学导论”教学效率。[4]

(1)课前预习

在基于SPOC的线上线下混合教学中,教学团队首先将本模块的微视频、重要知识点PPT、辅助阅读的参考文献等资源发布到SPOC平台;然后用SPOC的“通知”功能发布学习任务,明确规定课前环节中学生需要预习的内容以及对知识点的掌握程度;最后教师利用SPOC平台的“统计”功能评估学生参与预习的程度,为课中环节的实施提供直接的参考和指导。需要指出的是,这里要求学生预习的内容不是课上教学的视频版,而是帮助学生进入课堂学习状态的前置知识点及外围知识点,有助于减少教学课时较少的压力。

(2)课堂教学活动

本课程共有16学时的理论,分8次进行。对偏重知识传授的模块如模块1、模块2,根据学生的预习情况对基本知识点进行强调,重点讲授学生难以自行理解、掌握的知识,最后进行疑难解答;对模块3、模块4、模块5通过引入情境任务,以贴近生活的案例介绍Python数据分析常用的Numpy、Pandas、Matplotlib库的应用;模块6、模块7演示实际项目的数据分析过程,强化“数据科学导论”课程与实际数据分析工作的关联性,让学生更好地了解行业状态,明确今后的学习和研究方向。

(3)课后实践

实践是教学的重要环节,没有课后实践,学生很难做到对课堂知识的理解消化,更难做到熟练掌握。“数据科学导论”课程没有实验课时,教学团队就使用Anaconda记录教师课上讲授案例,然后作为作业布置给学生复现,以此作为基本要求。另外,也可以寻找复杂度较高、涉及知识点较多的案例作为拓展作业。在完成课后实践过程中,学生对知识的理解和掌握程度大大加深,解决问题的能力得到相应提高。

2.“数据科学导论”课程思政实践

“数据科学导论”课程是以科学技术为基础的课程,但进行数据分析的数据又是来自社会现实。因此,在进行课程思政时应把马克思主义立场观点方法的教育与科学技术的培养结合起来,培养学生正确认识问题、分析问题和解决问题的能力。[5]例如,教学团队在模块1的教学中,插入“实事求是,是马克思主义的根本观点,是中国共产党人认识世界、改造世界的根本要求”,强调进行数据科学研究时坚持一切从实际出发来研究和解决问题,必须从不断变化的客观实际出发,实事求是。模块2至模块7的数据尽量采用相关实际案例和社会经济实证数据,鼓励学生多关注国内外社会经济的时政问题,培养对社会的责任担当意识,激发学生课后利用所学解决本专业领域问题。在课程大作业环节,鼓励学生结合时政问题,充分利用所学技术进行数据分析,如国内外新冠疫情发展趋势及比较分析、近10年中国GDP分析与比较等,引领学生深刻认识我国制度的优势性,树立为实现中华民族伟大复兴的中国梦而不畏艰难、努力学习的志向。

教学效果

目前,經过2018—2019学年第2学期、2019—2020学年第2学期、2020—2021学年第2学期三轮次授课,教学团队已经积累了一些基本教学数据。每个开课学期,选择“数据科学导论”课程的学生约为120人,分为2个班,每个班学生为60人,学生来自统计、金融、数学、大数据等专业,充分体现了“数据科学导论”课程培养交叉型、复合型知识人才的特性。在8周的课程时段里,学生的整体出勤率在90%以上。从课后对学生进行的调研来看,学生大多认为基础理论部分比较容易,数据可视化和数据统计知识部分难易程度适中,而人工智能部分则有较大难度。从学生所提交的作业来看,学生基本掌握了数据科学的思维和Python作为数据分析工具的基本技能。期末大作业,绝大部分学生均能按时提交。

结语

本文介绍了笔者所在学院面向非计算机专业学生开设“数据科学导论”课程的教学实践,包括理论内容设计、实践内容设计、线上线下混合式教学方法、课程思政的开展等实践环节。在未来的教学实践中,教学团队将继续累积经验,持续改进和完善“数据科学导论”课程教学。

参考文献:

[1]朝乐门,杨灿军,王盛杰,等.全球数据科学课程建设现状的实证分析[J].数据分析与知识发现,2017(06):12-21.

[2]戴永辉,徐波,冯彦杰,等.数据科学与管理本科通识课程建设[J].计算机教育,2020(04):28-31.

[3]沈晓娟.云平台在计算机网络技术翻转课堂中的应用[J].电脑知识与技术,2017(13):136-137.

[4]唐国明,雷军,赵翔,等.基于教育云平台的数据科学导论翻转课堂设计[J].计算机教育,2019(08):18-22.

[5]张晓黎.财经院校《Java数据科学》课程的思政研究[J].电脑知识与技术,2020(16):180-182.

作者简介:何丰,男,教授,研究方向为软件工程与大数据技术。

猜你喜欢

导论课程教学
《ERP原理与应用》课程混合式教学改革探索
课程思政在组织行为学课程教学中的探索与实践
A Study of The Bridges of Madison County from the Perspective of Ethical Literary Criticism
A Case Study of Cohesive Devices in an English News Report
“自我诊断表”在高中数学教学中的应用
A—Level统计课程和AP统计课程的比较
The Images of Hua Mulan in Chinese and American films
在遗憾的教学中前行
“船舶与海洋工程导论”教学改革探索研究
计算教学要做到“五个重视”