数据分析与可视化课程教学研究与实践
2023-04-27王婧娟那丽春方玉玲
王婧娟 那丽春 方玉玲
关键词:数据分析;数据可视化;教学设计;课程建设
随着信息技术和数据存储技术的快速发展,海量数据喷涌而出。如何从杂乱无章的数据中提取对人们有用的信息,并将结果以可视化图形模式提供给用户,是至关重要的问题。目前各高校均在自己传统专业的基础上,增添了人工智能、大数据等前沿技术课程。例如笔者所在的上海立信会计金融学院,面向各个学院的本科生开设了数据分析与可视化、Python数据处理技术、人工智能基础与应用等数据与信息素养课程[1]。这些课程均聚焦企业需求,在传统专业的基础上进行更新,目标是培养出高素质的综合型人才。
本文主要以数据分析与可视化课程为例,阐述在当今大数据时代的背景下,如何将前沿的数据分析与可视化技术融入本财经院校各院系课程建设和教学中。
1 数据分析与可视化课程的现状与挑战
数据分析与可视化课程是公共通识课模块长学段限定选修课程,课程内容丰富全面[2]。大数据专业将此课程设计为专业基础课程,以培养大学生数据分析和编程能力[3]。数据分析与可视化通识课程旨在培养广泛的基础知识和技能,侧重点不是“专”,而是“識”和“通”。
数据分析与可视化课程的目标是让学生学习数据分析与可视化的基本方法,使学生掌握数据分析、设计和可视化开发的技能,且具备较好的分析和解决问题的能力,为未来从事数据科学相关领域的工作奠定牢固的基础[4]。因此,如何进行该课程的建设以达到人才培养目标是一个非常重要的问题[5]。
彭焕卜等[6]分析云南大学本科生某门课程的选修者的相关数据,对选修者的成绩、学习能力、学习内容等进行分析并可视化展示,增强数据分析与可视化在教育教学中的应用。杨艳霞等[7]采取案例教学法对网络爬虫得到的数据进行分析及可视化操作。然而这些探究对于非计算机专业的数据分析与可视化课程的建设借鉴意义不大。原因有:1) 上述参考文献面向的是计算机相关专业的数据分析与可视化课程,对专业知识要求较高,而公共通识课大部分的选修同学编程基础薄弱,应在课程教学设计中考虑到此学情及通识课的构建目标,培养学生更广的知识面和处理问题的综合能力;2) 数据分析与可视化课程内容较多但学时有限,面对丰富的课程内容不能只采取线下教学,否则内容设置和计划难以落地实施。
以下将从教学研究和教学效果等方面对本课程建设进行探究,为数据分析与可视化课程及后续相关课程建设提供参考。
2 数据分析与可视化课程教学研究
数据分析与可视化课程的教学目标是培养学生的信息数据可视化处理技能。本节提出此课程的教学内容设计和实施方案。
2.1 课程定位与设计思路
由于Python简单易学,具有丰富的第三方库,现成为众多非计算机专业首选的编程语言。本课程使用Python语言,基于Numpy、Pandas、Matplotlib第三方库,IDE是Jupyter Notebook(anaconda3) 。通过本课程的教授,让学生掌握数据获取、数据分析、数据可视化等内容。在教学的过程中,对教学方法进行变革,提高学生的编程能力和计算思维,让学生学会运用所学知识解决实际问题,培育具备数据素养和数据分析技能的应用型人才。此外,激发学生动手编程的兴趣,为将来高年级的学习打好扎实的基础。
2.2 分层次教学模式设计
课程教学模式设计依据“认识数据、数据存储访问、数据处理与分析、数据可视化”分层次逐层展开,如图1所示。第一层是认识数据,即掌握基本的Py⁃thon编程基础,建立从现实世界去理解计算机领域的抽象知识;第二层涉及数据文件的读写操作;第三层是针对特定应用领域的数据进行处理与分析;第四层是可视化展示数据分析的结果。
第一层,认识数据,掌握编程基础。此内容由浅入深,指引学生理解并运用Python语言基本语法,开发设计简单应用。首先让学生逐步领会计算机编程的思维方式,掌握Python编程基础,理解变量、数据类型、操作符、表达式、字符串、流程控制语句等相关概念。让学生熟练使用Jupyter Notebook进行简单编程。接着深入讲解Python内建数据结构,包括:列表、元组、字典和集合,以及函数的定义和调用。演示典型示例,强化学生编程能力,帮助学生构建模块化程序设计思维。
第二层,数据存储访问。此内容让学生了解不同文件的类型及文件处理的过程和数据文件的读写访问方法。通过实际操作向学生展示常用的txt和csv文件的读写操作,让学生掌握如何通过程序对外部存储文件进行操作。
第三层,数据处理与分析。数据处理与分析绝对绕不过两个强大的第三方库,即Numpy和Pandas。此内容通过学习这两个库,让学生掌握常用的数据处理操作技能,通过具体的案例应用,进一步增强学生的编程思维。Numpy专门用来处理多维数组,其运算效果远高于普通的列表。Pandas是基于Numpy的数据分析工具,能方便地操作大型数据集。通过第三方库的学习,学生可快速掌握常用的数据预处理、数据选择、排序、统计、查询、透视表等方法。
第四层,数据可视化。此内容是让学生能用可视化工具对数据进行可视化展示。该内容主要是基于第三方库matplotlib,让学生掌握折线图、散点图、柱状图、直方图、饼图和箱线图等常用绘图方法。针对不同的数据和不同的应用场景,选择合适的绘图方法是关键。至此,学生能灵活选择数据绘图方法,对数据分析的结果图形化展示,实现数据分析完整流程。
2.3 教学实施方案
由于非计算机专业学生对编程普遍不感兴趣,很难建立良好的程序设计思维,以下从教、学、评三方面来探讨教学实施方案。
2.3.1 线上线下教学
本课程采取线上和线下混合式教学方式。首先,在课前,利用线上超星学习通平台,推送知识点学习视频,让学生在课前预习将要学习的基础知识,找出各自的疑惑点。其次,在线下教学过程中,学生带着疑惑听课,教师在授课时,通过学生互动反馈,重点解决学生课前预习过程中的疑难点,这样线下授课更具针对性。然后,在线发布课程作业,进一步巩固课程学习的知识及技能。教师课后批改课程作业,了解学生对知识点的掌握情况,针对常见问题可进一步强调重难点。基于学生课前预习、课上互动、课程作业测试等过程,更全面地了解学生的学习情况,针对常见问题,实行“精准教学”。
2.3.2 以学生为中心的分组学习
该课程是公共选修课,由于不同学院的学生对编程的掌握快慢不同,比如数学院的学习者利用自身的专业优势,学习编程知识较快,但外国语学院的学生就难以适应快节奏学习,因此,教师要注重异质分组,互补共进。每组由5至8名学生构成,以小组为单位完成数据分析与可视化项目设计等任务。小组教学已被证实在计算机教学中具有较好效果[8],不仅能促进学生交流,还能创建浓厚的课堂研讨互动气氛。与个人相比,分组的优势是小组成员能发挥各自的所长并在协作中弥补自身不足,共同进步。每次课程实验在超星平台发布,由小组长提交,内容包括代码、小组内的分工、组内互评等。线下上课时,每组进行汇报,教师对共性问题及各组的情况进行评价,如数据解读、任务的设计与实现、程序设计思路等,通过組内和组外两层学习反馈,增强学生对知识的领悟和应用。
2.3.3 多元考核评价
数据分析与可视化课程涵盖的知识面较广,不仅包括基本语法,还包含应用能力的培养,单一的课程考核方式不能全面测验学生的学习程度。本课程的总成绩包括平时考核成绩和终结性考核成绩。平时考核成绩包括课堂考勤、超星视频、课程实验、阶段性测验,占总成绩的70%;终结性考核是以小组为单位的期末综合大作业,占总成绩的30%。其中,期末大作业是让每个小组的学生根据其感兴趣的领域采集、分析数据再可视化展示结果。在课程的最后一个教学周,让每个小组长提交本组的数据集、源代码和分析报告,每个小组派代表在课程上进行汇报。期末大作业的打分从小组的选题是否新颖、数据获取及处理的工作量、可视化展示的效果、复杂度等评价。组内可根据成员对大作业的贡献度以及参与度互相评分。除此之外,为了调动学生在课堂上的积极性及主动性,教学互动等也考虑在评分中。
3 课程教学效果分析
2021年第一学期面向非计算机专业本科二年级学生开设了数据分析与可视化课程。学生已在一年级通过《Python程序设计基础》学习了基本的语法和程序设计思维,由于课时有限仅学习到列表的相关知识,且所学内容非常浅,学生对编程的兴趣普遍不高。课程开始前对学生做了问卷调查,95%的学生认为本课程对未来的学习及就业有益,62%的同学感觉编程较难。
3.1 知识难点分析
根据2021年第一轮的教学经验,发现学生对于基础的Python语法掌握较好,函数和控制结构掌握情况相对较弱。对于Numpy学习的难点在于多维数组,Pandas的学习难点在于两个Pandas数据结构——Se⁃ries和DataFrame的运用。在学习Matplotlib这部分内容时,由于函数较多,且每个函数的参数也较多,学生对于图形的选择和图的格式设置会产生眼花缭乱的感觉,因此,针对这些难点在教学中需要重点突破。
3.2 应用实践能力评价
期末综合大作业让学生分组选择他们感兴趣的数据,由于本门课程针对的是非计算机专业的学生,主要包括以下学院:金融学院、国际经贸学院、保险学院、法学院、统计与数学学院、人文艺术学院、金融科技学院。上交的大作业的数据集涉及金融、房地产、就业等多类数据集。期末综合大作业的考核方式是百分制,包括数据的选取(5%) 、数据的导入导出(5%) 、数据预处理(20%) 、数据分析(30%) 、数据可视化(20%) 和小组汇报讲解(20%) 。期末综合大作业的评价结果如图2所示。
每个小组均有自主设计分析问题的能力。对于问题的提出和对分析结果的阐释方面,得分率较高;对于数据的图形化展示方面,图形选取的合理性和表达的精准性等方面有待增强。
针对非计算机专业的学生,虽然他们编程基础弱,但通过小组合作的方式学生可以提交高质量的项目大作业。各个小组对擅长领域的数据集进行了深刻分析,较好地完成了数据分析与可视化作业。
4 结束语
数据分析与可视化作为一门新课程,为实现教育培养目标,需持续从教学内容、教学方法和过程等方面不断完善。本文针对数据分析与可视化课程,基于分层次教学模式的教学理念和线上线下混合式教学模式,从课程定位、设计思路、以学生为中心的分组学习和多元考核评价等多方面进行了设计和探究。通过小组展示项目大作业,能看出课程教学改革效果显著,学生能应用所学知识对某领域或某行业的数据进行挖掘与分析实践,进而挖掘出数据潜在的联系和价值。未来将进一步完善内容体系,精练课程内容和方法,争取打造具有高阶性、创新性和挑战度的双一流课程。