新经管背景下Python大数据分析课程实验教学改革与实践
2023-03-21莫国莉谭春枝滕莉莉谢军
莫国莉 谭春枝 滕莉莉 谢军
[摘 要]文章针对Python大数据分析课程实验教学提出了将线上线下混合式教学、归纳法、三阶段教学法三种教学方法结合起来,以解决当前课堂教学学时不够、分析模型复杂多样、理论问题过深、部分学生理解困难且动手能力差的问题,改变实验课程中把大数据分析模型当作黑箱工具、只教如何应用、不求学生深入理解原理并运用原理解决经济金融实际问题的状况。
[关键词]大数据分析;实验教学;混合式教学;理论体系式教学;案例应用式教学
[中图分类号] G642.423 [文献标识码] A [文章编号] 2095-3437(2023)23-0066-04
大数据技术目前在经济管理领域的应用已经非常广泛,国内外高校对大数据分析也展开了多种形式的教学和研究,研究成果较为丰富。但是,许多研究是将大数据视为时代背景或技术手段,探讨大数据给教学管理、教学评价、教学理念、教学模式、教学技法等带来的机遇与挑战[1-3];而关于大数据分析类课程本身的教学研究成果相对较少,且理论教学和实验教学方法未能跟上大数据技术发展的步伐[4]。另外,当前的教学研究成果主要面向理工类学生,针对人文社科类的学生开展的教学研究相对较少[5-6]。因此,本文针对以上研究存在的不足,提出在新经管背景下对Python大数据分析课程实验教学进行改革的一些建议与方法。
一、Python大数据分析课程教学现状与问题剖析
Python大数据分析是经济、金融专业中一门重要的课程,也是一门理论紧密结合实践的课程。目前对于Python大数据分析的授课主要有理论体系式教学和案例应用式教学两种截然不同的方法。
(一)理论体系式教学方法存在的问题
理论体系式教学方法,即将Python大数据分析技术引入传统的金融/经济学课程中,授课周期长,需要对大数据导论、数据库设计、计算机网络基础、Python/R语言语法知识、算法结构设计和程序设计方法,甚至高等数学、偏微分、概率论等方面进行系统教学,培养的对象不区分本科生和研究生,也不区分理科生和文科生。目前一些开设Python大数据分析课程的高校,其授课体系标准也不统一:有些只是简单粗糙地讲了模型的功能、原理,然后以比较复杂的开源程序为例,演示如何运用大数据分析模型;有些则用了大量的课时讲解Python语言的语法与程序的调用原理,然后用了少量课时简单演示大数据算法的调用过程;还有些虽然比较详细地介绍了几种大数据分析算法,也设计了上机实训环节,但是没有对算法之间的逻辑关系进行理顺,且由于课时有限,所讲的分析算法的类型也较少。总之,这种注重让学生掌握全面的理论知识结构的教学方法,会让学生难以理解授课内容,不利于培养学生灵活运用模型解决实际问题的能力。
(二)案例应用式教学方法存在的问题
由于社会急需大量大数据分析人才,因此一些院校或培训机构对理论体系式的课程进行了精简,使用案例应用式教学方法。具体来说,案例应用式教学或以应用简单的大数据分析模型(如决策树、朴素贝叶斯、均值聚类等等)为主要目标,利用开源数据集和算法模型去实现特定的功能;或以Python语言自带的工具包为核心,对工具包中每种模块的运用分别进行介绍。不难看出,这种案例应用式教学方法的本质是将大数据分析算法黑箱化,即仅讲授实际分析所涉及模型或者软件工具箱的应用,而避开讲授每种模型的工作原理,更不讲模型之间的逻辑关系与模型演化过程。比如,某培训班课程大纲中,先是讲授数据分析基础、Numpy模块实现数值计算、Pandas模块实现统计分析、Matplotlib模块实现数据可视化等模块的调用与操作过程知识点,然后就讲授如何将这些模块运用于常见的日常生活案例,比如影视作品分析、客户价值分析、销售收入预测等。这种以实用案例为主的案例应用式教学方法虽然能使学生快速上手,在短时间内学会调用程序模块进行大数据分析,但在很大程度上会使学生认为大数据分析算法更像是“黑箱操作”,不知其所以然。同时,实验课程的程序并不是以紧扣经济、金融现实急需解决的问题作为例子来设计的。因此,这种教学方法也不利于学生对知识的深入理解和深刻把握,更难以培养学生运用知识解决现实难题的能力。
(三)两种教学方法共同存在的问题
1.课时设置不够合理
Python大数据分析是一门实践性较强的课程,对部分算法模型,学生需要先弄懂原理才能灵活运用,而对模型的部分原理,学生必须在对代码有所认识之后才能更深刻理解。但传统“教师讲、学生听”的课堂教学方式是一种信息单向传输且以教师为主体的教学方式,让学生被动地接受知识,容易形成重视理论教学而忽视实践教学的局面,使得教学内容与实际应用脱节。即便课程设置有实验课,但一个学期下来仅有少量的上机课,课堂内容难以得到很好的实验验证。反之,有些课程大纲虽然增加了实验课时,但是又压缩了课堂的理论讲解时间,导致学生对算法原理了解得不充分,不能够灵活运用程序解决实际问题。
2.教学内容深度不够,重点不突出
如某学校理工学院Python大數据分析课程,虽然注重理论和基础知识的讲授,但教学内容的深度、广度严重不足。课程教学内容虽然包括爬虫技术、数据库技术、数据可视化技术以及存储技术等,但重要的内容却是如何利用各种模型执行不同任务,如金融时间序列定价预测、具有时空相关性的金融机构/金融产品投资风险的分类等。这类模型对初学者来说非常复杂抽象,有的学生甚至完全无法理解,最终导致部分学生不能对分析模型的本质有所理解和把握,也不能对数据分析算法进行灵活运用。
3.实验内容过于单调
对于Python大数据分析实验,有些高校和培训班虽然提供了大量实验案例,让学生有实际动手机会,却忽视了实验案例与学生对数据分析算法理论的理解的结合,而将实验看作一个简单的上机过程。此外,要真正实现经济、金融大数据分析,必须了解分析时需要收集什么方面的大数据信息、如何收集等等,但这类课程内容涉及不多。因此,如若仅在课程中安排一些数据处理技术方面的实验内容,而缺乏模型在经济/金融场景中实际运用的分析,就难以让学生达到能够应用大数据分析技术解决实际问题的水平。
二、教学模式与方法的改进措施
(一)采取线上线下混合式教学
由于课程课时有限,因此没有足够的学时保证所有知识都能在课堂上被全面讲授且讲得透彻。但是,学生若没有掌握好相应的知识,在后期的实验操作中难免会遇到很多包括数据调用、数据清洗、程序调试等各方面的问题。例如,Python里需要掌握和调用的函数众多,但Numpy函数库和Pandas函数库几乎包含了日常计算所需的所有函数。其中,Numpy是进行大数据计算所必须调用的函数库,其主要包括的函数功能有数组的创建、矩阵数据的处理、数据的排序、一元/多元数据的计算、文件读写等;而Pandas函数库则主要用于进行数据分析,其主要包括的函数有统计汇总函数,数据清洗函数,数据筛选、绘图与元素级运算函数,时间序列函数和其他函数等。这些函数全部都用课堂学时进行一一讲授不太现实,因为仅要讲完每种函数的功能和调用格式,就需要20~30个学时,这就会导致其他课堂内容无法得到展示。为了解决此类问题,可在课程开设之前,让学生先在中国大学MOOC(慕课)网上以在线的形式自学指定的一些Python慕课。到正式线下上课时,只需要花2个学时左右的时间来进行Python数据类型、函数类型等重点内容的讲授,帮助学生总结梳理知识点。对于比较难以理解的数据函数原理与调用过程方面的知识,也可以先让学生自学线上慕课,再在课堂上帮助其进行函数功能总结。在完成之后其他章节大数据分析模型中对函数的调用实验课后,学生就可以逐步理解每个函数的原理与调用了。
(二)运用归纳法进行教学
帮助学生梳理归纳总结各类算法的逻辑关系,可以帮助学生从繁杂的模型中快速整理出头绪,花较少的时间就可以系统准确地掌握各类算法,达到自由运用并改进算法的目的。比如,决策树、朴素贝叶斯、K近邻属于分类算法,回归树、模型树、K近邻回归属于预测方面的算法,K均值聚类、层次聚类、基于密度的聚类等属于聚类算法。而决策树、回归树、模型树其实具有一定的相似性,只是最后一步的算法结果略有不同:决策树最后的叶子节点是将对象分为几类,回归树最后的叶子节点是取一定范围内相关结果分类的均值作为其值,而模型树最后的叶子节点则为回归模型。又如,深度学习中的卷积神经网络、循环神经网络、长短期记忆网络等算法,其实都是在传统神经网络的基础上,根据其存在的缺点进行某些方面的改进,衍生出的新算法。总之,通过对算法进行归纳总结,弄清算法之间的演化逻辑关系,学生就不用死记硬背大量算法原理,可以灵活运用算法并根据需要进行算法的改进。由上述可知,很多算法模型都是Python大数据分析中重要的内容,既是理论的承载,又是实现某种功能以解决实际问题的关键,这些模型虽然算法不同,但其设计的目标、思路、原理却有关联之处,帮助学生理解模型原理、掌握相应函数的调用是整个Python大数据分析授课的关键任务。
此外,归纳法还可以运用于课程内容的设计。比如,Python大数据分析整个教学和实验课程设计可以归纳为4个理论领域以及6项实验内容(见图 1)。
(三)采取三段式实验教学方式
将整个教学过程分为理解模型、使用模型和掌握模型三个阶段(见图 2),通过这样的教学方式,可以培养学生掌握模型并将其用于解决实际问题的能力。
三、案例分析
以某学校金融专业19级(70人)、20级(90人)为例,这两个年级的学生都是理科生,数学基础较好,但是大多数学生并没有修过Python语言,仅有个别学生在备考计算机二级考试时自学过一点Python语法知识。因此,授课还是有一定难度的。课程开始前,任课教师提前一个月布置学生进入中国大学MOOC(慕课)网进行Python语言学习。课程开始后,教师再用2个学时对Python语言的重难点进行总结,主要是帮助学生掌握Python数据类型与函数库类型,以及函数的调用方法。然后,按照数据预处理、数据的分类、预测与聚类分别讲解各模块下包含的简单基本算法。同时,为了让学生对未来新出现的方法也可以快速地自学上手,也对一些基于原有的基本算法进行改进和拓展的新方法的思路进行说明。每章理论模型教学完成之后,教师都会安排一些时间开展上机实验。由于课时有限,教师一般提前将上机的内容发给学生,让其自己对照现成的程序进行输入运行,遇到问题再到课堂上进行询问解答。如果课堂解答的时间不够,可以通过线上的形式课后在线解答。经过兩个学期的教学实践,发现学生基本能理解已有的现成、开源算法,并对其进行运用与改进,能够写出课程论文解决实际问题。学生对教学的评价也比较高,两个学期的评教分数均在90分以上。
四、结语
本文针对Python大数据分析课程实验教学,提出了将线上线下混合式教学、归纳法、三阶段教学法三种教学方法结合起来。线上线下混合式教学让学生在上课前就先通过慕课网自学Python的一些基础知识,以节约时间进行实践练习,很好地解决了学时不够的问题。归纳法将各类大数据分析模型归纳为分类、预测与聚类三大类分析模型,该方法既可节约学生学习、理解大数据分析技术的时间,也可帮助学生更好地动态掌握不断涌现的大数据分析技术与方法。而三阶段教学法则根据大数据分析模型本身,在每类模型的教学过程中采用理解模型、使用模型、掌握模型三个阶段的教学模式。通过以上三种教学方法的综合,既解决了当前课堂教学学时不够、分析模型复杂多样、理论问题过深、部分学生理解困难且动手能力差的问题,又避免了实验课程中把大数据分析模型当作黑箱工具、只教如何应用、不求学生深入理解原理的问题,使学生能够提高学习效率,系统全面学习知识,对各类新算法能够动态掌握。
[ 参 考 文 献 ]
[1] 谢天保,杨娜.“新经管”背景下大数据分析课程的教学改革研究[J].教育观察,2022,11(31):53-56.
[2] 王春蕾.基于大数据分析的混合式教学模式设计[J].集成电路应用,2023,40(5):110-111.
[3] 周志宇,阮梦黎.基于大数据分析的混合式教学生态构建[J].中国现代教育装备,2023(5):70-72.
[4] 陈张杭健,俞承晔.基于Python的“金融大数据分析”课程教学案例设计及其实现[J].安徽电子信息职业技术学院学报,2023,22(2):34-39.
[5] 张琴.基于大数据分析的精细化教学管理路径研究:以泰州学院数理学院为例[J].科技风,2022(32):52-54.
[6] 俞少宾,丁恺.新文科背景下大数据分析课程教学模式改革[J].新文科理论与实践,2022(4):73-82.
[责任编辑:周侯辰]