APP下载

利用翻转课堂将大数据引入数据库课程的教学设计与实践*

2016-06-28邹先霞杜威暨南大学计算系广东广州5063广东警官学院计算机系广东广州5030

高教学刊 2016年10期
关键词:翻转课堂大数据

邹先霞 杜威(、暨南大学计算系,广东广州5063  、广东警官学院计算机系,广东广州5030)



利用翻转课堂将大数据引入数据库课程的教学设计与实践*

邹先霞1杜威2
(1、暨南大学计算系,广东广州510632 2、广东警官学院计算机系,广东广州510230)

摘要:大数据是信息科学最新发展的关键技术,将大数据引入数据库课程帮助学生掌握IT行业的最新技术,为将来更好地适应行业需求打下基础。大数据引入信息科学技术专业课堂具有非常重要的意义,但由于受到学时、教学大纲、知识难度等条件限制,教师难以直接在课堂上讲授大数据。翻转课堂颠覆了传统的教学模式,为学生提供灵活的学习方法。本文对将大数据引入数据库课程的翻转课堂的教学资源、引导学生自主学习等方面进行了教学研究,设计了MapReduce学习单元的翻转课堂教学设计,经过教学与实践,取得良好的教学效果。

关键词:数据库课程;大数据;MapReduce;翻转课堂

*本文受广东省高等教育教学研究和改革项目“基于创新人才培养的数据库系统原理实践教学改革与实践”(项目编号:GDJG20142082)、广东省教育教学成果奖培育项目“基于应用型本科人才培养的数据库系统原理课程的教学改革与实践”支持。

Abstract:Big Data is an important up-to-date technological development in information science. The fact creates the need to integrate the study of Big Data as part of the database curricula which helps students master the new technology,and better meet the needs of the industry. It is vital to the teaching of information science and technology. However,it is hard to teach big data in the course because of the limitation of teaching time,teaching plan and study difficulties. Flipped class is different from traditional class and provides students with flexible study methods. The paper discusses the teaching researches from the perspectives of teaching resources of flipped class which introduces the Big Data into database curricula and guiding students to do self-study. And it also designs the learning units of MapReduce based on the flip class. After the teaching practice,the course obtains good feedback.

Keywords:database curricula;Big Data;MapReduce;flipped class

一、大数据引入数据库系统课程的必要性和挑战性

大数据被定义为4个V:数据量大(Volume)、速度快(Velocity)、类型多(Variety)、真实性(Veracity),融合了一切新兴元素,成为继传统IT之后下一个提高生产率的技术前沿,是计算机科学技术最新发展的关键技术之一,在医疗保健、金融、制造、政府、零售行业等领域获得了成功的应用。

大数据作为计算机专业课程的一部分,特别是作为数据库或数据管理课程的一部分,将有利于信息技术专业的学生掌握最新的数据管理技术,为将来从事数据库或数据分析能力打下坚实的基础。大数据作为IT行业的最新技术,国外很多知名大学(如加州大学伯克利分校等)已将大数据作为数据库课程的重要内容[1,2],国内一些重点大学也开设了类似的选修课。但在大部分高校里,要开设一门新课程,将面临培养计划的修订,总学分的限制,教学大纲的制订等;另外新开一门选修课,学生也可能不太了解热点技术,而导致选修人数不够课程开不出来的情况。大数据作为一个新的技术热点,新闻、会议主题或各种论坛上有很多的讨论,但要作为课堂教学则要考虑到学生的接受程度、什么时候适合给学生讲解这部分内容,教学内容如何组织等问题。

翻转课堂,或称颠倒课堂(Flipped Class/In-verted Classroom),是将知识传授和知识内化的顺序颠倒,教师针对学习内容提供教学视频和课件、学生在课前自主安排学习知识,在课堂中教师组织展开深入交流并提供个性化辅导的一种新型教学模式[4,5]。翻转课堂的教学方式将有效地解决大数据引入数据库课程所面临教学学时、选修课开不出来等难题。翻转课堂教学模式[6]将大数据引入数据库课程不影响教学学时,拓展了学习内容,让学生可以选择最适合自己的学习方法,大大提高了学习效率和效果,锻炼了学习者的自学能力。

暨南大学网络中心购买了Blackboad平台,该平台具有共享性、可扩展性和高可靠性,提供资料共享、在线答疑、Blog、Wiki、小组协作等多项功能。Blackboad为翻转课堂教学资源共享、跟踪和管理学生学习进程、师生在线交流等提供了技术支持[7]。本文作者长期从事数据库相关领域的研究工作和数据库课程的教学工作[3],对大数据有较为深入的认识,对将大数据哪些知识点作为教学内容、如何实施这部分教学内容进入深入的思考,经过教学和实践,取得良好的教学效果。

二、大数据学习单元的设计

翻转课堂教学模式的首要任务是教学资源的开发,即编写教学内容,制作课件、录制视频和实践安排等。大数据作为信息科学的热点技术,暂时不属于培养计划的范畴,没有教学大纲,没有教学学时,如何选择教学内容变得非常关键。大数据的教学内容既要能融入数据库课程,又要适合学生的学习能力,我们针对所在学校的学生情况选定了与数据库课程相关性强的学习单元。

MapReduce:用于大规模数据集的并行运算。概念“Map(映射)”和“Reduce(归约)”是从函数式编程语言和矢量编程语言里借来的特性。MapReduce框架能处理并行编程中分布式存储、工作调度、负载均衡、容错均衡、容错处理以及网络通信等复杂问题,被认为是大数据处理的核心编程模型。MapReduce实例主要有Apache Hadoop、Google MapReduce和Microsoft Dryad等,我们选用开源的Apache Hadoop作为主要讲授内容,是对数据库编程知识的拓展。

我们将这些学习单元纳入了数据库系统原理课程,学习目标分为三个层次:

(1)能够掌握现有大数据管理系统的主要特性、优点和局限性;

(2)能用某类大数据管理系统建立具体的应用实例;(3)能针对具体的应用选择合适的大数据管理系统。

我们通过设计翻转课堂教学模式的四个步聚:教学资源开发、学生自主学习、课堂讲解及课后总结来逐步实现教学目标。

三、MapReduce翻转课堂教学设计

(一)MapReduce并行框架

MapReduce是大数据处理的核心技术,教学目标要求学生掌握并行编程的基本框架,具体教学内容包括Hadoop MapRdeuc介绍、Hadoop集群、等基本概念。

Hadoop MapReduce是一个开源分布式计算平台,以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心,为用户提供了系统底层细节透明的分布式基础架构。Hadoop的集群可以分成两大类角色:Master和Salve。一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode作为主服务器,管理文件系统的命名空间和客户端对文件系统的访问操作;集群中的DataNode管理存储的数据。MapReduce框架是由一个单独运行在主节点上的JobTracker和运行在每个集群从节点的TaskTracker共同组成的。主节点负责调度构成一个作业的所有任务,这些任务分布在不同的从节点上。主节点监控它们的执行情况,并且重新执行之前的失败任务;从节点仅负责由主节点指派的任务。当一个Job被提交时,Job-Tracker接收到提交作业和配置信息之后,就会将配置信息等分发给从节点,同时调度任务并监控TaskTracker的执行。

Map/Reduce框架运转在键值对上,也就是说,框架把作业的输入看为是一组键值对,同样也产出一组< key,value>键值对作为作业的输出,这两组键值对的类型可能不同。

Map:(k1,v1)→list(k2,v2)

Reduce:(k2,list(v2)→list(k3,v3)

对基础理论教师主要制作课件PPT和微视频及收集文档资料,再利用Blackboad实施翻转课堂。Blackboard平台提供了教学过程和教学时间的安排。在教师指定的时间段内将学习资源、论坛等开放,该时间段后学习资源就会关闭,通过时间安排教师可有效地控制学生的学习过程和学习步骤,从而达到学习的有效性。利用Blackboard平台教师可实施答疑、实践、总结等系列过程,既完成了教学活动,又给了学生学习的自由度。在学生自主学习过程中,设计二种交流形式。一种方式是教师引导学生利用Blackboad平台的Wiki总结知识点,老师首先将键-值、Map、Reduce、Shuttle等概念作一个最简单的解释,同学们再根据自己的理解对老师和其他同学提供的解释进行补充和修订,形成一个较为严格、完整的概念。另一种方式是利用Blackboad的论坛进行自由式的讨论。Blackboad记录了学生参与活动的次数和时间,利用这些记录Blackboad设计了学生的学习过程和交流形式对学生进行适当的奖励,鼓励学生参与自主学习,激发他们的热情。

(二)实践教学

理论知识对掌握大数据是远远不够的,还需要设计实践教学。首先是开发环境的搭建,我们为学生设计了一个虚拟集群环境,利用虚拟机(Virtual Machine,VM)来搭建一个伪分布式环境来运行MapReduce。虚拟机上需要安装:操作系统Linux;Hadoop-1.0.4-bin(包含了Hadoop MapReduc程序框架和Hadoop的分布式文件系统HDFS);jdk-7u21-linux-x64和Hadoop Eclipse的插件;具体过程包括:网络配置、安装JDK、建立SSH互信和配置Hadoop。MapReduce处理所需的数据集通过DataFactory产生数据,然后从关系数据库导出。集群环境所需软件和搭建过程作为教学资源放在Blackboad平台,学生分组搭建集群环境。

为了让学生掌握MapReduce并行编程思想,实践教学提供应用示例和编程模板。WordCount是Hadoop MapReduce自带的一个例子,用于计算指定数据集中每一个单词出现的次数,该示例简单明了地阐述Map/Reduce的处理过程。WordCount的算法描述如图1所示。

图1 WordCount的MapReduce算法描述

图2 WordCount-MapReduce处理

图3 AverageTempByStation的MapReduce算法

根据WordCount实例,给学生提供一个MapReduce的模板,该模板将导入所有需要的库、提供Map和Reduce方法的定义及创建、配置和运行Hadoop MapReduce job的方法,让学生理解程序结构,如图2所示。

表1 Hadoop MapReduce的翻转课堂教学设计

学生通过实例代码加深对Hadoop MapReduce并行编程框架的理解,也检验环境配置是否成功。

(三)Hadoop MapReduce实践设计

学生通过示例理解了Hadoop MapReduce并行处理机制,再进一步安排学生实践内容。我们设计了气象监测数据分析的实例,要求模拟气象监测点的数据,数据集分成行,每行属性值之间用制表符分隔,每行属性包括:监测点编号(StationID)、经度、纬度、温度(temp)、降水、湿度、年、月、日等。学生采用Hadoop MapReduce实现求各个监测点的日平均温度,其算法思想如图3所示。

学生还可采用该数据集进一步实现聚集计算如排序、最大值或最小值等,同时利用数据库课程所学的SQL知识实现这些聚集运算,并对Hadoop MapReduce和SQL聚集计算的能力进行分析和比较。

教师在引导学生完成实践教学后,归纳学生难理解的知识点,实践中存在的问题等进行课堂讲解,学生在听完课后再对自己的理解和实践进行总结和修订。

Hadoop MapReduce翻转课堂的教学时数、教学内容、教学方式等具体设计如表1所示。

四、教学评价

大数据不在目前的数据库课程教学大纲的范围内,因此不作为期末笔试考试部分。为了有效地促进学生对这部分知识的掌握,教学评价采用对学生在BlackBoad的学习轨迹分配不同的学习权重,由老师和学生共同对每个学生的学习情况进行评分,如上机实践情况由老师给出评分,而博文、论坛、Wiki则由访问的学生给出评分,老师再给一个评价,根据权重算出每个学生总的评分作为该课程的平时成绩记入学生成绩中。该评价方式一方面促进学生的学习,另一方面也提高学生的参与度,更好地激发学生的兴趣。

本次教学改革对近二年的学生进行了跟踪调查,采用调查问卷的形式收集反馈信息,在“简略写下你在本课程中的收获”的提问时,学生的回答有:“学会了自己主动独立解决不懂的问题”,“实践出真知”,“积累了团队合作的经验”,“实习中用到了”,“对实际工作很有用”等反馈信息,85%的同学对开展的教学改革都给予了肯定,在学校教务处的课程评价中近二年的平均得分为92.96,在全校课程评价中排名前10%。

五、结束语

大数据是现代信息技术的热点问题,掌握基本的大数据处理技术对计算机科学技术专业的学生尤为重要。大数据技术非常广泛,将哪些内容引入教学,如何开展教学是信息科学相关专业教师迫切需要解决的问题。本文针对在数据库课程教学中引入大数据开展了教学内容和教学方法的设计与实践,一方面探索了数据库课程教学内容的改革,另一方面也是探索数据库课程教学方法的改革。

参考文献

[1]Yasin N.silva,Suzanne W.Dietrich,Jason M.Reed,and etc. Integrating big data into the computing curricula. SIGCSE 2014.

[2]Clare Stanier. Introducing NoSQL into the database curriculu m[C].10th International Workshop on the Teaching,Learning and Assessment of Databases,2012:61-72.

[3]邹先霞,杜威.基于建构主义的数据库分析与设计课程教学方法探索[J].大学教育,2013(10):57-59.

[4]黄琰,蒋玲,黄磊.翻转课堂在“现代教育技术”实验教学中的应用研究[J].中国电化教育,2014(4):110-115.

[5]张金磊,王颖,张宝辉.翻转课堂教学模式研究[J].远程教育杂志,2012(4):46-51.

[6]马秀麟,赵国庆,邬彤.大学信息技术公共课翻转课堂教学的实证研究[J].远程教育杂志,2013(1):81-87.

[7]钟绍春.信息技术与课程整合的资源及软件研究[J].电化教育研究,2005(3):53-56.

中图分类号:G642

文献标志码:A

文章编号:2096-000X(2016)10-0089-03

作者简介:邹先霞(1974,12-),女,湖北公安人,博士,副教授,研究方向为数据集成、大数据、数据流等。

猜你喜欢

翻转课堂大数据
翻转课堂在小学数学教学中的应用
翻转模式在“液压与气动”教学中的应用研究
翻转课堂在英语语法教学中的运用研究
翻转课堂教学模式在《PLC应用技术》课程教学中的应用
基于大数据背景下的智慧城市建设研究