新工科背景下的《大数据与云计算技术》课程建设研究
2020-11-27长江大学计算机科学学院湖北荆州434000
叶 青(长江大学 计算机科学学院,湖北 荆州434000)
刘长华(长江大学 学校办公室,湖北 荆州434000)
一、研究背景及意义
随着移动互联网技术和传感技术的迅猛发展,国内外各行各业的应用系统规模迅速扩大,其随之产生的数据量也将呈爆炸性增长。 目前, 全球的数据增长速度已经达到每年40%。 根据麦肯锡公司的分析报告,2018 年大数据工作岗位需求激增,大数据人才的缺口将达到1500 万。 据IDC 预测,到2019 年,大数据分析行业的年度全球收入将达到1870 亿美元。 大数据的产生为以互联网和人工智能为核心的工科学科提供了良好的生态环境和硬性支撑。
2016 年,“新工科”概念的提出为工程人才的培养与工程教育理论的探索提供了新视角和新思路,也是为了应对新一轮科技革命和产业革命的浪潮[1]。 与老工科相比,新工科更加重视学科的实用性以及各个学科之间的交叉性与综合性,致力于提供一流的工程教育,培养多元化、创新型、复合型的卓越工程人才,促进产业转型,提高国家的核心竞争力[2~3]。 新工科专业涵盖了针对新兴产业的诸多专业,包括大数据、云计算、区块链、人工智能等创新型专业。
2019 年10 月20 日,习近平总书记在第六届世界互联网大会上指出:“当前, 新一轮科技革命和产业变革加速演进,人工智能、 大数据、 物联网等新技术新应用新业态方兴未艾。 ”这是对“新工科”进行再深化,这些推动措施正在改变高校教与学的方式,改变高校的人才培养方案,改变高校的课程评价体系,改变高校的教学资源配置[4]。 相对于传统的工科人才培养,新工科的人才培养模式正在朝向培养新兴产业急需的兼具实践能力、创新能力、竞争力的高素质人才。
教育部印发的《关于公布首批“新工科”研究与实践项目的通知》指出,要充分把握“新工科”建设的内涵,促进“工医”、“工农”、“工文”等多学科交叉。 大数据与云计算技术作为“新工科”建设的重点,国内多所高校已积极开设《大数据与云计算技术》课程,力争培养掌握大数据与云计算处理技术、有大数据应用经验的创新型工程人才。 但是,由于该课程的开设和建设还处于初期,且大数据与云计算行业的技术更新较快,目前尚无较成熟的课程建设先例供各大高校借鉴。因此,对《大数据与云计算技术》课程建设展开深入研究,整改教学内容,优化教学方法,加强课程与企业以及行业之间的联系,提高课程的实践性和应用性,具有较强的实际意义和研究价值。
二、实例项目驱动的教学内容设计
目前,地方高校由于人才培养方案缺乏及时更新、教学方法落后、教学资源单一等问题,该课程的教学内容严重滞后于大数据行业的需求,与前沿技术相距甚远[5~6]。大数据与云计算技术具有的多学科交叉、实用性强、内容抽象且更新较快等特点。大数据行业的就业方向主要包括三大类:大数据系统的研发、大数据应用的开发、大数据分析,具体岗位包括:大数据分析师和大数据工程师。
在新工科背景下,《大数据与云计算技术》 课程体系的制定应以行业需求为导向, 不断补充一线大数据行业所需的新技术、新标准到教学内容中,以实际项目为驱动的设计课程的教学内容,加速培养新兴领域的工程技术人才。 首先,将课程内容划分为初级、中级和高级三个能力级别。 其次,明确每一个级别的培养目标。 《大数据与云计算技术》课程的教学内容能力级别及教学目标见表1。初级的培养目标是掌握云计算的基本概念,让学生掌握大数据处理平台Hadoop 的环境配置和集群搭建, 对MapReduce技术有一个理论上的深入理解。 中级的培养目标是从应用出发,围绕大数据处理的两个核心问题——分布式存储和并行计算, 介绍HDFS、HBase、Hive 等Hadoop 平台主要组件的使用方法,并让学生掌握基于大数据的机器学习和数据挖掘算法的实现。 高级的培养目标主要针对基础较好的学生,重点围绕如何根据大数据本身的特点将大数据处理问题转换为MapReduce 并行化算法设计思路, 通过引入真实的行业应用案例让学生设计、 构建和实现有效的MapReduce 并行化算法,最终完成大数据应用系统的开发。
表1 课程教学内容能力级别及教学目标
在中级和高级能力培养阶段,根据培养目标的难度,以项目为驱动引入规模适中且易于理解的实际案例,将其贯穿于整个教学过程。 以课程教学高级目标中的项目2: 基于Hadoop 的城市智能交通综合应用为例,实际应用中的交通大数据处理平台的整体架构如图1 所示,HBase 作为底层的分布式数据库,提供统一的数据访问接口。HDFS 作为HBase 的文件存储支撑,支持海量数据的分布式存储以及高效的实时数据访问。MapReuce 计算框架实现对分布式数据库中的数据进行分析。 该案例的实施建立在前期教学内容MapReduce、HDFS 和HBase 之上,因此,可以在对应的教学阶段融入该案例的子项目, 包括: 基于HBase 的实时数据检测、 基于MapReduce 的离线数据分析、基于Hive 的高速统计等。
在完成上述三个级别的教学内容之后,鼓励学生从案例分析中发现突破点、创新点,由课堂教学过渡至双创项目的设计与研发,做到“产学研”三位一体,尽量为学生提供良好的创造创新环境,让学生有更多的机会接触行业前沿技术,接触大数据研究领域的科研层面,实现培养创新型人才的目标。
图1 项目2 的整体架构
三、能力培养为导向的考核评价体系
长久以来,高校的课程考核评价体系主要针对理论型课程或半理论型课程制定,这类课程的培养目标是学科理论型人才,评价体系更关注于考核学生对理论知识的掌握程度,且多采用闭卷考试形式[7~8]。 作为一门以技能培养为导向的实践应用型课程,《大数据与云计算技术》的课程目标是培养应用技术型人才[9~11]。 采用传统的考核评价标准难以全面、准确地度量学生在课程中收获的技能,更无法为课程教学质量以及教学方法的优化提供良好的促进作用。 因此,需要建立以能力培养为导向的考核评价体系。
对应于课程教学内容能力级别中的初级、 中级和高级教学目标, 该评价系统从三个方面考核学生对于本门课程教学内容的掌握情况:知识理解、技术运用能力和项目实施能力。知识理解考核学生对于课程理论知识的理解与掌握情况,技术运用能力考核学生对知识的运用能力和实践操作能力,项目实施能力考核学生对技术的综合运用能力、 项目组织能力以及创新能力。 这种考核评价体系通过进一步细化学生多层面的能力考核目标,能够更全面、更客观、更合理地帮助教师掌握学生的情况,有针对性地培养学生以及改进教学质量。
上述三个方面的考核成绩根据一定的比例合成最终考核成绩,其比例分配应该灵活设定,主要取决于高校的办学层次以及学生的综合素质。技术运用能力考核主要涉及将Hadoop平台与特定应用环境相结合, 将数据挖掘算法灵活运用于大数据分析中,进而解决某种实际问题。该项考核成绩优异的学生,基本已具备了大数据分析师、大数据可视化工程师等岗位所需的专业能力。 项目实施能力考核主要涉及专业拓展能力和创新性思维的评估,包括:Hadoop 平台的搭建和运行维护、大数据项目的设计与开发、大数据平台的硬件规划等。该项考核成绩优异的学生可以作为重点培养对象, 继续引导学生深入探索大数据行业的前沿研究领域。
总之, 以能力培养为导向的考核评价体系应该从实际情况出发,对于具有一定工科优势的高等院校,可以适当提高项目实施能力的考核比例, 为学生提供实践与科研并行的学习环境,挖掘具有工程创新型能力的人才;对于综合性的高等院校,则应当强调技术运用能力的考核比例,重在鼓励学生运用基本的理论知识完成知识转化;对于实力一般、学生底子较薄的高等院校,则降低项目实施能力的考核权重,重点考核学生前两方面的能力。
四、多形态一体化的课程教学方法研究
(一)以项目为主导的课堂授课方式
为了实现创新型技术人才的培养模式,《大数据与云计算技术》课程要打破传统的以知识传授为主导的单一授课方式,逐步转换为以项目为主导的教学方式。结合前期的知识积累,精心准备几个具有通用性的实际案例, 将技术运用融入一个个真实的项目,以项目为载体开展教学活动。
对于应用型课程, 学生的参与程度直接影响到动手能力的培养,进而影响教学质量和教学效果。通过将学生分组并给每组学生分配一个实训任务, 鼓励每一位学生都参与到项目的实施中来,调动学生的主观能动性。不仅可以培养学生自主学习和主动探索的习惯,还能提高项目组织能力,甚至提高人际沟通与协调的能力。 进而,为双创项目的产生奠定基础,将课堂教学拓展到双创项目的指导中。
(二)课堂教学向双创项目的过渡
为了让学生能真正熟练掌握并运用Hadoop 大数据处理平台以及大数据处理算法, 仅仅了解基本的编程框架和API是不够的,应该具备熟练运用MapReduce 计算模型和编程框架完成大数据分析和处理问题, 进而针对新兴领域设计并优化有效的并行化算法,实现大数据应用系统的开发,为双创项目做技术储备。 从课堂教学过渡到双创项目的流程如图2 所示,包括课堂教学、课后辅导、双创项目指导三个环节。
通过引入多个全国大数据技术大赛的获奖项目、 大数据课程的优秀课程设计案例、 大数据技术研究案例以及大数据行业的真实案例,并进行系统的课后答疑和针对性指导,发掘个人能力强、综合素质高的学生,培养其完成双创项目的开发与实现。由课堂教学逐步过渡为双创项目,可以有效减少学生前期知识积累的时间周期, 有助于学生快速进入项目的设计与实现环节。
图2 课堂教学向双创项目的过渡流程
(三)基于互联网的在线辅助教学平台和在线实践平台
新工科背景下, 为了解决教学内容与行业需求以及前沿技术脱节的问题,搭建基于互联网的在线教辅平台。根据课程的培养目标, 实现课程教学资源的上传下载、 教学任务的布置、师生在线讨论答疑、学生作业提交、老师在线考核、开源项目的共享等功能。 充分解决传统工科课程的教学内容滞后于产业新技术的问题,为学生提供更多元化的知识获取渠道,将新的理论、新的大数据处理框架和工具引入教学活动中来,拓展学生的知识面,从而更好地应对日新月异的就业环境。
实践教学是培养创新型人才的重要途径,对实现《大数据与云计算》这类课程的培养目标具有重大意义。为了确保学生通过课程学习具备一定的动手能力,引入EduCoder 实践平台(www.educoder.com)开展课程的实践教学。 EduCoder 实践平台是基于互联网的新型IT 工程教育服务云社区,支持大数据与云计算、人工智能、深度学习等众多新兴学科,涵盖了大量优秀的实践项目。教师和学生都可以在平台上注册免费账户,教师既能够自主新建实践项目, 又可以利用平台现有的资源来创建属于自己的课堂。学生通过加入任课教师创建的课堂,就能在教师的指导下以闯关的形式完成课程内的各个实训任务,实践大数据处理技术。
在过去的《大数据与云计算技术》课程教学中,教师普遍反映学生在配置大数据平台Hadoop 的运行环境时经常出现各种各样的问题。在线实践平台的引入,可以有效解决学生能力参差不齐而造成的教学效果不佳现象。 EduCoder 平台以虚拟机的方式为学生提供大数据工作环境,简化Hadoop、Spark等大数据处理平台的底层环境搭建过程, 让学生把更多的时间精力放到掌握MapReduce、HDFS、HBase 等核心技术上去,这也契合了“新工科”的能力培养导向。
五、结语
总的来说,大数据时代为计算机行业带来了许多机遇,与此同时也带来了挑战。面对大数据行业的飞速发展,对实用型课程的教学过程也应与时俱进,不断优化。 本文对《大数据与云计算技术》课程制定考核评价体系、深化教学内容、优化教学方法等方面展开研究, 提出一种以能力培养为导向的教学模式,引入丰富的大数据项目案例和在线实践平台,不仅有助于培养更高质量的工程应用人才,改造传统的工科专业,积极部署未来战略必争领域的人才培养, 实现社会效益和经济效益的“双赢”。 同时,也顺应了“新工科”的时代背景,对于同类院校其他“新工科方向”的相关课程建设起到促进作用,并提供技术性的重要参考依据。