计算机专业大数据处理方向教学体系建设
2018-03-08杨慧
杨慧
摘 要:在大数据时代背景下,各行各业都逐渐呈现出数据资本的现状。但是,如何更好地处理大数据、应用大数据却成为世界范围内的共同难题,而作为与大数据最为紧密的领跑者——计算机专业被赋予众望。故本研究从计算机专业的教学体系建设为契点,希望从课程群、教学方法、教学模型等角度出发,为高校的计算机专业在大数据处理方向的建设提供相关实证依据。
关键词:计算机专业 大数据处理方向 教学体系 完善
中图分类号:G642 文献标识码:A 文章编号:1672-3791(2018)12(c)-0038-02
在互联网以及计算机科学快速发展的今天,每个行业都逐渐重视数据的观测与分析,因为这些数据在一定程度上可以预测未该行业的走向,其中最为常见的就是我们日常生活中用到的各类只能软件,它们为什么能够知道我们个人的喜好呢?其很大程度上取决于后台大数据的支持,我们在某个时刻浏览的网站及频率均会产生记录,累积到一定程度就会对我们的行为趋势产生一定的了解。因此大数据处理一般包括数据收集、数据记录、数据储存、数据处理、产生导向结果等几个方面。但是对于计算机专业的大数据处理方向的学生以及高校而言,如何建设教学体系才能培养出符合时代要求的数据分析师成为当下最迫切解决的问题。
1 大数据概述
1.1 大数据概念
对于大数据的概念,目前世界范围内也没有统一的定义,但是早在2008年《Science》杂志将大数据定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据。从以上的定义中不难看出大数据的内容范围非常之广,并且对该数据的处理是一台计算机所不能解决的,它的数据类型以及处理方式均远远超出传统数据的范畴。
1.2 大数据应用现状
查阅文献发现在美国针对医疗方面采取的大数据分析结果为整个行业增值3000亿元的价值,并且他们将大数据这一新兴技术产业广泛应用于空间站、航空航天、道路检测等领域,其产生的价值是不可估量的。而在我国,随着近些年互联网产业逐渐与大众相接轨,大数据处理以及收集的必要性逐渐被重视,国内已有的研究有针对消费行业的,也有环境质量监测的,更值得一提的是,很多高校都逐渐开设大数据收集与处理技术等具有针对性的专业,这说明我国的大数据处理技术已经做好渐入佳境的准备。
1.3 大数据处理技术
在大数据处理方面,具体分为以下几个方面:(1)数据收集,在该领域,有WEKA、RapidMiner、Dryad、Pregel技术,WEKA是开源的集合大量承担数据挖掘任务的机器学习算法,RapidMiner 可实现Excel、Access、Oracle等数据库的访问。(2)数据储存:Google 较早开发了GFS,随后基于Spanner 服务器的F1(fault tolerant distributed RDBMS)新型数据库。微软自行开发的分布式计算平台Cosmos,主要包括存储系统、执行环境、SCOPE(structured computations optimized for parallel execution),能够存存储和分析大数据集。
2 教学体系建设目标以及思路
2.1 建设目标
在我国当前阶段,虽然大数据的收集领域有很多,但是由于是一个新兴的产业,传统的数据分析师已经不能应对当下数据的处理要求,但是大数据的应用领域之广以及创新视角的变化又是非常快的。所以,笔者认为在大数据时代背景下的数据处理分析人员不仅要能够具备良好的善于收集、分析数据的能力,而且更为重要的是要具备将这些大数据背后的分析结果能够很好的应用到相应的领域并使其差生最大价值。
2.2 建设思路
由于各行各业均有大数据的存在,并且每个领域的数据分析利用视角也均会产生较大的差异,因此换句话说大数据分析这一行业是“鱼龙混杂”的现象。但是作为培养大数据处理分析人员的高校或者组织单位,一定要有“追本溯源”的教学思路,所以无论在什么领域,都应该教会学生会应用最为基础的数据分析技术,并且要能够培养学生善于具体问题具体分析的敏锐度,能够对数据应用的大趋势把握不会出错。因此,高校在培养学生的过程中,应该注重计算机编程、数学、统计等方向的基础类课程,在这一阶段之后就是结合当下的各个领域,让学生们熟知在教育、生物科技、消费等基础领域视角的数据具体价值,以便在实际应用的时候能够有自己的思路。
3 教学体系建设内容
3.1 基础课程
对于计算机专业的学生来说,基础类的课程无疑有数学课程和计算机课程等两个主要方面。对于前者而言,其课程主要涉及到高等数学、数理统计、离散数学、概率论等基础课程。因为在对大数据进行挖取的过程中很多时候都会用到微积分、线性模型等数学知识。而对于后者而言,包括C语言、C++以及JAVA语言等,程序设计课程作为计算机专业的基础课程,让学生掌握解决问题的算法和算法实现的具体过程是该类课程的主要目标。
3.2 大数据方向课程
一般情况下大数据的处理有如下几方面:(1)数据收集,在采集数据的过程中,当下比较成熟的方法有爬虫、ETL工具等,需要分析人员将数据拔下来后能够进行相应的分类处理。(2)数据储存:在对大数据进行储存的过程中,比较常用的就是分布式存储,这样做的好处就是能够为后续的分析任务节省很多的时间与精力。(3)数据分析与建模:因为只有大量的数据在收集之后才会产生价值,并且才会在一定程度提高准确的趋向性。
3.3 大数据方向实践课程
每个专业都会面临一个共通难题,就是理论与实践的有效结合,因此对于数据分析这种实践性特别强的专业,更应该提高学生的实践能力,因此,在教学的硬件设施方面,高校应该及时的为学生提供有效的实践练习的实验室或者具体的数据分析处理实践基地。
3.4 教学策略与方法
与其他的专业相比,大数据处理方向的计算机可能相对比较枯燥,所以在如何做到“寓教于乐”,则需要教育者和相关部门进行相关思考。在笔者的调研和分析之后,学生都是存在很强的竞争意识,所以高校可以联合有相同需求的高校定期举行职业技能大赛等活动,可以在一定程度上激发学生自主学习和创造的能力,也能够培养学生在团队活动中的责任与担当。
此外,教学还应当与学生的实践相挂钩,可以采取学分制的方法,要求学生在每学年、甚至每学期都得具有一定的数据分析实践,这样可以督促学生及时的将自己学习的理论知识用到实际当中,真正意义上做到学以致用。
4 结语
在大数据极速发展的今天,对计算机专业的数据处理学习者既提出了较高的挑战,但与此同时更多的是给予他们机遇,一个脱胎换骨、不断完善自己的过程;希望本文所提出的教学体系建设能够为这个蜕变的过程贡献其力量。更希望计算机专业的教育者更能够在自己的实践道路上及时对该内容做出有效调整。
参考文献
[1] 赵晓娟.大数据时代计算机专业实验教学改革研究[J]. 电脑迷,2017(6):169.
[2] 李鸿健.大数据时代计算机专业实验教学改革研究[J]. 现代计算机,2013(13):29-31.
[3] 谢志明.基于CDIO的云計算与大数据课程体系建设[J]. 计算机教育,2017(1):47-52.