大数据时代下计算机专业教学的探索
2014-03-19方昕
方昕
大数据时代下计算机专业教学的探索
方昕
大数据时代的到来引起了教育领域人士的关注,各高校逐步开始重视相关教学及研究。根据大数据概念及计算机学科联系紧密的特点,能够帮助学习者整理和分析信息,结合实际教学经验,引入计算机专业教学的教育模式、创新教学方法、与时俱进的学习意识等内容来探索大数据时代对计算机专业教学作用及方法,为该专业教学研究人员提供一定参考,也为培养大数据研究人才奠定基础。
大数据;计算机专业;教学方法;教育模型
0 引言
20世纪60年代以来随着计算机硬件技术的发展相继出现了数据存储、数据处理等技术,80年代后期出现了“普适计算”理论,90年代后期数据呈现指数增长,逐渐被研究员和学者重视和关注,为大数据概念出现奠定了基础。21世纪,研究人员开始深入探讨大数据研究和应用。2012年由英国牛津大学教授维克托·尔耶·舍恩伯格所著的《大数据时代》对促进人们生活、思维、工作变革奠定基础;同年,美国政府投入2亿美元启动“大数据研究和发展计划”,意味着大数据将逐渐产生深远影响。近年来,我国也相继开始对其高度关注,《“十二五”国家战略性新兴产业发展规划》和《物联网“十二五”发展规划》提出大数据和信息处理技术的重要性。2012年,我国召开了大数据应用研究座谈会,开始逐步研究大数据理论和应用,涉及到学术界、企业界、政府部门等,相关人才需求也会急速上升,遍布各行各业,如金融、保险、医疗、教育、企业等。
而我国高校是培养人才的摇篮,从高校、教育机构着手培养大数据相关人才为社会需求打下扎实基础,与其息息相关的计算机学科在其中也将发挥巨大推动作用。计算机学科是研究计算机的设计、制造和利用其进行信息获取、表示、存储、处理等的理论、原则、技术、方法的学科。计算机专业教学主要目的是让学生对计算机学科相关基础知识掌握,受到严格的科学研究训练,具有创新意识和较高的综合素质,能对成熟的理论、技术和方法具有相应的应用分析能力。因此,从高校计算机专业教学考虑,完善符合大数据时代发展的培养机制显得尤为重要。本文根据大数据研究现状、特点和处理技术,探索如何将计算机专业教学与大数据时代背景相结合,提高课程体系教学质量,从教学层面探讨与时俱进的人才培养。
1 大数据概况
1.1 大数据概念
大数据不是一种技术,也不是一种产品,而是一个抽象的概念,近年来继云计算、物联网之后的一个技术热点。它与传统海量数据有着本质区别,且定义尚未统一。早在2008年《Science》杂志将大数据定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据”[1]。Gartner公司提出大数据是高容量、高生成速率、种类繁多的信息价值,同时需要新的处理形式确保判断的作出、洞察力的发现和处理的优化[2]。麦肯锡将大数据定义为:无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合[3]。百度中大数据定义为:大数据(big data)或称巨量资料,它所涉及的资料规模巨大到无法透过目前软件工具在适当时间内达到管理、处理且整理为帮助企业经营决策更积极目的的信息和资讯。科学家Rauser将其简单定义为:大数据是超过了任何一个计算机处理能力的庞大数据量。大数据所涵盖的数据类型有结构化、非结构化、半结构化的数据,具有4V特点(volume,variety,velocity,value)[4], IBM认为还应该具有第5个V特点:真实性(veracity)[5],有利于领导决策和信任。虽然定义尚未统一,但是大数据已经出现,数据本身就是价值、资产,现每年呈指数增长。据思科公司预计于 2013年在互联网上流动的数据量将达到每年667(Exa)字节[6]。
1.2 大数据应用现状
国外来自麦肯锡2012年有关大数据的一组数据显示,大数据产业为美国医疗系统带来每年3000亿美元的收益[7]。谷歌公司分析处理了人们在网上检索的词条与疾病中心的数据,判断出了流感的传播来源,为公共卫生机构提供了有价值的信息[8]。吴闻新等人预测了医疗行业数据的增长[9]。
美国俄亥俄州运输部(ODOT)利用INRIX的云计算分析处理大数据来了解和处理恶劣天气的道路状况,减少了冬季连环撞车发生的概率。SaaS型软件公司Opower使用数据分析提供消费用电的能效[10]。国内大数据的研究与应用相对起步较晚,文献[11]利用计算机集群构建油田勘探开发一体化解决大数据问题。文献[12]通过大数据分析解决智能交通问题。与教育领域结合,2012年北京航空航天大学首开大数据技术与应用专业,开始为我国率先培养大数据人才。
1.3 大数据处理技术
人才的培养要与大数据的市场需求和处理技术紧密联系,为了解决这些难题需要根据大数据的特点进行新技术的变革。其关键技术主要包括大数据采集、存储、管理、数据挖掘、安全、检索等。在大数据采集存储方面,Google较早开发了GFS,随后基于Spanner服务器的F1(fault tolerant distributed RDBMS)[13]新型数据库。微软自行开发的分布式计算平台Cosmos[14],主要包括存储系统、执行环境、SCOPE(structured computations optim ized for parallel execution),能够存储和分析大数据集。Facebook也相继变革了自己的存储技术,先后推出了Haystack、Hadoop、Hive[15-17],简化数据采集、查询、分析等操作。在数据挖掘方面,有WEKA、RapidM iner、Dryad、Pregel[18-21]技术,WEKA是开源的集合大量承担数据挖掘任务的机器学习算法,RapidM iner可实现Excel、Access、Oracle等数据库的访问,Dryad用于集群处理,与MPI、PVM等紧密联系,Pregel用于图处理及并行计算。在大数据搜索、查询方面,有 PowerDrill、Impala、Caffeine、Nectar[22-25]技术,PowerDrill属列存储,分析搜索时可跳过不必要分区提高搜索效率,Impala属并行处理,Caffeine属更新搜索结构技术,Nectar可减少搜索延迟,避免对旧数据的重复计算。当然,随着互联网、云计算、物联网的发展,大数据相关技术将不断涌现,目前我国大数据研究还处在起步阶段,未来发展涉及领域十分广泛,对于人才需求将急速上升。因此,我国教育机构特别是高校要做好培养人才、提升教师能力的准备。
2 大数据在教学中的作用
大数据技术与计算机学科息息相关,对于教师教学、学生学习、研究都起到重要作用,并且以计算机专业相关知识为依托。因此,重点应考虑如何将大数据与计算机专业教学相结合,首先要分析大数据的教学数据来源对该专业的影响及作用,其次结合我国地方院校专业人才培养任务(如:安康学院)探索计算机专业教育教学方式,课程设置,教学改革等内容,最后在实际教学过程中加以实施,完善教学策略,做好师生互动与沟通,真正做到师生相长。
大数据时代的数据处理不同于传统数据处理,例如云计算,可视化处理、数据采集、数据存储、数据库技术、数据挖掘技术等需要《大数据概论》、《分布式并行处理技术》、《数据库原理与应用》、《算法设计与分析》、《智能计算》、《数据挖掘》、《高级语言程序设计》等计算机课程做铺垫。因此,根据社会和时代需求对现有相关课程强化,同时按照课程体系开设相关课程作为选修课来弥补其空缺。在教学过程中,教师不但要了解大数据概念、发展、应用领域等来拓展自身专业知识有利于深造和进修,而且还要研究其对当今社会的需求和影响来教授学生相关技术,提高学生学习兴趣,使其能够顺应社会发展。在课程考核中可以改善学校考核方式、课程考核方式、课程开展环境,使其向多样化和多元化发展,全面评估专业设置和课程,提供更多的分析数据,帮助教师改善教学质量。大数据时代所带来的新鲜事物和技术、新知识、新课程等的冲击,使学生不但了解和拓宽了知识面有助于提高学习兴趣并了解社会需求,通过大数据分析,制定自身学习计划,有助于自导性学习的开展。
3 教学探索
3.1 课程体系设置
由计算机时代过渡到当前大数据时代,计算机技术面临着巨大挑战,计算机、移动设备、终端设备等将要解决结构化、半结构化、非结构化数据的处理、存储、通信、传输等难题,人才市场需要的存储技术人才、数据分析人才、数据应用人才等,都需要计算机相关知识为支柱。因此,专业课程体系设置可以遵循“引入-基础-专业-实践-深究”的思路,我校于2012年根据地方特色和社会需求对计算机专业课程体系和设置做了一定调整,专业培养目标旨在培养德、智、体、美全面发展,具有扎实的数理基础、系统的计算机理论知识,掌握计算机软硬件技术、网络技术,具备较突出的程序设计能力、网络技术应用能力和良好的人文素质及创新精神,能在大数据时代下从事软件设计开发、网络系统建设管理等工作,具有专业技能基础、创新意识和较好综合素质的应用性人才。专业课程总体设置为三类:专业基础必修课、专业必修/选修课、实践环节。专业基础课程在低年级开设即大一、大二年级,旨在打好基础,主要包括离散数学、大学物理、概率论与数理统计、计算机专业导论、C语言程序设计、数据结构、Java程序设计、计算机电路基础、计算机组成原理、操作系统、计算机网络、数据库原理与 Oracle应用等,同时开设外语,鼓励学生阅读外文文献,了解国内外最新技术和发展,培养自学能力。专业必修课在高年级开设即大三、大四年级,旨在方向钻研,包括软件工程方向、网络工程方向,主要课程有面向对象程序设计、软件工程、Android编程技术、无线网络及其应用技术、Linux系统管理与应用、网络工程与系统集成等,深化基础技能,提高专业水平。专业选修课在高年级开设,旨在建立完善理论体系,主要包括VC++高级编程、数字图像处理、面向对象分析与建模 UML、嵌入式软件开发、物联网工程概论、高级路由交换技术等。同时,实践环节包括社会实践、课程设计、学年论文、专业实习,从低年级到高年级依次开展数据结构课程设计、计算机网络课程设计、数据库原理及Oracle应用课程设计、计算机组装与维护、网络安全课程实习等相关课程设计、实习、实践,提高实践动手能力,为后续学习和研究提供条件,也为数据处理、特别是数据应用、软件开发人才培养做铺垫。
3.2 教学策略和方法
计算机专业课程对实践操作能力要求较高,教师在基本教学过程中应该将理论与实践相结合,由前期的理论教学为主配合实践操作过渡到后期的专业教学,以实践教学为主配合理论讲解,再到根据主题由学生自主设计与开发,同时注意师生间互动与沟通。在理论教学时,教师应该让学生明白所学课程内容的具体概念、原理、基本方法、应用领域,结合实例、案例教学,主要来验证相关理论,使学生从例子中真正掌握理论知识并牢固记忆,除此之外穿插讲解大数据相关的新技术和新方法,保持学生学习“热度”,并积极参与从而提高整个教学质量。以计算机导论、物联网工程概论为例,教师在授课时可将实物、视频、图片和计算机结合,由计算机基础知识拓展到物联网中各种技术产品,从而引出相关数据采集、存储技术,数据处理技术等。
学生由被动接受向主动学习转化,积极鼓励学生主动利用所学知识和技能去实践解决问题。在实践教学过程中,教师结合专业课程实验和课程设计同步为学生制定开发主题,并讲解开发实践过程中注意事项和关键技术,主动指导和启发学生积极思考,认真批阅实验报告和聆听解决方案,避免学生出现抄袭、偷懒等现象。对于技术性较强的课程,教师可以从案例或小型项目着手讲授,将重要理论和技术渗入到其中,让学生自主开发类似案例或项目。
以数据库原理及Oracle应用课程为例,其技术性较强,主要由教学、实践操作、课程设计三部分教授。在课堂教学时,教师应避免照本宣读,课件多以图片、案例、操作形式呈现,对于重要知识点以课堂案例演示为主,配合实验项目实践提高学生动手能力。课程设计以小型项目为主,考查学生对数据库技术掌握程度,认真指导并批阅课程设计报告。使得教师能更好地把握学生对新技术、新内容的接受和掌握程度,以便教师完善其教学方法,提高教学质量,培养学生对课程学习的兴趣和研究相关理论、技术的能力,为相关的教师或研究人员提供帮助。
3.3 学生兴趣培养
通过收集学生的学习满意调查问卷,分析、统计其表现数据,评估计算机专业课程设置、教师教学质量,改善课程设计、课程教学顺序和科目;以学生为本,根据大数据时代需求,科学引导学生学习。在计算机基础课程教学中,先要科学地引导学生对大数据产生的兴趣,增强学生的数据意识。在此过程中,可以先以与大数据相关的问题或者现象出发引起学生的注意,安排4至6个学时左右讲解计算机发展及相关技术,再过渡到大数据产生、发展、现状,使学生知道大数据对人们生活的影响,理解“数据”、“大数据”含义,能够区分数据、大数据、海量数据三者的不同。同时,通过图片、视频、案例讲解等引导学生知晓数据无处不在,可以利用计算机理论和技术来挖掘、存储、处理有用的信息,这些有用的信息对于企业、公司、机构、学校的价值,所涉及的专业课程有数据挖掘、数据库技术、高级程序设计、算法设计与分析、分布式并行处理、智能计算等等。教师可以从讲解基础课程开始自然过渡到专业课程和选修相关课程,起到抛砖引玉、深入浅出之用,使学生总体把握计算机专业课程设置体系及各课程之间衔接关系和重要性,从而吸引学生对大数据及相关课程的了解和兴趣,为后续课程学习、技能培训奠定基础。
同时,教师要充分发挥自身主导作用,使学生由“学会”转向“会学”发展,定期定量向学生提出待解决问题,由学生以小组形式自由分配任务、自主查阅、提出方案、求解验证、总结归纳,并适当讨论展示小组解决效果,分配和组织学生参加项目和课题研究,丰富教学形式,引导和增强学生对专业学习的兴趣。教师可针对出国、考研等情况的学生以个体形式提供相关专业资料、视频、图片、网站等,帮助学生进一步深入学习,掌握最新技术和方法,培养学生研究和创新能力,提高他们适应社会和解决问题的能力,使学生为深造打下坚实的基础。
4 总结
大数据时代将带给学生、教师很多新鲜事物,大数据应用也给计算机专业教育带来颇多机遇和启发,教师需要在教学实践中不断完善和探索,提高自身教学质量,同时加强与教师间沟通与协助,互相总结教学经验,重点探讨大数据时代下计算机专业教育模型,从兴趣、理论体系、科学实践、教学策略等方面创新、完善教学方法,为提高计算机专业课程体系的教学质量提供依据。
[1] GRAHAM-ROWE D,GOLDSTON D,DOCTOROW C,et a1.Big data:science in the pete byte era[J].Nature,2008,455(7209):8-9.
[2] JI Chang-qing,LI Yu,QIU Wen-m ing,et a1.Big data processing in cloud computing environments[C]//Proc of the 12th International Symposium on Pervasive Systems,Algorithms and Networks.2012:17-23.
[3] 计算机行业-大数据( Big Data) 专题报告[R].上海:光大证券股份有限公司研究所, 2011.
[4] BARW ICK H. The”four Vs”of big data[EB/OL].(2011-08-05)[2012-10-02].http://www.comput erworld.com.au/article/396198/iii3_four_vs_big_data/.
[5] IBM. What is big data? [EB/OL].[2012-10-02].http://www-01.ibm.com/software/data/bigdata/what_is_big_data.htm l.
[6] 大数据时代来临何为大数据? [EB/OL]. 2012-05-12. http: //datacenter. ctocio. com. cn /464 /12331964. shtm l.
[7] 涂新莉,刘波,林伟伟.大数据研究综述[J].计算机应用研究,2014,31(6):1612-1623.
[8] 冯海超.透视美国大数据爆发全景[N].互联网周刊,2013-01-14.
[9] 邬雪艳,孙永杰.云计算和大数据助力医疗协同[N].通信世界,2013-04-17.[10] 陈美.大数据在公共交通中的应用[J].图书与情报,2012(6):22-28.
[11] 李伟,赵春宇.油田勘探开发“大数据”管理及应用[J].信息技术,2013(4):196-198.
[12] 冯芷艳,郭迅华,曾大军等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报,2013,16(1):1-9.
[13] SHUTE J,OANCEA M,ELLNER S.F1:the fault-tolerant distributed RDBMS supporting Google’s Ad business[C]//Proc of ACM SIGMOD.2012.
[14] CHAIKEN R,JENKINS B,LARSON P,et a1.SCOPE:easy and efficient parallel processing of massive data sets[J].Proceedings of the VLDB Endowment,2008,1(2):1265-1276.
[15] BEAVER D,KUMAR S,LI H C,et a1.Finding a needle in Haystack: Facebook’s photo storage[C]//Proc of the 9th USENIX Conference on Operation Systems Design and Implementation. Berkeley: USENIX Association.2010:47-60.
[16] BORTHAKUR D,SARMA J S,GRAY J,et a1.Apache Hadoop goes realtime at Facebook[C]//Proc of ACM SIGMOD Conference on Management of Data. New York:ACM Press,2011:1071-1080.
[17] 王珊,王会举,覃雄派等.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752.
[18] 郑世明,苗壮,宋自林等. WEKA环境下基于模糊理论的聚类算法[J].解放军理工大学学报:自然科学版,2012,13(1):22-26.
[19] ARIMOND A.A Distributed system for pattern recognition and machine learning[D].Kaiserslautern:DFKI,2010.
[20] ISARD M,BUDIU M,YU Yuan, et al.Dryad:distributed data-parallel programs from sequential building blocks[C]//Proc of the 2nd ACM SIGOPS/Euro Sys Conference on Computer System.New York:ACM Press,2007:59-72.
[21] MALEw ICZ G,AUSTERN M H,BIK A J C,et al.Pregel: a system for 1arge-scale graph processing[C]//Proc of ACM SIGMOD Conference on Management of Data.New York: ACM Press,2010:135-146.
[22] HALL A,BACHMANN O,BUSSOW R,etal.Processing a trillion cells per mouse click[J].Proceedings of the VLDB Endowment,2012,5(11):1436-1446.
[23] 耿益锋,陈冠诚. Impala: 新一代开源大数据分析引擎[J].程序员,2013(8):95-97.
[24] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.
[25] GUNDA P K,RAVINDRANATH L,THEKKATH C A,et al. Nectar: automatic management of data and computation in data centers[C]//Proc of the 9th USENIX Conference on 0perating Systems Design and Implementation. Berkeley: USENIX Association,2010:75-88.
Teaching Exploration of Computer Science in Big Data Era
Fang Xin
(Dept. of Electronic and Information Engineering, Ankang University, Ankang Shaanxi 725000, Chinaa)
The arrival of the big data era has raised concern in the education field, universities have started to concentrate on the relative teaching and research. Since the concept of big data is closely related to computer science, it enables to help learners to organize and analyze info. Combined w ith the practical teaching experience, it leads in teaching model of computer science teaching, innovative teaching method, advancing learning awareness so as to explore the role and method of computer science teaching in big data era. It provides for professional researcher w ith reference and lays the foundation for cultivating research talents in big era as well.
Big Data; Computer Science; Teaching Method; Education Model
TP311
A
2014.09.05)
陕西省教育厅自然科学专项项目(NO.14JK1014);安康学院高层次人才项目专项(NO.AYQDZR201204);安康学院高层次人才项目专项(NO.AYQDZR201203);安康学院教材建设基金项目(NO.Jc201307)
方 昕(1985-),女,安康学院,电子信息工程系,讲师,硕士,研究方向:智能优化、数据挖掘,安康,725000
1007-757X(2014)11-0032-03