大数据与化学教育
2016-05-14陈竹兵徐汪华
陈竹兵 徐汪华
摘 要:在信息化、网络化高度发达的今天,数据增长速度飞快,以至于难以使用现有的数据库管理工具来驾驭,因此“大数据”这一概念应运而生。“大数据”在化学方面的影响鲜为人知,该文将讨论大数据对化学的影响力是否可以深入到大学化学教育层面。
关键词:化学信息学 在线学习 学生为中心 学习方式
中图分类号:G434 文献标识码:A 文章编号:1672-3791(2016)03(b)-0014-02
近几年来,“大数据”很时髦,作为一个计算机信息用语被炒得很火。任何公司学习利用“大数据”,更好地掌握客户的需求,从而实现利益扩大化,因此在这种大环境下“大数据”已然成为一种趋势。很多化学教育工作者认为“大数据”与化学没有相关性,其实非也。很多学生在化学学习过程中,已经开始利用相关搜索引擎查询化学数据、文献以及相关信息。“大数据”在化学方面的影响鲜为人知,该文将讨论大数据对化学的影响力是否可以深入到大学化学教育层面。
1 “大数据”的定义
人们生活在这样大数据填充的世界里,“推特”每天产生超过7 TB的数据,“脸书”每天产生超过10 TB的数据,很多大企业已经存储了PB级别的海量数据。David Weinberger指出,根据美国圣地亚哥研究所的数据,美国人在2008年全年使用了约3.6 ZB的数据。Weinberger解释道,托尔斯泰的《战争与和平》有1 296页,6英寸厚,电子版有2 MB。而1ZB等于5×1014本《战争与和平》。因此,人们开启了“大数据”时代。“大数据”并不只是数据量大,其经典定义可以归纳为4个V:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。其中,快速的数据流转和动态的数据体系是大数据区分与传统数据挖掘的最显著特征[1]。
近些年来,分析文本和交易的大数据软件引起了公众的注意。即使他们没刻意地关注大数据分析软件,大多数化学工作者在工作过程中不经意间也已经接触了大数据,例如Google等搜索引擎的使用。因为大多数搜索引擎结合了多核处理和Hadoop框架来分析海量数据并筛选出搜索结果。这一类型更高端的分析工具还能够计算出关键词的出现频率,文档中情感是否转变,甚至在大文字信息中,能筛选出最有影响力的观点。当这些分析工具运用到社会媒体中时,有助于社会学家们对社会舆论的研究产生新的视角。
2 “大数据”对化学教育的影响
虽然数据分析的化学应用尚未引起广泛地关注,但是其他类型的大数据分析工具已经在化学各领域展开了应用,特别是化学教育领域。如分子模型,药物、环境、毒理化学等。Lusher Scott指出,大数据分析方法在药物化学研究领域的应用已有十余年[2]。他们指出数据驱动药物化学的这种方法在提高药物研发决策力方面具有很大的潜能,所有的研发人员都信赖大数据,在海量数据中发现有用信息从而发现有意义的相关性和形式[3]。
大数据分析工具在工业化学领域也已经开始应用了,对大数据的需求是很明显的。一项研究数据显示:由于低效的实验设计及不充分的信息技术,研发实验中有40%被重复。
迄今,大数据在化学教育上的应用似乎只局限在研究生水平[4]。化学分支学科,如环境化学、化学信息学、药理学等,处理大量的数据集和复杂的数据交互,主要停留在研究生和研究水平。但是随着商业软件的使用越来越便利,大数据在化学教育方面的应用将会引申到大学本科层面。届时,大数据对研究生化学教育的影响同样体现在大学本科生的化学教育课程里。
大学化学专业的学生也会查询、搜索网络信息和数据,但是他们一般都是访问大数据库,而不是大数据,如CAS Scifinder数据库、英国皇家化学协会ChemSpider数据库。这些数据库含有上百万的化合物及其分析数据,但是这些数据并不是大数据,其大小最多只有TB量级。美国杜兰大学Gibb团队预测在不久的未来,化学工作者们将会有一个数据管理系统,这个系统将会自动分析化学文献,并根据研究热点进行分类。总之,大数据已经对化学研究和化学工业产生了很大的影响,化学已经开始走进“大数据”时代[5]。因此,针对那些未来可能会成为研究学者的大学本科生,大数据化学教育应该引起关注。
3 “大数据”在化学教育领域中的应用前景
大学化学学院需要找到正确的方式为学生引入大数据及相关技术,以作用于化学教育。迄今为止,有一些报道已成功将大数据技术引入到大学本科化学课程中。Reisner等人描述了一种练习,可以提高学生命名、归档数据文件。另外,有一些学者成功运用云计算管理实验数据。这些并没有真正将大数据工具运用到大学化学学生的化学教学中。但可以预见,随着大数据技术的普及,在化学教育领域,大数据会在资料查询、网络在线学习、视频教学等教学实践和教学活动中扮演信息保存库的角色。
对于很多教育者而言,第一次接触大数据可能并不是来自他们在专业学科中的应用,而是学院在提高学生成绩时所作出的努力。学习管理系统、网络课堂、网络作业等搜集大量的学生行为方面的信息。越来越多的大学运用大数据分析工具将这些信息转化为切实可行的建议,帮助提高学生的成绩[6]。八年前,亚利桑那州立大学首创性的结合eAdvisor系统和数据分析学来帮助那些学习成绩比较差的学生提高毕业率。结果,这所大学的差生毕业率由26%提高到了41%。其他大学也在运用大数据技术来管理学生的出勤率、作业完成率,并且帮助学生选择合适的专业课。这些例子无疑表明大数据无论是在化学教育数据信息共享,还是化学课堂教学都有很好的应用前景。
4 结语
大数据工具在工业、医药、环境以及毒理研究等领域已有广泛的应用,并且这种应用在未来会越来越广泛。因此,将大数据引入到大学化学课程中将会大有裨益。最起码,学生能根据相应的文件学到最佳的方法,并且他们可以根据合适的元数据可以知其然,知其所以然。在网络信息日渐发达的现代教育时代,逐渐认识并应用大数据,也是教育与时俱进的表现形式。
参考文献
[1] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.
[2] 欧阳勤,王懿,李海波,等.药物大数据时代下的药物化学教育创新[J].现代医药卫生,2015(12):1905-1907.
[3] Edwards M,Aldea M,Belisle M.Big data is changing the environmental sciences[J].Environmental perspectives, 2015(1):1-13.
[4] Davenport TH,Patil DJ.Data scientist:the sexiest job of the 21st century [J].Harvard business review,2012,90(10):70-76,128.
[5] Liu Y,Cai WS,Shao XG.Big data and chemical data mining [J].Chinese Journal,2015,60(8):694.
[6] 黄明燕,蔡祖锐.云计算教育应用研究综述[J].软件导刊:教育技术,2014,13(1):6-11.