APP下载

美国数据科学课程设置对信息素养的影响研究

2016-05-30王迪王东雨

2016年14期
关键词:信息素养课程设置大数据

王迪 王东雨

摘要:信息素养的概念在不断演变,大数据时代的来临,使得信息素养又有新的含义与要求。美国作为数据依赖的大国,对于大数据的认识已形成理论并发展为独立的学科—数据科学,在此基础上,信息素养的提升具有科学而有效的保障。本文首先分析大数据时代信息素养的概念,然后分析美国数据科学课程设置的现状,以期对我国信息素养的提升提供参考。

关键词:大数据;信息素养;数据科学;课程设置

数据科学是应对大数据挑战所必需的一系列学科的综合。数据、技术和人是数据科学的三大支柱,而且很明显,这三要素是不在同一水平线上的。数据无处不在,技术是为了应付越来越多的大数据问题而积极研发的,人是远远落后于这两个要素的。批判性思考大数据的问题,拥有必要的技能和知识来使用大数据技术以解决大数据问题的人才强烈短缺迹象明显。教育应发挥其使人具有相应的知识和技术的作用。通过对大数据和数据科学教育的密切关注,应该尽力缩小数据、技术和人之间的差距,建立一个高效的大数据生态系统,其中正确的人用正确的技术来正确地解决大数据问题。

大数据时代悄然来临。它描述了我们所面临的和将要面临的数据挑战。研究报告指出,全球大数据市场预计到2018年将增长到463.4亿美元。当今世界上90%的数据都仅在过去的两年中被创建的。但更具挑战性的是,许多企业还没有成功地利用大数据。Gartner的报告指出,纵观2015年,85%的财富500强企业无法有效地利用大数据转化为竞争优势。Gartner公司将其定义为3v:大容量、高速度和多样化的信息资产,具有成本效益和信息处理的创新形式以增强洞察力并助于决策制定。根据这个定义,通过加入真实性维度,产生了4v的说法。之后,进一步增加价值维度5v也经常被提及。接下来,将根据自己的想法和经验对各V进行简要介绍。第一,容量意味着数据规模扩展到TB、PB甚至更大。第二,速度意味着创建、处理、分析、存储数据的速度。第三,多样是指不同类型、来源和处理方式的多样化。第四,真实性是指数据的质量、可靠性和不确定性。我们认为,真实性是有挑战性的研究维度,因为这是仍需要更彻底研究的领域,特别是对数据集成和分析的准确性影响。第五,价值是指可操作性知识的获取,高投资回报率、较高的客户或产品相关性、业务运营、流程的创新。这些因素对传统数据分析与处理提出新的挑战也对信息素养提出更高的要求。信息素养,不仅意味着明确信息需求、评价信息资源、分析利用信息内容,还包括利用计算机等信息技术和信息系统进行信息组织和决策以及信息利用的道德、法律和政策的遵守等。

一、信息素养的概念

参照胡乡峰等在《信息素养的内涵及其构成分析》中对信息素养的定义,即信息素养通过教育形成,是个体在信息获取、评价、利用和生成等方面的能力和修养。进一步划分为信息知识、信息意识、信息能力和信息伦理。数据素养作为信息素养的重要组成部分,包括大数据的基本理论以及现代数据处理技术的基本知识;包括面对海量数据攫取信息满足需求的数据感知力,如从异构数据中分析数据规律解决社会经济问题;包括利用现代技术获取、处理、利用数据的能力,如利用数据挖掘、机器学习和云计算等技术对信息的挖掘处理[1]。大数据浪潮下的信息素养变得时髦、棘手并且重要,把数据素养融合到大学课程、学科与服务和管理当中势在必行。

二、美国数据科学课程设置现状

美国走在数据科学教育的前列,其教授类型分为四种,包括学士课程、认证课程、硕士课程和博士课程。其教学层次比较高,学士课程相对较少;认证课程大多是在线学习,通常不到一年便可完成且大多在研究生层面;硕士课程是最常见的,课程持续时间灵活,一到两年内完成,且提供的课程全面而完整;博士课程相对较少,是集中于天文学、计算机科学等少有领域的高精尖学科。

(一)学士和硕士课程设置

为详细地了解现状,进一步研究了学士和硕士课程设置。以数据科学、数据分析等为主题,排除倾向商业而不是数据科学的课程,如:业务分析、商业智能等。截止2015年8月,总共找到了42门课程。学士课程大多由联合部门或计算机科学部门提供,而只有由查尔斯顿学院和玛丽华盛顿大学提供的两门课程被安置在数据科学部门;现有硕士课程中,大部分是由联合部门提供的课程,反映出随着教育程度的增加,数据科学的多学科特点表现更明显。

很明显,大多数学术机构提供数据科学课程是基于多个学院、学校、部门的合作努力。这样,每个部门都可以贡献自身的传统优势也可以避免一些复杂的问题,如教师聘任、开发新课程、分散教育能力、部门间的竞争等。在不同部门学习,学生有不同的机会发展多角度审视和解决问题的能力。

(二)学士学位和硕士学位的核心课程

学士学位的课程调查到七所在学校网站上提供课程信息的大学:俄亥俄州立大学、罗切斯特大学、伊利诺理工大学、北肯塔基大学、查尔斯顿学院、渥太华大学和玛丽华盛顿大学。根据自身判断尽量归类具有类似内容可能用不同名称的课程,以获得有意义的结果[2]。

“概率与统计”和“数据挖掘”是最受欢迎的课程且七所大学均提供。这些大学中半数以上学校提供其它的课程,包括编程、离散数学、数据结构和数据库和机器学习,其中计算机科学的知识是数据科学的核心要素[3]。

使用同学士课程相同的标准,研究硕士课程体系的核心课程。调查结果显示:15所大学网站显示其课程,包括纽约大学、哥伦比亚大学、伍斯特理工学院、弗吉尼亚大学、北卡罗莱纳州立大学、东北大学、德州农工大学、路易斯安那州立大学、加州大学伯克利分校、卡内基梅隆大学、伊利诺伊大学香槟分校、华盛顿大学、匹兹堡大学、马里兰大学公园学院、印第安纳布卢明顿大学。

不同于学士课程、硕士课程设置中有许多不同。信息检索、信息社交网络分析和文本挖掘在学士学位和硕士学位均有开设外,硕士课程还包括数据挖掘、数据库、机器学习、数据可视化、数据科学概论等。15所大学中半数以上的学校都提供了这些课程,最普遍的课程是数据相关的:如探索性数据分析和数据库。这两个统计相关的课程是本科水平的概率与统计的高级版本,这表明统计是数据科学教育的另一个核心要素。

三、总结

数据科学的学士学位处于初始发展阶段,所调查的最知名的大学开设数据科学计划是在研究生阶段,而不是本科层次;大多数的数据科学课程由大学一级水平或联合部门提供;数据挖掘、机器学习和数据可视化是最流行的核心课程,而统计和数据库是学士和硕士课程的两个基本的背景课程。

系统而全面的课程学习为数据科学输送大批高质量数据科学人才,同时信息素养的提升是显而易见的。较高的信息素养是未来国家安全、经济发展和社会进步的绝对力量,大数据时代,我国推行数据科学教育迫在眉睫。(作者单位:河北大学管理学院)

参考文献:

[1]杨鹤林. 元素养:美国高等教育信息素养新标准前瞻[J]. 大学图书馆学报, 2014,(3): 5-10.

[2]汪小帆. 数据科学与社会网络:大数据,小世界[J]. 科学与社会, 2014, 4(1): 27-35.

[3]黄如花. 国内外信息素养类MOOC的调查与分析[J]. 图书与情报, 2014,(6):1-7.

猜你喜欢

信息素养课程设置大数据
高中信息技术教学如何培养学生信息素养
关于导学案培养学生自主探究学习能力的培养
“通信系统仿真”课程教学改革探讨
借助MOOC打造一门有趣有视野的信息素养通识课
高职物流专业课程设置与物流岗位职业证书的有效对接
独立学院商务英语专业人才培养模式探索