APP下载

大数据时代图书馆数据科学家培养路径探析

2017-05-30伍芳芳

科技风 2017年14期
关键词:数据素养大数据

伍芳芳

DOI:10.19392/j.cnki.16717341.201714245

摘要:在大数据时代,图书馆将在数据搜集、数据分析、数据处理等方面面临巨大的挑战,复杂数据的处理或将成为图书馆发展的方向。由此,图书馆数据科学家的作用显得越发重要。文章主要分析了图书馆数据科学家做什么,如何培养图书馆数据科学家以适应大数据时代的图书馆发展需要。

关键词:大数据;图书馆数据科学家;数据科学家;数据素养

1 数据科学家与图书馆数据科学家

数据科学家(Data Scientist)一词是由Natahn Yau在2009年提出来的。什么是数据科学家目前还没有统一的定义,普遍认可的是:“数据科学家是指运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对使用者有意义的信息,以易懂的形式传达给使用者和决策者,并创造出新的数据运用服务的人才”。

在大数据时代,大数据具有信息类型繁多,更新速度快,综合价值大等众多特性,如何选择可靠、更有价值的信息,进而进行分析、处理以为领导的战略决策提供参考,满足学校教学科研的需求,满足用户个性化服务的需要,是当今图书情报工作人员面临的重要挑战。因此,图书馆员只有快速的向数据科学家转变,才能适应大数据时代的图书馆发展需要而不被淘汰。

2 图书馆数据科学家做什么

笔者于2017年4月24日至28日在西南交通大学(九里堤校区)参加了为期5天的“图书馆数据科学家技术培训班”,通过学习,了解了大数据理念在实践运用中的一些成功案列;了解了信息搜集的一些成功案例;了解了使用Lucidworks Fusion对数据进行整合搜索和挖掘;了解了有关数据可视化的知识;掌握了利用Xpath来抓取京东、当当的图书信息,以及抓取外文图书数据库、期刊数据库、外文学位论文数据库的内容。

通过学习,个人认为图书馆数据科学家可以完成以下这些工作。

2.1 采集分析图书馆各类大数据,为图书馆的建设、管理、服务提供决策支持

图书馆数据科学家的首要任务便是对各类馆藏数据的采集和分析。比如对用户的进馆阅览记录、借阅记录、图书馆的馆藏书目检索记录、用户访问数据库的记录等这些用户行为数据进行分析和处理。通过这些数据,我们可以分析用户的访问时间、阅读倾向和使用习惯等,从而帮助我们分析和预测用户的信息需求,以为图书馆的建设、管理、服务提供决策支持。因此,图书馆应重视各类数据的采集、整理和分析。

2.2 培养用户的数据素养

目前,国外图书馆探索数据素养教育越发系统,并在长期实践中形成了较为成熟的教育模式,就如何确定教学对象、设置教学目标、设计教学大纲、选定教学方法和实施教学评价等方面累积了丰富的经验和成果。而纵观国内高校,目前大学生的数据素养水平差别巨大,对数据采集、处理和利用数据的能力普遍较低,在数据伦理道德上的观念比较薄弱。由此,高校图书馆开展对用户的数据素养教育显得迫在眉睫。

2.3 统计分析学校科研论文数据

图书馆数据科学家还有一个重要任务便是搜集整理学校的科研论文数据,通过分析提供科研论文分析报告,以促进学校科研水平再上新台阶。

2.4 开展大数据相关的培训讲座

为了提高学校的整体数据素养,图书馆数据科学家可以为学校的师生开展大数据相关的讲座培训。介绍数据在论文中的重要作用,因为从众多核心期刊论文中我们可以看出,高质量的论文一般都有大量真实可靠的数据来做支撑。

3 圖书馆数据科学家培养路径

3.1 提高图书馆员的数据素养

在大数据时代,数据素养已成为21世纪公民必备的技能,尤其是在数据密集型的科研范式下,研究人员创建、获取、存储及运用数字科研数据的能力已成为推动科技进步、应对经济和社会挑战创新的关键,并对全球生产力、竞争力和生活质量具有潜在影响。因此,只有馆员具备较高的数据素养后才有基础和能力为用户提供有关数据的服务以及培养用户的数据素养。

3.2 优化图书馆员的知识能力结构

科学数据管理人才的知识结构总体上应由计算机技能、数据管理理论、管理学知识和其他相关学科知识组成。而图书馆数据科学家则应具备系统的管理学知识和丰富的管理实践经验,懂得数据管理的一般理论,初通计算机知识,并具有较强的执行力和组织协调能力。随着图书馆参与科学数据管理进程的加快,数据科学家的作用越来越突出,他们是图书馆科学数据服务的领导者,主要任务是制订图书馆数据化管理和发展战略,因此数据科学家应该是既具备信息技术及相关理论知识,也精通管理、战略和实践的通才。同时,由于数据科学家所处职位和承担的责任要求,需具备较强的规划策划能力、分析判断能力以及项目执行能力,以及领导图书馆的科学数据管理队伍的建设能力。

3.3 掌握大数据分析处理工具

由于图书馆数据科学要处理巨量的数据,因此,其必须掌握常用的数据采集工具,例如Hadoop、Spark、Map Reduce、Mahout、Xpath等,要熟悉大数据应用案例,要掌握信息可视化、数据挖掘等相关技术。

3.4 加强外语知识的学习

由于图书馆数据科学家应具备较好的信息技术及相关理论知识,要掌握大数据采集、分析和处理工具,而这些最新的理论知识、处理工具及科研成果往往都是最先出现在外文文献中。图书馆员只有具备较好的外语水平才能理解和传递这些信息,否则不能充分利用它以为用户提供服务。因此,图书馆数据科学家还应具备较高的外语水平。

4 结语

随着信息技术不断发展,大数据的优势将在日常生活中体现得更加淋漓尽致,民众也将随着这些人性化、个性化的高满意度服务的出现而对图书馆的服务呈现出明确和迫切的需求。

因此,各类型图书馆在未来的发展中都应高度重视和培养本单位的图书馆数据科学家,这样才能适应大数据时代的图书馆发展需要。

参考文献:

[1]王伯秋.数据科学家及其对图书馆未来发展的作用[J].医学信息学杂志,2014,35(6).

[2]胡卉.国外图书馆数据素养教育最佳实践研究与启示[J].现代情报,2016,36(8).

[3]崔涛.图书馆视角下科学数据管理人才培养模式研究[J].图书馆建设,2017(3).

[4]朱扬勇.大数据时代的数据科学家培养[J].大數据,2016(3).

[5]田伟.大数据时代档案馆服务创新研究[J].档案学研究,2014(5).

猜你喜欢

数据素养大数据
大数据环境下高校图书馆的数据素养教育
大数据环境下高校图书馆的数据素养教育
基于文献计量的数据素养及其教育领域研究态势分析
大数据时代高校图书馆数据素养教育研究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
大数据时代图书馆员的数据素养研究