APP下载

国外高校图书馆科学数据素养教育研究

2014-09-05孟祥保李爱国

大学图书馆学报 2014年3期
关键词:高校图书馆大数据

孟祥保 李爱国

摘要 从科研生命周期、学科专业和大数据角度阐释了科学数据素养的内容与特征,将国外高校图书馆数据素养教育实践归纳为利用Libguides建立科学数据管理资源导航、数据素养通识教育、学科数据素养教育三种模式。然后,针对我国高校数据素养教育现状,指出我国高校图书馆应借鉴国外的基本经验:掌握科研人员数据管理需求;基于科研生命周期设计教育内容;注重合作,配备训练有素的教育馆员;依托数据管理平台推进科学数据素养教育。

关键词 科学数据素养 用户教育 数据管理服务 高校图书馆 大数据

1 引言

“数据驱动科学发展,科学就是数据,数据就是科学”,随着数据密集型科研和第四科研范式的兴起,研究者面临一系列数据管理问题,如数据管理计划制定、数据引用、数据出版、数据使用伦理等,科学数据素养成为科研人员学术研究与交流的必备能力之一。美国自然科学基金、国立卫生研究院等科研资助机构,以及英国高等教育拨款委员会、英国研究理事会、惠康基金和研究信息网络等科研资助机构的数据管理与共享政策,也对研究人员的数据管理能力提出了要求。2010年,第76届IFLA大会在瑞典哥德堡召开,社会科学数据素养成为会议主题之一。2012年,美国博物馆与图书馆服务协会(Institute ofMuseum and Library Services,IMLS)资助了“数据信息素养项目”,探索如何培养下一代科学家查找、组织、利用与共享数据的能力。可见,科学数据素养问题引起了图书馆业界的高度关注,欧美部分学术图书馆已经开展相应的素养教育活动,以提高科研人员的数据意识、数据收集与分析技能,促进科学数据管理与共享。因此,厘清科学数据素养的内涵及其特征,及时总结国外高校图书馆科学数据素养教育的实践经验,具有重要的理论价值和实践借鉴意义。

2 科学数据素养的内涵及特征

2.1 从科学研究生命周期的角度

“科学数据素养是指科学研究中收集、加工、管理、评价和利用数据的知识与能力。科学数据素养虽然与信息素养、数字素养类似,但是它主要关注数据收集、加工、管理、评价与使用的多种能力,而非基于文献,强调在科学研究中对数据产生、操作和使用数据集的能力”。卡尔森等认为信息数据素养教育的基本内容包括:数据库及数据格式介绍、数据发现与获取、数据管理与组织、数据转换与互操作、数据质量保证、元数据、数据管理与再利用、数据保存、数据分析、数据可视化、数据伦理(包括数据引用)等。科学数据素养的核心能力包括理解数据、解读与评价数据、管理数据、利用数据。从上述分析来看,科学数据素养与信息素养类似,包括数据意识、数据管理知识与数据管理技能三个层次;同时,科学数据素养具有周期性,强调对科学数据展开的收集、加工、评价、管理和利用的活动,注重在科学研究基本流程中所需要的各种管理数据的技能;此外,科学数据素养更为强调分析数据、展现数据的能力以及数据管理工具的使用。

2.2 从学科专业的角度

具体到学科领域,对科学数据素养能力的要求更为具体和更具有专指性,如社会学强调数据的收集和统计分析能力,经济学专门开设计量经济学课程,强调数据分析和建模能力,生物信息学则强调以计算机为工具对生物信息进行储存、检索和分析的能力。在新闻学领域,哥伦比亚大学新闻学院数字新闻塔尔中心针对“数据新闻记者”这一新型职位,提出后工业时代新闻记者所应具备的六项硬技能中即包括数据与统计能力、掌握用户分析工具的能力和数据分析技能。学科领域的数据素养具有嵌入特性,这种嵌入性体现为教学方式的合作,例如加州大学洛杉矶分校社会学系教师与图书馆员合作开展数据素养教育口,专业教师教授科学研究方法论和专业知识,馆员传授数据的收集、存储与管理等技能,相互协作,发挥各自的优势。

2.3 从大数据的角度

与科学数据素养紧密联系的一个重要概念是“大数据”,按照维基百科的定义,“大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、管理和处理能力,大数据必须借由计算机对数据进行统计、比对、解析方能得出客观结果”,具有数量大、速度快、多样性和真实性的“4V特征”。2008年,《自然》出版“大数据”专刊,从网络经济、超级计算、生物医药等多方面论述大数据对科学研究造成的影响。2011年,《科学》刊载“数据处理”专题文章,围绕大数据的收集、组织、存取展开专题研究。2013年,与大数据相关的11项课题获得国家社科基金项目立项资助,涉及统计学、新闻学、图书情报学。从大数据角度来理解科学数据素养,其内容包括:一是大数据意识,能够清晰认识到大数据对科学研究的颠覆性意义,例如,数据是全样本的,数据处理流程从“由薄到厚”转向“由厚到薄”;二是数据分析与挖掘能力,如机器学习、深度学习、语义分析、预测模型等,具备从数据中萃取有价值情报的能力;三是解释与展示数据的能力,能够熟练运用软件工具,对分析和挖掘的数据进行解释与可视化展示。

综上所述,本文认为“科学数据素养”包括三个层次:具有“数据”意识,能够认识到数据是一种资源;具备数据基本知识与技能,熟悉数据生命周期与科学研究生命周期,在特定专业领域内具有查找、管理、利用与共享数据的能力,了解相关数据管理政策法规、数据伦理等知识;在大数据时代,能够利用数据资源发现问题、分析问题与解决问题。

3 国外高校图书馆科学数据素养教育的基本模式

大数据时代的来临使得科研人员对数据素养教育的需求更为迫切。图书馆是科学数据素养教育的主要承担者之一,国外部分高校图书馆已经开始对科研人员、研究生和数据服务人员进行科研数据管理意识、知识和技能方面的教育与培训。通过调查,笔者发现国外高校图书馆存在三种模式的科学数据素养教育。

3.1 利用Libguides建立科学数据管理资源导航,提供数据服务

该方式是科学数据素养教育较为初级的形式,主要提供科学数据管理资源的网络资源目录与导航,帮助研究者建立起对科学数据管理的初步概念,了解科学数据管理的方法、工具与可利用资源。表1列出了美国、澳大利亚及英国部分高校图书馆利用Libguides建立的科学数据管理资源导航的情况。

利用Libguides建立科学数据管理资源导航,主要是对“科学数据管理”这一概念及围绕此概念的数据管理计划、数据政策、数据共享、数据资源、数据伦理等内容,以及图书馆所能提供的服务、数据资源分布或是数据管理与共享平台等进行介绍,是对科学数据管理的总体介绍和分类梳理。

3.2 科学数据素养通识教育

科学数据素养通识教育主要面向研究生或者某一学科的研究人员,概览性地介绍数据管理的基本理论与方法,使学习者整体把握数据管理的基本知识。表2列举了部分欧美高校图书馆的科学数据素养通识课程。

科学数据素养通识教育内容比利用Libguides建立科学数据管理资源导航更为深入,以数据生命周期和科研生命周期为主线进行“通论”教育,介绍数据管理基本概念、数据管理与分析工具的具体操作与使用、数据管理政策与伦理等,部分课程还介绍该图书馆的数据管理平台,如宾州州立大学图书馆、哈佛大学图书馆分别介绍其数据管理平台School-arSphere、Dataverse,起到了宣传图书馆数据服务的效果。科学数据素养通识教育的教学形式多样化,包括开设选修课程、专题讨论、在线课程等。部分课程得到美国自然科学基金、美国博物馆与图书馆服务协会、英国联合信息系统委员会、英国数字管理中心等机构的资助。

3.3 学科专题数据素养教育

该模式针对具体学科领域开展数据素养教育,与前两种模式相比,针对性更强、内容更为系统与深入。调查发现,开展学科专题数据素养教育的高校图书馆较少(具体见表3)。

学科数据素养教育主要针对特定学科的需要而设置,其中弗吉尼亚大学图书馆的数据素养教育课程形成了较为完备的体系,按照数据生命周期纵向设计,在不同的学科领域横向展开,为特定学科研究人员提供专业的培训。不同的学科领域对数据素养教育的需求也不尽相同,譬如理工科的数据素养强调数据分析工具的使用,注重大数据环境下的数据挖掘与分析方法的利用。不同层次用户的教育需求也是有差异的,研究人员更为关注如何撰写研究数据管理计划,以适应科研资助机构的数据管理与共享要求,而研究生可能更为关注数据收集、分析与处理过程以完成具体研究的数据利用与管理。

4 国外高校图书馆科学数据素养教育的经验借鉴

我国部分高校图书馆在科学数据素养教育方面开展了有益尝试,如一些图书馆开展的科研管理软件、商业统计数据库的使用培训等。北京大学图书馆在其网站首页列出“数据服务”,以一小时讲座的形式提供IBM SPSS Statistics 20.0网络版的培训。但是,这些图书馆的行动基本处于起步阶段,与国外高校图书馆相比尚存在一定的差距,具体表现是:①对科学数据管理、科学数据素养概念缺乏系统的研究与理解;②对科学数据素养教育缺乏足够的认识和重视,缺乏相应的政策支持和服务设计;③尚未形成明确的数据素养教育模式,部分图书馆的培训仅涉及了科学数据素养某个方面的内容,如要么仅介绍数据资源的分布与获取方式,要么仅针对数据分析软件的使用方法进行培训。总体来看,国内高校图书馆科学数据素养教育的课程内容设计缺乏整体性和系统性。而国外不少高校图书馆的科学数据素养教育已经起步,自上而下的数据管理政策、良好的团队协助、扎实的科研数据管理实践项目等推动了教育内容和模式的不断创新与发展,形成了既有通识教育又有学科专业教育的多种模式和分别针对研究人员和研究生的课程内容。国外高校图书馆开展科学数据素养所积累的实践经验值得国内高校借鉴。

4.1 掌握科研人员数据管理需求,宣传科学数据素养理念

国际科学研究政策惯例与国家数据管理法律框架、科研资助机构的数据管理计划要求、学术论文发表的原始数据共享规定、所在机构的数据呈现保存政策等数据管理方面的各种政策与规范,对科研人员的数据管理知识和技能提出了挑战,成为数据素养教育的内在动力。国外不少高校图书馆在开展科学数据素养教育前都进行了不同形式的用户数据管理需求调查,如康奈尔大学图书馆从数据类型、数据与元数据的格式和内容、数据获取与共享政策、数据再利用等方面对85名科研人员进行了调查。弗吉尼亚大学图书馆对研究人员的访谈,旨在探寻科研人员管理数据时面临的问题与所需要的数据管理培训等。这些调查以不同方式了解用户数据管理的需求,为各个图书馆开展具有针对性的科学数据素养教育奠定重要基础。不同的国家与地区、不同的学校数据管理需求具有差异性,国内高校图书馆在开展科学数据素养教育实践前应与研究人员积极交流,准确掌握用户的具体需求,同时向他们宣传数据管理与共享理念。

4.2 基于科研生命周期设计教育内容,注重教学的层次递进性

国外高校图书馆科学数据素养教育的内容设计,从横向上看一般是围绕科学研究的生命周期展开,涉及数据收集、组织、管理、保存、利用与再利用活动,以及相关的数据政策、数据管理计划、数据共享等内容,注重数据分析工具、数据管理计划书的撰写、数据引用、数据伦理等知识与技能的培训;从纵向看,科学数据管理的资源导航、数据素养通识教育、学科数据素养教育构成了一个由浅入深的连续整体,具有层次递进性。我国科学数据素养教育在内容设计上也应注重与信息素养教育的区别,体现出科学数据管理的周期性与完整性,注意教育模式上层次的递进性,针对不同的学科领域不同的用户群体,展开系列的数据意识、知识与技能的训练。

4.3 注重合作,配备训练有素的教育馆员

科学数据素养教育并不是某个馆员能独立完成的,合作是开展科学数据素养教育的必经之路。国外高校图书馆开展科学数据素养教育也是采取合作的方式,由图书馆的学科馆员、技术专家、科研管理部门、院系等以团队形式协作开展,他们根据各自专长,调查数据管理需求、共同设计教学内容。其次,配备训练有素的教育馆员是国外高校图书馆成功开展科学数据素养教育的保障。为此,不少国外高校图书馆十分注重馆员本身的科学数据素养能力建设,如哈佛大学图书馆举办数据科学家培训班,着力提升馆员的数据管理能力。部分图书馆还设置专门的数据馆员岗位,推进数据管理与服务工作。由是观之,国内图书馆开展科学数据素养教育时应注意学科馆员、图书馆技术人员、科研管理部门、数据管理机构之间的相互合作,立足于已有的信息素养教育经验,提升馆员队伍的数据管理技能,适时拓展服务功能,探索适合本馆的数据素养教育模式。

4.4 依托数据管理平台推进科学数据素养教育

图书馆在资源采集、组织与服务方面具有传统的优势,应发挥科学数据管理的职能,为高校科研与教学服务。国外部分高校图书馆建立科学数据资源,为研究人员提供数据存储、管理与共享系统,建立用户与馆员之间交流互动的平台。如前文所述,宾州州立大学图书馆、哈佛大学图书馆、普渡大学图书馆等依托各自的数据管理资源与数据管理平台开展数据素养教育,同时在培训中介绍图书馆的数据管理系统、宣传数据服务项目。同时,图书馆也逐步形成自身的特色资源与服务,如康奈尔大学图书馆的研究数据管理服务小组提供数据存储、数据分析、数据出版等系列服务。

5 结语

综上所述,国外高校图书馆科学数据素养教育基本是从数据生命周期角度出发,围绕科研流程所需技能而展开,多数采取通识教育模式,仅少数图书馆针对具体学科领域开展专题教育。目前,学界与业界对科学数据素养概念尚未形成统一认识,现行的科学数据素养教育基本以信息素养教育为参考蓝本,缺乏大数据时代数据素养的特征。此外,对于如何评价科学数据素养教育、大数据环境下如何构建数据素养教育内容等问题也有待深入研究。毋庸置疑,适时开展科学数据素养教育活动能够在一定程度上满足科研人员的数据管理需求,是拓展与深化高校图书馆服务功能的有效途径之一,也是高校图书馆积极融入学术交流与大数据环境的战略选择。积极探索科学数据素养教育的内容和模式,提高科研人员的数据管理意识和能力,将是图书馆在未来的科学数据管理服务工作中所需努力的方向之一。

猜你喜欢

高校图书馆大数据
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广活动研究
试论高校图书馆在网络环境冲击下的人文建设
大数据环境下基于移动客户端的传统媒体转型思路
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索