基于UKDA研究数据生命周期的图书馆学科服务模式研究
2018-07-26李杨裴丽
文 / 李杨 裴丽
大量数据的产生使得科学研究正处于信息海啸的边缘,如何对大量的研究数据进行有效的管理成为学界关注的焦点。2017年3月,OCLC发表的《研究数据管理的现实》系列报告强调:“研究数据管理已经成为高等教育中十分重要的一个领域,需要对服务、资源和基础设施进行大量投资,以支持研究人员的数据管理需求。”[1]
图书馆作为学校信息知识中心,逐渐提高了对研究数据管理的关注度。2016年,在美国大学及研究型图书馆协会计划与评估委员会发表的图书馆学领域十大研究趋势中,“研究数据服务”位列第一。《新媒体联盟地平线报告:图书馆版》连续在2014年、2015年和2017年三版中都将“提升研究数据管理的关注度”作为图书馆研究的关键趋势。国内学者也将“研究数据服务”列为图书馆学研究以及高校图书馆业务发展持续关注的主题领域[2]。在数字科研环境下,高校图书馆有必要将学科服务嵌入科研过程,融入研究数据生命周期各环节,以用户需求为核心,提供研究数据管理服务,从而提高科研用户的工作效率,促进科研创新。
一、UKDA研究数据生命周期模型
生命周期原本是生物学术语。1980年代美国学者将“生命周期”概念引入信息管理学领域。Levitan认为,信息生命周期包括信息的产生、组织、维护、增长以及分配[3]。研究数据是在科研过程中所产生或获取的各类数据信息资源。它同一般信息资源一样,具有生命周期的特征。目前得到学术界较多认可的研究数据生命周期模型有数据归档倡议(DDI)研究数据生命周期模型、数字数据管理中心(DCC)研究数据生命周期模型、DataONE研究数据生命周期模型、英国数据规定中心(UKDA)研究数据生命周期模型等。
UKDA研究数据生命周期采用环形结构描述研究数据生命周期。该模型将研究数据生命周期归纳为6个节点:数据创建、数据加工、数据分析、数据保存、数据访问、数据再利用[4],见图1。
图1 英国数据规定中心(UKDA)研究数据生命周期模型
与其他模型相比,UKDA研究数据生命周期模型更加直观,层次也更加简洁。虽然UKDA研究数据生命周期模型的主要适用对象是社会经济科学研究,但是鉴于其对研究数据生命周期较为全面且简洁的描述,该模型可为即将或刚刚开始研究数据管理的机构提供借鉴。
二、嵌入研究数据生命周期的学科服务模式
将学科服务嵌入研究数据生命周期,就是要将图书馆服务融入研究数据生命周期的各环节,对研究数据进行有效的组织管理,以学科服务的形式提供给科研用户,协助科研的开展,推进科研创新与成果转化。
(一)数据创建阶段
在数据创建阶段,学科服务团队应聚焦两方面服务内容。第一,制定研究数据管理规划。在科研项目开始之前,学科馆员应协助科研人员制定研究数据管理规划,规划内容应包括研究数据的格式选取、存储方式、数据分析及共享方式等。学科馆员还应积极为科研人员提供各种研究数据管理计划工具,并对制定的数据管理规划进行审核,提高效率,合理分配资源。第二,挖掘以往相关研究数据,实现数据再利用。UKDA研究数据生命周期模型是一个闭合环路。研究开始前,学科馆员应对以往相关研究数据进行挖掘,将能够支撑本次科研项目的数据提供给科研人员,使新的科研活动在以往数据的基础上开展,降低科研成本,体现研究数据管理的价值与意义。
(二)数据加工阶段
研究数据格式复杂、载体多样、内容繁杂。为了让数据更好地服务科研,学科服务团队应适时地协助科研人员收集研究数据,清理冗余数据,对研究数据格式、载体、命名等进行规范化监管。由于学科差异,科研过程存在不同。对于不同科研过程中产生的研究数据,学科馆员应协助研究人员进行元数据处理,并向研究人员介绍相应的元数据标准或提供元数据处理工具,为用户建立元数据记录,以提高不同科研方式与过程中产生的数据之间的可操作性,提高数据被发现的几率。
(三)数据分析阶段
在数据分析阶段,图书馆学科服务的主要任务是萃取和提炼研究数据中的信息知识[5]。学科馆员需要对经过标准化处理的研究数据进行分析,挖掘数据之间的潜在规律,对数据特征及内涵进行说明,将研究数据进行关联化处理,实现数据升值。学科馆员可以将分析结果以报告形式提供给科研人员,也可以在科研人员授权的前提下,将分析报告出版,向社会公开发表。
(四)数据保存阶段
数据保存服务是嵌入式学科服务的核心内容。数据保存的对象既有研究过程中产生的一次数据,也包括学科服务团队对研究数据进行分析、组织得到的数据集合。数据保存应按照统一格式,迁移至适当的媒介当中,并进行定期备份与更新维护。学科服务团队应充分发挥图书馆文献信息中心的职能,依托资源与专业优势,为科研项目或学科搭建知识库,将科研数据及其衍生数据按照安全与共享相协调的原则进行保存与备份。
(五)数据访问阶段
在数据访问阶段,学科服务的内容主要包括提供数据共享、发布、检索等。学科服务团队提供数据共享服务时,应注重保护科研人员利益。高校图书馆可根据科研人员意见设定共享级别,对于不同数据与不同用户,设定相应共享权限。数据发布包括对内与对外发布。对内发布是指将研究数据及其衍生数据等向科研团队内部发布;对外发布则是指经过科研人员授权允许后,将研究数据及其衍生数据向科研团队以外的社会公开。学科馆员还应发挥专业优势,帮助科研人员用正确的检索方式快速获取研究数据,以支持科研活动的进行,提高数据利用率。
(六)数据再利用阶段
在开展新研究之前,学科馆员应对以往相关研究数据集进行调研,在以往研究数据的基础上,开展新一轮的研究活动。这不仅能够避免重复工作,提高研究效率,降低科研成本,而且可以基于以往研究数据,制定新一轮的研究数据管理计划与科研活动计划,为嵌入研究数据生命周期的学科服务做好准备。
三、开展嵌入研究数据生命周期学科服务的若干建议
(一)需求分析
用户需求是开展嵌入式学科服务的出发点与落脚点。高校图书馆在开展嵌入研究数据生命周期的学科服务之前,应充分调研科研人员需求,坚持以用户需求为导向,指导服务的开展。目前,较为成熟的用户需求识别方法主要有:基于数据管理计划识别法,即通过研究数据管理计划揭示科研人员服务需求;基于结构化访谈工具捕获服务需求,即通过一些结构化访谈工具,了解用户需求;基于大规模调查问卷收集用户需求,即通过广泛发放调查问卷获取用户需求[6]。
(二)政策支持
图书馆开展嵌入研究数据生命周期的学科服务,需要有相应政策对服务进行规范与管理。2018年3月17日,我国实施了《科学数据管理办法》。该办法对研究数据的采集与保存、共享与利用、保密与安全等作出了规定。高等学校作为《办法》规定的研究数据管理主体之一,有必要在国家层面政策指导下,提升对研究数据的重视程度,制定适合本校情况的研究数据管理政策,明确研究数据管理内容,规范管理行为,并突出图书馆在本校研究数据管理服务中的主体地位,给予图书馆政策支持,提高科研人员对于图书馆服务的信任度。
(三)用户培训
由于专业限制,科研人员可能并不具备较高的数据素养。这制约了研究数据管理服务的水平。因此,面向科研人员开展数据素养培训对于开展嵌入研究数据生命周期的学科服务具有积极意义。高校图书馆在开展服务之前,应该对研究人员进行数据素养教育,提升研究人员的数据意识,丰富研究人员数据技能,让研究人员认识到研究数据管理的重要性,主动接受研究数据管理服务。数据素养培训可以通过授课、集中培训、单独辅导、自主学习、研讨会等形式开展,通过微信、网站、APP等途径向研究人员提供数据素养知识,开展全方位、多渠道的数据素养培训。
(四)技术支撑
图书馆开展嵌入研究数据生命周期的学科服务,需要完善的硬件环境,包括服务器、存储、通讯设备、计算机等。先进技术的介入能够提高服务水平与效率,如利用“云计算”实现研究数据的存储与共享;利用可视化技术对数据进行分析,发现数据关联;重视人工智能在服务中的应用;重视数据挖掘技术在用户需求捕获中的应用等。开展嵌入研究数据生命周期的学科服务在技术层面最核心的内容是构建一站式服务平台。平台的设计目标是实现全部研究数据管理的服务内容,提供管理计划制定、数据存储、数据下载、数据分析等功能。平台的构建不仅能够提高学科馆员的服务效率,而且能够帮助研究人员更加便捷地储存、共享、获取研究数据,实现研究数据一站式管理。
(五)机构合作
图书馆开展嵌入研究数据生命周期的学科服务,是一项复杂的服务项目,对于小型图书馆来说,开展的难度很大。针对学校规模较小或图书馆能力较弱的情况,应协调多部门合作,有效整合校内资源,为开展研究数据服务提供捷径。学校应建立以图书馆为核心的研究数据服务机构集合,整合学校科研管理、信息技术等部门,各自发挥优势,推动研究数据服务的顺利开展。
四、结语
当前科学研究已进入数字科研环境,研究数据的价值日益显现,研究数据已成为最重要的资源。高校图书馆作为学校的文献信息中心,有义务为科研人员提供高水平数据服务,助推科研。当前,我国高校图书馆开展嵌入研究数据生命周期的学科服务实践案例较少,仍处于起步阶段。我国高校图书馆在开展嵌入式研究数据服务时,应借鉴国外成功案例,构建适合本校科研工作特点的研究数据生命周期模型,将学科服务嵌入到研究数据生命周期各环节,提供优质高效的研究数据管理服务。这对于提高科研效率、促进科技创新、转变图书馆服务模式都有积极的作用。