基于信息生命周期的高校图书馆数据监护流程分析
2016-04-12周淑云
周淑云 伍 丹
(湘潭大学公共管理学院,湖南湘潭 411105)
基于信息生命周期的高校图书馆数据监护流程分析
周淑云伍丹
(湘潭大学公共管理学院,湖南湘潭 411105)
[摘要]科研数据作为科研创新的基础,对其进行有效的管理尤为重要。通过引入信息生命周期理论,探究在整个科研数据周期中,高校图书馆在数据监护中的作用,提出高校图书馆开展数据监控的启示:充分认识到数据监护工作开展的重要性,制定数据监护的长期规划;制定数字资源的长期保存计划,保障数据监护工作的有序开展;加强科学素养教育,培养专业数据监护人员;注重保护科研数据的知识产权,促进科研数据的交流与共享。
[关键词]信息生命周期高校图书馆数据监护
1前言
随着计算机技术的发展与互联网的普及,电子科研(e-science)时代到来,大量科研数据产生。海量的科研数据为科研人员带来前所未有的机遇与挑战,一方面科研数据作为信息时代最基本、最活跃的战略资源为科研创新提供了强有力的保障,另一方面e-science环境下产生的大量科研数据不仅数量多、类型复杂、管理难度大,而且在促进科研数据共享方面也面临着难题。目前,我国已经认识到科研数据的重要性,国家层面的有科技部的“科学数据共享工程”[1]和中科院的“中国科学院科学数据库”[2],但是基层科研单位的大量科研数据并未得到有效的管理。高校图书馆作为数字资源长期保存的主要机构,对数字资源的管理一直秉承“重保存,轻管理”的做法,如何进一步提升信息服务能力,是高校图书馆面临的重大挑战。近年来数据监护(data curation)成为图书馆科研服务的研究热点,不仅为科研数据的管理提供了有效的手段,也能为高校图书馆的信息服务能力的提升提供可能。笔者基于信息生命周期理论,对高校图书馆的数据监护工作进行探析,以明确高校图书馆在数据监护工作中的作用。
2信息生命周期概念
生命周期原为生物学领域的概念性术语,是指一个生物从出生到消亡所经历的各个阶段。信息生命周期最早由Levitan在1981年提出,他认为信息或信息资源是一种“特殊商品”,具有生命周期特征,具体包括信息的生产、组织、维护、增长和分配[3]。1985年,Horton在《信息资源管理》中提出,信息是一种有生命周期的资源,其生命周期由一系列逻辑上相关的阶段或步骤组成,体现了信息运动的自然规律,并由此定义了两种不同形态的信息生命周期:一是基于信息利用和管理需求的信息生命周期,由需求、定义、收集、传递、处理、存储、传播、利用7个阶段组成;二是基于信息载体与信息交流的信息生命周期,包括交流、利用、维护、恢复、再利用、再包装、再交流、降低使用等级、处置10个阶段[4]。信息生命周期在21世纪初正式进入主流研究视野,ISO/TC171文件成像应用技术委员会在2000年的伦敦年会上正式通过了405号决议,将ISO/TC46”信息技术委员会”的一个分委员会改为“信息生命周期管理”技术委员会,该决议称“信息无论是以物理形式还是数字形式管理,其信息生命周期均为信息的生成、获取、标引、存储、检索、分发、呈现、迁移、交换、保护与最后处置或废弃”[5]。笔者认为数据监护工作中的科研数据属于信息的一种具体形式,其生命周期符合信息的生命周期理论,但是还要注意文章讨论的科研数据的生命周期是一个动态的循环过程,不断有数据被废弃,同时又有新的数据产生。
3数据监护的内涵及实践
数据监护(data curation)是一种对科研数据进行管理的方法,它通过对科学数据收集、组织、查证和保存,使科研人员在以后的研究中发现这些数据的新价值。Choudhury认为数据监护是对数据进行收集、验证、组织及储存维护,以供科学家在面临的各种科研挑战时使用的活动[6]。笔者认为数据监护要注重对科研数据进行筛选与鉴定,有选择地进行监护,同时也要注意将科研过程中产生的重要科研数据纳入数据监护的范畴,对科研数据进行动态管理,使科研数据能最大限度发挥其价值。
国外的数据监护已经由理论走向实践,不少高校图书馆纷纷推出基于数据监护的学科服务及相关项目。其中较有影响力的是美国国家科学基金会NSF(the National Science Foundation)在2007 年启动 DataNet 计划,预算花1亿美元,明确以图书馆为主体,用5年时间资助5项数据监护重点研究课题,以推动数据监护工作,目前已经有两个课题获得全额资助,分别为墨西哥大学主持的DataOne(Data Observation Network for Earth)项目[7]和由约翰霍普金斯大学图书馆主持的Data Conservancy项目[8]。针对数据监护开展相应的教育与培训,如IDEA(International Data Curation Education Action)工作小组就是一项为了促进教育领域和研究领域的人员在这一方面的合作而产生的职业教育交流项目。[9]同时一些大学也纷纷开展数据监护的相关课程,如伊利诺伊大学图书情报研究院、缅因州大学、雪城大学信息学院等都开展了专门的数据监护课程,授课对象主要为研究生,旨在培养数据监护的专业人员。
我国在数据监护方面仍处于起步阶段,尚未有成熟的数据监护项目。虽然高校图书馆对于数字资源长期保存已经有20余年的研究,但是其工作重点仅停留在数据的保存,对于数据的管理能力仍有待提高。目前,除积极介绍国外关于数据监护的相关项目外,国内的图书馆界也积极探索图书馆在数据监护方面发挥的作用,借鉴国外的经验,提出具体的图书馆的服务内容与形式,有利于指导图书馆开展数据监护工作,抢占数据监护高地。
4信息生命周期视域下图书馆在数据监护中的作用
科研数据的生命周期主要包含的核心阶段为:数据产生——数据收集——数据整理——数据发布——数据利用[10],科研数据的生命周期意味着通过对科研数据的管理与保存,实现资源的发掘与再利用。针对科研数据的生命周期,高校图书馆可嵌入基于信息生命周期的数据监护,相应的科研数据监护流程可划分为:收集、评介、组织、处理、描述、访问、再利用,同时也要考虑科研过程中产生的新数据的收集与旧数据的剔除。
在科研数据生命周期的上游阶段——数据生产阶段,高校图书馆在宏观上需要与学校相关机构共同制定相关的政策,如数据提交政策、数据管理策略、数据长期保存策略,以明确数据监护的各阶段的主要任务,保证数据监护的实施。微观上,图书馆应在科研数据产生前,参与到科研项目中,与科研人员共同对将产生的数据类型、数据量等进行评估,确定相应的数据筛选方案、数据提交格式等。同时图书馆也可为科研项目提供数据检索与分析服务,图书馆员可作为嵌入学科馆员针对科研人员的信息需求进行数据检索,并对相关数据进行整理、分析,以便科研人员判断数据的可用性并根据反馈意见及时调整检索策略。在这一阶段,图书馆主要通过与科研人员的合作实现其作用,如麻省理工学院图书馆通过与科研人员(团队)合作,将科学数据咨询服务馆员嵌入到科研工作过程之中,为科研人员提供及时、准确的科学数据需求。[11]
高校图书馆在数据监护工作中的重点主要体现在数据生命周期的中游阶段。在这一阶段,图书馆的工作重点与难点主要为知识的抽取。首先,图书馆对于产生的未发表的科研数据提供存储服务,制定学科馆员帮助科研人员对产生的数据进行规范存储,并定期更新,同时对所存储的数据的名称、类型等进行简单描述。其次,对科研数据进行评估,根据相应的数据筛选方案,剔除没有价值的数据,有选择性的对数据进行保存与监护。数据监护管理的科研数据是不断更新,因此为满足科研人员与用户的信息需求,需要构建数据中心或数据库将评估和选择完的数据转移到里面,这就需要对所存储的数据格式进行转换,如设计相关的元数据、不同元数据标准或不同数据之间的交换形式等,对转移的数据进行长期保存,同时存储前注意数据的完整性,没通过预处理的中间数据是暂时的、动态的,这部分数据在后续的科研结束后可能具有长期保存的价值,因此对于这部分数据进行暂时性的归档和维护。[12]另外,在这一阶段需要确定不同科研人员与用户的对于数据的使用权限,确保有权限的使用者能够及时访问。高校图书馆在数据生命周期的最后阶段主要为提供科研数据的共享服务,在此阶段通常产生大量的有价值的数据,通过与科研人员的交流,确定共享的数据,并帮助其完成数据提交,同时注意调整数据的访问权限。图书馆在科研项目结束后也要保持同科研人员的联系,以保证及时更新数据库中的数据,与科研人员协商,确定公开的范围。[13]同时高校图书馆也要注意在数据监护过程中数据共享产生的知识产权问题。
此外,高校图书馆在数据监护工作中不仅作为主要参与者,同时承担着数据监护专业人员培养的任务。专业人才的培养实践已经在国外的高校图书馆积极开展,如美国北德克萨斯大学信息学院与图书馆通过合作的方式,开设了Graduate Academic Certificate in Digital Curtation and Data Management的课程,通过在线课堂的方式在三年内教授研究生(除图书情报专业的硕士、博士研究生外)4门课程,目前已经开设两门:数据监护基础和数据监护工具、应用与基础设施,未来还将开设数据管理与保存、数据管理研究两门。[14]一直以来图书馆以信息素养培训的主要机构存在,尤其是高校图书馆依托自身优势,积极与其他机构合作,培养用户的“科研数据素养”以应对电子科研(e-science)时代的到来。
5我国高校图书馆开展数据监护的启示
数据监护作为一项新兴的知识服务,国外的高校图书馆已积极展开实践,我国的图书馆界也开始意识到数据监护的重要性,因此笔者旨在通过上述高校图书馆在数据监护中的作用,为我国高校图书馆开展数据监护服务提供参考与启示。
5.1充分认识到数据监护工作开展的重要性
在高校图书馆开展数据监护工作首先要充分认识到数据监护对于高校图书馆的重要性。高校作为科研活动开展的重要场所,各种类型的科研数据不断产生,在e-science的背景下这些科研数据以电子的形式记录下来,存在着科研数据丢失与利用价值低的风险,因此科研工作人员迫切需要图书馆搭建科研数据交流与共享平台,以充分发挥科研数据的信息价值,而图书馆可依托自身的软硬件优势,积极宣传数据监护,使高校科研人员充分认识到其重要性,进而开展数据监护工作,制定明确的数据监护策略与发展规划,图书馆员以学科馆员的身份参与到科研项目中去,积极搭建数据交流与共享平台,加深学科服务的深度与广度,提升自身的信息服务能力,使高校图书馆成为提供知识管理的重要阵地。其次,数据监护工作的开展需要大量的资金投入,这就需要学校的相关部门与领导的大力支持,通过引入相关设备与专业人员,为图书馆开展数据监护工作提供保障。
5.2制定数字资源的长期保存计划
数字资源作为数据监护的对象,有关数字资源的长期保存尤为重要。数字资源的长期保存作为数据监护的基础环节,为数据监护提供数据源和基础性保障;数据监护则有利于保障数字资源长期保存计划的实施与优化。[15]在电子科研的时代背景下,大量数字资源不断产生,科研人员对数字资源的依赖程度与日俱增,这就促使高校图书馆制定有效的数字资源长期保存计划。国际图书馆协会与机构联合会(International Federation of Library Associations and Institutions,简称IFLA)与 国 际 出 版 商 协 会 (International Publishers Association,简称 IPA)在 2002 年联合发表的《永久保存世界记忆:关于保存数字化信息的联合声明》中明确规定:“出版者应该担负短期保存的责任,长期保存的责任应由图书馆承担”。图书馆只有将科学数据纳入长期保存的范畴,以主动的姿态承担起科学数据长期保存的责任,以数据监控为契机,才能寻求新的生长点。
5.3加强科学素养教育,培养专业数据监护人员
数据监护工作具有专业性与复杂性的特点,这就需要负责这项工作的人员具备相关的专业知识与较高的信息素养。培养用户的信息素养一直以来就是高校图书馆的主要任务之一。由于数据监护刚刚在我国兴起,关于这方面的研究主要停留在理论研究方面,因此高校图书馆一方面需要增强自身在数据监护方面的专业技能,不断学习科研数据管理方面的专业知识,借鉴国外相关的管理经验,为图书馆的工作人员开展专业的科学素养教育,通过为科研人员提供课程培训,提高科研人员的数据意识,增强其收集数据、管理数据、分析数据的能力。有条件的图书馆应该积极参与国际大型数据监管培育项目,邀请国内外数据专家为图书馆员进行技能培训,并设置专门的数据监护员职位。另一方面,专业人才至关重要。美国雪城大学秦健博士在《E-science环境下的信息服务、信息组织和信息系统》报告中总结当前图书馆参与科学数据管理所面临的问题,其中之一即是缺少具备专业技能的人员来提供数据管理服务[16]图书馆可以与相关专业的院系或机构开展合作,开设相关课程与学位,培养专业的数据监护人员。
5.4注重保护科研数据的知识产权
科学数据作为科研产出的重要内容,其知识产权保护问题一直是被关注的重点,欧美等发达国家已经制定了相关政策法规。美国在1996年颁布了国有科学数据完全与开放的国策,在不同的应用领域和部门,科学数据共享相关的政策管理和规章也相继出现,这些政策法规很好地促进了各自领域中的数据资源与信息的共享,协调了共享过程中出现的问题。英国在1998年制定了《数据保护法》(Data Protection Act 1998)、信息自由法案(Freedom of Information Act 2000)、环境信息条例(The Environmental Information Regulations)。[17]这些政策法规既保障了科研数据的知识产权,也促进了科研数据的交流与共享。在我国并没有相关的政策法规对此进行保护,科学数据引用问题也是目前科学数据领域研究的热点之一,大量科学数据被用在科研以及文献中,但是并没有对其引用状况进行标识和应用,导致科学数据的价值没有有效体现出来。因此高校图书馆可具体划分科研数据的密级,并适时更改密级,科研项目组可向图书馆提供具体的有访问权限的名单,图书馆根据名单予以开放。同时图书馆可与科研人员签订相关协议,以确定科研数据的具体公布情况,用于保证科研数据的知识产权。
6结束语
数据监护实质上是对科研数据的整个生命周期进行管理的知识服务,对于发挥科研数据的价值,推动高校科研进步有着重要的意义。目前我国对于数据监护的研究刚刚起步,由于其自身的专业性与复杂性,需要国家、社会尤其是图书馆界的全面支持。图书馆应评估数据监护的可行性与必要性,制定数据监护的宏观计划,积极开展与相关机构的合作,履行自身在数据监护工作中的作用,提升馆员的知识服务能力,推动图书馆的发展转变。
参考文献
〔1〕科学数据共享工程[EB/OL].[2015-08-14].http://www.science.data.cn/index.php
〔2〕中国科学院科学数据库[EB/OL].[2015-08-14].http://www.csdb.cn/in?dex.jsp
〔3〕LevitanK B.Information resources as“goods”in the life cycle of information production[J].Journal of the American Society for Information Science,1981,33(1):44- 45
〔4〕Horton FW.Information resources management[M].London Prentice Hall.1985
〔5〕李铭.看国际动态,找国内差距,促技术发展[J].缩微技术,2002(2):25-29
〔6〕Choudury S.Data Curation:An Ecological Perspective[J].College &Research Libraries News.2010,71(4):194-196
〔7〕DataONE[EB/OL].[2015-08-14].https://dataone.org/
〔8〕DataConservancy[EB/OL].[2015-08-14].http://dataconservancy.org/
〔9〕刘霞,刘小杏.数据监护范例分析——以DataCite、 DCP和IDEA Working Group为例[J].大家,2012(9):101
〔10〕丁宁,马浩琴.国外高校科研数据生命周期管理模型比较研究及借鉴[J].图书情报工作,2013(6):18-22
〔11〕Lincoln Laboratory Grid(LLGrid)[EB/OL].[2015-8-16].http://www.11.mit.edu/news/11grid.html
〔12〕樊俊豪.图书馆在科学数据管理中的角色定位研究[J].图书情报工作,2014(6):37-41
〔13〕沈婷婷,卢志国.科研项目不同阶段的科学数据监管方法[J].图书馆建设,2013(3):49-51
〔14〕UNT Receives More Than $800,000 in Funding to Investigate Needs in Archiving Research Data[EB/OL].[2015-08-17].http://untsystem.edy/news/2011/August/11-08-09-arch-res-data.html
〔15〕程连娟.美国高校图书馆数据监护的实践及其启示[J].图书馆杂志,2012(1):76-78
〔16〕肖潇,吕俊生.E-science环境下国外图书馆科学数据服务进展[J].图书情报工作,2012(17):53-58,114
〔17〕刘细文,熊瑞.国外科学数据开放获取政策特点分析[J].情报理论与实践,2009(9):5-10
Research on Data Curation of University Library Based on Information Life Cycle Theory
Zhou ShuyunWu Dan
[Abstract]Scientific data is the basis of scientific research and innovation, so the management of scientific data becomes important. Through the introduction of information life cycle theory, the paper explores the role of university library in data monitoring, and points out the importance of data monitoring. Then the paper suggests that university library should make a long-term plan of data monitoring, develop the long-term preservation plan, ensure the orderly development of data monitoring, strengthen the scientific literacy education, train professional data monitoring personnel, and focus on the exchange and sharing of scientific data.
[Key words]Information life cycle;University library; Data curation
[中图分类号]G250.7
[文献标识码]A
〔作者简介〕周淑云,湘潭大学公共管理学院副教授,博士。研究方向:信息法学,图书馆管理等,已发表论文30余篇;伍丹,湘潭大学公共管理学院14级研究生。