APP下载

高校图书馆科研数据管理实践研究
——以西英格兰大学为例

2020-06-13吕方婷

图书馆学刊 2020年5期
关键词:知识库数据管理科研人员

李 卉 吕方婷

(上海大学图书情报档案系,上海 200444)

随着E-Science的发展与开放获取运动的影响,科研数据在科研活动中发挥着越来越重要的作用,而传统的科研模式也正朝着数据密集型的模式发展。图书馆学界也结合自身优势,拓展与深化原有的服务,对于科研数据的管理与服务有了诸多探究与实践。

1 科研数据管理简述

科研数据(Research Data)是指数字形式的研究数据,包括在研究过程中产生的能存贮在计算机上的任何数据,也包括能转换成数字形式的非数字形式数据[1]。格式没有限制,可以是文本型、数值型、多媒体型(音视频等),也可以是模型和软件等。科研数据管理(Research Data Management,RDM)是围绕科研数据的生命周期为科研人员提供的一系列的活动与服务,包括对科研数据进行计划、组织、存储、分析、整合、获取、共享和再利用。有效的科研数据管理能够帮助科研人员提高科研效率,实现科研数据的共享,同时也避免了科研活动的重复劳动。图书馆开展科研数据管理与服务,不仅是科研人员的外在需求,同时也是图书馆发展的内在需要[2]。

2 国内外科研数据管理实践研究现状

国内对于科研数据管理实践的探讨,主要集中于借鉴国外的案例总结及经验分享,为我国的科研数据管理实践给出建议。涉及国家与地区有香港[3]、新加坡[4]、英国[5]、澳大利亚[6]、加拿大[7][8]、美国等,切入角度有高校科研数据管理实践的要素:政策制定、基础设施、服务、利益相关者和资金模式[9],或是分析其科研数据管理服务阶段、服务体系和学科教育实践[10],亦或是对服务方式、服务内容、合作机制加以剖析[11]。结合科研数据的生命周期,分析国外高校科研数据管理与服务的共性与特点,深入服务内容本身。国外的研究相较于国内而言更为成熟,实践层面也有案例研究分析如土耳其的大学[12]、布里斯托大学[13],理论层面从多角度探讨RDM服务发展所需的框架要素与标准[14],对科研过程和科研数据管理的生命周期模型进行批判性分析[15]。尽管国内已有诸多高校陆续开展了科研数据管理与服务工作,但多是基于实践内容的探究,涉及到系统化流程研究的较少。西英格兰大学(University of the West of England-Bristol,以下简称UWE)依托于项目建设,逐步推进自身的科研数据管理与服务,总结出一套较为完善的流程步骤,可为我国高校开展和推进科研数据管理实践工作提供建议与参考。

3 E UWE科研数据管理案例分析

西英格兰大学位于英格兰西南部第一大城市布里斯托,是一所现代化且极具活力的英国高校,也是英国大学联盟成员之一。学校历史可以追溯到1595年,历来有重视专业教育与培训的传统,拥有完善的科研战略计划,同时紧随英国高等教育科研质量评估系统(Research Excellence Frame⁃work),十分注重高校科研为经济与社会传播学术知识。

UWE的MRD(Managing Research Data)项目由JISC资助,以健康与生命科学学院为试点,旨在建立符合高校文化和行政的合适流程、框架和指导,满足科研人员的需求,分阶段完成与产出结果。UWE自2010年开始就构建自己的机构知识库,现还有数据存储库,两库并存各有侧重,为本校科研人员提供科研数据政策、数据管理计划、数据共享、数据存储等相关服务。

结合UWE的项目与实际成果,可抽象概括出高校图书馆开展科研数据管理实践中的一般流程化示意,如图1所示。

图1 高校图书馆科研数据管理流程

3.1 团队的组建

UWE图书馆的科研支持团队一直在不停地更迭与重组直到目前的状态。多年来,对研究的支持工作从属于学科馆员职责中的一小部分内容。随着开放获取运动的发展与影响,UWE图书馆在2010年推出了自己的机构知识库,因而又增添了一名负责推广和维护机构知识库的图书馆员,以及一名参与政策制定和宣传的馆员。而后随着UWE战略计划的改变,“有影响力的研究”成为一个越发突出的领域。为此图书馆引入了一个新角色——科研知识交流(R&KE)馆员,并逐渐意识到与其他部门合作的重要性,在一个更广泛的团队中共享科研支持活动和专业知识(如财务、版权等方面)。之后,由于近一半R&KE馆员达到退休年龄的原因,UWE图书馆重新审度,又引入了科研开放获取馆员,这也是对项目基金资助者日益增加的开放获取要求和HEFCE对2014年后的REF要求的回应,但同时也增加了宣传推广的压力与工作。目前UWE图书馆的科研支持团队由一名兼职的图书馆研究经理(前R&KE图书管理员)、科研开放获取图书馆员、科研支持图书馆员(存储库)和图书馆信息管理员(存储库)组成,该团队负责向科研支持管理层报告[16]。

在科研数据管理的实践过程中,所涉及的人员远远不止图书馆的员工,还包括高校的科研办公室、IT技术与服务部门、中高层领导、财务部门、相关学院等等。然而为什么由图书馆来牵头和负责更为合适呢?一是源于图书馆员更明确用户的需求,这也是图书馆开展服务的基础;二是源于图书馆作为信息与知识的交流中心,深知不妥善管理信息和数据的危险性;三是源于图书馆的日常工作已经与相关工作有交集,包括存储、组织、共享等;四是源于馆员的信息或者数据素养的形成与指引;五是源于图书馆员没有繁重的科研工作,作为行政管理人员更容易起到专业知识管理、交流和桥梁沟通作用[17]。当然在实操过程中,团队的组建还是需要根据高校的实际情况与特点进行。

3.2 前期的预调研

前期的预调研是十分重要而又复杂的,在这个过程中,能够明确高校对于科研数据管理相关内容的一定把握。结合高校的科研特点,可以包括收益风险矩阵、科研人员的意识与态度,科研数据管理的影响因素(思维导图)形成初步的报告与认知。

UWE认为科研数据管理的收益-风险矩阵[18]可以很好地展现利益相关者的收益风险关系,并能实现更广泛的机构参与和理解。纵轴包括长期利益、短期利益、即获利益、即刻风险、风险5部分,横轴包括普通大众、政府、出版环境、研究理事会、UWE、科研过程、数据、科研人员8个部分;并加以颜色区分。这个矩阵可以帮助UWE在建设科研数据管理与服务之前,事先了解整体的大环境与相关利益者的收益与风险关系,从而采取适合自己高校的相关策略和制定更为适切的目标。

UWE重点考虑了科研人员的意愿和需求,开展过两次关于科研人员的调查,运用问卷调查、访谈以及数据分析等3种方法对UWE的科研人员进行调查与分析。其一是为了支持大学的科研愿景。UWE图书馆选取了健康与生命科学学院的科研人员作为试点,分析其特定的信息需求。对该试点研究进行评估后,调查扩展到整个大学的研究人员,为图书馆提供支持科研人员信息需求的战略。UWE认为科研人员更注重期刊全文的访问以及存储数据,期望得到更多的指引帮助和培训,简化图书馆网站的设计,改善校园内外对电子期刊和数据库的访问。其二是关于科研人员对开放获取出版和存储库的态度调查。该调查是与存储库支持项目(RSP)和其他英国大学知识库合作组织的,旨在与英国高等教育机构建立存储库容量、知识和技能提供可参考性的资料。内容包括对开放获取运动的态度、科研项目基金、UWE的机构知识库、版权问题、出版问题。并依据实际可靠的调研结果形成一个全面的宣传计划,目的是进一步将UWE机构知识库嵌入UWE的科研学术流程中,并为高校制定相关科研数据管理政策给予参考。

UWE评估了之前关于科研数据管理项目的成果,结合自身学校特性,概念化自己过去的工作经验而构建模块,以形成科研数据管理方面的思维导图,也可认为是在实践过程中的影响因素。这对于思考科研数据管理早期的规划十分有帮助,也适用于其他机构和组织。该思维导图包括科研数据的长期储存问题(包括软硬件设施、政策、共享限制、元数据标准、长期储存需求、数据管理实践等)、科研数据文档(包括数据类型、格式、量级等)、服务需求(包括指导与帮助、管理责任、政策指引等)以及管理实践(包括共享数据、基金会的需求、元数据、互操作、回溯、共享等)。

3.3 成熟度模型

UWE初步使用的是目标运营模式的成熟度模型,包括8个方面:自测及评估方法在于邀请关键利益相关者通过相应的描述,若觉得相符便在A3纸大小的模型内8个部分中的每一个对应位置来确认他们对UWE当前研究数据管理准备情况。使用基本算法以1-5级的方式取得队列的平均得分,受访者一般在该整数的得分框内标记任何一个,只有受访者在两个方框之间放置标记的情况下才会添加粒度(0.5),求得每项平均分后再作具体分析。

随后UWE精简了这个成熟度模型[19],从6个方面便可揭示之前8个方面的科研数据管理准备情况。通过该模型,高校或评估机构能够自测是否准备好进行RDM的过程。同时还可在一定时间之后重复进行自测并指示进度的度量。图书馆团队或管理层的成员,可以通过与RDM的6个不同结果或方面相关的一系列陈述中的一个来确定他们对RDM准备情况的评估。此6个方面包括:图书馆和RDM的制度方法、关于科研资助者数据政策的知识、与数据管理和管理相关的知识、为研究人员提供培训支持和指导、倡导和建议使用元数据、数据的机构存储库。

3.4 M RDM服务内容

UWE提供的科研数据管理与服务对接该校的师生需求,服务方式也是遵循了科研数据的生命周期,包括数据计划、数据收集、数据保存、数据发现、数据分析、数据共享等阶段,服务内容也与其他高校图书馆提供的大同小异。一是帮助制定数据管理计划,助力科研人员对数据进行系统化的有序管理[11]。二是提供数据存储库,UWE自建了两个数据存储库,各有其侧重点。第一个是机构知识库,建设较早,提供一个在线的、协作的工作空间,方便科研数据的出版与共享。第二个是科研数据存储库,建设稍晚两年,主要是为了科研数据集的长期保存,改善UWE的科研数据集的可访问性和再利用性。三是开展定期的培训与主题周活动,可以在一定程度上提升科研人员的数据管理意识与数据素养,可以促进科研人员与科研数据支持馆员的交流,以帮助科研人员在科研行进的过程中时时有效交流,解决问题。

在科研数据的共享方面,UWE也做出了较为详细的阐述,说明了科研数据共享时要注意的事项。首先,个人数据的使用和共享需要经本人同意,并签订同意书,同意书中需指明可以使用数据的人的身份以及数据的使用范围,即是否可以将数据传送到大学外部。其次,非大学内部人员可以使用UWE科研数据,但是需签署数据安全免责声明或是数据处理协议(Data Processing Agree⁃ment,DPA)。另外,科研数据的使用也要遵循DPA,对于一些敏感数据则只能在UWE的计算机上使用,或者由与UWE签订了DPA的公司处理。

3.5 政策规范

UWE有一个较为良好的内外部政策环境。一是国家层面的相关政策,包括《2018数据保护法》(Data Protection Act 2018)[21]、《通用数据保护条例》(General Data Protection Regulation)等,主要是关于数据保护的政策法规。二是资助机构的相关政策,如英国研究和创新(UK Research and Innova⁃tion,UKRI)、研究英国(Research England)、威尔康基金会(The Wellcome Trust)等机构的开放获取政策[22]。三是大学制定的相关政策,除《西英格兰大学科研数据管理政策》(UWE Bristol Research Data Management Policy)外,UWE还有许多其他相关政策,如《科研数据安全指南》(Research Data Securi⁃ty Guidance)、《知识产权政策》(Interllectual Proper⁃ty Policy)、《西英格兰大学开放获取政策》(UWE Bristol’s policy on open access)、《信息处理政策》(Information Handling Policy)等等,这些政策指南对版权、数据共享、数据安全、开放获取、数据引用等科研数据管理关键问题进行了阐述,UWE要求科研人员遵守以上规定,进行科研数据管理工作,可以提高科研数据的质量,规范科研数据的创建、存储、保存、传播和再利用等行为。

3.6 宣传与传播

在整个科研数据管理实践的过程中,UWE图书馆的科研支持团队并不只是默默无闻地在做事,他们始终都有着高度的宣传意识,这点也能够在其项目报告书中得以体现。自始至终贯穿一体的宣传意识,所能带来的宣传效果是意想不到和获益无穷的。UWE图书馆科研支持团队创建了一个在线的博客,自始至终记录下他们在科研数据管理实践过程中的各种信息,包括项目团队的成员介绍、机构知识库的培训与使用、开放获取主题周、相关培训资料、快速问答等内容。同时以多媒体等形式呈现,如制作短视频介绍图书馆科研团队的相关工作,关于开放获取背景知识的相关讲座视频,以在线PPT形式介绍机构知识库背后的运作机理等。此外,他们所有的阶段性成果,包括机构知识库的年度报告等都在自建的机构知识库中可免费查询与获取,从图书馆的角度呈现开发共享的意识并真正带头使用机构知识库。

4 国内高校图书馆科研数据管理实践的启示

4.1 组建M RDM专业团队

目前,我国高校图书馆内专门的科研数据馆员还较少,不足以支撑图书馆开展科研数据管理服务。科研数据管理对服务人员的知识水平和服务能力要求较高,如对国内外科研数据管理政策、服务等内容的了解,以及数据分析和挖掘、平台使用、开展数据管理咨询和指导、提高科研素养等方面的能力[23]。针对目前尚无专业科研数据馆员的情况,图书馆应挑选具有相关知识背景的人员,鉴于服务对象的多学科情况,服务人员也应具有多学科背景,并对其进行专门的教育与培训,通过在职培训、馆际交流等方法,提高其科研数据管理认识和服务能力,并通过激励和考核手段激励馆员专业素质和服务能力的自我提高,培养出一支可以开展科研数据管理服务的团队。

4.2 逐步开展M RDM服务

图书馆想要推出一个新服务绝不是一件易事,其中所涉及的方方面面十分繁杂。在科研数据管理的实践初期就应该有一套体系化、系统化的构想。当然构想不是凭空的,而是基于前期的调研和评估。图书馆推出科研数据管理,所牵涉到的相关利益者有哪些?各利益相关者的长中短期利益和风险又有哪些?从哪些方面切入开展实践?收益-风险矩阵和成形的思维导图都可帮助图书馆在实践过程中打造体系化、系统化的构想。UWE图书馆的科研数据管理实践是分阶段进行的,每个阶段的产出和成果都会对下阶段有着指引和反思的作用。利益-风险矩阵帮助他们能够通过利益最大程度地规避风险,而思维导图可以为他们梳理出系统化的流程,成熟度模型可以反复评估,为各环节进一步改进提供指导。

4.3 建立完善的政策体系

目前,我国科研数据管理政策建设较为薄弱,无论是在国家层面、行业协会或是机构层面都有很大的缺口。2018年国务院办公厅印发了《科学数据管理办法》[24],明确各级政府部门及科研机构、高校等主体的职责,引导科研数据管理政策的制定,但是并没有出台明确的科研数据管理和保存方面的规范。个别高校制定了各自的科研数据管理政策,但总体上还有待完善。图书馆是协调组织各部门实现科研数据管理的关键机构[25],在国家层面等外部政策较为缺失的情况下,高校图书馆更需要制定具体有效的科研数据管理政策,包含存缴、数据保存、数据利用等方面的内容。参考UWE,并考虑高校具体情况,制定适应各校的科研数据管理政策。以推动高校的科研数据管政策建设为突破口,逐步推广到更高层次,甚至是国家科研数据管理政策制定。

4.4 保持高度的宣传意识

虽然说图书馆是一个非盈利性机构,但是有效的宣传是必要且十分重要的。好的营销策略与包装手段,加上确有其效的内容,才能真正打开市场,让用户了解到什么是其所需所适。可能源于文化因素,国内图书馆在宣传意识方面始终有所欠缺,实打实的成品推出,却无法广而告之,让真正有需求的用户有意愿和主动使用图书馆的服务。科研数据管理服务也是如此,UWE图书馆在整个推出过程中注重宣传,有专门的关于机构知识库的博客、科研支持团队的短视频、内容丰富的系列主题周活动等,这些都在一定程度上为自己的科研数据管理拓宽了市场和影响力,同时拉近用户与图书馆的距离。广泛宣传抓住用户的猎奇心理,定向宣传点对点抓住用户需求,用户在愿意尝试的过程中,逐渐发现符合自己的真实需求,增加了用户的黏度。这也为图书馆能反复及时跟进科研人员需求,完善改进自己的服务打下了基础。

猜你喜欢

知识库数据管理科研人员
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
科研人员破译黑猪肉特征风味物质
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
治疗艾滋病,中国科研人员有了新发现
广东公安科研人员风采
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用