E-E-C模式下国外大学图书馆RDM能力获取路径研究*
2021-03-09胡杨崔涛宗莹
胡 杨 崔 涛 宗 莹
(1.山东政法学院图书馆 济南 250014;2. 山东大学图书馆 济南 250100)
0 引 言
2019年3月14日,加拿大研究型图书馆协会(Canadian Association of Research Libraries,CARL)发布了一份关于大学图书馆馆员角色定位的声明,即《大学图书馆馆员:为研究型大学的发展提供助力》(The University Librarian: Providing Value to the Research University)[1]。声明指出,通过了解开放科学日益增长的重要性以及高级计算研究和科研数据管理(Research Data Management,RDM)的交叉点,大学图书馆员应保证图书馆在校园内支持RDM的作用,提供与数字信息和数据管理相关的专家建议,以推动高校科研发展,践行高校教育使命。开放科学背景下,以科研数据管理为导向的支持服务在一定程度上能够强化大学图书馆校内教育中心地位,进一步巩固大学图书馆在数据素养和“数字人文学科”等跨学科领域方面的领导地位。
通过调查发现,国外许多大学图书馆已部署开展RDM服务,其中美国半数以上大学开展了数据支持相关服务,英国已有30余所大学部署数据管理相关项目[2],并均取得显著成效。国内已有学者对国外大学图书馆RDM服务开展情况进行了不同角度的调研,张莎莎等从用户群体、服务内容与特点角度调查研究了美国高校图书馆RDM服务的主要特点[3]。戴舒从生命周期模型、管理服务团队和基础设施3个方面分析了美国9所高校图书馆的RDM人才队伍建设与设施资源配置[4]。孟祥保则从服务需求、服务内容、运作模式与服务保障四个角度调查分析英国23所高校图书馆RDM服务的特征,并从服务政策、服务平台、服务人员等5个方面提出相关参考性建议[5]。黄红华等介绍了英国大学图书馆RDM服务的主要内容,包括协助完善数据管理计划,组织多样化培训,配备专业服务团队等[6]。阎婷婷调查发现加拿大高校图书馆从政策性文件、数据管理计划、数据组织与安全、数据保存与共享、数据获取与引用、参考咨询和培训6个方面开展RDM服务[7]。
目前,国内关于RMD服务的研究成果主要集中于对美国、英国、加拿大等国家大学图书馆RDM服务开展的个案介绍,这些研究大多注重RDM服务内容与运作模式的浅层网络调研,对于服务能力的获取路径及选择策略,缺乏更深层次的系统挖掘,国内大学图书馆RDM服务实践较为欠缺。鉴于此,本文从大学图书馆如何获取RDM能力的问题角度出发,探究国外大学图书馆在RDM服务开发过程中的能力获取路径及策略,为加快推进国内大学图书馆RDM服务实践进程提供参考性建议。
1 国外大学图书馆RDM服务模式与构建流程
1.1科研数据管理服务模式2017年,OCLC(Online Computer Library Center)发布了《科研数据管理的现状》 (The Realities of Research Data Management) 系列报告,通过对国外大学图书馆RDM服务的部署及实施现状进行调查,提出了大学图书馆RDM服务的E-E-C (即Education-Expertise-Curation)模式[8]。
图1 RDM服务的E-E-C框架
如图1所示,目前国外大学图书馆部署的RDM服务主要分为三类,即教育RDM服务包、专业RDM服务包和策管RDM服务包[9]。每种类型的服务包又分别包含一系列特定形式的单个服务,这些服务代表着图书馆满足不同研究群体不同方面的数据需求。
教育RDM服务包是图书馆基于意识层面面向科研大众提供的一系列旨在提高研究人员数据管理意识,传授RDM基础知识与实践的服务集合。教育RDM服务通过向研究人员传授一系列包括制定有效数据管理计划、创建描述性元数据、促进数据再发现等RDM实践技能,使研究人员在了解良好数据管理实践基本原理的基础上掌握特定学科领域的数据规范。另外,教育RDM服务通过对国家、资助机构与学术出版商的数据政策与要求的解读,使研究人员意识到良好数据实践对促进开放科学与满足资助者要求的重要性,从而鼓励研究人员提高对数据安全的专注度。
专业RDM服务包是图书馆基于智慧层面面向特定科研群体提供的一系列支持具体数据管理问题与需求的定制化服务集合。针对科研活动周期不同阶段中的特定研究群体,专业RDM服务对其遇到的具体管理问题提供解决方案,服务方式包括提供热线服务电话,向数据馆员直接咨询,寻求定制化的支持服务,如元数据创建和中介存储等。专业RDM服务需要专业人员智慧的介入,是数据管理专家与研究人员面对面的直接互动式服务。专业RDM服务展示了数据馆员、技术专家和其他支持人员的专业知识,确保个体研究人员的数据需求得到满足,这一点超越了教育服务的意识提升功能。
策管RDM服务包是图书馆基于技术层面面向科研生命周期所提供的一系列支持数据管理所需相关技术的服务集合。针对科研生命周期阶段中的动态数据和长期数据管理问题,策管RDM服务可提供一系列技术支持,包括永久存储、分配唯一标识符、访问控制、元数据创建与管理、版本控制等。策管RDM服务需要大量基础设施投入,重在解决数据管理中存在的技术障碍。
图2 RDM服务构建过程
1.2RDM服务构建流程一般而言,图书馆RDM服务构建流程主要包含RDM服务决策、RDM能力获取与RDM服务部署三个关键步骤(如图2所示),能力获取是RDM服务构建的关键环节,部署是RDM能力的最终体现。
RDM能力是指能够完成某项数据管理活动或实现某项数据管理目标所需具备的能力。RDM能力的构成要素包括人力资源、基础设施、平台和工具等,这些组成要素组合及开发应用程度决定着图书馆提供RDM服务水平的高低。
图书馆获取RDM能力并建立服务涉及诸多因素,通常RDM能力的获取有3种选择路径:一是从本地开发、管理和部署的服务形式;二是与同行机构合作部署的服务形式;三是从外部RDM资源生态系统中采购提取的服务形式。本地开发主要是基于本地资源的内部开发。合作获取是指可以从其他地方获得各种组件进行组装,然后集成、调整或定制这些组件以满足本地需求。外部采购主要是指以外包的形式获取RDM能力。RDM服务生态系统正在变得非常密集,在RDM能力获取的潜在外部提供商方面有很多选择,包括同行机构、商业供应商、非营利组织、国家机构等。
部署规模主要指RMD服务的范围,分为机构之上、本机构、机构之下三个层次,以高校为例RMD服务规模可分为全校研究人员、校内特定研究人员,以及与高校相关的校外研究人员群体。部署规模决定了图书馆RDM服务的用户社区规模的大小。
2 RDM服务能力获取路径选择分析
基于OCLC所提出的科研数据管理服务“E-E-C”模式框架,利用网络调查的方式,对部分案例调查结果进行归类分析,展示国外大学图书馆在RDM能力的具体体现以及获取路径上的不同选择规律。
2.1教育RDM服务包中的能力获取路径国外大学图书馆教育RDM服务包中的能力主要涉及数据素养普及能力和数据培训能力两个方面。数据素养普及能力主要体现在RDM在线资源的建设与部署,数据培训能力则主要体现在面对面形式的培训课或研讨会的组织与实施。
开展数据管理素养的普及教育是国外大学图书馆提升研究人员数据素养的主要途径,建设RDM在线资源是其进行数据素养普及教育的主要方式。RDM在线资源包括RDM基本信息介绍、RDM常见问题解答以及RDM最佳实践的资源链接,对研究人员具有指导作用。一些大学图书馆提供面向科研生命周期的RDM在线资源指导,如牛津大学图书馆针对研究生命周期各阶段提供了多达16种在线资源[10],包括研究前期向研究人员普及资助机构数据政策的Funder Requirements课程,研究中期有关数据安全的中央备份库HFS与能够将DOI分配给牛津大学创建数据集的Identifiers工具使用教程,以及后期用于保存数据的数字存储库ORA-Data的实用操作指南等。一些大学图书馆基于RDM主题领域提供在线资源,如伦敦大学学院图书馆针对特定研究领域提供元数据创建、数据存储库和操作规范等在线资源[11]。同时,大学图书馆也提供某些RDM常见问题的答疑汇总资源,使得研究人员的数据需求能够得到及时响应。如帝国理工学院图书馆网站设有的Frequently Asked Questions栏目,列出了在项目计划、数据存储与数据出版过程中常见问题的解决方案[12]。
对科研人员专业知识的培训服务属于一种需要人力介入的能力,不仅要求服务人员具备专业知识,还须注重人力资源管理[13]。面对面培训课或研讨会是教育RDM服务包中最常见且利用率最高的形式,通常需要RDM专家的直接参与。如南洋理工大学图书馆学术交流部成立了RDM工作坊[14],工作坊中的RDM工作人员轮流当培训师,以DMP模板的10个问题为主线,开展各种形式的培训会。斯坦福大学图书馆根据不同部门或研究小组提供更加全面的RDM研讨会,包括斯坦福地理空间中心研讨会,跨学科数字研究中心研讨会和Lane Library课程和研讨会等。
通过调查发现,本地开发是国外大学图书馆获取教育RDM服务能力的主要路径。牛津大学提供的16种在线资源课程全部由研究生院和图书馆共同组织开发。伦敦大学学院图书馆的RDM特定主题支持服务,是由医学科学、物理科学、生命科学等领域的学科馆员来负责。国外大学图书馆通过制定当地数据政策,充分利用本地人力和物力资源,以RDM在线资源和研讨会的形式来实现对研究人员RDM方面的教育和指导。个别大学也会选择支持RDM教育的外部资源作为补充,这部分常见资源包括英国数字管理中心(DCC)和欧洲教育与培训数据库协作数据基础设施协会(EUDAT)联合提供的RDM教育收费服务[15]。针对研究人员所选定学科,The Carpentries旗下的课程项目Data Carpentry提供一系列收费的数据素养培训班[16]。
表1 国外大学图书馆教育RDM服务包能力呈现内容及获取路径
2.2专业RDM服务包中的能力获取路径国外大学图书馆专业RDM服务包中的能力涉及建设专业团队能力和个性化服务能力两方面,其中建设专业团队能力主要体现在组建成具有专业技能和相互协作的RDM服务团队,服务科研人员整体需求;个性化服务能力主要体现在针对特定科研群体、跨学科领域数据管理相关问题的专业支持程度。
RDM团队建设是一项系统工程,需从组织层面、团队层面及个人层面来提升团队的建设能力。国外大学图书馆大都组建有成熟的RDM服务团队,如格拉斯哥大学图书馆的信息与数据治理小组(Information & Data Governance Group,IDGG)负责审查与科研数据管理有关的所有政策,为研究人员提供有关信息素养和RDM技能的专业咨询,协助研究人员利用各种RDM工具[17];墨尔本大学图书馆数字管理(研究)团队提供数据管理、数字保存和研究数据管理方面的支持,旨在通过数字技术和最大化研究数据的价值来实现学术实践的现代化[18]。
个性化服务能力大都体现在针对特定数据管理问题的专业服务,如RDM专家咨询服务、设立本地电子邮件帮助热线、跨学科RDM专业支持等形式。数据可视化服务(Data and Visualization Services)是杜克大学图书馆专业RDM服务包的一部分[19],图书馆设立专门RDM 顾问和实习生团队,在数据源管理、可视化及数据清理方面提供专业支持,研究人员可通过电子邮件或虚拟会议进行咨询;地理空间测绘与分析是宾夕法尼亚大学图书馆专业RDM服务的重要体现,图书馆设有公共服务台,配备专业地理空间服务馆员[20],为地理信息科学、遥感和空间分析、景观生态学等跨学科研究人员提供专业数据支持。
以上图书馆是基于本地开发来获得专业RDM服务能力,也有部分大学图书馆通过合作获取来获得专业RDM服务能力。例如,墨尔本大学的数字化中心(The University Digitisation Centre,UDC)推出的虚拟信息学(ImmersiveInformatics)专业服务是一项试点培训计划,旨在为研究人员提供描述、识别、访问、保存和复用研究数据所需的专业知识。该计划由墨尔本大学和英国图书馆及信息网络化办公室(The UK Office for Library and Information Networking,UKOLN)联合提供[21]。同样,伊利诺伊大学图书馆与北美其他大学图书馆合作开展Alfred P. Sloan基金会数据管理网络(DCN)项目。DCN的目的是利用跨机构人员配置,将数据管理专家网络与本地数据集无缝连接,从而补充本地的专业知识。莫纳什大学图书馆基于分布式网络开展专业服务,图书馆是中心联络点,研究人员被引荐到校内其他单位获得RDM专业支持,例如从eResearch中心可获得有关数据存储和共享的建议,在记录和档案服务处可获得数据保留和评估的建议。杜克大学图书馆提供的Collaborations Across Campus服务联合其他部门共同为不同研究主题的在校人员提供服务。
部署专业RDM服务包对大学图书馆极具挑战性,因为专业RDM服务不仅需要专业人员的智慧介入,还要对RDM实践知识有足够的了解与掌握。通过以上分析,可以看出大学图书馆在专业RDM能力获取方面采用了本地开发与合作获取相结合的策略。这种选择策略基于两方面:一是专业RDM服务需要拥有审查和管理数据所需的学科知识和软件专业技能,绝大多数图书馆无法直接提供;二是当前研究活动中的数据机构、类型和格式变得日益复杂,而图书馆无法满足多样化的数据需求。
表2 国外大学图书馆专业RDM服务包能力呈现内容及获取路径
2.3策管RDM服务包中的能力获取路径策管服务保障了科研数据集管理与存储的完整性、可持续访问性,体现出RDM活动中所需的技术功能。策管RDM服务能力涉及实现这些目标所需的能力集合,包括数据共享能力、数据存储能力和数据保护能力。
调研发现,爱丁堡大学、莫纳什大学和悉尼大学图书馆在获得策管RDM服务能力方面主要采用两种方式,DataShare是爱丁堡大学基于本地开发的在线数字存储库,允许大学研究人员上载,共享和许可数据以进行在线发现和重复使用[22],而Pure研究信息管理(RIM)是由第三方供应商爱思唯尔提供的;莫纳什大学图书馆在RDM服务中将元数据从Monash.Figshare上传到Research Data Australia,这是一个通过澳大利亚国家数据服务(ANDS)提供的研究数据发现库。同时莫纳什大学基于本地开发了MyTardis平台,该平台支持从科学仪器中获取实时数据[23];悉尼大学图书馆电子学术库是开放获取机构知识库,由本地开发管理[24]。杜伦大学、布里斯托大学、康奈尔大学、瓦赫宁根大学图书馆均采用外部采购为主的策略,Zenodo是欧洲核子研究组织(CERN)开发的开放科学存储库[25];UK Data Service是英国研究与创新组织(UKRI)用于托管ESRC项目中的研究数据,包括英国政府资助的人口普查数据,商业数据和定性数据。Dryad是从加利福尼亚大学图书馆管理中心(UC3)采购的数据发布服务平台。Data.Bris是布里斯托大学从第三方服务商采购并由图书馆研究数据服务部负责维护的的多学科研究数据集的在线数字存储库。通过存储库发布的数据都可以根据非商业政府许可证公开获取,并且每个存储都分配有唯一的数字对象标识符(DOI)[26]。康奈尔大学图书馆策管服务包中的Web Hosting Services是由亚马逊网络服务(AWS)承担托管工作[27];4TU.ResearchData由大学联盟负责开发,用于活动数据存档。DANS-EASY则由荷兰数据存档和网络服务(DANS)研究所提供,用于支持访问长期数据资源。澳洲国立大学图书馆策管RDM能力获取采用了三种路径组合的策略,其中ANU开放研究库和ANU在线存储库均是本地开发部署的,Aliance是由多所大学联盟合作构建的RDM在线社交社区和项目工作站[28],澳大利亚数据档案(ADA)与国家计算基础设施(NCI)则是从第三方供应商采购。
在RDM策管服务能力获取上,国外大学图书馆大都采用了外部采购为主、本地开发为辅的组合策略。外部采购是策管RDM能力获取的主要路径,因为RDM策管服务往往涉及复杂的技术支持,而这种技能在大学内部尚未开发,更好的解决方案是依靠外部联盟提供的共享策管服务。
表3 国外大学图书馆策管RDM服务包能力呈现平台及获取路径
3 关于RDM能力获取路径结论与启示
3.1RDM能力获取路径特征比较本文通过案例研究对国外大学图书馆在RDM服务构建过程中服务能力获取路径选择及策略进行了深度分析,总结出大学图书馆在RDM服务能力获取策略方面的共性和差异。
图3 图书馆RDM能力获取路径
在图3中,获取路径表示的不是一组离散点,而是从一端本地开发到另一端外部采购的连续过程,其中合作获取位于两者的中间位置。换而言之,RDM服务能力的获取没有单一形式的本地开发,合作或采购,许多RDM能力获取策略往往在这些明确定义的路径之间综合产生。
三种能力获取路径特色鲜明:本地开发能够使图书馆对RDM服务的控制范围最大化,实现服务定制化;合作获取能够实现合作机构之间成本分摊和专业技能知识的汇集;外部采购则使得大学将RDM服务开发、运营和维护环节外包给第三方提供商,代价是放弃对当前和未来服务的一些控制。
3.2国外大学图书馆RDM能力获取带来的启示当前美国、英国等国家的大部分大学图书馆均已开展RDM相关服务,在E-E-C模式框架下,通过选取有效的RDM能力获取路径,为图书馆RDM服务构建奠定基础条件。与国外大学图书馆相比较,国内大学图书馆科研数据管理服务进展较为缓慢,RDM服务能力的缺失是目前阻碍着国内大学图书馆有效开展科研数据管理服务的主要原因之一。通过分析E-E-C模式下的能力获取路径,可以为国内大学图书馆有效建立RDM服务指明方向。
3.2.1 教育RDM服务能力获取 基于意识层面的教育RDM服务能力重在体现对科研大众的RDM 素养教育。大学图书馆获取教育RDM服务能力应多选择本地开发路径,以促进研究人员的数据管理意识的提升,增强图书馆与科研活动的贴近程度,实现图书馆RDM服务的精准化。具体而言,图书馆采取线上与线下相结合的方式来构建教育RDM服务。线上,可开展基于科研生命周期的RDM在线资源指导、基于RDM主题领域的RDM工具推荐与基于RDM常见问题的答疑汇总资源等活动;线下,图书馆可通过与科研人员的面对面交流,及时了解科研人员的RDM需求,有效开展精细化服务,不断丰富服务内容,以切实提高研究人员参与科研数据管理活动的活跃度,充分发挥教育RDM服务的定制化的特点。
3.2.2 专业RDM服务能力获取 基于智慧层面的专业RDM服务能力要体现对特定科研群体的专业RDM支持。大学图书馆专业RDM服务能力获取应坚持本地开发、鼓励合作获取的策略。选择本地开发,是因为RDM专家和研究人员之间的互动是通过校园内的交流来实现,但即使是资源最充足的大学图书馆在本地也无法提供所需的全部学科知识和专业技能。将合作获取作为专业RMD服务能力获取路径,是因为其既可以提升科研人员获取服务的效率,又有助于深化高校内部科研交流。同时,合作获取对提高图书馆与研究人员的互动能力,增强科研人员与高校的科研黏度大有裨益。国外高校通过合作获取途径促进专业RDM服务能力获取的案例有很多,例如,由多所美国大学图书馆合作开发的协作平台DataQ,可以将研究人员RDM咨询问题发布到留言板上,通过来自每所大学的学科专家回复实现合作[29];美国数据管理网络(DCN)、加 拿 大 Portage专家网络和荷兰国家研究数据管理协调点(LCRDM),都是通过合作获得专业RDM服务能力典型案例[30]。未来,专业RDM服务将向服务纵深继续发展,以实现更多合作。
3.2.3 策管RDM服务能力获取 基于技术层面的策管RDM服务能力要保证解决研究生命周期各阶段遇到的技术问题。大学图书馆策管RDM服务能力应选择外部采购为主,本地开发为辅的策略。具体原因有以下几点:a.一般大学图书馆内部技术人员稀缺,几乎没有额外能力来支持新系统开发。b.策管服务所需的技术基础设施在本地开发、管理起来成本高昂,利用外部共享基础设施能够缓解资金压力。c.管理和保存科研数据所需的基础设施适合于分布式网络部署的解决方案,而外部共享基础设施的出现迎合了这一需求。从国外大学图书馆实践案例来看,这种选择策略有效促进了大学图书馆策管RDM服务能力的提升。例如,荷兰数据存档和网络服务研究所的DANS Easy数据存储库为许多大学图书馆提供RDM服务;澳大利亚国家数据服务局(ANDS)为澳洲大学提供了国家级科研数据发现服务。本地开发在面对策管RDM服务能力获取时仅是从管理角度出发,提供必要的政策把控。
4 结 语
本研究通过对国外大学图书馆在RDM服务构建过程中能力获取的路径选择分析,发现图书馆RDM服务能力获取过程中的共性与差异。RDM能力获取的路径选择在不同大学间、不同的RDM服务包中都有差异。对决策者来说,重要的是如何选择适合本地需求优先级的最佳路径组合。关于以何种路径获取RDM能力的决策,将取决于机构需求与利益。虽然大学可能有兴趣将某些RDM服务外包给同行机构,但这些服务是通过有期限的补助金进行运作的。如果没有强大的商业模式来维持,仅依赖于有限补助金的服务在未来仍存在很大不确定性。同样,如果外部采购会以更大的规模和更低的成本提供,那么在基础设施上进行大量投资的本地开发策略是不明智的。有关RDM 服务能力获取的路径选择在未来RDM服务发展中仍然是一个亟待解决的问题。