英美高校图书馆科研数据管理服务调查*
2019-01-19李志芳
李志芳
(河南理工大学工商管理学院 河南焦作 454000)
科学数据是国家科技创新和经济社会发展的重要基础性战略资源,早在20世纪70年代,美国就开始注重数据共享和科学数据平台的建立。我国在20世纪末也建立了一些数据中心的试点,但是直到2008年才要求汇交国家项目产生的科学数据[1]。我国的科学数据平台以专业部门为主,科研院所为补充,但是资源类型单一,侧重于自然科学和工程技术科学等领域,而在科研数据管理(Research Data Management,RDM)方面却比较薄弱。笔者依据2018年更新的QS世界大学综合排名,调查了我国排名前20的高校,发现截至2018年8月,只有4所高校开展了科研数据管理服务,分别是北京大学、复旦大学、武汉大学和同济大学。在数字化学术、开放科学及数据密集型科学兴起的背景下,以及国家资助机构政策的要求和各组织机构数据意识提高的相互作用下,开展对科研数据管理的研究和实践成为高校图书馆工作的必然趋势,因此其致力于发展科研数据管理服务,希望能够抓住机遇真正成为研究的合作者,而不再被看作一个“货物的仓库”[2]。在国际数据组织以及一些图书馆联盟的推动下,国外学术图书馆在发展RDM服务方面取得了显著成绩,其实践模式值得我们借鉴。文章调查了英、美以及我国QS排名前20的高校,共计60所高校图书馆的RDM服务,从细节上系统分析英美高校图书馆的RDM服务,包括导航路径、数据管理计划(DMP)、数据管理的指导(组织数据、存储数据、保存数据、共享数据)、科研数据管理政策,科研数据管理培训以及数据馆员的配置等方面,积极探索适合我国RDM的实践模式。
1 相关研究
国外高校图书馆科研数据管理的发展得到了国家和相关组织机构的高度重视,主要表现在国家数据管理和共享政策的完善、资金资助机构政策的强制性要求、高校科研数据管理政策的规范以及图书馆相关组织的推动等,多方面的因素使得国外高校图书馆的科研数据管理服务的普及性及完善性都显著高于我国。2007年,美国国家科学基金会(NSF)启动了DataNet计划,明确提出以图书馆为主体实施科学数据管理[3]。美国图书馆协会(ALA)和美国研究图书馆协会(ARL)积极推动图书馆在数据管理方面的发展,指出数字化技术的发展和对信息基础设施的投资从根本上改变了科学的进行方式,这种转变的核心是科学数据。国外学者的研究注重数据管理的实践,内容侧重于以下几个方面:①案例分析高校图书馆科研数据管理的实践经验。Searle S[4]采用案例分析的方法,介绍了澳大利亚两所高校基于场景的关于科研数据管理的小组学习活动;Henderson M E[5]介绍了基于高校图书馆的科研数据管理的一个项目,即美国弗吉尼亚州立大学(VCU)图书馆聘请了一个科研数据管理的主管,在图书馆管理的配合下,提出与VCU教师、研究人员、学生、服务和资源提供者建立关系的计划,参与数据管理计划编写和研究数据管理。②研究者对科研数据管理服务的需求分析。Naum A[6]通过让图书馆嵌入到科研者之中,对研究人员进行访谈,明确研究者对澳大利亚阿得雷德大学(Adelaide)的数据仓储和元数据存储的需求,强调了需要为阿得雷德大学的研究群体开发一个科研数据仓库和给元数据存储提供解决方案。Mattern E[7]采用参与式设计和视觉叙事的方法研究科研人员在他们自己的学科中遇到的有关科研数据的挑战,及他们对图书馆RDMS服务的建议。③与数据出版相关的研究。数据共享和重用的一个挑战就是数据的出版和数据的引用,需要相应的期刊政策来支持。Sturges P[8]调查了利益相关者的观点和实践,确定了期刊数据共享政策的现状,开发了一种利益相关者驱动的期刊政策模型。④图书馆的角色定位问题。高校图书馆作为RDM服务的主体和实施者,其作用和职责需要明确。Searle S[9]从实践出发研究了图书馆的角色定位问题。从相关研究来看,国外的研究更注重实践性。
目前,我国高校图书馆开展RDM服务的并不多,周力虹、段欣余和宋雅倩[10]调查了我国高校图书馆RDM服务的情况,选取了112所“211工程”的大学,仅有4所高校明确开设了RDM服务,分别是北京大学、复旦大学、武汉大学和上海外国语大学,但并不是都以图书馆为核心提供此服务的,且馆员咨询内容有限,缺乏数据管理计划和相关服务的咨询和指导。但是国内学者已经意识到高校图书馆开展RDM服务对科研工作发展的重要意义,很多学者对国外高校开展科研数据管理的经验进行调查总结,为国内高校图书馆开展RDM服务提供借鉴和参考。国外RDM服务实践较早且有成效的国家包括美国、加拿大、英国、澳大利亚、德国及新加坡等。研究内容侧重于以下几个方面:①国外高校图书馆的具体实践经验总结。例如彭建波[11]归纳了北美人文社会科学数据管理的实践,从制度、规划、机构合作、建设和服务、技术、人才和培养六个方面,提出了建议;唐燕花[12]探索了国内外高校开展RDM服务实践的主要构成要素,提出了国内开展RDM服务的建议和措施。②国外科研数据管理政策研究。例如司莉、邢文明[13]调查了美国、英国和澳大利亚三个国家的高校数据管理政策及政府制定的数据公开政策。③国外科研数据管理平台研究。例如,覃丹[14]对英美两国一流高校所构建的5个数据管理平台进行分析,为我国数据管理平台建设提供借鉴和启示;刘兹恒和曾丽莹[15]分析了我国高校科研数据管理与共享平台的现状、特点和发展模式,指出我国高校科研数据管理与共享平台的模式主要有院所主导建立、以调查数据库为基础演变和国家资金资助建成三种。④图书馆的角色定位及图书馆员的能力培养。高校图书馆作为科研数据管理的服务主体,其角色定位成为国内外学者们研究的热点,樊俊豪[16]研究了图书馆在科学数据管理中的角色定位,他认为图书馆扮演着嵌入式科学数据管理专家、基于过程的科学数据监护机构、科学数据存档与长期保存机构、数据素养的教育机构等角色。RDM服务的兴起使高校图书馆需要培养或引进一个新的职业,即数据馆员。因此数据馆员的能力培养成为RDM服务实施的关键。国内学者胡绍君[17]探讨了高校RDM服务对学科馆员的能力要求,明确学科馆员在RDM服务中的角色。从国内学者对科研数据管理的研究来看,整体上我国科研数据管理研究起步晚,目前高校图书馆缺乏科研数据管理的咨询和指导,缺乏相关政策的支持和相关机构的推动,但是也形成了一些特色的科研数据管理平台,并且中国图书馆学会每年会举行“数据馆员”的培训,表明我国的一些相关机构从未停止探索适合我国高校图书馆RDM服务的模式。
2 高校图书馆RDM的实践分析
依据2018年最新更新的QS世界大学综合排名,分别选取美国、英国和我国排名前20的高校进行调研。采用文献调研法和网络调查法,访问每所高校图书馆的RDM服务页面,从其导航设置、RDM服务内容和馆员配置三个方面展开分析。
2.1 RDM导航设置
图书馆的导航设置一定程度上反映了图书馆的服务方式。文章分析了英美国家及我国排名前20的高校图书馆科研数据管理的路径设置,其中英美高校图书馆,其研究数据管理服务的路径有以下四条:①研究支持导航下。传统的高校图书馆导航一般分为资源和服务两种,资源目录下提供的是馆藏资源或数字资源检索,而服务导航下提供的是图书馆的借阅、咨询培训、座位管理、文献传递等服务。英美国家的很多高校图书馆除了资源和服务之外,将研究或教学支持独立成为一项服务,单独作为主导航,为本校研究者和教师提供研究支持和教学支持。②服务导航下。受调查的英美国家的高校图书馆有一部分将研究数据管理服务依然设置在图书馆服务导航下,不过有些图书馆在服务导航下设置了研究支持目录,并将研究数据管理设置在研究支持目录下。③数字化学术或学术交流导航下。一部分美国高校图书馆将研究数据管理设置在数字化学术或学术交流导航下。例如美国的芝加哥大学图书馆、普林斯顿大学图书馆和宾西法尼亚大学图书馆。④员工目录下。受调查的英国高校图书馆中有部分将研究数据管理设置在员工目录下,在员工目录下设置研究支持目录,并将研究数据管理设置在研究支持目录下。从英美国家高校图书馆研究数据管理的路径设置来看,英美国家的高校图书馆非常重视研究支持服务,所有被调查的英美国家的高校图书馆都设置了研究支持的导航,主要服务于本校教师、学生的学术研究。另一方面,英美国家的高校图书馆在具体的导航设置上略有不同,例如,被调查的部分美国高校图书馆将数据管理服务设置在数字化学术或学术交流目录下,而被调查的部分英国高校图书馆将研究数据管理设置在了员工目录下。在导航设置上英美国家的高校图书馆还体现出三个特点,一是英美国家的高校图书馆都有研究支持的导航,一部分与资源和服务一起作为主导航,一部分是在服务导航下另设研究支持的目录。说明英美国家的高校图书馆非常重视对研究者的科研支持,Corrall S[18]认为学术图书馆在研究支持方面起着越来越重要的作用,认为文献计量学和RDM服务是图书馆研究支持的新趋势;二是RDM服务可以多个路径到达;三是很多图书馆借助于LibGuides平台,将RDM服务以学科服务的形式开展,例如美国的加利福尼亚学院图书馆,英国的南安普顿大学图书馆。
2.2 RDM服务内容
英美国家高校图书馆开展的RDM服务的具体内容相似,但组织的方式和工具略有不同。美国高校图书馆的RDM服务按照数据管理生命周期开展,而英国高校图书馆的RDM服务很多是按照项目前中后的方式来组织。另一方面,在数据管理计划工具的选择上,美国使用的是DMPTool,而英国使用的是DMPOnline,这两个工具都是帮助研究者撰写数据管理计划的,只是开发者不一样而已,DMPTool是加利福尼亚大学加州数字图书馆中心开发的,DMPOnline是由数字化监护中心(Digital Curation Center,DCC)开发的。被调查的美国20所高校都是DMPTool的成员,而英国的20所高校都是DMPOnline的成员。文章依据调查结果,发现RDM服务的核心内容包括:数据管理计划(DMP)的书写,数据管理的指导,科研数据管理政策,科研数据管理培训。
2.2.1 数据管理计划
被调查的英美国家的40所高校图书馆的RDM服务内容都包含了指导研究者如何书写数据管理计划,它是RDM服务的核心内容。数据管理计划是一个书面文档,它描述了研究者如何管理、描述、分析和存储科研数据,以及在项目结束时使用什么机制来共享和保存数据[19]。DMP是动态的,需要持续规范地监护它。为了实现研究数据的开放获取,许多资助机构要求产生的研究数据能够被公开获取作为资助项目的一部分。许多机构已经制定了数据共享和正式数据管理计划的要求[20],例如国家科学基金会(NSF:National Science Foundation),国家卫生研究院(NIH:National Institutes of Health),国家人文科学基金会(NEH:National Endowment for the Humanities)都要求将数据管理计划作为资助申请和奖励的一部分。因此,研究者需要了解如何书写科研数据管理计划,调查的英美国家的高校图书馆提供了数据管理计划的咨询和指导,并提供了丰富的资源,具体服务包括:
(1)资助机构关于科研数据管理的资助政策。在书写科研数据管理计划之前,研究者需要明确项目的资助机构对科研数据管理计划的要求。例如,麻省理工学院图书馆[21]关于数据管理计划的说明,就提供了很多资助机构对研究者进行科研数据管理计划指导的链接列表,根据这个列表,研究者可以轻易获取各资助机构提供计划的指导。
(2)提供数据管理计划的样例和模版。很多高校图书馆的RDM服务中会提供相应模版资源的链接,同时各个资助机构的网站也会提供数据管理计划的样例和模版。DCC提供的数据管理计划工具DMPOnline给出了各个资助机构需要的数据管理计划的模版[22],共包括来自不同国家和地区的17个资助机构。其中,美国的NSF提供了一个通用模版,这个模版与DCC提供的样式相似,每个部分都包含了需要描述的内容、指导和需要考虑的问题,在具体回答的问题方面存在差异。NSF的通用模版需要描述清楚五个部分,分别是数据类型、数据和元数据标准、获取和共享政策、重用和再分配政策、归档和保存计划。DCC数据管理计划的模版,需要回答七个方面问题,分别是数据收集、元数据、伦理和法律约束、存储和备份、选择和保存、数据共享、责任与资源。有些图书馆还会提供本校的数据管理计划模版,例如剑桥大学图书馆的数据管理计划模版[23]。如果资助者没有提供数据管理计划方面的指导,剑桥大学图书馆会为他们的研究者提供一个简单的数据管理计划的模版作为参考。
2.2.2 RDM指导服务
RDM服务提供数据管理方面的指导,有两种方式:一种是依据数据管理的生命周期来提供相应的指导服务,另一种是按照项目开始、项目中和项目结束的方式来展开数据管理的指导。项目开始之前需要写数据管理计划以及RDM预算。项目中,需要安全存储数据,明确描述数据,清楚数据版本,保证数据命名和结构的逻辑性,恰当应用数据,遵守伦理、法律、商业义务。项目结束时,决定哪些数据持续保存,格式化数据,考虑将数据存储在一个合适的存储库,使用持久性标识符,确保数据长时间可访问。按照“项目开始—项目中—项目结束”的方式进行RDM服务的指导,实质上也是遵循了数据管理的生命周期,因此文章遵循数据管理的生命周期展开RDM服务指导内容的细节,包括组织数据、存储数据、保存数据、共享数据、数据政策和科研数据管理的培训。存储数据发生在项目进行时,研究者考虑如何存储数据;保存数据发生在项目结束时,研究者考虑将数据保存在合适的数据存储库。
(1)组织和存储数据。研究者合理组织数据对将来理解数据非常有意义。RDM服务中需要指导研究者有效地组织和存储个人科研数据,需要考虑文件的命名规则、文件格式、数据版本和质量的控制、元数据的创建和使用。跟踪科研数据的文档和记录是非常重要的,所以在项目开始时就需要花费时间制订文件及文件夹的命名规则,保持统一标准的命名规则有助于将来能更好地理解和重用数据。文件的命名应该具有一致性和描述性,具有一个清晰的目录结构。文件的格式直接影响将来打开这些文件以及其他人访问这些文件的能力。要采用开放的文件格式,如果需要以专有格式来保存文件的话,可以写一个Read文件,记录产生文件的软件名称和版本以及制作该软件的公司。国会图书馆出版了一个推荐格式声明,格式最好选择:未加密的、非专利的、未压缩的、研究共同体普遍使用的、遵守公开的文件标准。研究团队协作时,要注意控制数据的版本,调查的很多高校都提供了版本控制指南和控制工具,例如斯坦福大学提供了两个简单的版本控制软件:Google Drive和Stanford Box,还有更高级的版本控制软件gitHub。另外,还要注重元数据的选择和创建,元数据能够使其他研究者更详细地了解并正确使用和引用数据。在研究项目开始时甚至在数据收集开始之前就应该考虑记录数据,研究人员可以在各种元数据标准中进行选择,这些标准通常适用于特定的文件格式或规程。存储数据需要考虑在项目进行期间如何存储自己的数据,如何管理敏感数据,如何备份数据等。高校图书馆的RDM服务会提供数据备份的指导,提供数据备份的可选项以及如何保证数据安全的技巧,一般情况下,英美国家的高校图书馆会建议使用3-2-1的备份策略,即3个备份,2种存储媒介,1份离线存储。国外非常重视个人信息的保护,因此如果涉及敏感数据,研究者要考虑是否需要保密,是否需要获得同意以及敏感数据如何被使用等问题。
(2)保存和共享数据。保存数据要求研究者要为共享的数据选择一个合适的数据存储库,一般的数据存储库包括几种类型:一种是存储在学科的数据存储库,例如Dryad、Protein Data Bank等;一种是存储在通用的数据存储库,例如FigShare、Harvard DataVerse、Zenodo等;一种是存储在本校的数据机构库中,被调查的所有英美的高校图书馆都有本机构的数据存储库,都提供了详细指导和说明如何选择合适的数据存储库,以及需要考虑哪些问题。共享数据需要考虑如何出版数据,如何发现、获取和引用现有数据,如何管理版权和知识产权等问题。
(3)数据政策方面的指导。被调查的英美国家高校图书馆的RDM服务中提供有相关的科研数据管理政策的说明和咨询。大多数的资助机构包括研究理事会、基金会、慈善机构等已经出台了科研数据管理政策,他们期望公共资助的科研数据是公共物品,应该尽可能少地限制其公开使用。资助机构都有各自的数据政策,为研究者提供如何处理科研数据的指导。2012年5月,RCUK要求所有受资助的大学都要有一个数据管理政策。因此,被调查的英美国家高校大部分都有各自的科研数据管理政策,而没有科研数据管理政策的高校也会有与数据管理或数据开放获取相关的政策。剑桥大学图书馆[24]在RDM服务中提供了20个高校主要资助机构的科研数据管理政策的概要和链接,帮助研究者理解资助机构的政策要求。DCC也提供了资助者及机构的数据政策,其中资助者的数据政策包括RCUK的资助者以及非RCUK的资助者的政策,共计10个; 机构的数据政策[25]主要是高校发布的数据政策,共计57家机构,最早是伯明翰大学于2009年10月发布的研究数据管理政策。高校图书馆开展RDM服务,需要包含国家、基金资助机构和学校本身的科研数据管理政策的说明和咨询,以帮助研究者理解并满足他们的需求,促使研究者更好地开展数据管理实践。
(4)被调查的英美高校图书馆提供的RDM服务中会包含科研数据管理的培训,主要包括3种形式:①在线培训,提供了丰富的在线培训资源。②举办研讨会或讲座。③为研究团队提供专门的培训或讲座。培训的内容主要是与RDM服务相关的主题,例如开放科学、如何书写科研数据管理计划、数据管理和共享的最佳实践等。各个高校图书馆的RDM服务提供了非常多的培训资源的链接,例如DCC提供的数字策展课程[26],包括面向所有人的培训和个体组织请求的私有培训,内容包含开放科学、数据管理计划、数据保存、基金需求等,还有面向图书馆员的科研数据管理,涉及的内容包括科研数据和科研数据管理、数据管理计划、数据共享、技能等。英国爱丁堡大学图书馆管理的MANTRA[27],提供与科研数据管理有关的培训和免费在线课程,如果需要证书,还可以报名参加为期5周的流动课程,这个平台还提供了研究数据管理和共享的MOOC。除此以外,还有很多数据管理的免费课程,例如新英格兰合作数据管理课程(NECDMC)项目[28],美国NSF的DataONE项目,提供关于数据管理的教育,包括概述数据管理的最佳实践,提供教育材料方便研究人员使用,以及链接到DataONE及其合作伙伴提供的工具和资源。科研数据管理培训的资源如此丰富,高校的研究者和图书馆员可以有效应用这些资源,提高数据管理能力。
2.3 数据馆员配置
数据密集型科学的兴起及科学研究范式的转变产生了以数据为驱动的研究模式,促使新的知识需求产生,新兴了很多与数据有关的行业,例如数据科学家、数据分析师等。图书情报学术界也公认在图书馆应该有一个新的职业,即数据馆员。顾立平[29]认为数据馆员是为科研数据管理而服务的,它是图书馆员职业生涯的一个发展方向,而不单指具体的岗位名称,它可以是数据管理专员、数据支持人员、数据管理规划顾问、科研数据管理项目专员、RDM服务开发人员、数字研究图书馆员、科研数据管理协调员等。数据馆员在科研数据管理的服务中扮演着非常重要的角色。被调查的英美国家高校图书馆,负责RDM服务的馆员主要分为两种形式:①组建了专门的科研数据管理团队(RDM Team)。例如美国的加利福尼亚学院图书馆,由专门的学术交流馆员、学术和数据馆员、元数据馆员等,负责科研数据管理的相关服务;美国的普林斯顿大学图书馆设立了学术交流馆员;美国的西北大学图书馆提供了专门的数据管理馆员,负责回答与数据管理和数据管理最佳实践相关的问题,并提供课堂演示和个人培训课程。英国的华威大学也设立了学术支持馆员,包括电子仓储助理、研究数据负责人、学术交流负责人等。②以学科服务的形式开展,由学科馆员负责。例如,美国的纽约大学图书馆就是由其中的一名学科馆员负责数据服务。其联系方式基本一致,可以单独预约,也可以通过在线咨询、电话或邮箱联系。
3 对我国高校图书馆RDM的启示
科研数据管理服务在我国还处于起步阶段,如何更好地促进该服务在我国的发展,文章的调查给了我们以下几点启示:
3.1 国家、科研资助单位、机构制订相应的数据管理政策,激励数据管理和共享
通过文献调研,可以发现我国缺乏相应的科研数据管理政策的引导。英美国家高校图书馆开展RDM服务之所以如此系统和丰富,离不开国家、政府和相关组织机构的高度重视,例如美国政府要求公开获取政府信息、出版物和联邦资助研究产生的数据,同时政府尊重这些数据的隐私和保密问题,呼吁在现有的信息共享法律限制内公开获取数据。美国的科研资助机构强制性要求资助申请中必须包括如何管理和共享研究数据的计划。英国成立的数据管理中心DCC,一直致力于数据管理服务,提供了丰富的科研数据管理的相关服务、培训和工具;英国的RCUK要求所有受资助的大学都要有一个数据管理政策。我国目前缺乏政策性的指导和支持,不过在2018年3月,国务院办公厅印发了《科学数据管理办法》,该办法的出台对科技工作者及国内致力于科研数据共享的研究者来说是极大的鼓舞。另外,在政策的引导方面,需要多个机构相互协作,共同推进科研数据管理实践。RDM服务的开展并不是单个机构就能促成和推进的,需要国家、政府、资助机构、高校、图书馆、出版商等多个利益相关者的共同努力和推进。图书馆在开展RDM服务时,需要积极发挥其核心力量的作用,主动协同多方利益主体共同参与,整合各机构的业务优势,促进科研数据资源的高速运转,使科研数据的生产、采集、管理与利用实现良性循环[30]。
3.2 做好服务开展前的需求调查,有针对性地提供服务
调查中的部分英美高校图书馆,在开展RDM服务之前,会对本校的研究者做一个需求调查和分析,调查研究人员如何管理数据,并帮助确定研究人员对数据存储、保存和共享的需求。例如美国的西北大学在2013年的时候进行了一项调查,来支持自己的RDM服务,结果表明研究人员最关注的问题是数据的存储和管理,尤其是长期的数据存储和管理,而且研究人员需要有关数据管理的援助和教育[31]。英国的诺丁汉大学也做过一项类似的调查[32],结果表明,数据的类型复杂多样,研究者很少共享数据给团队以外的人;研究者对培训也非常感兴趣,尤其是数据管理计划的书写、对元数据和存储数据以及资助机构的需求。这表明,研究者对RDM服务是有需求的,高校图书馆在RDM服务方面有发挥作用的空间。但是我国研究人员数据管理和数据共享的意识整体上处于低水平,我们需要去了解他们的需求同时让研究者更多地了解RDMS的重要性,才能更好地开展相应的服务。Renwick S[33]研究了发展中国家学术图书馆的科研数据管理现状,发现虽然很多研究人员拥有数据,但他们几乎没有知识和经验去管理。因此,做好服务开展前的需求调查和分析非常有意义,可帮助研究者了解科研数据管理这项服务,消除他们的疑虑。
3.3 数据馆员的教育和培训
图书馆服务的核心是人,RDM服务的开展需要具备数据管理专业知识的人,因此引进具有数据服务能力的人才以及对图书馆员开展数据教育和培训显得非常重要。调查发现,高校图书馆一般采用引进专业数据人才和对现有馆员进行培训两种方式培养数据馆员来开展RDM服务。中国图书馆学会专业图书馆分会和中国科学文献情报中心每年也会举行“数据馆员研讨班”, 从理论、方法、技术、政策、实践层面,持续、系统地推进图书馆开展数据管理与服务的实践[34]。国外很多高校开设了数据管理的课程,Harris-Pierce R L和Liu Y Q[35]调查了北美图书馆情报学的数据管理教育开设情况,在北美有52个图书馆和信息科学(LIS)的学校网站,以及16个相关机构提供了数据管理课程。美国RDA(Research Data Alliance)中描述了关于科研数据,图书馆应该做的23件事情[36],涉及十个部分,分别是:学习资源、数据参考与推广、数据管理计划、数据素养、元数据、引用数据、数据授权与隐私、数据保存、数据仓储、实践社区。这十个方面详细阐释了图书馆应该怎么做,图书馆员应该学习哪些知识,具备哪些能力才能开展RDM服务。对我国高校图书馆员来说,培训的途径包括[37]:继续专业化教育,取得相关的数据管理学位;参加经过专业认证的相关数据管理的课程和培训;与国内高校的信息管理学院合作,进行专业系统的数据管理教育。
3.4 数据管理模式的借鉴是基础,融合自身特点创新是核心
由于政策环境的差异及我国的资助机构并没有强制要求提交科研数据管理计划,目前我国高校图书馆并没有普遍开展RDM服务,但科研数据管理计划的框架和思维可指导研究者更有效地管理个人数据。很多调查显示目前研究者主要是将个人数据存储在自己的存储设备上,经常会出现数据丢失或在将来发生数据不可理解的情况。因此,我们可以借鉴国外高校图书馆数据管理的方法和思维,指导研究者更有效地组织数据,例如文件命名格式、文件夹组织结构的制定、书写一份Read文件、描述数据等。另一方面,我们要形成自己的特色。2015年,北京大学图书馆联合国家自然科学基金-北京大学管理科学数据中心、北京大学科研部、北京大学社科部推出“北京大学开放研究数据平台”, 平台为研究者提供研究数据的管理、发布和存储服务,鼓励研究者开放和共享数据;为数据用户提供研究数据的浏览、检索和下载等服务,促进研究数据的传播、重用和规范引用[38]。这个平台并不像国外的RDM服务从指导研究者如何书写研究数据管理计划和保存共享自己的数据开始,而是先收录北京大学拥有的一些具有极高影响力的精品调查数据,然后开展一届“全国高校数据驱动创新大赛”,鼓励大家利用这些数据创造出新的研究成果,并通过这次竞赛收到很多创造性的研究成果。这种实践模式从数据的利用开始,使这些数据创造出了价值,然后,鼓励研究者自行提交,从而形成良性循环,值得借鉴。同时,在“双一流”的背景下,我国很多高校引进了ESI数据库来支持本校的学科分析和规划,形成研究报告之前会产生很多数据,这些数据的保存可有效梳理高校的学科发展,可以按照科研数据管理的框架来组织和保存这些数据。
3.5 依靠已有基础设施,推进科研数据管理
调查发现,RDM服务的一个重要内容就是如何有效地保存和共享研究者的数据。在这个阶段,图书馆的数据馆员需要提供可存储数据的数据仓库,研究者有很多选项,可以选择面向全球的一些通用数据存储库,也可以选择学科数据存储库,但通过调查可以发现英美很多高校都为研究者提供了自建的本机构的数据存储库,也叫数据机构库。而我国高校也非常重视数据机构库的建设,2016年,为促进全国高校机构知识库快速、健康发展,中国高等教育文献保障系统(CALIS)管理中心联合16家高校图书馆共同发起成立“中国高校机构知识库联盟(Confederation of China Academic Institutional Repository, CHAIR)”,其宗旨是推进全国高校机构知识库的建立,推动学术成果的开放获取,促进学术广泛应用[39]。目前联盟共有50家会员,元数据总量达到2 812 320条。被调查的我国20所高校中有13所为联盟成员,即这13所高校都建设了本校的机构知识库,用来收集和保存本校科研人员的学术与智力成果,但与成果相关的数据保存非常少。如果要开展RDM服务,可以利用已建的机构库来保存研究者的数据成果。
(来稿时间:2018年12月)