英国科学数据管理培训体系调研与启示
2021-07-09吕艳娥
柏 雪,郑 聪,吕艳娥
(桂林理工大学图书馆,广西 桂林 541004)
1 引 言
在数字时代,记录、分享科学数据作为科学研究过程不可分割的一部分,正变得越来越重要。通过对科学数据进行有效管理,不仅能够确保数据的可发现性、可访问性和可理解性以实现数据的长期重用,还可以为研究人员带来更高质量的研究、更高的可见性以及引用率的提高。政府、基金资助机构、期刊、研究机构逐渐意识到科学数据管理(RDM)和共享的重要性与必要性,开始鼓励研究人员对数据进行规范化管理,甚至要求提交和共享科学数据。社会和技术因素驱动着科学数据快速增长,科学研究正向协作性、数据密集性和计算性研究方向发展。数据量大、数据可复制性、数据可共享是密集型科研范式的重要特征。在此背景下,RDM将变得更加重要,但也更难掌握。RDM所需的技能、资源和知识的复杂多样性为研究者带来了巨大挑战。不论是科研人员还是从事RDM服务的支持人员对RDM培训需求都日益增长。开展RDM培训可以提升用户的数据素养和管理技能,有助于推动RDM和开放科学的发展。
当前,我国的科学数据共享处于初级探索阶段,RDM水平有待提高,RDM培训机制和体系尚未形成。需要开展RDM培训来提升科研人员和科研支持人员的数据素养与RDM能力。国内的RDM培训实践案例较少,目前仅有中国科学院文献情报中心和国家科技图书文献中心举办过RDM相关培训。英国是世界上最早开展电子科研(e-Science)的国家之一,其RDM服务与培训均走在世界前列,取得了非常显著的成效,积累了丰富的实践经验。本研究调研了英国的RDM培训体系,分析其成功经验,并针对我国建立RDM培训体系提出相关建议。
2 英国RDM培训体系调研与分析
笔者通过网络调研和文献调研,调查了英国提供RDM培训的机构。经过梳理发现,英国提供RDM培训的机构主要包括科研资助和监管机构、高校等研究机构、信息技术部门、图书馆等研究支持机构以及一些跨组织机构。这些来自不同层面的机构的培训形成了一个立体化的RDM培训体系,为英国的RDM培训持续提供政策、技术、基础设施、资源和平台支持。
2.1 自上而下制订系统的RDM政策,为RDM培训提供有力的指导方针
从组织视角来看,经过多年的发展,英国已经自上而下建立起一套较为全面的RDM政策和法规体系(见图1)。英国的RDM政策体系主要包括政府、研究资助机构和研究机构三个层面的政策。政府的RDM政策主要偏向宏观的统筹规划;研究资助机构的RDM政策偏向引导和指导;研究机构的RDM政策偏向于具体执行实施。
图1 英国研究数据管理政策体系调查
2.1.1 政府的数据管理法律和政策。英国政府对开放科学非常重视,已将其提升到国家发展的战略高度。英国政府于2005年开始实施《信息自由法》,2012年颁布《开放数据白皮书》,2017年重新修订《新数据保护法案》等数据法律,2017年颁布《数字经济法》。这不仅为英国的开放数据和开放科学提供了法律依据和保障,为英国的数据驱动创新保驾护航,还引导和创造了良好的数据开放、共享和管理的社会氛围。政府的法律和政策为RDM培训的发展提供了法律保障。
2.1.2 资助机构的RDM政策。英国的大多数资助机构和研究委员会,非常重视其资助的项目对公共投资的价值,86%的英国研究委员会要求RDM计划与资助申请一起提交。为了促进资助项目成果的最大化利用,英国的研究资助机构制订了一系列RDM政策。英国超过80%的科研经费由英国研究理事会(RCUK)提供。RCUK成立于2002年5月,2009年6月重组为英国研究与创新部(UKRI)。2011年,UKRI发布《关于数据政策通用原则》《研究数据管理最佳实践指南》,提出研究数据管理与共享的7条原则。随后,UKRI下属的7个理事会根据这套共同原则制订了各自领域的RDM政策。包括:1)艺术与人文科学研究理事会(AHRC)的《研究资助指南》;2)生物技术与生物科学研究理事会(BBSRC)的《数据共享政策》;3)工程与自然科学研究理事会(EPSRC)的《研究数据政策框架》;4)经济与社会科学研究理事会(ESRC)的《研究数据政策》;5)医学研究理事会(MRC)的《数据共享政策》;6)自然环境研究理事会(NERC)的《数据政策》;7)科学与技术设施理事会(STFC)的《科学数据政策》。
另外,一些非UKRI资助机构也出台了相关的RDM政策,如英国癌症研究中心(CRUK)的《数据共享和保存政策》、欧洲委员会(EC)的《地平线2020公平数据指南》、惠康信托基金的《数据、软件和材料管理与共享政策》等。
2.1.3 研究机构的RDM政策。英国现在的大多数研究资助机构都要求研究人员提交RDM计划,作为拨款申请过程的一部分,并指出研究人员有义务将相关研究数据存入合适的存储库。研究数据的有效管理对研究人员本身以及其他用户,如决策者、商业组织和非营利性机构都是有益的,因为它有助于促进有价值的数据的发现和再利用。为了确保符合资助方要求并遵守良好的RDM实践,英国许多高校在遵循政府相关数据法律和政策的基础上,在资助机构的数据共享和管理政策指导下,结合本校科研实际需求,提出本机构的RDM政策,以确保数据得到有效处理并符合资助机构要求,如剑桥大学的《研究数据管理政策框架》、牛津大学的《研究数据和记录管理政策》、圣安德鲁大学的《研究数据管理政策》、开放大学的《研究数据管理政策》、华威大学的《研究数据管理政策》等。
2.2 监管、资助机构主导,为RDM培训提供资源和平台
在英国,UKRI在RDM中所扮演的角色是宏观的统筹、管理与协调,其下属的7个研究理事会负责具体的政策实施和推进。研究信息网络(RIN)、英国数据监管中心(DCC)、英国数据档案馆(UKDA)和联合信息系统委员会(JISC)在确定和提高RDM技能方面发挥了主导作用。在研究机构的培训合作中,JISC侧重于提供培训资金和网络、技术等基础设施建设,DCC则侧重于负责具体的培训项目实施以及政策制订和数据管理规划等问题的咨询。这些机构之间均有不同程度的指导和合作关系,这些资助机构为英国的RDM培训提供了良好的培训平台、培训资源以及资金支持。
2.2.1 JISC提供的RDM培训。JISC是一个非政府性质的公共机构,为英国高等教育和技术部门提供非营利性数字服务和解决方案,致力于将英国打造成世界上数字技术最先进的高等教育、继续教育和研究的国家。JISC开展和资助了一大批RDM培训项目。JISC和RIN共同资助了RDM技能支持计划(DaMSSI-ABC),旨在探索英国研究生课程中的RDM技能和技能发展路径、确定并推广RDM培训的基准,并与包括专业机构在内的其他利益相关者合作。DaMSSI-ABC是JICS资助的RDM项目中的一部分,旨在支持和提高JISC的RDMTrain项目中RDM培训材料的开发、传播和重用的一致性。DaMSSI-ABC包含5个RDM培训项目,涉及服装和表演艺术、社会和政治科学及社会人类学、心理学及临床心理学、地球科学、考古学、健康科学6个学科。该项目商定并确定学习成果的基准和评估方法,以便能够有效地比较各种培训机构提供的课程。DaMSSI-ABC取得的成就包括将RDM技能培训纳入研究人员职业发展框架中,确立了一般和特定学科的RDM技能价值,改善了RDMTrain项目所代表的社区与专业机构和其他利益相关者之间的沟通。
JISC资助的其他比较具有代表性的RDM培训项目包括:1)南安普顿大学的研究人员支持课程;2)埃克塞特大学的The Holistic Librarain项目;3)东伦敦大学开发的TraD项目以及SupportDM课程;4)爱丁堡大学为所有从事研究数据管理的人员开设的MANTRA课程。
2.2.2 DCC提供的RDM培训。另一个提供RDM培训的典型机构是DCC。DCC成立于2004年3月1日,最初是为响应JISC的第6/038号通知而成立的。2010年3月,DCC重组为由爱丁堡大学领导、主要合作伙伴为格拉斯哥大学人文高级技术与信息研究所(HATII)和巴斯大学数字信息管理专业中心(UKOLN)的机构。DCC与英国、美国、澳大利亚等国的数据机构如澳大利亚的ANDS、CNI、DataOne和美国的数据保护以及BioSharing组织建立合作关系。DCC现在已经发展成为国际公认的数据监管专业技术中心,专注于RDM的能力和技能建设。
DCC的课程是专门为满足一系列受众的需求而设计的,其目标群体是在英国和世界各地高等教育与继续教育中从事数据保存和监管活动的群体,包括RDM专业人员、图书馆员、IT专家和研究人员。DCC有超过10年的RDM培训经验,其培训师拥有丰富的技能发展经验和深入的学科知识。DCC有全年的培训计划,培训内容涵盖数据管理与共享简介、数据管理规划(包括DMPonline)、数据伦理、开放科学与开放数据、公平原则、数据引用和许可、数据选择和保存、数据共享和存储库、RDM服务、RDM成本核算与业务规划、出资人要求(包括“地平线2020”、交付和构建RDM服务)。培训形式包括面对面授课、网络研讨会、慕课、RDM论坛、国际数字监管会议等。DCC为用户提供了大量的培训资源,如操作指南和清单、案例研究和政策概述、制订数据政策的步骤等。DCC还与机构密切合作,根据用户需求提供RDM定制培训服务。
2.2.3 UKDA提供的RDM培训。UKDA成立于1967年,成立的初衷是为科研数据的分析和再利用提供高质量的研究数据。UKDA是英国唯一由国家资助的研究基础设施,目前已成为英国数据基础设施的重要组成部分。UKDA是国际公认的获取、策划和提供社会科学和人文数据访问的专业中心,是英国数据服务的牵头组织。通过UKDA可以统一访问英国最大的社会、经济和人口数据,所以,UKDA被认可为英国学术界内社会科学研究人员获取数据和相关资源的第一站。其数据安全访问和数据管理方面的实践在全球范围内都具有较大影响力。
在RDM培训方面,UKDA提供研究数据使用技能的指导和培训。UKDA的RDM培训方式主要包括网络课程、研讨会和出版物。培训内容包括许可证、组织基础设施、数据储存程序、数据保存、数据发现和重用、数据评估和记录、数据保密和道德等。UKDA在RDM方面的培训课程一直非常受欢迎,并已在欧洲、美国、中国、印度等地提供培训。另外,UKDA提供数据使用和管理方面的出版物,UKDA开发的《研究数据管理手册》已在大量网站和指导文件中重复使用,得到了一系列研究资助者、数据服务者和大英图书馆的认可。UKDA出版的《管理和共享研究数据实践指南》受到研究人员和知识库管理人员的广泛欢迎。
2.3 研究机构和研究支持机构协同合作,联合开展培训
英国的RDM活动由政府、资助机构、数据监管中心、研究机构、信息技术部门、图书馆等多部门共同参与。研究机构、信息技术部门和图书馆之间良好的培训合作机制是英国的RDM培训取得成功重要因素。英国很多较为成功的RDM培训项目都是由多个部门联合开展的。联合开展培训不仅能够发挥各个机构的优势,确保RDM培训质量,还能够充分整合资源,避免重复开发,降低课程的开发成本。
埃克塞特大学的Open Exeter项目就是一个典型的多机构合作项目。它由JISC资助,由埃克塞特大学图书馆、信息技术部门、研究及知识转移人员、研究人员和研究生等利益相关人员共同合作完成。该项目由Follow the Data、Exeter Embeds和Technical Enabling三个主要部分组成:1)Follow the Data部分涉及与不同学科领域的博士研究人员团队合作,评估埃克塞特大学RDM的现状。参与该项目的研究生被要求在2012年1月到2012年7月初的时间段内每周完成一次对RDM涵盖数据创建、存储和共享的不同元素的审查,审查结果由数据监管干事上传到图书馆的N:Drive中存储。在此期间,数据监管干事与研究生每隔一周举行“一对一”会议。审查结束后,数据监管干事根据审查数据和会议反馈结果撰写分析报告初稿。在审查报告的基础上,采用DAF调查的改编版本来全面调查埃克塞特大学的RDM实践情况。2)Exeter Embeds部分的主要内容是开发一个RDM倡导、治理和培训的框架,以将RDM政策充分嵌入埃克塞特大学的研究和教学中。其中,一个重点领域是为研究人员、项目管理人员和包括学科馆员在内的研究支持人员编写培训材料。该部分由各学院、IT部门、RKT和图书馆共同完成。3)Technical Enabling部分主要由IT部门负责,致力于开发一个功能完善的研究数据库。该数据库是在Follow the Data部分的调查结果和Exeter Embeds部分制订出的框架基础之上进行开发的。另外,为了开发设计良好、内容适当的RDM培训课程,Open Exeter项目从研究者的需求和视角出发,在开发课程时还与6名研究生合作,创建了一个RDM生存指南。Open Exeter项目开展各种不同的培训课程,包括DCC101培训的2个单独实例(一个针对研究生,另一个针对图书馆、信息技术、研究办公室专业服务的工作人员)、在开放获取周期间的一系列活动以及在各自学院为新研究生举办的RDM上岗培训。
其他具有代表性的案例包括:1)RDMRose项目。由JISC资助,利兹大学图书馆、谢菲尔德和约克图书馆与谢菲尔德信息学院合作开发,为从事RDM的信息专业人员提供RDM开放培训资源。2)数据管理DIY培训包试点课程。由爱丁堡大学的EDINA和数据图书馆与UKDA,DCC及普渡大学图书馆的分布式数据监管中心联合开设。3)图书馆员RDM入门课程。由北安普敦大学与DCC合作开发。4)Research360项目。由DCC与巴斯大学可持续化学技术博士培训中心合作开展。
3 启 示
当前,我国在开展研究数据管理和服务方面起步明显晚于欧美国家,提供的RDM培训更是乏善可陈。建立RDM培训体系是提升RDM能力的重要途径。通过对英国RDM培训体系的剖析发现,建立RDM培训体系,需要政府、资助机构、高校、图书馆、信息技术中心、学院和其他利益相关者从多层面共同努力。
(1)制订和完善RDM的相关法律和政策,为RDM培训提供政策保障
国务院办公厅在2018年3月17日印发《科学数据管理办法》(以下简称《办法》)。《办法》对RDM的工作体制、管理原则、责任主体等进行统筹规划,并对科学数据的采集、保存、共享和安全作出相关规定,另外还拟组建科学数据中心。中国科学院在《办法》的指导下于2019年2月19日发布《中国科学院科学数据管理与共享办法》,明确科研项目数据汇总要求,建立论文关联数据汇交机制,明确包括院属法人单位、重大科技基础设施、野外台站、科学数据中心等科学数据开放共享主体的责任,规划中国科学院数据中心体系包括中心、学科中心、所级中心。这表明,我国政府和监管机构已经开始意识到科学数据管理和共享的重要性。我们应该抓住这一契机,积极贯彻落实和扩展RDM政策体系。主管部门根据《办法》,加强对数据生命周期各环节的政策研究,制订详细的RDM政策和规章制度,科研院所、高校等责任主体在遵循《办法》和主管部门RDM政策的基础上,借鉴国外政策经验,制订更为详细的适合本机构的RDM政策、实施细则、评价标准,作为指导方针和服务设计的框架。各机构自上而下建立起一套立体完善的RDM法律和规章制度,为我国的RDM培训的发展提供政策土壤和法律保障。
(2)建立RDM考核激励机制,调动培训对象参与培训的积极性
按照《办法》规定,RDM的主管部门是国务院相关部门和省级人民政府相关部门。主管部门可以制订一套详细可行的RDM考核评价体系,通过以下途径来激励研究人员和研究支持人员提升自身RDM能力:1)鼓励研究者在申请基金时提交相应的数据管理计划,并将数据管理计划是否规范作为考核指标,利用政策法规的约束性引起研究人员对RDM的重视;2)对数据中心或机构库研究数据的搜集、存储和备份、共享、道德规范等进行考核评价,促使研究支持机构参与RDM培训,提升RDM能力;3)RDM主管部门制订一系列宣传方案,向科研人员、研究机构、研究支持人员宣传RDM的重要意义,提高其对数据共享的认可度和RDM意识,营造良好的RDM氛围;4)建立一套面向RDM支持人员的长效培训激励机制,促使其RDM服务能力提升,使其具备帮助研究人员完成机构和资助人RDM任务的专业能力和技能。
(3)开发培训课程,整合培训资源,提供RDM培训
英国的RDM培训大多由资助机构提供,我们可以借鉴此经验,由数据中心牵头组织开发RDM培训课程:1)围绕科学数据生命周期开发内容丰富的RDM培训课程,课程设计应兼具实用性、互动性、协作性和系统性,课程模式可包含RDM课程的通识教育模式和针对学科领域的RDM课程教育模式,培训内容应涵盖RDM政策、基础理论知识、案例模板、实践技能等;2)编写培训材料、指南、操作手册等指导性资料或者为用户提供阅读清单,可以以在线电子阅读材料和纸质出版物的形式提供给用户,方便用户自学和重复使用;3)搜集并充分整合已有的培训资源,避免重复开发造成的人力和物力浪费;4)考虑研究支持人员和研究人员等不同群体需求的区别,及时评估不同用户的培训需求和用户不断变化的需求,根据评估结果制订相应的培训方案;5)尝试采用多种培训方式如演示、在线学习模块、活动、小组讨论、案例研究、实践操作等向用户提供RDM培训,还可以探索将RDM培训课程嵌入图书馆学或信息科学等研究生课程中;6)建立培训评估和效果反馈机制,采取问卷调查、定期组织RDM培训研讨会、举办年会等方式搜集培训效果反馈信息,对当前的培训方法、实践方案、培训效果等问题进行探讨,总结经验教训,对存在的问题和不足及时调整和优化。
(4)研究机构和图书馆等责任主体加强机构合作,积极参与交流培训
研究机构、图书馆等责任主体可以积极合作,探索将RDM培训嵌入到继续教育、高等教育中:1)高校等研究机构应重视RDM,引导本机构的研究人员、研究支持人员、信息管理人员等积极参与RDM培训,提升其RDM意识和接受度;2)图书馆等RDM服务机构应充分认识自己在RDM中的角色和责任,提升本机构RDM整体服务能力,构建RDM服务人才培养机制,设立数据馆员岗位,并为其制订系统的培训方案,提供培训资源和业务交流机会,提升数据馆员RDM专业素养和实践技能;3)学院与图书馆积极合作,构建数据素养课程体系,面向研究生开设通识和学科化的数据素养教育课程或将RDM培训嵌入科研项目,通过项目教育提升研究人员的RDM实践能力;4)学院与图书情报学院合作,设立数据管理专业,精心设计课程,培养数据专业人才;5)高校与数据中心等机构合作,以实践为导向,设立RDM教育认证项目;6)RDM利益相关机构积极主动参与国际RDM合作与交流,学习国外先进培训经验。