比利时高校科研数据管理服务调查研究*
2023-10-20崔涛李青
崔 涛 李 青
(山东政法学院 济南 250014)
0 引 言
近年来,随着科技创新迈入数据驱动的第四范式时代,科学研究活动呈现出明显的大科学、定量化特点。科研数据作为科学研究的副产品,其管理与保存价值日益凸显。同样,高校作为科研数据的重要产出与汇聚地,加强数据的管理与共享对保持其核心竞争力而言是一项长期而艰巨的任务。欧美等发达国家的高校在科研数据管理(Research Data Management,RDM)服务实践方面起步较早,对良好科研生态的形成起到了至关重要的作用。相较而言,国内高校的科研数据管理服务整体处于滞后状态,以“中国高校图书馆研究数据管理推进工作组”的九所成员高校为例,调查发现,有五所高校开发了数据管理平台,分别是北京大学开放研究数据平台、武汉大学科研数据管理平台、复旦大学社会科学数据平台、上海外国语大学数字学术服务平台和上海交通大学机构知识管理服务系统;仅有两所高校出台了科研数据管理相关的政策法规,分别是《武汉大学数据管理办法》与《同济大学数据安全管理办法》;教育培训方面,仅有北京理工大学定期举办“研究数据管理国际研修班”。由此可见,这些高校在数据资源平台建设与数据政策制定方面做了一些基础性工作,但不难发现,国内高校的RDM服务水平参差不齐,围绕科研数据生命周期的全过程服务还未深度开发与部署,更缺乏可推广、可复制的RDM服务典型案例。
比利时地处欧洲中心地带,作为西欧老牌发达国家之一,虽然国土面积小,却有着欧洲最受推崇的高等教育模式,其公立大学办学水平得到全世界广泛认可。全国现有10所公立性高校,其中荷兰语区5所(荷语鲁汶大学、根特大学、荷语布鲁塞尔自由大学、安特卫普大学、哈塞尔特大学),法语区5所(法语鲁汶大学、法语布鲁塞尔自由大学、烈日大学、蒙斯大学、那慕尔大学)。比利时高校数量虽少,但排名普遍较佳。据QS2023世界大学排名显示,比利时10所公立高校中有7所位于世界大学排名前500。多所高校以在经济学、商学、医学、兽医学、物理学等学科领域的开拓性研究而闻名,这期间每年会产生大量的科研数据,如何更好的管理、存储与共享这些科研数据,比利时高校在数据政策体系构建、服务组织架构、服务框架设计方面进行了积极有益的探索。基于此,本研究以比利时10所公立高校为调查对象,探究比利时高校科研数据管理服务的实践经验,以期为加快国内高校的科研数据管理服务实践进程提供参考。
1 比利时高校科研数据管理服务现状
1.1 科研数据政策体系
调研发现,比利时各高校在科研数据政策的制定与实施方面均采用“外引内建”的方式,“外引”指引用外部机构制定的宏观政策作为指导性文件,“内建”指在外部总体政策框架下,根据高校自身特点,制定出本校的相关数据政策。借助此方式,比利时高校形成了内外协同、全方位、多层次的科研数据政策体系(见表1)。政策“外引”方面,比利时高校主要引用欧盟、国家资助机构、权威期刊出版商等机构发布的科研数据政策。作为欧盟创始成员国之一,比利时各高校积极拥护欧盟关于科研数据的各项倡议与要求,作为本校研究人员的科研行为准则予以实施。其次,比利时主要基金组织如弗兰德研究基金会(The Research Founddation—Flanders,FWO),比利时科学政策办公室(Research Fellowships of the Belgian Federal Science Policy Office,BELSPO)等机构对其资助的研究项目也
表1 比利时高校科研数据管理政策体系的构成
提出具体要求,包括制定数据管理计划(Data Management Plan,DMP),规定数据保存时限, 将数据发布在受信任的存储库中等。与资助机构一样,越来越多的期刊和出版商期望研究人员将与科学出版物相关的数据免费开放,纷纷采用《透明度和开放性促进(TOP) 指南》文件来规范和加强研究人员的科研数据共享行为与意愿。政策“内建”方面,比利时各高校将科研数据管理视为良好研究实践的重要组成部分,同时遵循欧盟委员会提出的科研数据应“尽可能开放,尽可能封闭”的倡议及FAIR指导原则,纷纷制定出本校的科研数据政策。调研发现,各高校制定的校级数据管理政策框架条例大体相同,均以数据管理基本原则和参与主体职责为主,但在内容完备程度上略有差异。如《根特大学科研数据管理政策》[1]认为科研数据是有价值的科学输出,研究人员有责任有义务共享科研数据。大学行政部门负责起草和更新数据政策,学院负责做好宣传政策细则的同时,制定具体举措鼓励研究人员进行良好的数据管理实践,研究人员应遵守原则进行科学研究。《法语布鲁塞尔自由大学科研数据管理政策》[2]则从数据生命周期角度更加详细规定了研究人员在数据管理各环节中应遵守的政策法规和应尽责任。《烈日大学科研数据政策》[3]还对博士生作出规定:自2021学年起招收的博士新生需在6个月内提交初始DMP,论文答辩前提交DMP的最终版本。此外,比利时各高校内部设置的专项研究基金(Special Research Fund,BOF)和工业研究基金(Industrial Research Fund,IOF)从2020年开始,均要求其资助的研究提交数据管理计划。
1.2 服务组织架构
高校科研数据管理服务的成功运作离不开系统高效的组织运营体系,比利时高校在科研数据管理服务探索发展中建立了较为成熟的校级RDM服务组织机构。
以荷语鲁汶大学科研数据管理能力中心[14](RDM Competence Centre,RDM—CC)为例(见图1),RDM—CC是由大学图书馆、研究协调办公室(DOC)、信息技术办公室(ICTS)、法律部门和LIBIS等利益群体合作组建的服务组织机构,其任务包含三方面:一是通过使研究人员和支持人员实施高质量的科研数据管理实践,来支持大学的高质量研究。二是基于对研究实践和研究人员RDM需求的深入了解,指导和提供结构化的RDM信息、培训、工具、工作流程和服务。三是通过共享专业知识,在RDM支持人员间建立起强大的合作网络。各参与主体在能力中心发挥不同的作用:大学图书馆就数据描述、元数据和文档以及数据共享的学科特定问题向研究人员提供指导;研究协调办公室根据研究资助者的政策和期望指导研究人员编写数据管理计划 (DMP),同时负责数据管理实践所需的专业知识培训;信息技术办公室(ICTS)提供一系列服务来支持研究人员如何使用RDM(如DMPonline、GitLab)工具,使得数据符合FAIR数据原则,同时负责提供数据存储与备份的最优方案;法律部门在数据安全方面提供有关研究伦理和知识产权的建议;LIBIS公司作为荷语鲁汶大学图书馆的外部供应商,在研究生命周期内为研究人员提供管理、存储、发布和共享数据的高效、可持续的技术解决方案。
图1 荷语鲁汶大学校级RDM能力中心的组成
荷语鲁汶大学RDM能力中心由RDM指导委员会统筹领导,下设政策、基础设施、教育与实践三个工作组,分别在法规、技术工具和专业服务方面提供具体支持。RDM指导委员会作为科研数据管理服务的最高级别单位,由研究副校长领衔,负责协调三个工作组的日常工作,指导学校RDM服务的战略发展方向。政策工作组主要由来自图书馆、研究协调办公室(DOC)和法律部门的专业人员组成,负责制定本校相关数据政策,出台相应的激励措施,并在机构层面开展政策文本的宣讲活动。基础设施工作组主要由信息技术办公室(ICTS)和LIBIS外部供应商的专业人员组成,负责科研数据管理所需的基础设施的整体布局,并就研究人员在数据管理实践中遇到的软件技术问题提供帮助。教育与实践工作组主要由来自图书馆、研究协调办公室(DOC)的专业人员组成,通过教育培训与业务实践相结合的方式开展具体服务。除举办日常的培训课程、研讨会外,还通过任命数据专员、数据大使或数据管理协调员的方式为研究人员提供研究数据管理方面的专业支持。如法语鲁汶大学每年招募30余名特定学科的专家作为数据大使,嵌入到院系研究团队中,充当任何与数据管理相关问题的联络人[15]。根特大学任命了1名数据管理协调员和5名数据专员,每个人都有不同学科的研究经验,形成了技能和专业领域互补的团队,5名数据专员分别负责一个或几个不同的学院集群[16]。
1.3 服务内容框架
科研数据是在研究项目环境下生成、收集或使用的所有数据,其数据类型多样,从内容角度看可划分为数值数据、文本数据、多媒体数据、视听资料、软件等。从收集方式角度可划分为实验数据、观测数据、仿真数据、编译数据等。科研数据管理涵盖了计划、组织、记录、存储和备份、保存和共享研究数据在内的所有实践与活动。科研数据生命周期描述了科研数据在研究项目之前、期间和之后经历的不同阶段。比利时各高校围绕科研数据生命周期不同阶段开展了多种形式的服务(见图2)。
图2 比利时高校科研数据管理服务链的组成
1.3.1数据管理计划
编写数据管理计划 (DMP)目的是描述在研究过程中生成和使用哪些科研数据, 并依据道德和法律要求计划如何组织、记录、存储、保存和共享这些数据。比利时各大资助机构对DMP有不同的要求(见表2),大多数资助机构要求研究人员在项目启动后的6个月内提交初始DMP,项目结束后提交最终的DMP版本,也有资助机构要求研究人员撰写DMP时使用规定的模板来确保DMP文本的一致性。调研发现,比利时高校以帮助研究人员撰写高质量的数据管理计划为服务切入点,提供包括DMP要求解读、DMP工具支持、DMP审查、数据管理成本核算、DMP培训课程在内的多种服务。10所高校均在其RDM网站清晰罗列出各资助机构的DMP政策要求供研究人员参考。工具支持方面,DMPonline.be是一个托管多个DMP模板的在线编辑平台,目前已在比利时各高校间广泛推广与使用[17]。部分高校面向本校研究人员提供DMP的审查服务,根特大学在RDM网站列出了各资助机构关于DMP审查标准文件,供研究人员参照自评[18]。哈塞尔特大学的研究人员则可联系学科RDM专家对其撰写的DMP进行审查评估[19]。数据管理成本作为项目重要支出的一部分,是研究人员撰写DMP时应重点考虑的问题。对此,法语鲁汶大学、烈日大学、蒙斯大学3所高校提供了一些工具和清单(如英国数据服务数据管理成本计算工具和清单[20],LCRDM研究数据管理成本指南[21])来帮助研究人员精确计算数据管理成本。此外,荷语鲁汶大学面向全校研究人员和博士生定期举办互动研讨会,提供编写DMP最佳实践指导、实用技巧和示例[22]。
表2 比利时资助机构和大学范围内的DMP要求概述
1.3.2研究进行阶段
a.数据组织。正确组织科研数据,是实现科研数据追踪与发现的前提条件。如果在数据组织过程中,使用的文件名或逻辑组织结构不一致,大量的科研数据很快就会变得难以管理。法语鲁汶大学在文件夹结构、命名规则、版本控制等方面指导研究人员正确高效的组织数据,包括如何正确使用层次化的文件夹结构,如何使用标准的文件命名规则以及如何通过文件版本控制(Github、SVN)或手动语义版本控制并保存变更日志来管理数据版本等[23]。荷语鲁汶大学RDM能力中心则专门开发了一套文件组织系统,通过使用该系统,研究人员可以快速的选择出逻辑一致的方式来组织和命名数据文件[24]。
b.数据记录。一旦创建或收集了原始数据集,准确记录这些数据集至关重要。比利时高校主要从数据文档和元数据两方面指导与支持研究人员准确的记录数据。数据文档是指查找、评估、理解和重用科研数据所需的描述性信息。数据文档包含研究级文档和数据级文档,研究级文档记录有关研究项目背景与设计的总体信息,如项目标题与摘要、数据收集方法、相关研究人员名单与机构、文件命名约定及其他一般信息。数据级文档则记录有关数据集或数据集中单个变量的更详细信息,如有关数据集的信息可以是数据文件清单,数据文件之间的关系,生成数据集的注释脚本,执行的匿名化方法等;有关变量的信息可以是标签、代码、分类,缺失值等。根据学科的不同,数据文档可以采取多种不同的形式,如密码本、日志和实验室笔记本等。数据文档应与数据集本身同时创建,必要时进行更新。元数据是“关于数据的数据”,用于描述和注释数据,它是一种高度结构化、机器可读的数据文档形式。元数据与数据文档具有相同的目的,它们提供了理解和重用数据所需的所有信息。数据文档只能由人工解释,而元数据可以被机器读取。它们通常被格式化为.xml或.json文件,或嵌入在数据文件本身中。它提供有关研究数据的结构信息,以便更容易的在在线数据库、存储库中查找数据。
c.数据存储与备份。在研究项目期间存储数据必须是一个灵活的过程,数据应该易于获取又安全可靠。比利时高校向研究人员主推三种不同的数据存储方式:本地存储,网络存储和云储存。本地存储指将数据存储在可以直接访问的物理设备(笔记本电脑、外部驱动器)上,但在数据丢失和隐私保护方面存在风险。网络存储指将数据存储在高校内部服务器上,缺点是只能在高校范围内进行协作,并且只能在线处理数据。云存储则是指 OneDrive for Business、Dropbox、Google Drive等在线服务。在云端存储科研数据非常方便,既可在任何地方访问,又可实现与本地存储自动同步,便于离线使用。数据备份是确保定期在多个位置备份重要数据的副本,以便在遇到数据丢失时可以恢复它。比利时高校最常用的备份方案是3-2-1原则,即至少保留三份研究重要的数据文件,将这三个副本分别存储在至少两种不同的媒体上,并且在不同的地理位置拥有至少一种媒体。
1.3.3研究后期阶段
a.数据保存。数据保存是指在研究项目结束后长期存储数据的做法。数据保存不同于研究进行期间的数据存储和备份,后者通常涉及可变数据,而前者涉及“冻结”且未在使用的数据。数据保存环节主要涉及到保存数据的选择、保存期限和数据存储库三方面。长期以可用的形式维护数据需要付出大量的时间和资金成本,因此研究人员需要选择要保留哪些类型的数据以及保留多长时间。比利时高校鼓励研究人员通常保存资助机构要求的(如临床试验数据)、高潜在重用价值以及能够验证研究结果的数据。部分高校规定了科研数据的保留期限,如根特大学、烈日大学、蒙斯大学、那慕尔大学均要求研究数据至少保存5年,荷语鲁汶大学、荷语布鲁塞尔自由大学、安特卫普大学则规定研究数据保存期为10年,当研究数据在超过保存期限后仍有潜在价值时,必须永久保存并转移到大学档案馆。数据存储方面,研究人员可以选择在文件服务器或数据存储库中来保存数据集。比利时高校认为将数据存放在已建立的、可信赖的数据存储库是首选选项。但是,由于法律、道德、合同等因素无法将数据存放在外部存储库中时,可将研究数据保存在内部文件服务器中。
b.数据共享。数据共享意味着科研数据可以被复制和验证,有助于提高研究成果的透明度与影响力。比利时高校就数据共享与许可问题为研究人员提供支持。根特大学根据数据共享程度,将科研数据分为了开放访问数据、受控数据和封闭数据三类[25]。开放访问数据指任何人可以自由、不受限制的使用数据;受控数据指数据未以完全开放的方式共享,在更受限制的访问和使用条件下提供的数据;封闭数据指暂时处于禁运状态或根本无法共享的数据,但通常可以共享这类数据的元数据。比利时高校向研究人员主要提供三种不同的数据共享方式:一是通过个人邮箱、项目网站或云存储服务(Dropbox、Google Drive等)与协作者共享数据,但这可能面临着数据丢失的风险;二是将数据集发布在特定数据期刊的数据论文中,这样可以更详细地描述数据集,增加可见和被重用的机会;三是将数据集存放在文件服务器或数据存储库中,调研中的多所高校建立了本校的数据存储库,如RDR是荷语鲁汶大学基于开源存储库软件Dataverse 开发的数据存储库,研究人员可方便地上传、描述和共享他们的研究数据。Document Server@UHasselt是哈赛尔特大学基于开源软件DSpace开发的在线平台,研究人员可选择以开放、禁运、受限或封闭的方式共享数据集。蒙斯大学指导研究人员如何使用Re3Data或Fairsharing来选择特定学科的数据存储库或通过Figshare、Dryad、Zenodo发现公共通用存储库。也有高校在数据存储库基础上进一步搭建了元数据存储库,元数据存储库是一种在线基础设施,研究人员可以在其中存储数据集下的元数据,由于道德或法律问题,其他人员可能不被允许访问数据集,但可以自由访问底层元数据[26]。哈赛尔特大学规定自2021年起,研究人员应将其经过同行评审的出版物的数据集元数据上传到UHasselt元数据存储库中。目前,UHasselt元数据存储库中仅支持通用元数据模型,可以上传包含特定元数据的 XML或JSON文件,每个单独文件的大小不应超过5GB,文件(ZIP、TAR、RAR)的总大小不应超过20GB,研究人员每年可免费享有50GB的存储空间。
在公开科研数据时,重要的是让潜在用户提前知道他们可以使用这些数据做什么,数据许可是传达此类权限的有效方式。受信任的数据存储库通常会将许可证应用于其持有的任何数据集,通常在存储数据时选择。对于开放访问数据,常用的标准许可是知识共享(CC) 许可套件,它提供不同级别的许可。根特大学、哈塞尔特大学等高校均向研究人员提供许可选择器工具。对于受控数据,标准许可证通常是不合适的。在这种情况下,需要定制许可证(如由受信任的数据存储库实施的“最终用户许可证”或“用户协议”)以使数据可用。
2 比利时高校科研数据管理服务的特点
2.1 政策引领,完善的政策引导和支持机制
比利时高校在科研数据管理服务开展过程中始终坚持“政策为先”的发展理念。一是引入外部政策作为上位政策进行指导。比利时各高校发布的科研数据政策均是在遵循外部上级政策的规定之下进行制定的,各高校将欧盟、主要资助及权威期刊出版商等外部机构的科研数据政策纳入到本校数据政策体系中,用以约束与指导本校研究人员的科研行为。同时,各高校规定,如果外部机构的科研数据政策规定了比高校提出的更严格或更具体的数据管理要求,则它们将优先于本机构政策的规定。二是校级科研数据政策分为专门政策和辅助政策。10所高校均制定有专门的科研数据政策,政策文本大多以科研数据管理基本准则和各级主体职责划分为主。辅助政策指的是与科研数据相关的其他政策法规,这些政策法规往往在某一方面或某一部分涉及到科研数据的管理。如根特大学制定的《根特大学信息安全愿景》《处理个人数据和机密信息的一般行为准则》《根特大学科研诚信政策计划》等均是辅助性政策[27]。与外部政策相比,校级政策内容更加具体,体例框架更具规范化,易于操作和执行。从纵向结构看,外部政策是校级政策的基础,校级政策是对外部政策的具化。从横向结构看,校级政策又以专门政策为主,其它配套政策为辅,各政策间相互补充、配合、协调,使政策体系保持整体性与完备性。
2.2 权责分明,强大的校级科研数据管理组织结构
比利时高校在科研数据管理服务发展中组建了系统高效的RDM组织机构,确保数据管理过程的全面可持续。一是多元主体参与,大学图书馆、研究协调办公室(DOC)、信息技术办公室(ICTS)、法律部门和LIBIS等利益群体参与到科研数据管理的服务组织与运营中来,发挥各部门在数据管理方面的优势,大大提高了服务效率。二是运作模式稳定可持续,在RDM服务组织机构中,决策层负责科研数据管理服务的总体布局,执行层分为政策工作组、基础设施工作组和教育实践工作组,形成了战略制定、部署实施和保障监督的闭环模式,使得服务过程一体化。
2.3 细化需求,丰富的科研数据管理服务内容
比利时高校的科研数据管理服务较好的满足了研究人员的各项数据需求。在服务对象上,比利时高校的科研数据管理服务不仅仅局限于本校教师与研究人员,部分高校将服务对象拓展到学生群体。如安特卫普大学为本硕博学生专门定制的RDM可转移技能课程,旨在帮助学生发展他们在管理研究数据方面的知识和实践技能。服务形式上,比利时高校在实践中探索了建立专题网站、公开咨询邮箱、开放服务柜台、举办研讨活动、嵌入研究项目在内的多种服务形式。服务内容上,比利时高校科研数据管理服务起步较早,在服务内容方面进行了长期的建设积累,服务内容贯穿整个数据生命周期,能够满足研究人员不同阶段的数据需求。比利时高校通过明确的服务定位、丰富而实用的服务内容和主动参与的服务形式使得科研数据管理实践成果颇丰。
3 启示与建议
3.1 消除政策碎片化,加快构建垂直管理的科研数据政策体系
比利时各高校通过“外引内建”的方式,内外政策相互间衔接和支撑,形成了较为系统完善的科研数据政策体系。与之比较,国内高校的科研数据政策呈现“碎片化”状态,纵向来看,国内有关科研数据的外部政策环境还不完善,围绕《科学数据管理办法》等上级政策的落实执行不到位,从科学技术主管部门到资助管理机构再到科研机构层面,出台的与之配套的政策可谓少之又少,导致严重的科研数据政策断层问题。横向来看,首先,国内现开展科研数据管理服务的高校仅有一项主导性政策即针对本机构的科学数据管理办法,而用于助推落实主导性政策的辅助性政策缺失,直接导致了主导性政策较差的实施效果。其次,国内高校的科研数据政策仅仅是从本部门的治理角度出发,各自为政,缺乏更高层面的政策约束与指导,无法形成整体性的治理效果。因此,国内高校的科研数据政策体系略显单薄,应通过不断更新出台新的政策标准,来消除当前的政策碎片化现象。一是我国科研资助机构与学术期刊出版商应加强对已有各类数据相关政策的梳理和评估,尽快推出适合各自个性化需求的、有效的且符合国际最佳实践的科研数据政策,同时超前研究储备一批备选性支持政策,加快形成重点明确、相互支撑的外部政策环境。二是国内高校应正确认识外部引导政策和高校专门政策的关系。科研数据管理政策体系既包括来自外部机构的政策,也包括高校内部政策,必须加强相互间的衔接和配套。高校一方面应及时引入外部各级各类科研数据相关政策法规,并及时做好政策宣传与解读工作,达到发挥外部政策合力与引导作用的目的。另一方面,应及时制定本校自主性数据政策,各高校在制定过程中既考虑自身的特殊性和特质性,又需考虑各学校政策间的关联性、协同性[28],确保科研数据政策的规范性。
3.2 多元参与,分工明确,设立科学合理的RDM服务组织结构
相关研究表明,积极开展合作是机构快速推进科研数据管理服务的关键因素[29]。科研数据管理服务是一项整体性、复杂性工作,需要有专门的组织机构来引导、实施与监督。比利时高校在RDM服务推进过程中成立了去中心化的组织机构:RDM指导委员会负责RDM服务的开发计划,具有一定的决策自主权和执行力;成立RDM服务工作组能够实现RDM服务分工而治,使得每一种具体的RDM服务由一个独立的小团队开发和维护,这种微服务架构使得RDM服务快速迭代的能力体现出来,从整体上确保了高校科研数据管理活动的规范化和常态化运转。因此,国内高校在推进RDM发展时,及时组建有架构、有系统、有分工、有合作的校级RDM组织机构是必不可少的。借此经验,本研究设计了如图3所示的国内高校校级科研数据管理组织架构:一是组建RDM指导委员会,由校级领导担任负责人,委员会负责制订学校RDM服务的整体规划和相关制度,协调RDM服务实施过程中遇到的问题,并对实施过程和效果进行监督与评价,提出改进措施,保障科研数据管理工作的有序开展。二是成立RDM服务工作组。政策工作组负责科研数据政策体系的构建。基础设施工作组负责科研数据管理的技术支持,教育与实践工作组开展具体的RDM服务,三者能够形成良好的有机循环。三是动员RDM利益相关群体,形成跨部门的综合数据管理体系。比利时高校科研数据管理服务的常态化运行离不开校内科研管理部门、信息技术部门、科研诚信部门与法律事务部门等利益相关群体的持续合作。RDM服务作为一项复杂且全面的工程,需要高校各部门的通力协作,不同部门在其中也扮演着各不相同的角色。高校在开发RDM服务前应主动识别相关主体及其其拥有的RDM优势,通过整合各主体的价值观,使各方愿意投入RDM服务共同的目标中去。
图3 高校科研数据管理组织结构的基本构成
3.3 以数据需求为依托,构建一体化、细粒度的RDM服务全链条
比利时高校将科研数据生命周期嵌入RDM服务中,在研究的每个阶段为研究人员提供了更为细致的服务内容,极大促进了科研创新发展。当前,国内开设科研数据管理服务的高校多聚焦于研究后期的数据归档平台建设上,没有围绕科研数据周期的全内容要素来开展具体服务,其服务深度与广度均有待拓展[30]。胡媛[31], 沈玖玖[32],普丽娜[33],尹丽英[34]等学者的研究表明,随着研究人员对于科研数据的需求日益多元化,传统的数据咨询与存储等基础性服务已无法满足研究人员的真实需求,当前研究人员更关注于所获得的数据服务在多大程度上能够支撑自身的科研活动。所以国内高校在RDM服务未来发展中应加强对研究人员数据需求的准确挖掘与精准对接,依托数据需求来构建一体化、细粒度的服务全链条。一体化强调的是RDM服务的全面性与连续性,细粒度则追求RDM服务的个性化与定制化。具体而言,一体化主要体现在资源、空间与服务流程设计上。资源方面,高校应通过搭建专业的RDM专题网站来实现RDM资源的整合与汇聚,包含科研数据相关的国家、资助机构与期刊政策,RDM常见问题答疑,数据管理流程指南及RDM培训课程等。空间上,高校除通过Web Service与咨询服务台等方式提供的请求/响应式数据服务外,还应积极探索线上线下相结合,虚拟创客空间等形式,主动了解并挖掘不同学科领域研究人员的潜在需求,增强服务的前瞻性与互动性。服务流程上,根据科研数据生命周期,高校RDM服务可划分为前、中、后三个阶段,高校应结合研究人员的需求分析与明确每个阶段的服务任务,进而设计具体的服务方式与内容。同时要加强服务规范的制定与推广,不断优化服务流程,形成相对完善的RDM协同机制,提升服务效能;细粒度主要体现在技术,人员配备和服务内容上。技术方面,高校应加大对RDM专业软件与工具(如DMP工具、数据存储库)的开发利用,使得“技术+”RDM服务进一步细化,提升RDM服务的技术支撑能力。人员配备方面,应科学设置RDM服务专门岗位,合理配置相关人员,特别要加强面向科研过程的嵌入式数据馆员的培养,使其具备扎实的学科知识、丰富的数据素养和开阔的通识知识结构,从而能为研究人员提供可信赖的、个性化的、专业化的RDM增值服务。服务内容上,高校RDM服务应是从大而全转变为全而细的渐进过程,在过渡中应始终遵循服务环境泛在化、服务格局一体化、服务途径多向化、服务方法多样化、服务方式多元化的设计原则。
3.4 重视科研数据管理的宣传与外联活动,培养研究人员RDM技能
有研究表明,不能明确数据管理带来的益处与RDM相关技能的缺失是研究人员接纳并参与科研数据管理服务的两大主要障碍[35]。多数研究人员认为管理与共享科研数据无疑会增加自身的工作量,而收益最大的是数据重用者而非数据生产者。比利时各高校在科研数据管理服务中特别注重科研数据相关知识与服务的宣传与推广工作,如举办开放获取主题周,RDM专题路演、RDM知识交流工作坊等。荷语鲁汶大学、根特大学、哈塞尔特大学等多所高校定期向学院和研究人员团队推送科研数据管理服务的最新发展动态及阶段性成果报告,极大程度提高了研究人员的数据认知与参与意愿,使得RDM服务保持生机与活力。此外,各高校秉承RDM是所有研究人员的一项基本技能的理念,通过引进国外(如JISC、DCC)成熟的RDM课程资源与开发本校课程相结合的形式,有效提升了研究人员的数据管理技能。借鉴比利时高校的实践经验,国内高校一方面应保持高度的RDM宣传意识,向研究人员普及科研数据管理的重要意义,唤醒个体对科研数据的责任意识,使其及时参与到科研数据管理的行动中来。另一方面,应加大RDM专业知识与技能相关课程资源的培育力度,课程内容涵盖RDM政策、基础理论知识、案例模板、实践技能等,通过培训来提升研究人员的数据素养与RDM能力。
3.5 聚焦数据要素市场化要求,助推高校RDM服务内涵本土化再升级
高校开展RDM服务不仅是为了服务于科学研究,更重要的是服务于国家数字经济战略发展的需要。当前,我国数据要素价值有序释放,数字经济发展进入数据驱动新阶段。2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》指出要建立保障权益的数据产权制度,建立安全可控、弹性包容的数据要素治理制度。2023年1月4日,中国信息通信研究院发布的《大数据白皮书(2022年)》显示,我国虽已形成数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域,但仍存在着数据安全责任体系构建不成熟,数据安全的主体责任边界模糊,具体业务场景下的技术落地仍然缺乏实践指引,数据安全管理与技术易脱钩一系列问题。数据要素市场改革下对高校科研数据管理的影响是多方面的,科研数据是否包含商业秘密,是否具有商业开发或技术转让的潜力以及当研究涉及到个体参与者时的伦理问题及使用个人数据时的隐私保护和知识产权等都是科研数据作为生产要素进入市场前评估的重要因素。同时,科研数据作为生产要素进行流通的重要前提是开放共享,但科研数据开放过程中又面临着对数据安全性、合规性、权益分配等方面的考量,在一定程度上阻碍了科研数据的互联互通与价值实现,市场因而呈现“数据需要开放,却又难以开放”的困境。在此背景下,高校在RDM服务本土化开发与部署过程中应主动对接国家数据要素市场化改革要求,发挥高校在数据确权,数据分类分级管理、数据安全与隐私保护等方面的传统优势,如面向研究人员普及如何编辑敏感数据以消除或减少识别个人身份可能性的匿名化与假名化技术,提供有关数据隐私保护方面的技术与法律咨询等服务,从而不断优化RDM服务链条,更好服务于我国数字经济的高质量发展。
4 结 语
数据密集型科学环境下,科研数据管理是高校进行高质量研究和守护学术诚信的基础。高校科研数据管理服务的开展要以政策法规为导向依据,以加强组织机构建设为基础依托,以深化服务内涵为主要抓手,才能保障服务质量,更好的服务于研究人员。当前国内高校的科研数据管理服务缺少体系性,更缺少多部门的参与,使得高校科研数据管理的工作重点被长期圈定在技术领域,服务难以规范化和常态化,服务能力提升困难。参考比利时高校科研数据管理服务的实践经验,国内高校应着力加强对RDM服务的组织领导和顶层设计,有效保障科研数据管理工作的顺利开展。