基于科研项目生命周期的科研数据管理体系研究
2021-12-01金贞燕阿童木
金贞燕 阿童木
摘要:[目的/意义]以科研项目全生命周期为主线,探索科研数据管理体系,为我国科研数据管理的实施提供借鉴。[方法/过程]基于科研项目生命周期,以科研项目参与主体为导向,构建科研数据管理组织体系和实施体系, 明确科研项目参与主体: 国家、科研资助机构、科研机构及研究人员科研数据管理的职责,以及每个参与主体在科研项目生命周期每个阶段应尽的科研数据管理任务。[结果/结论]科研数据管理立足于科研项目展开的整个过程,建立以科研资助机构为主导、基于科研项目全生命周期的管理模式。
关键词:科研数据 数据管理 科研项目
分类号:G250.73
引用格式:金贞燕, 阿童木. 基于科研项目生命周期的科研数据管理体系研究[J/OL]. 知识管理论坛, 2021, 6(4): 228-237[引用日期]. http://www.kmf.ac.cn/p/256/.
1 引言
2007年经济合作与发展组织(Organization for Economic Cooperation and Development,OECD)发布的《OECD关于公共资助的科研数据获取的指导方针和原则》(OECD Principles and Guidelines for Access to Research Data from Public Funding)中[1]强调了公共资助的科研数据的公开接触,认为共享和开放公共资助的科研数据不仅有助于最大限度地发挥新的数字技术和网络的研究潜力,而且可以从公共研究投资中获得更大的回报。近几年来,各国政府组织也认识到以国民税金生产的科研数据的重要性,纷纷制定了国家层面的科研数据管理和共享的相关法律法规和政策。特别是在美国、英国、澳大利亚等主要发达国家,由科研资助机构主导制定了科研数据管理和共享的一般原则及具体的认定政策。目前,科研数据管理与共享已成为一项全球性运动,许多国家越来越多地采用类似战略,这些战略通常由政府管制,并由科研资助机构主导制定相关政策,取得了可喜的成果。就我国而言, 虽然2018 年3月国务院办公厅颁布了《科学数据管理办法》[2],要求政府预算资金支持开展的科研活动,需要对科研数据进行合理的开放共享和管理使用,但现阶段,各级科研资助机构尚未制定科研数据管理与共享方面的政策,科研项目实施中生成的科研数据被放置在研究人员个人的电脑或实验室服务器上,缺乏集中管理,使得科研数据没有得到有效共享, 存在丢失及无法长期保存的问题。近年来,国外政府及科研资助机构的科研数据管理及共享政策接连发布,国内也对此进行了分析和今后应对方案的研究,而这些研究大都只注重科研数据管理的某一环节或者浅层的网络调研,缺乏从整体的角度进行系统的考察和深入分析。本研究认为科研数据是科學研究活动中产生的,而科研项目作为科学研究活动的主要形式,随着现代社会的发展更加受到公众、企业界和政府的高度重视,各国政府将更多的经费用于科研项目活动。加强科研项目活动中的科研数据管理与共享,不仅是国家政府有关管理部门的当务之急,同时更是以科研项目为支撑的科研机构的重要责任。鉴于此,本研究从整体的角度出发,以科研项目全生命周期为主线,探索科研数据管理体系,为我国科研数据管理与共享工作的发展提供借鉴。
2 相关研究现状
科研数据是科学研究基本来源的事实记录(数值数据、文本记录、图像和音频),是被科学界所共同接受的对研究结果所必需的数据,但不包括实验室笔记、初步分析、论文草稿、未来的研究计划、同行评论与同行的交流以及实物(如实验样本、细菌和测试的动物)等内容[1]。科研数据作为投入大量时间和金钱而产生的重要的信息资源,为了对结果进行验证、提高研究的效率、使数据安全和数据损失最小化、让数据广泛普及、扩大影响力以及通过数据的再利用实现研究的连续性,同时为了遵守基金组织的要求,要适当地进行管理[3]。要对科研数据进行有效的管理,需要经过统一的、系统性的复杂过程。一般科研数据管理(Research Data Management,RDM)包括制定数据管理规划(Data Management Plan,DMP)、按DMP搜集和创建数据、为数据添加良好的元数据和描述性信息,对数据进行保存和确保可获取性等内容。
近年来科研数据管理成为国内外图书馆学情报学界的研究热点之一,研究内容涵盖了RDM理论研究、RDM政策研究、RDM服务研究以及RDM案例研究等多个领域,其中,RDM体系研究是当前研究中的一个重要组成部分。在RDM体系研究方面,国内的研究以理论研究或者案例分析为主。多数RDM体系研究主要基于两条主线,一条是以数据生命周期的数据管理过程为主线,如王琪以数据科学和信息生命周期管理理论为基础,构建了高校RDM体系,涉及数据的采集、组织、存储、共享与利用、保密与安全等内容[4];储节旺等在总结牛津大学的科学数据生命周期模型的基础上,构建了科学数据管理体系,涉及数据生命周期的每个阶段,包括数据的收集、处理、保存、共享、分析和再利用[5];刘桂锋等基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”4个主要层次,构建了高校科学数据安全的内容框架体系[6]。另一条是基于科研活动周期的数据管理为主线,如杨乐等认为科研活动周期是构建科学数据管理体系的基础研究内容,主要的科学数据管理体系包括数据管理计划、数据存储和出版及整合利用[7];刘琼等以信息生态学为理论指导,构建了高校图书馆的数据管理计划服务框架体系,并提出了图书馆提供科学数据管理计划服务的组成要素[8];张培风等认为数据管理的相关政策、数据的存储库、数据管理过程中的各项活动等构成了科学数据管理的完整体系[9]。在国外,从建立数据管理体系的角度来看,建设时间早,具有法律基础、国家科研资助机构的数据相关政策、大学层面的数据管理支援体系等,同时依托科研项目受到科学基金的支持,表明RDM政策制度和实施体系已经相对成熟。因此,RDM体系研究方面,目前国外学术界更加注重科研数据的类型、格式、获取、存储等实践研究[10]。尤其是元数据作为对科研数据详细信息进行描述的记录信息,受到国外学者的普遍重视,J. Stillerman等认为现代科学产生了大量复杂的异构数据集合,为了有效地利用这些数据,研究人员必须找到相关的数据以及足够的相关元数据,来理解这些数据并将其置于上下文中,这一问题存在于广泛的研究领域,人们使用专门构建的工具来解决这一问题。这些工具通过将数据关系嵌入其数据存储机制和应用程序中来显示。但在生成有用的工具时,这些方法往往难以扩展,并且数据关系不一定是对称的[11]。因此,J. Stillerman等试图建立一个通用的导航元数据系统,将数据之间以及注释和数据之间的关系作为一级对象存储在系统中,它们可以被看作是从部分图形类型中提取的实例。在这一系统中,可以编写通用程序,允许用户浏览这些图形并深入了解其数据[11]。J. Stillerman等认为这个数据导航,为数据的探索提供了先例[11]。总之,国外已有成熟的RDM体系和工具,而我国迫切需要建立RDM制度、体系和工具。然而,国外的RDM体系和工具仅适应于国外RDM过程,很难通过移植方式适应于我国RDM过程。
3 基于科研项目生命周期的科研数据管理体系分析
科研项目是为了解决某一科学技术目标的最基本的单元,也是科学研究的一个最基本的单元。科研项目作为有始有终的一种一次性活动,这种活动也遵从“生命周期”的规律,“科研项目生命周期”一般是指从项目的申报、立项、项目启动、组织与准备、实施项目到项目验收结束。国际档案理事会认为RDM工作应立足于科研项目展开的整个过程,建立基于科研项目全生命周期的管理模式[12]。科研项目活动过程中的RDM活动是复杂的系统性工程,其特点是,参与群体众多、实施过程繁杂。本研究主要探讨基于科研项目全生命周期的RDM组织体系和实施体系,为明确RDM职责提供参考。
3.1 科研数据管理组织体系
由科研发展资助资金支援的科研项目开展过程中,众多的利益相关者参与其中共同构成科研数据管理与共享生态系统。其中起关键作用的利益相关者包括4类,即国家政府、科研资助机构、科研机构与研究人员。从科研项目的RDM组织体系构成上看,主要由三个层面构成:法律层面、政策层面和执行层面。各参与群体从这三个层面上各自承担不同的职能,一是在法律层面上的国家立法机构;二是政策层面上的资助研究人员进行科学研究的科研资助机构;三是执行层面上的承担科研任务的科研机构,主要包括国家所属研究所、高等院校以及承担科研项目进行科学研究并产生科研数据的研究人员。其中科研资助机构作为负责科研项目的申请受理、评审、立项、实施过程管理、结题验收以及组织对计划的评估等的机构,具有重要的核心地位。科研资助机构制订政策,把RDM融入到科研项目管理的过程中,积极推动科研机构(大学)科研数据管理与共享发展,各科研机构(大学)在其政策指导下,严格按照资助机构政策的要求,根据本机构实际执行RDM相关政策。图1是以科研资助机构为核心的科研项目生命周期内的RDM组织体系,各组成群体在体系中的职责如下:
(1)法律层。在进行科学研究时,数据的采集、使用和共享必须遵守法律规定和伦理规范,健全的法律体系能够保障科研数据管理与共享得以顺利实施。一般国家政府的数据政策是以法律的形式存在,其法律政策是方向性的规划指导与原则性的约束,但具有权威性,不容亵渎与挑战。
大多数国家为了社会范围内的数据管理、收集、整理和流通具备一定的保障,都制定了数据使用相关的法律法规。但是对于我国而言,由于科研数据管理相关研究与工作起步较晚,虽然保护科研人员的知识产权已经达成共识,但是科研数据著作权保护方面,没有完善的科研数据著作权保护体系,这是影响科研数据广泛共享的一个比较大的障碍之一。而欧美等发达国家的数据共享制度建设已经达到一定水平,关于数据管理和共享的法律法规非常之多,为我国数据立法工作提供了良好的借鉴。例如,英国信息自由法案2000(The Freedom of Information Act 2000)是为了增加公共部门的透明性而制定的,具体要求普通人提供公共机关所拥有的信息。重要的是可以根据信息自由法案申请科研数据。该数据的著作权归属于进行研究的研究者或科研机构。所有的科研数据不会根据该法律公开。该法有多种例外条款,与科研数据直接相关的例外条款包括个人信息、通过其他渠道可访问的信息(如网站)、未来出版中使用的信息、保密保障合同保护的信息(如用户同意书)或数据库限制性接触的敏感数据等。美国也有信息自由法(Freedom of Information Act),该法强调信息的自由传播,确立了政府信息公开是原则,不公开是例外,并以不高于成本的价格,完全、公开和无歧视地向全社会提供共享服务,并且采用政府信息面前人人平等的原则,政府拒绝提供信息要负举证责任,法院具有重新审理的权力。开放共享并不意味着任何人可以随心所欲地做任何事情,实施数据的开放共享也有一定的前提条件,建立多方利益群体之间相互制约、相互监督的制度有利于提高数据共享的程度与效率[13]。
(2)政策层。RDM政策可以为科研数据管理工作的顺利进行提供良好的环境,并有利于科研数据共享的积极实践。科研资助机构是科研项目的主要资金承担者,是公共资金支付者的负责机构,对科学研究有着指引作用,其建议与强制性执行往往决定着数据的管理和共享状态,因此,在引导科研数据管理与共享方面起着至关重要的作用。科研资助机构在科研数据管理与共享的过程中,应当起到指引、监督作用,可以通过规范的数据政策来要求研究人员提交、存储和共享科研数据,同时可以通过将RDM纳入考核评估体系以激励研究人员管理科研数据。科研资助机构希望看到,自身提供给科研项目的资金充分发挥价值,以换取对社会的最大回报,从而最终实现公共利益。
欧美发达国家在科研数据管理与共享政策实施方面积累了丰富的经验,在这些国家,科 研资助机构的数据政策已成为推行数据共享和加强数据管理的驱动力量。通过科研资助机构强制性的政策进行管理和执行,能够更好地规范管理政策的执行,又能提高政策的办事效率。这些国家的数据政策是基于OECD的原则,即公共资助的科研数据是一种公共物品,应尽可能减少限制地提供给公众[1]。其中,英国是通过研究资助者强制性的数據政策,来执行科研数据管理与共享的典范。在英国,第一批拥有数据政策的英国研究资助者是那些同时支持数据中心的机构:自然环境研究委员会(NERC)、经济和社会研究委员会(ESRC)和艺术与人文研究委员会(AHRC)。2004年,英国与其他33个国家的政府一道,通过了《经合组织关于从公共资金获取数据的宣言》,这是进一步制定数据政策的一个关键驱动力。随后发布了原则和准则,以帮助指导制定与科研数据的获取、使用和管理有关的政策和良好做法(经合组织,2007年)。英国研究资助者对这一动力作出了回应。医学研究理事会(MRC,2011年)、生物和生物医学科学研究理事会(BBSRC,2010年)和惠康信托基金(2011年)都在2005-2007年推出了数据政策,这些政策均以经合组织的原则为出发点。而英国研究委员会(RCUK)《数据政策共同原则》于2011年4月发布,体现出资助者数据政策的协调化趋势。工程和物理科学研究理事会(EPSRC,2011)及科学和技术设施理事会(STFC,2011)随后分别于5月和9月发布了各自的数据政策。纪律联合会也在政策声明方面团结一致。2011年1月,17个主要国际公共卫生研究资助机构签署了《共享科研数据以改善公共卫生宣言》(Wellcome Trust,2011)。这种一致性和连贯性政策提高了RDM的实施效率14]。要知道在全英国高等教育机构中,55%的研究是由研究理事会所资助的,每年的资助金额高达30亿欧元,这些政策对研究实践产生了深远的影响[15]。在美国,推动数据共享议程和共享政策的制定机构也是像美国国家科学基金(NSF)和美国国立卫生研究院(NIH)等研究基金组织。
(3)执行层。RDM的执行层是科研机构(大学)和研究人员。研究人员是数据的生产者和使用者,在科研数据的管理和共享的过程中起着关键性的作用,是必不可少的核心因素。科研机构是科研数据的产生地和重要使用场所,科研机构遵循科研资助机构的数据政策,在细化数据政策的基础上,对掌握的科研数据进行存储、整合、分析,并配合科研人员从事科研数据的管理工作。
在科研数据管理与共享执行层面,最大的障碍是研究人员共享数据的意愿并不强烈。虽然研究人员是数据共享的最大受益者,但多数研究人员对共享数据表现出担忧或犹豫不决,导致这种现象的原因,通常是未知因素和对共享过程的真实需求不了解。同时,没有健全的相关政策和激励机制,缺乏统一的数据标准,不同于学术论文、共享风险的存在等也是数据共享的主要抑制因素。科研机构(大学)作为RDM的重要执行部门,在能否顺利实施科研资助机构的数据管理政策方面起着至关重要的作用。科研机构(大学)首先需要向研究人员广泛宣传科研数据管理与共享的政策和益处,营造宣传数据共享的氛围,以提高科研人员数据共享的热情;其次,需要根据科研资助机构的政策要求制定适合于本机构的科学合理的RDM战略和实施路线图,同时为研究人员提供科研数据管理基础设施(机构知识库、学科知识库等)和相关支持服务(图书馆支持服务等)。科研机构(大学)与研究人员之间是相对复杂的隶属与管辖关系,两者互相补充,互相配合,缺一不可。两者关系的矛盾主要体现在个人利益与集体利益的衡量上,在RDM实施进程中,个人与集体利益如何实现双赢是需要克服的工作难点。
3.2 科研数据管理实施体系
以上是以科研资助机构为核心的科研项目生命周期内的RDM组织体系,建立组织体系的目的是构建RDM政策传导和RDM实施体系,促进和规范科研数据管理与共享实践,从而为科学研究、政府决策以及经济社会建设提供数据支撑,最大限度地发挥数据共享的效益。因而,如何确保政策的执行和实施效果是我们必须思考的问题。笔者在分析基于科研项目的RDM组织体系的基础上,进一步探讨基于科研项目生命周期的RDM实施体系,从而确保政策的顺利实施和获得预期效果。
科研项目活动和RDM活动均遵循生命周期规律,各自有不同的阶段和不同的活动内容,在科研项目实施过程中,可以借鉴生命周期理论,将科研资助机构制订的DMP强制性政策和RDM各阶段的活动融入到科研项目实施的全生命过程中,结合项目各阶段特点,分步实施数据管理活动、阶段审核DMP实施的情况,及时发现问题,适时调整方法或思路,能有效地提髙数据管理的效率,为顺利完成科研RDM的目标奠定坚实的基础。常规的科研项目整个过程可分为项目立项审批阶段(项目计划书的编写、立项论证、评审等)、项目研发实施阶段(组织实施、原始数据收集、研究分析、监督检查等)、项目完成验收阶段(结题、成果鉴定、验收、成果发表等)三个阶段,这三个阶段形成了一个完整的科研项目管理链,各阶段的管理都要遵循一定的程序进行管理。将RDM相关活动整合到科研项目生命周期的每个阶段,每个阶段包括不同的数据管理内容:①项目立项审批阶段的数据管理主要包括DMP的编制和审核; ②项目研发实施阶段的数据管理主要包括收集科研数据、整合科研数据、项目中期跟踪调研评估DMP的执行情况、提供科研数据管理相关支持服务;③项目完成成果的验收阶段的管理内容又包括科研数据的保存、评估基于DMP的数据共享情况、出版与共享。科研项目实施过程中的RDM体系见图2。三个阶段的RDM主要职责如下:
(1)项目立项审批阶段的DMP的强制性提交政策。在立项审批阶段,主要包括提出所要研究的问题、编写研究项目计划书、提交评审研究项目计划书。在这一阶段科研数据管理的主要任务是DMP强制性提交政策的贯彻实施,科研资助机构在政策层面上强制性要求在项目计划书中必须包括DMP,研究人员必须按照科研资助机构的具体要求编写DMP,科研机构(大学)根据科研资助机构的政策要求在物质和人力层面为研究人员提供相应的DMP编制支持服务,科研资助机构在项目的评审过程中审核计划书中DMP的编写情况。DMP是围绕着待开展的科研项目全过程,为如何实现科研数据管理与共享的目标定计划的过程。这些计划过程均应在科研项目所有活动开始之前进行,以确定各阶段应开展的数据管理活动、遵循的准则等,明确每个阶段的数据管理活动及管理要求,用于指导后续活动,使参与每项活动的每个人都明白各项活动中数据管理的目标、要求和职责,确保每项活动中的科研数据管理始终处于计划的预期中,最大限度地降低科研数据管理活动的盲目性和随意性,从而确保设计计划的结果达到预期的目标和效果。关于DMP具体要求,国外很多科研资助机构详细说明了其所要求的数据管理与共享计划应该包含的内容,一般包括:数据管理计划的概念、制定数据管理计划的意义、提交数据管理计划的时间、数据管理计划的具体内容等,并指出项目申请者需要重点说明数据发现方式、数据访问范围及资源范围、数据标准及元数据标准等内容。很多科研资助机构都提供数据管理计划指南及数据管理计划的模板。
根据国外的经验,在数据管理政策中影响最大的政策是DMP的强制性提交政策,具体做法是:在研究资助申请书中,义务性地提出科研数据管理和共享的内容,并且监督数据管理政策的执行情况,特别是在科研项目结题阶段评估数据管理计划的实施,并采取惩罚措施。实施DMP政策的科研资助机构和大多数研究人员认为,在审核研究资助申请书时,该申请书的科学价值是最重要的评价要素,但微弱的DMP也是资助落选的原因之一。美国代表性的科研资助机构NSF从2011年开始全面引进DMP义务提交规定,英国的科研資助机构大部分都适用,被认为是刺激科研数据管理和共享的非常有效的手段。在研究进行之前,研究人员编写DMP,具体计划数据的整体生命周期,可以提高科研数据的质量。但是DMP本身并不是科研数据相关政策的全部,只有和各种不同的政策手段一起使用才能有效。
(2)项目研发实施阶段的DMP实施进展评估策略。科研项目实施阶段是指科研项目立项后组织实施至科研成果验收前这一段时间,该阶段的主要研究工作包括原始数据的收集、研究分析。原始数据的收集是搜集和使用原始数据,研究分析主要包括综合分析、数据计算、数据统计、数据选择标准和释义。在这一阶段,RDM的主要任务是数据的收集,研究人员对研究过程中产生的数据进行收集和整合。在这一过程中相关科研机构(大学)的主要任务是在有限的资源条件下,为了保证科研项目实施过程中的RDM的有效实施,为研究人员提供RDM支持服务。科研资助机构在项目的中期审查过程中,跟踪监督研究人员DMP的实施情况。研究人员利用研究机构提供的多种设施和服务对研究过程中产生的数据进行管理,同时接受上级有关部门的监督、审查等。
科研项目实施阶段作为数据产生的重要阶段,中期对DMP的实施进展评估是推行实施科研数据管理的重要一环。DMP实施进展評估是通过定期或不定期检查,对DMP的实施进度、质量和水平实行有效地监督的过程。DMP进展评估,对于确保完成DMP目标具有重要意义。
DMP进展评估主要是依据提交的DMP内容,对DMP实施进展情况进行跟踪、监督和评议,对实施情况做阶段性总结,并对以后的实施与管理,提出意见或建议。在科研项目实施过程中,除了科研资助机构的中期跟踪检查评估,各科研单位及管理部门可采取自查和他查、阶段检查和定期检查相结合的方式,加强DMP实施情况的检查监督工作,及时采取措施,解决检查中发现的问题,协调好各方关系,确保科研数据管理按计划、高质量地完成。
(3)项目验收阶段的DMP绩效评价制度。 在项目完成评估阶段,对于数据分析结果的评估和审计通常发生在同行评审过程中,主要以科学讨论会、研讨会或发布会的形式开展。项目最终评审结果在子报告或最终报告中呈现,并通过大众媒体、科普或出版的形式向公众传播。作为项目生命周期的最后一个重要的过程,这一阶段的RDM的任务是:研究人员需要寄存科研数据、出版和共享科研数据,并对数据进行持续的管理;科研机构保存和共享研究数据;科研资助机构需要评价项目立项阶段提交的DMP和数据共享情况。RDM在归档、发布和传播阶段的活动与数据归档和保存有关,研究人员在此阶段确定要保存哪些数据以及保存多长时间。
与科研项目立项审批阶段相比,各科研院所和研究人员对项目结题、鉴定、验收的管理远不如用于争取科研项目上下的功夫大,这在一定程度上影响了科研数据的访问共享。为了更有效地管理科研项目实施过程中产生的数据,一方面,教育研究人员关于数据集的保留要求是很重要的,还需要酌情提供长期存档数据的存储选项,包括有关访问控制、方便检索、数据隐私和保密要求的详细信息。这一点显得越来越重要,因为不仅是科研资助机构,越来越多的期刊出版商也要求研究人员尽可能公开他们的数据。这意味着,当提交一篇文章发表时,研究人员需要指出他们是否能够使支持发表的数据集可供评论者访问。另一方面,要认真执行结题程序,制定和强化DMP实施的绩效评价制度,对没有按照DMP的具体内容实施科研数据管理和共享的项目,实行惩罚的措施,今后再申请项目将受到一定限制。
总而言之,RDM过程是基于现代项目管理的生命周期理论,通过对科研项目的立项、实施和验收三个阶段的管理控制,实现对整个项目过程中的管理。基于科研项目生命周期的RDM应作为科研项目管理的一环,跟踪科研项目全过程进行管理,而不是仅重视和关注某一个阶段。项目工作是一个渐进的过程,项目往往要经历几个显著的阶段,在各个阶段所需完成的工作、工作的重心、所需的资源及人员等是不同的,各阶段是相互联系、相互影响的,因此要加强各个阶段科研数据管理,才能有效完成项目目标。同时,一个完整的项目从立项到最终项目验收过程中的科研数据管理,往往需要来自于不同的部门多个项目成员参与,共同完成项目科研数据管理目标。在RDM过程中,参与其中的各部门之间只有通力合作、支持数据管理相关政策和数据管理工作,才能保证数据管理工作得以成功和持续发展。
4 对我国RDM运行体系的建议
4.1 尽快制定健全的数据开放法律法规
目前,国家整体研究经费的投资规模排在世界前列,研究影响力也在改善。我们不能一直推迟再利用投入巨额财政资金生产的科研数据的机会。如果能够对庞大的科研数据进行系统管理和共享,数据的再利用就会变得容易,这也将会成为提高我国科学研究国际影响力的很好的契机。与发达国家相比,法律层面上,我国只在《科技进步法》《促进科技成果转化法》中提及科学技术资源的相关规定,没有专门针对数据管理与共享的国家强制力的法律法规。已经制定的一些制度条例具有指导性的作用,但缺乏影响力,缺少全局性的指导。对科研资助机构的政策而言,国外科研资助机构把项目申请与科学数据提交直接联系挂钩,然而,我国科研资助机构相关政策很少且不成体系,只有比较初步的尝试,针对性不强。因而,我国迫切需要制定和完善科研数据的管理与共享政策体系和实施体系。在国家层面上应尽快制定针对性较强的数据开放相关法律条文,从而保障科研数据开放共享的顺利进行。
4.2 尽快建立以科研资助机构为主体的RDM政策实施体系
RDM的实施,有必要以科研机构(大学)所属的研究人员在研究过程中生产的数据为中心,进行管理和共享。但是,单纯靠科研机构和研究人员建立数据管理及共享体系比较难。特别是改变个别研究人员的行动是非常困难的课题。在我国,主要的科研机构和大学基本都是国家所有,国家投入的研究经费的绝大部分都是由这些机构以科研项目的形式来执行。因此,从战略上来说,可以从科研项目管理的角度,以科研资助机构为主导,制定科研数据管理与共享政策,并且把相关政策融入到科研项目管理的整个过程中,提高政策的有效性。各科研机构(大学)以科研资助机构的政策为导向,自行制定细化科研数据管理与共享相关的政策、流程建设等发展蓝图,建立科研数据管理体系。具体来说,首先,应考虑通过科研资助机构的强制性政策,加强政策的执行力度,例如,在所有研究项目计划书中实施DMP义务提交的政策,并且科研项目实施全过程中跟踪监督DMP的执行情况;第二,以科研机构(大学)为中心,通过制定执行数据管理与共享的路线图,引导研究人员参与其中;第三,通过评价制度的变更和奖励制度的建设激励研究人员进行科研数据管理与共享。即,科研资助机构层面的针对研究人员的DMP提交强制性政策、科研机构层面的发展蓝图和激励措施同时实施,同时建立多种支援体系,加强资助机构、科研机构和研究人员之间的协同合作,促进科研数据开放实践的发展形成合力。
5 结论
本研究为了今后在我国建立有效的科研数据管理和共享体系,探析了RDM组织体系和实施体系。有效的RDM需要国家的各种法律基础和科研资助机构的政策和程序、建立相关系统、培养专家等广泛的改革举措。在建立国家层面的科研数据管理体系时, 科研资助机构起着承上启下的主导作用。我国科研资助机构的科研数据管理政策需要借鉴国外其他国家先进的经验和制度要求,制定切实有效的科研数据管理政策。通过科研资助机构制定的政策将科研数据的管理和共享的责任追究到科研机构(大学)。同时,有必要将强制性政策和以科研机构(大学)为对象的政策适当融入到科研数据管理的相关政策中,以加强政策的执行力度。国外的经验表明,数据管理和共享与现有的论文、专利及报告书为主的成果管理不同,不是短期内可以建立的,需要有长期发展的观念,特别是科研资助机构、科研机构(大学)负责人、研究人员及其他利益相关者之间对数据管理与共享方面的认识差异较大,相互之间形成共鸣是很重要的。鉴于此,应立足于我国科研项目开展流程的现实情况,将科研项目流程划分为若干个阶段,针对不同的项目阶段,明确相应的管理责任主体,体现“谁拥有、谁负责”的原则,构建清晰、完善的RDM责任体系。
参考文献:
[1] Organization for economic co-operation and development. OECD principles and guidelines for access to research fata from public funding[EB/OL]. [2020-12-15]. http://www.oecd.org/science/ sci-tech/38500813.pdf.
[2] 国务院办公厅. 科学数据管理办法[EB/OL]. [2020-12-21]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
[3] TENOPIR C, ANDUSKV R J, ALLARD S, et al. Research data management services in academic research libraries and perceptions of librarians[J]. Library and information science research, 2014(36): 84-90.
[4] 王琪. 数字化科研环境下高校科学数据管理与支撑体系研究[D]. 南京: 南京大学, 2019.
[5] 储节旺, 厦莉. 嵌入生命周期理论的科学数据管理体系构建研究[J]. 现代情报, 2020, 40(10): 34-42.
[6] 刘桂锋, 阮冰颖, 包翔. 数据生命周期视角下高校科学数据安全内容框架构建[J]. 情报杂志, 2021, 40(2): 46-53.
[7] 杨乐, 颜石磊, 李洪波. 科研数据生命周期研究和数据知识库理论架构[J]. 图书情报工作, 2019, 63(1): 91-97.
[8] 刘琼, 刘桂锋. 高校图书馆科学数据管理计划服务框架构建与解析[J]. 国家图书馆学刊, 2019, 28(4): 21-31.
[9] 张培风, 张连分.全球科研范式变革下的图书馆科学数据管理服务创新——基于数据管理生命周期的视角[J]. 图书馆理论与实践, 2019(5): 39-48.
[10] National Science Foundation. Chapter II-proposal preparation instructions[EB/OL]. [2021-02-01]. https://www.nsf.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp#dmp.
[11] STILLERMAN J, GREENWALD M, WRIGHT J. Scientific data management with navigational metadata[J]. Fusion engineering and design, 2018, 128(8): 113-116.
[12] AROVELIUS R. Management and preservation of scientific records and data[EB/OL]. [2021-01-28]. https://www.ltu.se/cms_fs/1.95314!/file/Handbook%202010%20final%20SUV%20logo.pdf
[13] MULLIGAN H. Briefing-freedom of information: new rules on datasets [EB/OL].[2021-01-21]. https://www.farrer.co.uk/search/?q=Briefing-freedom+of+information%3A+new+rules+on+datasets
[14] JONES S. Developments in research funder data policy[J]. The international journal of digital curation, 2012, 7(1): 114-125.
[15] LOUISE C, VEERLE VDE, LIBBY B, et al. 研究數据的管理与共享最佳实践指南[M]. 北京: 科学出版社, 2018: 4.
作者貢献说明:
金贞燕:提出论文研究思路, 设计研究架构, 撰写与修改论文;
阿童木:整理资料, 修改论文与校对。
A Study on Research Data Management System based on the
Scientific Research Project Life Cycle
Jin Zhenyan A Tongmu
Library, Renmin University of China, Beijing 100872
Abstract:[Purpose/significance] Taking the whole life cycle of scientific research project as the main line, this paper explores the RDM system and provides reference for the implementation of RDM in China. [Method/process] Based on the life cycle of scientific research projects and guided by the participants of scientific research projects, the organization system and implementation system of RDM were constructed. The responsibilities of the participants of scientific research projects, the state, R&D funding institutions, R&D institutions and researchers, and the RDM tasks of each participant in each stage of the life cycle of scientific research projects were defined. [Result/conclusion] RDM should be based on the whole process of scientific research projects, and establish a management mode based on the whole life cycle of scientific research projects, which is led by RDM funding institutions.
Keywords: research data data management scientific research project