APP下载

加州数字图书馆数据管理计划工具研究及思考

2015-05-13吴海茹

新世纪图书馆 2015年5期
关键词:科研机构数据管理科研人员

吴海茹

为提高科研数据管理水平,国外众多研究机构引入生命周期管理理念,形成各具特色的数据管理模型,如ICPSR社会科学数据存档生命周期模型、DataONE科学数据生命周期管理模型、英国数据存档生命周期管理模型等[1]。这些模型虽因研究主体的不同而存在一定差异,但均将制定数据管理计划视为科研数据管理的关键点。为帮助研究者迅速生成简单有效的数据管理计划,加州数字图书馆数据保存中心基于科研人员的现实需求,联合其他7所科研机构,共同研制了一款数据管理计划生成工具—DMPTool。本文拟对该工具进行介绍,并阐述该工具为国内科研数据管理带来的启示。

1 DMPTool的提出及发展

2010年初,美国国家自然科学基金会(简称NSF)发布了项目管理指南,规定自2011年1月18日起所有提交至NSF的申请项目必须以附件形式提交一份不超过两页纸的数据管理计划,详细描述申请者如何实现项目数据的有效管理与共享传播,缺少数据管理计划的申请项目将不予接受[2]。除此之外,美国卫生和人类服务部下属的国立卫生研究院、美国航空航天局等其他科研项目资助巨头同样在其资助指南中对项目的数据管理做出明确规定。为响应这些科研项目资助机构的要求,方便科研者制作数据管理计划,美国加州数字图书馆数据保存中心联合加州大学洛杉矶分校图书馆、加州大学圣地亚哥分校图书馆、史密森学会、弗吉尼亚大学图书馆、伊利诺伊大学厄巴纳香槟分校图书馆、数据监管中心以及DataONE项目中心,推出了数据管理计划生成工具DMPTool[3]。

2011年10月,DMPTool在线版本正式发布,该工具一经发布,便引起科研界及图书馆界的极大关注,并入选美国国会图书馆2011年十大数字保存发展项目。2013年,DMPTool项目组接受Alfred P.Sloan基金会、美国博物馆和图书馆协会注资,开始了第二阶段的研发工作。2014年5月,项目组正式发布DMPTool V2版本,相较版本1,版本2实现了诸多改良(见表1)。

1.1 DMPTool角色权限改良

系统的角色权限设计包括两个维度:一是系统用户的角色定义,包括角色大类(如操作员、管理员)和大类下的角色细分(如科研机构级别管理员、总系统管理员);二是职责和权限在不同角色大类和细分角色的分配。

升级版的DMPTool在角色权限方面做出了如下改良:(1)增设系统编辑员角色,包括资源编辑员和模板编辑员,前者负责帮助信息、链接信息、参考答案的日常维护和更新,后者负责数据计划模板的日常维护和更新。(2)增设科研机构级别DMP复核员角色,负责对机构内提交的数据管理计划进行统一检查和审核。(3)对管理员角色进一步细分,增设科研机构级别管理员,负责管理、维护机构级别的DMPTool,及时收集反馈基层数据管理需求信息,协调发展科研机构与资助机构、总系统管理员的合作关系。

表1 DMPTool新旧版本对比分析表

1.2 DMPTool模块设置改良

升级版的DMPTool登录界面包含三大模块:公开化DMPS、DMPTool新闻和DMPTool帮助。该界面设计可以使用户在正式使用工具前通过大致的浏览就可以初步掌握DMP的结构内容、DMPTool的发展动态及具体如何使用DMPTool。其中,帮助模块最能集中体现升级版DMPTool的创新:(1) 增加FAQ(Frequently Asked Questions,常见问题解答);(2)专设针对系统管理员的Wiki帮助,并通过GitHub进行托管控制;(3)增加数据管理指导内容,相较旧版工具侧重于数据计划的生成,升级版的工具更侧重于对科研人员数据管理能力的提升;(4)增加公开资源信息,公开资源信息包括各资助机构的项目信息、最新政策、资助动态等内容,该内容的加入赋予了DMPTool新的内涵和外延,除了数据管理计划生成功能,DMPTool进一步彰显了对科研机构、资助机构和科研人员三者信息沟通和合作的促进作用[4]。

1.3 DMPTool模板设置改良

旧版的数据管理计划工具中,可供用户参考复制的数据计划模板大多是按照资助机构的数据管理政策制定,实际工作中,由于各科研机构对数据存储、数据共享要求的差异,这些按照资助机构要求制定的模板并不能完全满足科研人员以及科研机构数据管理计划生成需求。因此,升级版的DMPTool中特别增设了科研机构DMP模板,该模板管理权限统一下放到科研机构层级的系统管理员。

1.4 DMPTool自定义改良

数据政策、用户需求的不同都会引发数据管理计划的不同,而数据管理需求又会随着科研领域、数据管理偏好、数据计划用途等具体内容的变动而变化。DMPTool必须在统一的数据管理政策下,尽可能关注科研人员多样化、个性化需求,才能实现应用工具的可持续化发展,因此,升级版的DMPTool进一步拓展了其自定义功能。(1)科研机构自定义。包括①机构基础信息输入、Logo设计;②机构授权,自定义设置不同的角色和权限,如模板编辑员、资源编辑员、复核员、管理员;③模板自定义,设计符合本机构数据政策、应用于不同领域或提交给不同资助机构的DMP模板。(2)科研人员自定义。这一模板大多是为了满足用户特定条件下的需求,如教师想设计一份用于大一本科生数据管理课堂教学的通用性DMP,或者项目中不同角色(PI或CO-PI)的科研人员需要从不同角度出发设计不同数据管理侧重点的DMP,这些都可以通过用户自定义功能实现[5]。

2 DMPTool的功能分析

2.1 快捷生成科研数据管理计划

DMPTool工具是一款开源软件,可免费获取,用户登录注册也不受任何限制。协助科研人员以最简单直接的方式生成数据管理计划,是DMPTool的项目宗旨之一。纵观整个DMPTool的使用步骤(如图1),完美诠释了在线应用工具的便捷性。

第一步,选择DMP模板。包括三项内容:(1)选择登陆方式(机构用户或非机构用户);(2)选择科研项目资助机构,如NSF-AGS(NSF天文地理科学基金会)或 NSF-BIO(NSF生物科学基金会)等;(3)选择所需复制的计划模板,即开放共享的计划、机构内共享计划、用户创建的历史计划。用户应评估当前计划需求,选择适当的模板作为新计划的制定基础。

第二步,填写数据计划基础信息。包括以下内容:填写计划名称、项目申请号、项目提案截止日等内容;增加项目合作者信息,设置项目合作方拥有对数据计划编辑、预览、下载的权限;设置数据计划公开方式,包括仅项目申请人和合作者可见、机构内共享和公开存取3类。

第三步,完成DMP细节描述。通过答题的方式,完成数据格式、数据存储方式、数据共享策略等内容的设置,每道问题都配答题指导、参考答案和相关性资源链接,能够保证数据管理能力较弱的用户也能详细、客观地作答。

第四步,自动生成科研项目数据管理计划。DMPTool在综合前3步信息的基础上,自动生成报告,用户只需选择报告导出格式(txt/rtf/pdf等3类),便可预览、审查系统形成的数据计划,并根据实际需求做出相应调整。整个使用过程方便快捷,不仅有利于科研人员时间成本的节约,潜移默化中也有利于其数据管理能力的提升[6]。

2.2 紧密联系研究者、研究机构和资助机构

先前的科研模式中,研究者、研究机构和资助机构三方对科研数据的管理需求被完全割裂,而DMPTool的出现,成为联系三方科研数据管理需求的桥梁和纽带。(1)研究者和研究机构间数据管理的有机联系。科研人员可以通过DMPTool查看所属机构的计划示例,预览科研机构的需求,查看计划的最新动态,另一方面,科研机构也可以利用DMPTool积极了解科研人员的数据管理水平及需求,利用工具中呈现的数据管理信息和政策,整合规范自身的数据管理政策,促进科研人员与机构图书馆、IT部门及其他数据管理部门的合作和创新。(2)研究者和资助机构间数据管理的有机联系。DMPTool几乎囊括了所有主要项目资助机构(NSF/HIN/DOE/NASA/USDA/DOD)的数据管理要求,并及时追踪各机构的数据政策变更,科研人员可以通过DMPTool了解资助机构的数据管理需求,另一方面,资助机构也可以随时通过对数据管理计划的查看、编辑,及时掌握科研人员的需求动向,改良其数据管理要求和政策。(3)研究机构和资助机构间数据管理的有机联系。科研人员制定的数据计划可以通过科研机构的审核后提交至资助机构,强化了科研单位对资助机构的数据管理政策研究,另一方面,科研机构也可以通过DMPTool与资助机构探讨数据管理相关政策,反馈科研人员的集中化数据管理需求,逐步实现数据政策的规范统一[7]。

2.3 满足用户多样化、个性化定制需求

DMPTool不仅能够帮助用户高效生成标准化数据管理计划,还可以满足用户多样化、个性化的数据管理需求。(1)对科研人员而言,用户可以在标准化数据管理计划中添加体现其个性化需求的元素,使得整个计划在满足资助机构、科研机构要求的同时体现用户一些个性化、多元化的数据管理需求。(2)对科研机构而言,DMPTool管理员可以依据科研人员需求自定义其数据管理计划工具,在现有功能的基础上增加机构级别的信息服务功能,如数据存储服务,不仅进一步完善数据管理计划,更有利于其对科研数据的统一规范化管理[8]。(3)对资助机构而言,用户可以依据资助机构的不同需求而提供不同的计划版本,同时可以依据资助机构需求信息变更,及时调整数据计划,保证计划体现资助机构的专门性需求。

3 DMPTool带来的启示

3.1 分层推进科研数据管理工作

科研数据生命周期理论告诉我们,科研数据遵循计划、采集、确认、描述、保存、分析的发展过程,要确保科研数据发挥出更多价值,必须依据数据发展进程来管理数据。国外科研资助机构及科研机构很早就将提供数据管理计划作为项目申请的硬性要求,我国也应积极设立数据管理计划相关规范要求。首先,政府部门应积极引导科研数据的规范化管理和开放式存取,制定完善的数据管理政策,从政策层面进行数据计划流程的规范和引导。其次,各科研资助管理机构应依据政府出台政策制定相关的实施细则或操作指导,硬性规定项目申请必须附带符合标准的数据管理计划,同时从多方面提供资源,辅助其计划制定。最后,科研机构同样需要制定符合本机构数据管理需求的数据管理政策,协助科研人员制定数据计划,促进科研数据的共享和传播。

3.2 强化科研各方的信息沟通和共享

政府科研管理机关、科研人员、科研机构和资助机构共同构成了科研有机统一体。政府是科技创新的保护者、相关配套制度的建设者、重要基础设施的投资者以及科技创新与产业政策的制定者;科研资助机构在政府相关政策指导下落实科研项目考核评估、促进产学研结合、优化科研资源配置、引导科研成果创新;科研机构侧重机构层面管理规章制度的制定和落实,组织申报各级、各类科研项目,负责科研成果的审核、评估和归档及其他面向本机构科研人员的科研服务项目;科研人员是最直接的科研成果产出者,利用政府、资助机构、科研机构提供的多方资源开展研究,形成丰富的科研成果。充分的信息共享和沟通是科研有机统一体高效运作的前提,DMPTool项目的成功之处也正是在于其实现了研究者、研究机构和资助机构的紧密联系。我国也应通过统一科研平台的构建,及时发布国家科研导向和政策扶持,反馈各类科研需求,保证科研人员的言路畅通和科研政策的上通下达。

3.3 基于科研人员需求构建完备数据管理工具箱

DMPTool数据管理计划生成工具的产生直接源于科研人员项目申报的需求,除了DMPTool,美国加州数字图书馆数据保存中心还设计有一系列满足科研人员数据管理的工具(图2)。

以数据生命周期为序,在数据计划阶段有DMPTool协助科研人员生成数据管理计划,项目申请成功后,科研人员可以通过DataUp检测数据格式、建立标准化元数据,EZID赋予科研数据统一化标识符,最后通过Merritt实现数据的长期存储、管理和分享。整个数据管理过程中,科研人员还可使用Colectica进行数据追踪。强有力数据管理工具箱保障了科研人员对数据的全过程及高效管理。我国科研相关机构也应在切实了解科研人员需求的基础上,设计一系列数据管理应用工具,形成工具箱体系,实现科研人员对科研数据的全方位、高效化管理。

3.4 整合共享,提高科研数据利用效率

各科研机构、科研资助机构在实践中都积累了丰富的科研数据管理经验,科研人员也形成了较高的科研数据管理素养,美国加州数字图书馆的DMPTool工具对三方资源进行了有效整合。(1)通过自定义功能的设置,鼓励科研人员、科研机构在DMPTool平台设计符合不同用途和需求的计划模板,并实现模块共享化管理;(2)DMPTool工具中整合了科研机构、资助机构的数据政策、常见问题、管理程序等信息,通过长期应用实践的磨合,有利于更为统一规范的数据管理政策和科研数据环境的形成;(3)DMPTool平台实现数据计划的三级复核制度,并设有不同级别的数据计划管理员,充分利用了一切可利用的资源实现了科研数据的高效管理。国内的科研数据管理也应在多方科研力量集结的基础上,实现数据管理资源的有效整合和利用。

4 结语

加州数字图书馆联合其他7所科研机构研制的DMPTool数据管理计划生成工具为我国数据管理提供了新视角,国内科研机构应在设立数据管理计划标准化程序、切实了解科研人员需求的基础上,促进科研人员、科研机构和资助机构的沟通交流,整合多方资源,设计强有力的数据管理工具箱,实现对科研数据高效管理。

[1] 丁宁.国外高校科学数据生命周期管理模型比较研究及借鉴[J].图书情报工作,2013(3):18-22.

[2] NSF.Grants.gov application guide:A guide for preparation and submission of NSF applications via grants.gov[EB/OL].(2011-01-18)[2014-05-21].http://www.nsf.gov/pubs/policydocs/grantsgovguide0111.pdf.

[3] Sallans,Andrew.DMPTool:a community tool[EB/OL].(2011-07-11)[2014-05-21].http://blog.dmptool.org/about-the-dmptool/.

[4] Lake,Sherry.DMPTool2:Improvements and Outreach[EB/OL].(2013-11-04) [2014-06-04].http://blog.dmptool.org/presentations-and-press/.

[5] Strasser,Carly.Expanded functionality for better data managementplanning[EB/OL].(2014-02-25)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.

[6] Zing, Tao.DMPTool:Expert Resources and Support forDataManagementPlanning[EB/OL].(2013-09-06)[2014-06-04].http://blog.dmptool.org/presentationsand-press/.

[7] Sallans, Andrew.DMPTool:Integration with other open science software[EB/OL].(2013-05-23)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.

[8] Abrams Stephen,Sallans Andrew.Enhancing DMP Tool:Further Stream lining The Data Management Planning Process[EB/OL].(2013-12-10)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.

猜你喜欢

科研机构数据管理科研人员
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
企业级BOM数据管理概要
科研人员揭示油桃果实表皮不长毛的奥秘
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
逆行者的武汉
企业科研人员激励问题及对策研究
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
快来看,科学家都支持睡懒觉啦