APP下载

国外科学数据开放共享政策述评

2018-08-08

图书馆论坛 2018年8期
关键词:知识库数据管理资助

自21世纪以来,国外相继制定了科学数据开放共享政策。有关科学数据开放共享政策[1]及其内容[2]与特点[3]引起了我国的关注,但国内的研究并未对国外科学数据开放共享政策进行全面描述与分析,甚至有论文误把科学数据共享政策当作科学数据开放共享政策[4]。事实上,两者有着显著差异。科学数据开放共享政策是指某一机构或组织关于如何有效实施科学数据开放共享的相关规定或制度安排,它与传统的科学数据共享政策的主要差异是:它明确规定科学数据共享对所有人而言都是完全开放的、免费的和无限制的;而一般的科学数据共享政策往往要求在特定领域或有限范围内且遵循某些条件来实行科学数据共享,仅适用于特定范围内的用户,对其他用户而言是无法利用的。在我国大力“推动实施国家大数据战略,推进数据资源整合和开放共享”的过程中,有必要梳理国外科学数据开放共享政策,以便为制定我国科学数据开放共享政策提供参考。本文分别对国际组织、英国、美国和其他国家的科学数据开放共享政策进行述评。

1 国际组织科学数据开放共享政策述评

国际组织制定的科学数据开放共享政策见表1。经合组织在《关于公共资助的研究数据获取的原则与指南》[5]中提出,研究数据开放利用应该遵循开放、灵活、透明、遵守法律、保护知识产权、承担责任、专业化、互操作、质量、安全、效率、责任、可持续等13条原则,彰显其在推动科学数据开放共享上的表率作用。国际地球观测组织(GEO)在《全球地球观测系统数据共享原则实施指南》[6]中提出指导GEO成员和全球地球观测系统用户实施科学数据开放共享的6点建议。《LERU开放研究数据声明》[7]强调研究数据应及时和免费地提供公开利用,通过明确研究人员、高层管理者、机构、图书馆、图书馆员、信息技术和数据科学家在开放研究数据中的责任来引导科学数据开放共享的实施。《北极数据管理原则与实践声明》[8]支持所有科学数据的开放获取,要求数据长期保存和可持续利用,要求数据提供者和用户遵守极地信息共享伦理和数据共享规范,由此确立北极数据管理与开放共享的基本原则。《G8科学部长伦敦声明》[9]强调最大程度、最少约束地开放公共资助项目的科学数据,使科学数据更易被发现、访问、评估、理解和利用,并具有互操作性,从而确立G8科学数据开放共享的基本准则,并引导其他国家科学数据的开放共享。《发展中国家数据共享原则》[10]强调所有公共资助项目的数据和信息应得到持续的开放共享,为发展中国家制定具体的科学数据开放共享政策提供了基本准则。《WDS数据共享原则》[11]要求依据国家或国际法律和政策,“完全与开放”地共享数据、元数据和其他相关信息,指导数据生产者和数据用户实施科学数据的开放共享。《大数据世界中的开放数据》[12]确立公共资助项目的研究成果必须实施数据开放利用的价值规范,明确研究人员、大学和研究机构、研究资助者、行业协会、图书情报机构、国际科学组织、出版商在科学数据开放共享中的责任以及科学数据开放共享的边界和诸多有利于科学数据开放共享的做法。《ERC资助研究成果开放获取指南》[13]要求由ERC完全或部分资助的研究出版物在出版时即存储在一个合适的知识库中,并在出版6个月(人文社科领域为12个月)内实施开放获取,同时建议受资助者保留所有研究数据,并与其他研究者分享这些数据。《开放获取科学出版物和研究数据的实施指南》[14]要求受资助者制定数据管理计划,把经过验证的研究数据与相关元数据存储在知识库中,并通过知识库提供验证结果所需工具信息,以促进第三方开放共享研究数据,从而在欧盟范围内确立科学出版物和研究数据的开放获取原则,也为受ERC资助的学者提供研究数据开放共享的行动指南,促进“水平线2020”项目研究成果的开放共享。

表1 国际组织科学数据开放共享政策

上述国际组织科学数据开放共享政策文本往往包含科学数据开放获取重要性声明、利益相关者责任、数据质量、数据互操作、数据评估、知识产权保护等主题,一些政策文本也对数据安全、开放获取方式、开放数据范围、出版时滞、费用资助、支持环境、可持续发展等作了规定。这些政策的共性是注重科学数据开放共享的价值,注重科学数据的知识产权及其保护,注重科学数据的质量、评估与互操作,也强调利益相关者的责任担当。这些政策对于在世界范围内促进科学数据的开放共享,克服科学数据开放共享的政治、经济、伦理、法律、社会、机构、技术等障碍,具有至关重要的作用。

2 英国科学数据开放共享政策述评

英国在科学数据共享领域一直走在世界前列。早在2005年6月,英国研究理事会(Research Council UK,RCUK)发布《RCUK对获取研究结果的立场声明》,明确由公共基金支持的研究结果(包括研究数据)应能够被研究团体和其他人访问和利用[15]。2011年4月RCUK颁布的《RCUK数据政策通用原则》强调,公共资助项目的研究数据应该以最少的限制,及时全面地得到公开利用[16]。黄国彬等[17]论述了英国科研资助机构的科学数据共享政策,但这些政策并不是针对科学数据开放共享而言的。在英国,尽管有多个机构制定了科学数据共享政策,但只有部分机构率先颁布科学数据开放共享政策,包括英国国际发展部(DFID)、英国气象局(UKMO)、RCUK、英格兰高等教育资助理事会(Higher Education Funding Council for England,HEFCE)、英国大学联合会(Universities UK)、惠康基金会(Wellcome Trust)、英国医学研究理事会(Medical Research Council,MRC)以及一些英国大学、其他研究机构、出版机构(见表2)。

表2 英国科学数据开放共享政策

从政策主要内容与影响来看,《DFID开放和增强的研究获取政策》[18]和《DFID开放和增强的研究获取政策实施指南》[19]要求DFID资助的研究成果,包括数据集和其他资料,通过开放获取出版或自存储方式实施开放共享,打破以往政府开放数据政策仅仅覆盖政府数据而不涉及科学数据的传统,为英国政府部门树立了科学数据开放共享的典范。《开放数据政策》[20]要求公共气象服务资助项目形成的数据必须实行开放共享,并确立气象科学数据开放共享的8个评估标准,从而奠定英国气象局科学数据开放共享的基础。《开放研究数据协议》[21]颁布了适用于所有科学研究领域的10条开放研究数据原则,要求支持研究结论的数据应该在成果出版日就能被访问和引用,成为其他科研资助机构制定专门科学数据开放共享政策的基准和研究人员实施科学数据开放共享的行动指南。《MRC关于临床试验和公共健康干预研究的开放数据政策》[22]把英国医学研究理事会(MRC)资助的临床试验和临床干预研究数据、公共健康干预研究数据、观察性研究数据纳入开放共享范畴,要求研究人员遵循《分享个人参与公共资助临床试验数据的良好实践原则》指南,使研究协议、分析计划和所有相关的统计分析得到开放利用,充分体现了《开放研究数据协议》的要求,成为7个RCUK分支理事会中成功实施科学数据开放共享的先锋,为研究人员开放共享相关研究数据提供有效指导。《开放获取研究与研究数据管理政策》[23]确立了埃克塞特大学研究数据开放共享的10条原则,规范了大学与研究人员在研究数据开放共享中的责任,要求研究人员把相关研究数据存储在埃克塞特大学机构知识库中以实现数据的开放共享。《研究数据管理与开放数据政策》[24]明确了研究数据开放共享的7项原则,规定研究者(包括所有大学职员和研究生)和布里斯托大学在研究数据管理和开放共享中的责任,为布里斯托大学研究数据的开放共享提供有效指导。《金史密斯学院开放获取声明》[25]要求研究成果和数据能通过金史密斯学院在线研究知识库和金史密斯学院在线数据知识库实现开放获取与共享,且规定了伦敦大学金史密斯学院与研究群体在研究成果开放获取中各自的责任,有效促进伦敦大学金史密斯学院研究数据开放共享的实施。《开放获取研究与研究数据管理政策》[26]要求研究人员把研究数据存储在法尔茅斯大学研究知识库(FURR),并使之实现开放共享,同时明确了法尔茅斯大学研究人员和大学本身在研究数据开放共享中的责任,指导法尔茅斯大学研究人员实施研究数据开放共享。《研究数据政策》[27]强调研究数据应是开放共享的,明确了施普林格·自然出版集团辖下期刊对4类研究数据开放共享的不同要求与做法,在英国出版界树立了研究数据开放共享的典范。

上述政策构成了宏观(主要是政府部门)、中观(主要是科研资助机构)、微观(主要是高校和研究机构、出版机构)三个层面的英国科学数据开放共享政策体系。虽然不同政策文本内容各异,但是这些文本往往包含政策声明、利益相关者责任、知识产权保护、数据存储、开放数据范围、数据发布、数据再利用、数据知识库、元数据、费用或资助、开放许可协议、数据管理计划、出版时滞等主题。开放获取方式、数据评估、数据质量、数据安全、支持环境等也至少出现在2个政策文本中。从整体看,英国科学数据开放共享政策通过明确利益相关者在科学数据开放共享中的责任、知识产权保护、关键的科学数据开放共享活动(如数据存储、数据发布、数据再利用、数据评估、数据监护)及相关的开放许可协议、开放获取方式、元数据、数据质量、数据管理计划、数据互操作、出版时滞、费用等事项,大力支持与保障英国科学数据开放共享的快速发展,彰显出英国在开放科学运动中的主导地位。

3 美国科学数据开放共享政策述评

美国是世界上科学数据拥有量最多且介入科学数据共享管理最早的国家[28]。1991年7月,美国总统行政办公厅科技政策办公室发布《全球变化研究数据管理政策声明》,要求实行“完全与开放”的科学数据共享。随着开放获取、开放科学运动在美国的崛起与快速发展,一些美国政府部门、研究资助机构、研究机构与出版机构开始制定相关科学数据开放共享政策(见表3)。

从政策主要内容与影响来看,《全球变化研究数据管理政策声明》[29]承诺促进全球变化研究数据的“完全与开放”共享,以最低成本向全球变化研究人员提供开放获取数据。《提高联邦资助科学研究成果获取》[30]要求每个联邦机构制定联邦资助科学研究成果公共获取计划,使联邦资金资助而形成的科学数据能被大众最大化地免费获取,并提供机构科学数据保存评估,指导科学数据开放共享。《提高NIH资助的科学研究出版物和数字科学数据获取的计划》[31]明确提出美国国立卫生研究院(NIH)资助的科学研究数据必须实施开放获取与共享。《PLOS数据可利用性》[32]把科学数据开放共享作为期刊论文发表的前提条件,要求将与指定PLOS期刊论文相关的数据和元数据都存储在适当的公共知识库中以实现开放共享,从而确保PLOS期刊上发表的论文所依据的数据和资料都可得到开放利用,使PLOS成为美国出版界开放共享科学数据的领头羊。《NASA提高获取科学研究成果的计划》[33]确立了NASA科学数据公共获取的原则、范围、条件和实施步骤,显著提高了NASA内部研究人员和受资助者的科学数据开放共享;而《数据与信息政策》[34]确立了NASA科学数据开放共享的政策框架,使来自NASA地球观测卫星、亚轨道平台和实地调查获得的地球科学数据能够及时得到开放共享,使所有NASA生产的标准产品及其算法软件源代码、系数和辅助数据得到开放利用。《AHA资助研究的开放科学政策声明》[35]要求AHA资助而产生的期刊论文在出版后的12个月内通过公共医学中心得到免费利用,并通过AHA批准的知识库把验证研究结果所需的事实数据在资助期满后的12个月内实现免费与公开利用,从而提高AHA资助研究成果的使用效率。《NOAA提高研究成果公共获取的计划》[36]确立了科学数据公共获取的范围、条件和任务,要求那些获得资金资助的出版物和环境数据应及时公开,以供利用,为公共获取NOAA科学数据提供指导。《NSF公共获取计划》[37]要求把NSF资助的研究成果(包括研究数据),在首次发表后12个月内通过自存储方式保存下来,并实现开放共享与利用。NSTC的《促进访问联邦政府支持的国际科学合作中的科学数据和研究成果的原则》[38],明确科学数据应实现开放获取,强调政府支持的科学数据应免费提供利用,鼓励使用开源数据格式、开放数据标准来促进科学数据的开放共享。

表3 美国科学数据开放共享政策

上述政策初步组成美国科学数据开放共享政策体系的雏形,覆盖宏观、中观、微观三个层次。这些政策虽然内容各异,但是从以下几方面规范了科学数据的开放共享:(1)强调公共资助的科学数据应以合法合理的方式实现开放获取与共享;(2)要求制定科学数据管理计划,对科学数据的开放获取进行明确规划;(3)要求利用开放获取机构知识库实现科学数据的长期保存;(4)要求评估科学数据的保存与利用绩效;(5)要求提高科学数据的访问和互操作性;(6)明确科学数据开放获取的时间安排或时滞。正是由于得到上述科学数据开放共享政策的支持,美国科学数据的开放共享也如同英国一样,走在世界前列。不断丰富的美国科学数据开放共享政策,将保障美国在开放科学与开放研究领域获得更大的竞争优势。

4 其他国家科学数据开放共享政策述评

加拿大、爱尔兰、澳大利亚的许多机构或组织也制定了相关科学数据开放共享政策(见表4)。

从政策主要内容与影响来看,《加拿大地球空间观测数据政策》[44]要求加拿大所有地球空间观测数据在最短的时间内得到开放共享,以实现数据价值的最大化。《加拿大基因组数据发布与共享政策》[45]要求加拿大基因组资助项目必须及时和无限制地共享数据和资源,由此显著提高相关研究数据的开放共享。《三机构出版物开放获取政策》[46]确立了加拿大卫生研究院、自然科学与工程研究理事会、社会科学与人文研究理事会三机构促进科学出版物开放获取的7条原则,明确科学数据开放共享的途径和时间要求,有助于实现三机构资助研究成果和数据的开放共享。5个爱尔兰机构制定的开放获取政策都坚持一项共同的原则——要求把受资助产生的研究成果在出版后尽快存储到开放获取知识库中,通过知识库实现相关研究数据和元数据的开放共享。《开放获取悉尼大学研究政策》规定,大学将提供开放出版平台和机构知识库,研究成果在出版后12个月内须连同其收集的学术成果和相关元数据在外部可访问的知识库上开放共享,同时要求研究数据实现开放利用。

开放数据的发展在世界范围内仍处于起步阶段,英国和美国以外其他国家颁布的科学数据开放共享政策并不多见。上述三国科学数据开放共享政策(悉尼大学除外)的一个显著共性是,要求受资助或所在机构产生的科学数据必须及时和免费地得到开放共享。

表4 其他国家科学数据开放共享政策

5 结语

国外许多机构或组织制定了科学数据开放共享政策,主要目标是为研究加速、支持新发现、促进合作、提升研究责任、提高研究效率与创新能力。虽然国外科学数据开放共享政策内容各异,但主要包含三类要素:(1)政策要求,包括对数据质量与标准、数据获取与共享、数据保护与保存、数据管理计划的要求;(2)政策规定,包括对隐私、传统知识、敏感数据、知识产权或数据所有权的规定;(3)其它说明,包括对科学数据开放共享目的、原则、范围、角色与责任、监管和实施的描述。

我国科学数据的开放共享尚处于初始阶段,未制定国家或行业层次的科学数据开放共享政策,是制约我国科学数据开放共享的障碍之一。国外科学数据开放共享政策为我国提供以下启示:

(1)应站在国家战略高度来认识科学数据开放共享的重要价值与意义,广泛推广科学数据开放共享的理念与思想。这不仅因为科学数据开放共享具有十分重要的经济、政治、社会、技术与经营利益,如促进经济增长,促进新产品和服务开发,获取公共投资的更大回报,获得更大的透明性和决策支持,实现市民参与,改进政策制定流程,验证以前的结果,测试新的研究假设和方法,提升跨学科、跨部门和跨机构研究,提高科技论文的引用率,避免昂贵的重复工作,帮助了解重要的科学发现和参与公众讨论,而且因为我国已制定实施国家大数据战略,《促进大数据发展行动纲要》要求在依法加强安全保障和隐私保护的前提下,稳步推动公共数据资源开放共享。

(2)应逐步建立健全包括国家层次、行业层次、机构或企业层次的科学数据开放共享政策体系,以便为利益相关者(含政府、大学、研究机构、资助机构、图书情报机构、出版商、软件开发者、研究者个人、数据管理者等)参与科学数据开放共享提供有效指导,并确保科学数据开放共享实践有序高效展开。

(3)每项科学数据开放共享政策应规范利益相关者在科学数据开放共享活动中的权利与义务,明确科学数据开放共享方式、时间安排、数据质量要求以及知识产权保护条款,从而指导科学数据开放共享实践,提高我国科学数据开放共享水平。

猜你喜欢

知识库数据管理资助
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
CTCS-2级报文数据管理需求分析和实现
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
美国防部资助研发能垂直起降的无人机
基于Drupal发布学者知识库关联数据的研究