我国科学数据DOI应用现状、问题与对策
2014-02-02刘润达诸云强刘闯吴立宗
刘润达诸云强刘 闯吴立宗
(1. 北京市科技传播中心,北京 100035; 2. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101; 3. 中国科学院寒区旱区环境与工程研究所,甘肃兰州 730000)
我国科学数据DOI应用现状、问题与对策
刘润达1诸云强2刘 闯2吴立宗3
(1. 北京市科技传播中心,北京 100035; 2. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101; 3. 中国科学院寒区旱区环境与工程研究所,甘肃兰州 730000)
DOI的应用已经从期刊、电子书、技术报告、标准等文献的标识向与文献相关的科学数据、版权甚至作者的标识等多元化方向发展,并成为知识链接发展的一个重要阶段。本文系统分析科学数据DOI在我国的应用现状,结合科学数据资源的特征,分析科学数据DOI安全与权益、多重解析、粒度与更新、数据引用和出版等问题,并以全球变化科学数据出版系统为例,针对上述问题,给出具体的对策。
数字对象标识符;DOI;科学数据;数据引用;数据出版;数据引文索引;科学数据共享;数据中心
Keywords:Digital Object Identif i er, DOI, scientif i c data, data citation, data publishing, data citation index, science data sharing, data center
1 DOI的迅猛发展
DOI(Digital Object Identif l er,数字对象标识符)是一种唯一的、永久性的逻辑标识符,它能标识网络环境下的任何数字对象(如文本、图片、声音、影像、软件等),并能够通过这一唯一的标识符永久定位到数字对象的物理地址。DOI源于国外出版商在线期刊数字出版服务,是为突破在线期刊通过URI(Uniform Resource Identif l er)互联产生的系列问题而提出[1],被称为互联网上数字内容的条形码。DOI系统由国际数字对象标识基金会(International DOI Foundation, IDF)和多个注册代理机构(Registration Agency,RA)组成,IDF负责DOI整体的管理和运营[2],包括有关DOI的政策制定、技术支持、名址注册等业务;RA负责具体的数字对象注册和管理。IDF通过与各个RA之间的合作运行DOI系统,提供基础服务和增值服务,对数字对象(内容)进行唯一标识和管理,提供对象信息持久、动态的链接机制,保证对数字对象获得一致的理解、确认和持久访问,扩大信息资源获取和共享的范围。
自DOI诞生以来,伴随着数字出版、互联网信息服务的发展浪潮,DOI获得快速发展。目前,DOI技术成为国际上数字出版界构建数字信息交换平台的首要选择,是学术出版、科技信息服务等领域无可争议的标识与链接标准,并且在出版产业链、影视产业链中也发挥着越来越重要的作用[3]。周庆辉等认为,未来不能实现跨平台链接的STM期刊(科学、技术及医学类期刊)将被孤立和游离于全球一体化的电子知识库之外[4]。2005年美国关于参考文献的国家标准ANSI/NISO Z39.29把DOI 作为著录项目[5],2012年DOI正式成为ISO标准[6]。当前,DOI的应用已经从期刊、电子书、技术报告、标准等各种文献类型的标识向与文献相关的科学数据、版权甚至作者标识等多元化方向发展,并成为知识链接[7]发展的一个重要阶段。
DOI应用于科学数据的标识可称为科学数据DOI。2009年,德国科技图书馆联合其他来自欧美等国领先的研究型图书馆、信息中心等机构,成立了一个DataCite国际联合体,是最早致力于科学数据注册的RA[8]。我国也开展了科学数据DOI的研究与应用,最早在生物医药领域开展应用实践。本文在总结我国科学数据DOI应用现状的基础上,提出我国科学数据DOI应用存在的问题,并给出相应的对策。
2 科学数据DOI的意义
科学数据是十分宝贵的研究资源,特别是在当下数据密集型科研范式的时代,科技创新和社会经济发展越来越依赖于科学数据。近几十年来,美国、欧洲等国际发达国家和地区,印度等发展中国家以及世界数据系统(CODATA)、国际山地中心等国际组织,通过国家计划、学术联盟等,建立了一系列的数据中心、数据共享网络,促进科学数据的集成、保藏、共享和再利用[9-17]。我国也先后启动了国家科学数据共享工程、国家科技基础条件平台、重大科技计划项目数据汇交、国家科技报告系统等[18-22],积极推动和促进包括科学数据在内的科技资源的共享和再利用。
在科学数据需求日益旺盛、科学数据共享蓬勃发展的今天,利用DOI对科学数据进行标识具有重大的意义。科学数据注册DOI将为科学数据提供互联网环境下访问的便利途径,可以更加方便地对科学研究数据进行认可、引用、验证和重新利用。通过引用标准,DOI实现科技文献中对科学数据的引用以及科学数据与其他科技资源的链接,为科学数据中心、DOI注册代理机构和科学数据的实际拥有者带来益处。
对于科学数据中心及数据管理机构,科学数据注册DOI可以起到正名、国际化、促使用、助绩效等多种作用。(1)理论上,一个数据中心为一条数据注册了DOI后,此数据中心上该条数据的地址就成为此DOI所对应的首选解析地址,即使实现了多项解析功能,相对于其他副本,该中心具有解析优先权,而注册了DOI的数据也就自然成为了DOI体系中该数据内容的合法代表,从而起到正名的作用。(2)由于DOI系统的世界性,注册DOI的科学数据在全球的相关应用中都是有效的,可以提升此数据的国际知名度,为科学数据的国际化打下基础。(3)科学数据DOI促进数据质量的改善和数据建设的系统化(如科学数据出版),吸引和促进数据的使用,与此同时DOI的解析为科学数据中心网站带来流量,进而促进科学数据的使用。(4)科学数据注册DOI有助于数据中心及数据管理机构对数据库(集)本身进行数量化绩效管理,可以作为传统的数据中心服务绩效的有益补充,包括引用绩效和解析服务绩效。引用绩效是指数据通过DOI被其它文献或数据引用,这与汤森路透的DCI(Data Citation Index)[23]相似,可用于跟踪数据的再应用情况并度量影响力[24]。事实上,科学数据的引用已经引起国外期刊、学者的广泛关注。CODATA 专门成立了数据引用标准与实践工作组。《Nature》《PLoS Biology》等杂志,都要求论文发表时将论文引用到的数据进行公开。国内相关研究机构和学者近年来也开展了科学数据引用的研究与实践[25-26]。解析服务绩效是指通过DOI号对数据的每一次访问都会引导到注册地RA的系统中,虽然这一过程可能有缓存,但解析计数具有很强的参考性。不仅如此,通过科学数据DOI,还可为科学数据管理部门提供内容及版权管理、数据查重、数据查新、科学数据的领域分析及报告等。
科学数据注册DOI除了对数据拥有方和数据平台有诸多益处外,对数据生产者和数据用户也意义重大。对于数据生产者,科学数据注册DOI可促进科学数据的确权,从而为科学数据成为标准的成果产出形式作铺垫,数据生产者将从中获益。对于数据用户,数据注册了DOI以后,可方便用户对数据的定位和引用,用户可以享受高质量的数据服务,而且通过DOI这一永久的标识符,用户可以不必担心由于数据链接URL的变更而找不到数据。
另外,DOI引导数据生产者提交更加规范的数据及相关文档,将数据生产者的数据生产活动独立为现代科研流程的一部分,这一趋势加快了数据生产的专业化程度,提高数据的质量,对于科学数据的各个相关方都有重大意义。
3 DOI在我国科学数据中的应用现状
3.1 我国数字对象唯一标识体系及DOI的引进
我国对数字对象唯一标识符的研究应用始于十几年前。2002年,“数字资源唯一标识符应用规范”研究建立了数字对象唯一标识符的命名原则、体系结构和基本解析规则等,并对开放和分布式唯一标识符解析机制进行实践,提出了我国数字对象唯一标识符CDOI的应用体系和发展方案[27-29]。
在探讨建立自有的唯一标识符的同时,我国也在积极地采用和推广DOI[30]。曾有组织建议建立一个由出版商、数字资源提供商、图书馆、档案馆、博物馆、新闻媒体和政府有关部门共同参与的非营利性协作组织“中国唯一标识符管理中心”,开展针对DOI的推广和技术的研制等工作。2007年3月,中国科学技术信息研究所与万方数据公司共同成为中国首家DOI注册机构,建立了“中文DOI平台”,为国内的中文期刊提供DOI注册、解析和增值服务,同时将DOI应用于精品科技期刊项目中[30-31]。2009年,万方公司开始为其全文合作期刊提供免费DOI注册与链接服务。2013年,中国知网(CNKI)成为我国第二家DOI注册代理机构(RA)[32]。
DOI引入我国后,在图书文献领域得到了迅速的发展。目前,我国经过中文DOI系统统计的中文注册数量己经达到全球第二,突破了2000万。如从2009 年开始,中华医学会杂志社对其属下的120余种期刊统一要求在文章首页左下脚注位置标注DOI号,DOI 标志在医学期刊中开始得到较为广泛的应用[33]。DOI在保护论文作者知识产权的同时,大大提高了用户检索和获取论文的效率。
3.2 DOI在科学数据中的推广
我国在DOI的推广应用方面一开始就很重视科学数据,完成了科学数据DOI命名规则及元数据描述标准,并基于“中文DOI系统”提供了科学数据DOI的解析和搜索服务,同时强调科学数据的关联信息和引用信息,实现数据与文献的引用[34]。
彭洁等曾探讨了利用DOI进行科学数据引用的相关问题,总结了科学数据引用规范的内容[35]。2008年,中国西部环境与生态科学数据中心在国内率先以“黑河综合遥感联合试验”为例开展了基于DOI的科学数据标识、引用研究与实践[36]。数据引用的一般格式为:
数据作者列表.数据标题(版本).数据出版/发布单位.数据出版/发布时间.数据唯一永久标识符.
按照数据中心数据版权的类型,提出了完全自主版权数据、再加工数据、与正式出版文章相关的数据等形式的数据引用方式。2013年,中国科学院地理科学与资源研究所申请为中文DOI科学数据出版机构。随后以全球变化领域科学数据为对象,研究制定了地理资源科学数据系统DOI注册规则、科学数据DOI注册编码方案、科学数据DOI注册和发表流程、科学数据DOI注册和发表同行评议、数据DOI注册元数据标准等,并建立了我国第一个科学数据出版系统——全球变化科学数据注册与出版系统。国内其他的数据管理机构,如中国极地研究中心等也开始启动和推进科学数据DOI工作。
4 我国科学数据DOI应用问题分析与对策
4.1 科学数据DOI安全与权益保护问题
在科学数据DOI应用推广过程中,用户考虑得最多的问题是“会不会因为DOI的应用,影响科学数据的安全或注册者(数据中心)本身的影响力和利益”。为了分析这一问题,就需要剖析DOI系统的运行模式。
如前所述,DOI系统由IDF、RA共同维护。IDF不存储DOI号、数据地址信息及元数据,只存储DOI号段对应的RA地址。DOI系统基于Handle System(句柄系统)和<Indecs>元数据框架两种技术,主要起查询和解析功能[37-38]。与域名服务器类似,在某一个RA中注册的DOI号不管从哪个入口查询,都会由IDF引导到这个RA来进行具体的操作。注册者只需要将用于DOI查询的简单元数据注册到RA中即可。RA也可以与注册方协商,提供基于元数据的增值开发和应用,而详细的元数据及数据资源实体仍然保存在注册者原有的服务系统中。
可以看出,IDF实现了一个RA的“联邦”。“联邦”意味着参与方各自独立,如果关系断裂,系统依然自成体系,保持运作。DOI体系的元数据存储于各个RA,这与其他信息的融合,如研究人员ID(ORCID)[39],将所有的信息进行整合有着本质的区别。由于元数据的分布式存储,除非各个RA相互之间有协议,否则,DOI系统无法提供一个全球统一的元数据搜索机制,而在一个特定的范围内(如一个RA内),通过元数据搜索DOI名及对应地址的功能可由RA作为增值服务提供,决定权同样在RA与具体数据注册方。
科学数据DOI注册时提供的元数据与期刊DOI注册时提供的元数据有不同的地方,期刊论文的元数据指论文的题录信息,其公开在法律框架和惯例共识上没有太多的障碍。科学数据的元数据相对复杂,其是否公开受到政府法规的限制。目前,我国科学数据DOI的注册流程采用先分配DOI号,后完善元数据信息的方式,即考虑到科学数据的特殊情况,元数据的大部分内容可以暂时不入库,如果数据中心与RA在没有后续协议的情况下,元数据可不通过DOI平台公开。另外,为保持DOI注册的延续性,也可以为科学数据中心分批提供数据DOI注册服务,根据情况,可以允许将质量好或其他各方面条件具备的部分科学数据先注册DOI,其他的待完善后再注册。
需要明确的是,虽然鼓励科学数据完全开放共享,但科学数据DOI的注册并不意味着数据的共享。为了保护科学数据DOI注册者的权益,DOI系统并没有对资源链接地址作太多的要求。资源链接地址可以是直接的资源获取页面,也可以是注册者原有系统详细的元数据访问页面或资源访问控制页面,数据资源的具体获取可以遵照原有系统的访问控制策略。但往往规定注册DOI的科学数据必须符合国家有关的法律规定、产权清晰、保证其真实性等。
因此,DOI在科学数据中的应用不会造成科学数据的安全问题,更不会损害数据资源注册者的权益,反而能够更好地保护数据资源注册者知识产权,促进科学数据的重复利用。
4.2 科学数据DOI的多重解析问题
相对于期刊文献的永久确定性,科学数据由于没有形成成熟的出版机制,其确定性不强,这必然为科学数据DOI的更新和维护带来很大的问题。维护权限的分配实质是利益链条上的机构利益再分配,涉及具有维护权限的一方利益体能否保护其他利益体的合法权益[40]。在DOI注册权限方面,IDF最初采用的是拥有知识产权者注册的策略,明确体现了对知识产权实行源头管理的原则,也体现了对出版商利益最大程度的保护,但对于没有知识产权或知识产权归属不明确的实体(如早期版权不明的作品、博物馆的藏品等),注册权问题没有明确规定[41],科学数据则可以采用拥有方授权数据中心进行注册的方案,相应的维护权限也就确定了。在实践中,数据中心有义务对科学数据的信息进行长久维护,地址更新后可以通过RA或RA提供的接口进行更改,RA提供失效监测报告等服务。
默认的DOI应用是解析DOI获取数字对象的URL,如果只有唯一的URL,这一过程称为单一解析(单项解析);如果点击一个DOI号可以触发多种行为,这个过程称为多重解析(多项解析)。早在2000年,IDF就提出了DOI标识的多重解析问题,将多重解析作为DOI功能开发的第二阶段目标。实现多重解析,涉及与DOI系统的结构及多重解析应用有关的多个层面的问题,包括底层解析系统的支持、多重解析的描述和呈现、客户端与服务器的交互过程、多重解析的维护以及自动化的多重解析等。在数字期刊领域,近年来,DOI的单一解析已越来越不能满足用户的需求和实际的应用情况,DOI多重解析使DOI的作用远远超过了单一的资源标识、定位。DOI单一解析的控制权归属非常清晰,而且与IDF保护知识产权的战略出发点非常一致,但多重解析在此问题上尚无定论,这必将给多重解析的大规模商业应用带来不良影响。
由于DOI多重解析功能的技术实现草案和规模化应用方案的不成熟,加上科学数据DOI应用本身的发展现状及特点,科学数据DOI目前还主要集中于单项解析。一方面,DOI体现对知识产权实体源头管理的原则,但由于没有规范的出版流程,科学数据有着不规范等问题。同名不同内容、同内容不同名或一个数据多个版本等情况很多,甚至还有一些非法的镜像问题,使得科学数据DOI的多重解析难上加难。另一方面,由于DOI系统的松散架构,会出现一个数字对象被赋予多个DOI的情况,如同一个数字对像的多个备份,或同一个对像被不同的RA分配不同的DOI。IDF鼓励通过元数据比对,不同RA之间提供互操作来去除这种重复,这种查询需要RA的紧密合作。科学数据目前对元数据信息的完整收集都很难保证,加上安全性的考虑,因此更加难以确保DOI注册的唯一性。鉴于此,当前科学数据的应用应该注重其唯一性并着重发展单项解析。
4.3 科学数据DOI的粒度与更新问题
期刊论文相对独立,其DOI标识对象和粒度非常清晰,大多是某一篇论文,也可以是论文中的某个图形、表格。同时,论文一旦发表就不存在更新的问题(除非发现文字错误后发表声明进行勘正或发现有学术问题后被撤稿)。与期刊论文不同的是,科学数据集规模大小可能相差非常悬殊,从专题数据库到某一个数据表甚至是若干记录,从系列图层构成的专题图到一个空间图层,都可以是一个数据集,其组织形式、类型格式也会不一样。而且,科学数据往往要求能够进行动态的更新,数据集的时空序列越长,其价值越大。如中国社会经济统计数据集,可能包括第一产业经济、第二产业经济、第三产业经济、城市基础设施、通讯、医疗、教育水平、就业等一系列的统计数据集。在进行DOI标注时,首先就要确定分解为多少个数据集进行标注,然后需要确定社会经济统计数据更新后,DOI如何处理?
结合国家地球系统科学数据共享实践的经验,我们认为科学数据发布粒度的划分原则同样适合于科学数据DOI粒度:一是保持数据资源实体独立性和完整性的原则;二是有利于数据资源发现和使用的原则。具体划分建议:(1)不同属性内容的数据,要用不同的DOI进行标识,通过不同的元数据进行描述;(2)不同时间、地点,但利用同样的采集、处理和质量控制方法的数据可以作为一个数据集进行标识;(3)相同数据要素,但采用不同的采集、处理和质量控制方法的数据可以分别进行标识;(4)知识产权不同的数据,即使数据内容相同,建议分别进行标识。
对于科学数据的更新,可以按照上述办法,判断是否重新进行DOI的标注。一般情况下,如果数据集的要素、处理方法、知识产权等都没有发生变化,只是新增加了新的数据记录(如前述的社会经济统计数据从2010年更新到2011年),可以不用改变DOI标识,修改DOI元数据即可。该模式的缺陷是用户不易发现数据集的变化。为了克服这种缺陷,也可以考虑重新注册DOI,但要体现两者数据的关联。例如,在全球变化科学数据注册与出版系统中DOI后缀编码的最后一位就是版本码。为了体现不同版本数据之间的关联性,后续更新数据集的DOI,只需要在前一版本科学数据DOI编码的基础上递增版本号即可。
4.4 基于DOI的科学数据引用、出版问题
随着科学数据共享的深入,国内外学者越来越意识到科学数据的引用、出版、评价是激励科学家自发公开、共享数据的最有效机制。国际上众多的学术刊物也亦推出了“Data Paper(数据论文)”和“Data Citation Index(DCI,数据引文索引)”,以此来促进和推动科学数据的引用、数据与文章的关联以及数据出版工作[42]。吴立宗等认为数据出版并不是简单的数据发布,而是包括数据提交、同行审议、数据发布和永久存储、数据引用和影响评价5个基本环节[26]。目前,我国大部分的科学数据发布前缺乏同行审议,科学数据引用并没有形成广泛的共识,很多期刊并不允许将数据引用列入正式的参考文献中。尤为重要的是数据引用并没有作为一项绩效指标,列入到成果评价中。上述因素是阻碍我国科学数据DOI应用快速发展的根本原因。
为此,必须加强科学数据规范化引用、数据论文的研究与宣传工作,加强科学数据及其数据论文的同行评审,尽快在全社会构建起完善的科学数据出版体系和环境。特别是推动基于科学数据引用、数据论文的科研成果评价体系的建立。为了解决上述问题,全球变化科学数据注册与出版系统已经开展了科学数据论文撰写及同行评议、数据论文出版的研究实践。第一期数据论文将采取纸质和电子版2种方式出版:纸质版在《地理学报(增刊)》上发表,电子版数据论文及数据实体可在全球变化数据注册与出版网络系统上开发访问。
5 结语
DOI系统为持久的互操作标识符的使用和注册提供了一个技术框架和社会化基础设施,对于网络环境下科学数据的出版、发布、传播、知识产权保护都有重要的作用。我国在科学数据的DOI应用方面已经进行了有益的尝试,取得了一定的成效,但整体上科学数据DOI应用还处于起步阶段。科学数据DOI的应用是科学数据共享新时代机遇,如何抓住机遇,实现科学数据的增值,是我国数据管理者需要研究的问题。
本文在总结我国科学数据DOI应用现状的基础上,研究分析影响我国科学数据DOI应用的主要问题,结合全球变化科学数据注册与出版系统等,给出了相应的对策。主要结论包括以下几个方面。
(1)科学数据DOI应用首先的障碍在于对DOI的认识。DOI通过IDF、RA和注册者明确的分工,其数据资源实体和详细元数据仍然掌握在数据拥有者中。IDF主要提供DOI号查询和解析功能,这与传统的信息整合系统有着本质的区别,因此,可以较好地保证科学数据的安全和注册者的权益。
(2)尽管DOI支持多重解析技术,但由于科学数据本身存在的同名不同内容、同内容不同名、数据多版本、数据质量参差不齐等问题,科学数据DOI的多重解析会带来很多的困难。因此,建议当前科学数据DOI的应用应该注重其唯一性并着重发展单项解析。
(3)由于科学数据的时空尺度大、类型多样、规模差异大,科学数据DOI标识必须考虑数据粒度与更新的问题。在粒度界定时遵循数据资源实体独立性和完整性以及有利于数据资源发现和使用的原则。
(4)科学数据引用和出版是激励科学家自动发布和共享科学数据的重要机制。虽然科学数据DOI与数据引用和出版没有必然联系,但其应用则会极大的推动科学数据的应用和出版。须加强科学数据规范化引用、数据论文的研究与宣传工作,加强科学数据及其数据论文的同行评审,促进DOI在其中的应用,尽快在全社会构建起完善的科学数据出版体系和环境,推动基于科学数据引用、数据论文的科研成果评价体系的建立。
[1] 维基百科.DOI[EB/OL].[2014-04-08].http://zh. wikipedia.org/wiki/DOILast.
[2] Paskin N. Digital Object Identifier System[EB/OL]. [2014-09-15]. http://www.doi.org/overview/ 090225 DOI-ELIS-Paskin.pdf.
[3] 郭晓峰, 涂勇, 蔡京生. DOI在内容产业的应用 [J]. 传媒, 2012(2): 72-74.
[4] 周庆辉, 陈红云, 张晶,等. DOI与CrossRef在科技期刊出版中的作用 [J]. 编辑学报, 2009,
[5] NISO. NASI/NISO Z39.29-Bibliosographic References [EB/OL]. [2014-04-19].http://www.niso.org/apps/ group_public/download.php/12967/Z39_29_2005_ R2010.pdf.
[6] Gasiorowski-Denis E. Digital Object Identif l er (DOI) Becomes an ISO Standard [EB/OL].[2014-04-20]. http://www.iso.org/iso/news.htm?ref l d=Ref1561.
[7] 李月婷. 中国三大全文数据库知识链接方式比较分析 [J]. 图书馆, 2013(6): 86-90.
[8] Brase J. Datacite - A Global Registration Agency for Research Data [R]. RatSWD Working Paper No. 149, 2010.
[9] Korsmo F L. The Origins and Principles of the Word Data Center System [J]. Data Science Journal, 2010, 8:IGY55-IGY65.
[10] Bai Y. Review of Geospatial Data Systems’ Support of Global Change Studies [J]. British Journal of Environment and Climate Change, 2013, 2(4): 421-36.
[11] Shrestha B. Mountain Knowledge Hub Initiative in the Hindu Kush-Himalayan Region [J]. Grazer Schriften der Geographie und Raumforschung, 2007, 43: 25-37.
[12] Ramapriyan H K, Behnke J, Sof l nowski E, et al. Evolution of the Earth Observing System (EOS) Data and Information System (EOSDIS) [M]//Standard-Based Data and Information Systems for Earth Observation. Berlin: Springer,2009.
[13] Nagendra K S, Bukhres O, Sikkupparbathyam S, et al. NASA Global Change Master Directory: An Implementation of Asynchronous Management Protocol in a Heterogeneous Distributed Environment [C]. Distributed Objects and Applications. IEEE, 2001.
[14] Goodchild M F, Fu P, Rich P. Sharing Geographic Information: An Assessment of the Geospatial One-Stop [J]. Annals of the Association of American Geographers, 2007, 97(2): 250-266.
[15] Bernard L, Kanellopoulos I, Annoni A, et al. The European Geoportal-One Step Towards the Establishment of a European Spatial Data Infrastructure [J]. Computers, Environment and Urban Systems, 2005, 29(1): 15-31.
[16] Crompvoets J W H C, Bregt A, Rajabifard A, et al. Assessing the Worldwide Developments of National Spatial Data Clearinghouses [J]. International Journal of Geographical Information Science, 2004, 18(7): 665-689.
[17] Rao M, Pandey A, Ahuja A K, et al. National Spatial Data Infrastructure-Coming together of GIS and EO in India [J]. Acta Astronautica, 2002, 51(1): 527-535.
[18] Xu G H. Open Access to Scientific Data: Promoting Science and Innovation [J]. Data Science Journal, 2007, 6(Open Data Issue): OD21-OD25.
[19] 王卷乐, 杨雅萍, 诸云强, 等. “973”计划资源环境领域数据汇交进展与数据分析 [J]. 地球科学进展, 2009, 24(8): 947-953.
[20] 诸云强, 孙九林, 廖顺宝. 地球系统科学数据共享研究与实践 [J]. 地球信息科学学报, 2010, 12(1): 1-8.
[21] 刘润达, 褚文博, 诸云强. 国家科技基础条件平台运行服务阶段关键问题探析.现代情报 [J]. 现代情报, 2012, 32(11): 51-57.
[22] 孙自法.中国建国家科技报告制度促科技资源开放共享 [EB/OL]. [2014-05-28]. http://finance.ifeng.com/ a/20140301/11779873_0.shtml.
[23] Thomson Reuters.Introduction to the Data Citation Index [EB/OL].[2014-06-15].http://wokinfo.com//products_tools/multidisciplinary/dci/.
[24] Sigdc I. Quick Guide to Data Citation [EB/OL].[2014-04-04].http://www.icpsr.umich.edu/files/ICPSR/enewsletters/iassist2.html.
[25] 彭洁, 涂勇. 科学数据引用的探讨 [J]. 数字图书馆论坛, 2008(10): 14-18.
[26] 吴立宗, 王亮绪, 南卓铜, 等. 科学数据出版现状及其体系框架 [J]. 遥感技术与应用, 2013, 28(3): 383-390.
[27] “中国数字图书馆标准规划建设”项目组. 我国数字图书馆标准规范建设之数字资源唯一标识符应用规范 [M]. 北京: 中国科学院文献情报中心,2008.
[28] 王燕, 毛军. 我国数字资源唯一标识符应用模式与管理机制 [J]. 现代图书情报技术, 2005(2): 10-14.
[29] 宋文, 孙坦, 毛军, 等. CDOI规范及在国家图书馆的应用 [J]. 现代图书情报技术, 2008(10): 1-5.
[30] 李颖, 赵蕴华, 姚长青, 等. 中文DOI系统的应用研究与开发——从战略规划到国内外合作 [J]. 数字图书馆论坛, 2009(8): 32-38.
[32] 中国知网.DOI简介 [M]. 北京: 中国知网CNKI, 2013.
[33] 廖京辉, 董秀玥. 谈有效利用数字对象唯一标志后缀部分 [J]. 编辑学报, 2013, 25(1): 41-42.
[34] 李颖, 乔晓东, 杨兴兵, 等. 基于DOI 系统的中日韩三国之间科技信息共享 [J]. 中国科技资源导刊, 2012 (6): 81-85.
[35] 彭洁, 涂勇. 科学数据引用的探讨 [J]. 数字图书馆论坛, 2008(10): 14-18.
[36] 吴立宗, 屈永华, 王亮绪, 等. 黑河综合遥感联合试验的数据管理与共享 [J]. 遥感技术与应用, 2010, 25(2): 772-781.
[37] Sun S, Lannom L, Boesch B. Handle System Overview [S]. IETF RFC 3650, Internet Engineering Task Force (IETF), 2003.
[38] 梁健. Handle System在中文DOI系统中的应用 [J].现代图书情报技术, 2008(9): 16-20.
[39] 刘润达, 王运红. 开放研究人员及贡献者唯一标识(ORCID)概述 [J]. 情报科学, 2013, 31(11): 86-90.
[40] 任瑞娟, 刘丽斌, 濮德敏, 等. 中文DOI路在何方——从参考文献著录与DOI的关系探讨中文数字对象唯一标识符的发展方向 [J]. 中国图书馆学报, 2010, 36(186): 115-121.
[41] 郭晓峰, 练霞. DOI多重解析的解决方案研究 [J]. 数字图书馆论坛, 2007(10): 10-15.
[42] 汤森路透. 汤森路透发布Data Citation Index促进对全球研究数据的发现[EB/OL]. [2014-02-18]. http:// www.thomsonscientif l c.com.cn/press/press20121102/.
Analysis on the Current Status, Problems &Countermeasures of Scientific Data DOI in China
Liu Runda1, Zhu Yunqiang2, Liu Chuang2, Wu Lizong3
(1. Beijing Science & Technology Communication Center, Beijing 100035; 2. StateKey Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101; 3. Cold and Arid RegionsEnvironmental and Engineering Research Institute, Chinese Academy of Sciences, Lanzhou 730000)
The applications of DOI (Digital Object Identif i er) have expand from the identif i cation of journals, electronic books, technical reports, standards to the more diversified direction such as the identification of literature related scientif i c data, copyright, and even authors, etc. DOI application has become an important stage in the development of knowledge linking. This paper systematically examines the application status of scientific data DOI in China, combining the characteristics of scientific data resource, analyzes the safety, rights and interests, multi-resolution, granularity and update, data citation and publishing problems relating scientif i c data DOI. Taking the Global Change Scientif i c Data Publishing System as an Example, gives specif i c countermeasures targeting the above mentioned problems.
G203
ADOI:10.3772/j.issn.1674-1544.2014.05.011
宋济范.
搭建信息资源的桥梁 [J]. 生殖医学杂志, 2012,21(4): 323.
刘润达( 1980- ),男,博士,副研究员,研究方向:地学数据共享、科技资源管理、科技传播;诸云强*(1977- ),男,博士,副研究员,硕士生导师,研究方向:地学数据共享和信息化科研环境、资源环境信息系统;刘闯(1948- ),女,博士,研究员,研究方向:地球信息科学、全球变化研究数据出版;吴立宗(1975- ),男,博士,副研究员,研究方向:科学数据共享、冰川与冰湖编目。
国家自然科学基金项目“基于元数据语义的地理空间数据关联方法研究”(41371381);科技基础性工作专项项目“科技基础性工作数据资料集成与规范化整编”(2013FY110900);中科院地理资源所一三五科技计划项目“基于云服务的地学科研信息化环境研究、构建与应用示范”(2012ZD010);资源与环境信息系统国家重点实验室自主部署项目“陆地表层系统数据-模型共享研究与应用示范”(O88RA900KA);中科院“科技领域云”项目“基于云服务的地学科研信息化环境”。
2014年5月27日。