APP下载

浅析数字对象标识技术在数据资源的管理与交易中的应用*

2021-01-14郭晓峰乔晓东

科学与信息化 2020年36期
关键词:解析对象权利

郭晓峰 乔晓东

北京万方数据股份有限公司 北京 100038

引言

当前大数据时代,数据资源极大丰富,成为人人趋之若鹜的“金矿”。但由于数据资源的管理缺乏有效的技术手段,在数据资源的交易、利用等方面也出现了大量混乱现象,如数据资产交易领域非法交易猖獗,数据利用领域无视数据的权利而随意复制传播、非法使用等现象司空见惯。探究这些乱象的根本原因,是数据的知识产权界定以及数据的安全隐私保护等缺乏有效的法律依据,同时技术上也缺乏有效的手段对于数据的合法交易、利用提供便利的基础设施,促进合法的数据交易,并保护正当的数据利用。如能够对数据资源进行清晰的确权,对数据交易及数据利用进行管理及追溯,为数据的合法来源提供证据等。

回顾20世纪90年代互联网发展之初,网络中的数字资源呈现爆发式增长,但由于在网络环境下缺乏有效的数字资源管理机制,同样产生了大量混乱现象,死链频发、盗版猖獗。在互联网环境下,如何才能对数字资源进行有效的管理,并对数字资源的版权提供保护手段?这些问题催生了数字对象管理理论及相关技术系统,自此,基于数字对象标识符和元数据的数字资源注册与管理作为一种有效的技术手段被普遍采用,并成为数字图书馆、数字出版、科学数据管理、版权管理等领域成熟的内容管理方案,Handle/DOI系统就是成功的范例。

参考上述领域的成功案例,对于数据资源的管理与交易同样可以基于数字对象管理理论及相关技术系统,建立有效的数据资源注册机制,对于数据资源的基本情况及其权利归属等重要属性进行清晰的登记,并对其属性的变更情况进行及时的记录与追踪,同时提供便利的方式使大众能随时获得数据资源的登记信息,便于数据资源的需求方发现数据资源并对其进行合法的获取与利用。

本文将按照上述研究思路,在介绍数字对象标识技术及其应用的基础上,结合国家重点研发计划“科技成果与数据资源产权交易技术”的具体研究案例,提出基于数字对象标识技术促进数据资源交易的应用解决方案,并对本方案的优势进行比较和分析,形成研究结论。

1 数字对象标识技术与应用介绍

数字对象标识理论与技术诞生于1990年的第一代数字图书馆发展浪潮之中,是数字对象架构(DOA,Digital Object Architecture)的关键组成部分,而DOA理论为第一代数字图书馆提供了体系结构,其中数字对象标识能够为数字对象(DO)提供命名与安全访问机制。DOA由TCP/IP的联合发明人、互联网之父Robert Kahn博士提出,同时他带领国家创新研究所(CNRI, Corporation for National Research Initiatives)研发了数字对象标识技术系统——Handle系统[1],于1995年正式运行,以全球分布式系统架构支撑数字对象标识的分配、 安全管理及广泛利用。在Handle系统由CNRI运行近20年、为全球提供了10亿规模的Handle标识注册及管理服务之后,2014年,在联合国国际电信联盟(ITU)的监管下,CNRI联合多个国家相关机构于瑞士日内瓦正式成立非营利性国际组织DONA(Digital Object Numbering Authority Foundation),负责Handle系统的全球化运营与发展,在治理结构和技术设施两个层面上创造性地实现了全世界各国联合自治的模式,为下一代网络信息管理提供基础设施。我国也是DONA最早的发起成员及理事会成员之一。

在数字内容管理及版权保护等应用领域,数字对象标识技术得到了广泛应用。DOI系统[2]基于Handle系统提供的唯一标识注册、解析和管理能力,利用数字对象唯一标识和标准化的元数据对各类数字资源进行注册、管理,利用标识符解析到数字资源的网络访问地址及其他相关信息,实现数字资源的唯一识别、永久链接,并促进数字资源在互联网环境下的版权保护、发现和利用,以及系统间的信息交换和互操作。1998年DOI系统首先在数字出版行业开始应用,随后欧洲也从2003年开始实施科研数据的DOI注册、解析并基于DOI提供数据集的引用、复用等服务,至今全世界范围内已有1亿多篇文献及2000余万个科学数据集注册了DOI。2012年DOI系统发布为ISO标准[3],成为通用性的数字资源标识国际标准,并于2018年发布为中国国家标准[4]。在我国,中国科学技术信息研究所和万方数据公司于2007年开始运行中文DOI服务[5],为期刊论文、科学数据等学术研究资源提供DOI注册、解析及其他增值服务。中文DOI服务是亚洲第一个DOI服务,目前服务规模在全球居第二位,共注册DOI 3293万余个,涵盖期刊论文、学位论文、科学数据、图书、会议论文、预印本等资源类别。

2009年由EU DAT(欧洲数据基础设施) 项目成立的EPIC(欧洲永久标识联盟)基于Handle系统为欧洲科学研究社区提供科学数据的永久标识(PID) 服务[6]。同时多个著名的数字图书馆、数字内容管理系统,如DSpace、Fedora等都内置了Handle系统,为数字内容提供唯一标识注册、解析功能。在数字资源的版权保护及更广义的数字权益管理领域,需要在数字资源的全生命周期中对其进行有效(持久、一致)的识别和确认,2012年由欧盟出版商协会组建的Linked Content Coalition(LCC)开发了唯一标识规范,指出可解析的唯一标识及持久的数字内容注册管理均是必要的基础设施,元数据必须以标准格式发布等。

我国相关领域对数字对象标识标准体系也予以了高度关注。2012年新闻出版领域发布了非等效采用DOI国际标准的新闻出版数字资源唯一标识行业标准《CY/T 82-2012 新闻出版数字资源唯一标识符》(PDRI)[7]。科技资源领域,2016年发布了《GB/T 32843- 2016 科技平台 科技资源标识》(STRI)国家标准[8],指导各类科技资源的统一标识以及科技资源的编目、注册、发布、查询、维护和管理。

2 服务数据标识注册、解析与追踪解决方案

2017年底,科技部下达了“科技成果与数据资源产权交易技术”重点研发计划的研发任务,万方数据公司承担了该计划中“基于标识的服务数据资源管理技术体系研究”工作,主要基于Handle标识,并结合重点研发计划的研究成果《服务数据资源确权标识标准》及《服务数据资源权利描述标准》,研究形成“服务数据标识注册、解析与追踪解决方案”,并开发实现“服务数据标识注册、解析与追踪系统”,实验、验证服务数据资源管理的轻型技术体系,在提供促进服务数据资源交易的基础设施方面开展了创新性研究。

服务数据标识注册、解析与交易追踪解决方案的整体流程如图1所示。在技术路线方面主要采用标识+元数据的基本技术方法,在第一次登记时利用基本元数据及权利描述元数据记录数据资源基本属性、权利状态的同时赋予其确权标识,实现数据资源的登记、认证。每次交易,实质上是数据资源的权利转移过程,仍然需要利用权利描述元数据记录权利所属状态的变更情况。在标识体系方面,经过充分调研采用具有互操作性的全局性唯一标识体系——Handle标识体系,在标识注册的同时,实现确权标识与数据资源属性信息的绑定;利用唯一标识系统的解析功能及标识与属性的绑定关系,实现通过标识动态获取资源多维度属性信息,并可以持久链接到数据资源本身。同样利用解析功能和每次交易的登记信息,实现基于标识对数据资源的交易和权利变更过程的永久追溯。在元数据方面,主要包括服务数据资源基本属性、权利状态、交易信息等内容的描述,并采用XML等标准化语言进行描述。

图1 解决方案整体流程

方案通过服务数据的首次登记、交易登记、交易追踪等业务流程,实现服务数据交易的规范化管理,促进服务数据的发现、交易与利用。具体描述如下:

(1)服务数据首次登记

服务数据的原始拥有方上传服务数据的基本元数据及权利描述元数据,系统基于Handle系统为该项服务数据分配确权标识,并将数据资源的基本属性、权利状态存储在系统中,实现确权标识与数据资源属性信息的绑定,完成数据资源的首次登记与权利确认。

(2)服务数据交易登记

每次交易实质上都是服务数据的权利转移过程,因此需要利用权利描述元数据记录权利所属状态的变更情况。由数据交易方提交服务数据交易后的权利状态,由系统在该确权标识对应的数据记录中增加此次交易后的权利状态信息,实现数据资源权利变化更新登记与权利确认。

(3)服务数据交易追踪

利用Handle系统的解析功能,使用全网统一的解析格式,实现通过确权标识(Handle)动态获取数据资源最新的基本属性、权利状态变更全流程信息,从而实现对服务数据交易的追踪。

(4)服务数据的发现及交易促进

利用系统登记的服务数据基本属性、权利状态等信息,可以通过这些信息的集中发布、检索、推送等促进服务数据的发现、交易;另外,通过确权标识的解析,也可以实现服务数据本身或其相关信息的持久链接,并可动态获取服务数据相关信息,促进服务数据基本属性、权利状态的发现、获取及系统间的互操作。

3 结束语

本项目研究成果形成的方案具有创新性,在资源管理方面,首次研究形成基于标识的服务数据资源注册登记、解析及交易追踪全流程管理方法及技术解决方案,实现利用标识动态获取数据资源的最新登记状态、权利状态及交易信息等,并可直接从标识永久链接到资源本身,起到在网络环境下对资源进行确认的作用,同时促进资源本身的访问与利用。

本方案形成了一种轻型解决方案,基于成熟的、全球通用的数字对象标识基础设施进行二次开发,在减小开发工作量的同时,保证了服务数据标识注册、解析与交易追踪系统在互操作性、扩展性、分布式部署等方面满足性能要求;并且具备安全认证、防截取、防假冒,保证满足安全要求。

猜你喜欢

解析对象权利
晒晒全国优秀县委书记拟推荐对象
三角函数解析式中ω的几种求法
判断电压表测量对象有妙招
我们的权利
股东权利知多少(一)
睡梦解析仪
攻略对象的心思好难猜
电竞初解析
对称巧用解析妙解
区间对象族的可镇定性分析