APP下载

几个值得关注的语义出版研究热点

2018-05-07徐雷

出版科学 2018年2期
关键词:开放共享去中心化

[摘 要] 自语义出版的概念正式提出后,工业界和学界对语义出版的关注越来越高,由于语义出版和Web技术密切相关,近几年Web等领域的发展给语义出版带来了新动向,也出现了一些对语义出版内涵的再思考。本文对目前主流的语义出版研究和实践现状进行梳理总结,发掘了语义出版数据的开放共享、去中心化语义出版实践、真正的语义出版等研究热点,希望引起学界对这些研究方向的关注和重视。语义出版数据的开放共享、去中心化实践是Web技术的开放性及数据科学发展的必然结果,伴随着这些最新的技术和实践原则的提出和推进,将进一步引起各界对语义出版研究与实践的深化以及对什么是真正的语义出版的思考。

[关键词] 语义出版 开放共享 FAIR 可信任 去中心化

[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2018) 02-0016-07

[Abstract] After the definition of semantic publishing put forward in 2009, more and more attentions are paid from industry and academia. Due to the close relation between semantic publishing and web techniques, new trends from the field of web and related domains were brought into the scope of semantic publishing, and some new ideas about the original concept of semantic publishing emerged recently. In this paper, main stream of semantic publishing studies and practices were classified and summarized, and opening, sharing, decentralizing and genuine semantic publishing as the newest hotspots in semantic publishing field were proposed with expectation to bring more attentions to people in this field. It is an inevitable result of the openness of the Web and development of data science that opening, decentralizing as new trends come out in the development of semantic publishing. Together with these newly put forward techniques and principles, this will introduce more and more people to consider the connotation of the genuine semantic publishing in the future and promote more and more study and research in deep.

[Key words] Semantic publishing Opening and sharing FAIR Trusty publishing Decentralization

1 引 言

自肖頓(Shotton)[1][2]首次提出语义出版(semantic publishing)的概念后,语义出版在学术界和工业界的研究和实践逐渐升温。语义出版其实可以简单地总结为任何可以增强出版物语义内涵的技术手段,它是Web技术尤其是语义Web技术、文本分析等技术和出版领域实践的一次有意义的融合。Web技术中的信息发布、访问协议以及标记语言等技术为语义出版物提供了开放的访问存取环境,语义Web技术中的RDF/OWL标准、Linked Data技术及实践原则为语义出版物提供了规范的表示模型,以自然语言处理为核心的文本分析与挖掘技术则为语义出版流程的自动化提供了支撑。因此,语义出版概念并不是作为一项新的技术被提出,它是各种现有技术在出版领域中广泛应用后自然而然被归纳总结的结果。具体而言,语义出版通过可视化、动态检索等手段来增强出版物的语义,对相似内容的出版物进行关联,共享出版物背后的科学数据,增加丰富的出版物元数据来提高机器的可读性,进而促进出版物的可发现性。

语义出版模式的流行对现有的基于科学论文层次的科学交流来讲意义重大。传统的科学出版模式将科学研究成果使用自然语言进行表达并集中存储在数据库中,实际上科学论文以这种方式呈现其中蕴含的知识被发现的概率并不高,科研人员需要进行繁琐的出版物检索、研读等科研活动才能获取并总结出所需的科研背景和现状。而语义出版要求出版物具有丰富的元数据、细粒度的以及高度互联的内容片段,这可以极大地提高学术交流的效率以及新知识的发现概率[3],避免或者降低科学假设以及科学实验的重复进行。本文简要梳理了目前最新的主流语义出版的研究与实践,重点分析在开放科学的环境下,语义出版研究与实践的几个最新的研究热点,主要包括:语义出版数据开放共享、语义出版的去中心化实践以及对什么是真正的语义出版的思考。

2 语义出版发展现状

语义出版技术在出版业中的应用越来越广泛[4],国际诸多大型企业如威科集团[5]、爱思唯尔出版集团[6]、BBC[7][8]等早已将语义出版技术作为其创新战略和商业实践的一部分。国内外对语义出版的科学研究与实践也逐渐增多,已经有语义出版相关的图书及专著相继问世,诸如文献[9][10][11]等。语义出版相关的科学活动也相当活跃,知名的要数最近几年陆续组织的语义出版国际研讨会(Semantic Publishing Workshop,SePublica)[12],致力于解决语义出版相关的各种原则、技术问题,以及每年举办的语义出版挑战赛(Semantic Publishing Challenges)[13],主要以从科学文献中自动抽取知识片段为任务目标。

和中文“出版”一词的内涵有一些差异,英文“Publishing”一词具有“发布”的意思,其含义更为广泛。同时,由于语义出版更多是一项实践活动,目前的研究成果除了在科学文献中体现外,更多是在各种数据集、语义出版工具和平台中体现。另外,有时国内的一些研究成果并不以“语义出版”来命名,因此,实际上现在对语义出版的研究及实践已经较为广泛。从国外对语义出版的研究内容来看,凡是涉及数据、信息、文献、知识等内容的细粒度组织与发布都是语义出版的范畴。语义出版物,除了传统的科学论文这一主流的载体形态之外,还包括各种相关的科学数据、个人学术主页等形式。排除语义出版相关的介绍性的研究之后,可将目前的语义出版研究与实践大致分为如下几个方面。

(1)语义出版元数据及本体等标准设计。用于对出版物进行标准化的组织,便于不同出版物之间的互联与共享。最知名的比如SPAR语义出版系列本体[14],包含了语义出版流程本体、出版状态本体、出版角色本体、引文本体等涵盖出版诸多流程的本体集合。其他诸如Linked Science Core Vocabulary、BIBO、纳米出版物模型、微型出版物等[15]。

(2)语义出版数据集开发及发布。开发语义出版物或相关的语义出版数据(Semantic Publishing Data)并发布,供用户使用。比如Semantic Lancet项目数据集[16]、Linked Open Data中的出版物数据集[17]、CEUR-WS数据集[18]、科研数据集[19]、OpenCitations数据集[20],以及SciKG数据集[21]等。这些数据集一般是科研项目、期刊文献、会议论文、作者信息、引文数据等各种粒度的出版物信息关联数据,一般都提供SPARQL访问端、在线浏览、批量下载等访问形式。

(3)语义出版物相关技术、工具及开发。围绕语义出版物的形式及结构,采用各种技术手段,如实体链接技术、数据库映射技术、结构化与标准化技术、发布技术、众包标注平台设计等,来识别出版物中的结构信息[22],进行文本转换、切分、识别、抽取、结构化等操作[23],以生成各种语义出版物。文献[24]中总结了数据抽取、数据转换、数据存储、数据可视化、数据质量工具。具体的过程,如文献[25],提出了一个从科学文献中抽取知识的平台,完成了句子修辞结构分类和文本摘要抽取的方法。语义出版工具有Spotlight、Utopia Documents、CiTalO等。

(4)语义出版物的应用与消费。语义出版物倾向于采用细粒度的数据组织方式,使得计算机更容易理解,某种程度上对人来说可能就不那么友好。因此,语义出版的应用方面主要解决发布的语义出版物如何使用的问题。比如对语义出版物进行可视化[26]、设计语义出版物的浏览器[27]等,以及采用语义出版技术手段进行在线教育[28]、使用已有纳米出版物(Nanopublications)进行疾病实验数据探索[29]、将语义出版技术应用于非遗数字资源[30]等。

3 语义出版技术研究热点

上一节总结的关于语义出版的标准、数据、技术、应用几个研究与实践维度,是目前语义出版研究的主流,尤其是技术环节,目前已有大量的技术、工具、平台在开发并应用,大部分语义出版研究实践都属此类,这也充分显示语义出版的实践特性,其主要目的是加速语义出版物的自动化流程,增加语义出版物的发布效率。在这些主流的语义出版研究实践中,伴随着语义出版实践的深化,语义出版数据的开放共享、语义出版的去中心化探索与实践,以及什么是真正意义上的语义出版逐渐受到学者的关注和重视,成为当前语义出版技术的研究热点。

3.1 语义出版数据开放共享

开放是互联网的固有特性,产生于互联网技术环境下的语义出版物,作为一种细粒度的知识载体形态,应该适应这种开放的趋势。在语义出版领域,2017年的一个重大事件是开放引文数据倡议(Initiative for Open Citations,I4OC)[31]的提出,最初的动机正是开放共享的需求驱动的。科学论文的作者提供了论文的引文链接数据,当作者需要使用引文数据时,理应免费获取这些引文数据,而这些数据却被隐藏在各大出版商手中,不被论文的作者所使用。I4OC倡导引文数据应该被免费合法的共享出来,建议各大出版商应该把各自数据库中的引文数据开放。引文数据的开放与共享,使得对科学的计量与评价更为便利与准确,避免了直接从数据库检索获取引文数据的环节,以及由此带来的查询不全面不准确、成本过高且耗时的问题,从而提高科学计量指标的准确度[32]。

目前I4OC已经获得了诸多出版商的响应和支持,在https://i4oc.org/上可以找到目前最新的支持引文數据开放的出版商。当谈到I4OC时,不得不提的是上节提到的OpenCitations数据集[33],I4OC倡议就是基于这样一个数据集的发布而出现的。OpenCitations是一个使用SPAR本体[34]描述的引文数据集,将使用Crossref和ORCID标引的文献数据开放,该数据集于2011年在牛津大学创建,数据抓取自PubMed 中心的开放获取数据,可以通过HTTP直接访问,也提供了SPARQL服务端以及批量下载的数据。

数据驱动的开放科学环境下,已经出现了大量的开放获取期刊、各种预印本服务以及科学数据共享政策。实际上在语义出版领域开放共享实践也并不少见,除了提及的OpenCitations数据集外,语义出版在网络自出版等分布式信息发布中的应用也逐渐多起来。在学术界,很多学者一般都有自己的主页来维护自己的科研成果和项目信息,相对于传统的科学文献数据库,这种自出版方式可以极快地将自己最新发表的科研成果、研究进展、项目进度等发布出来,而不用等待很长的时间来让常规的检索服务来索引,极大地促进了科学交流的效率。这类似于目前流行的预印本服务,其目的都是让学术交流回归本源,促进更广泛的学术合作,只不过语义出版物本身的结构化特征使其更便于知识的发现。也有学者[35]对自己的学术主页进行了语义化,包括自己个人信息、发表的出版物等内容,甚至提供语义检索的接口。总的来说,学术界中的科学数据包括语义出版数据的开放共享是大趋势,数据开放越来越多地受到人们的关注甚至呼吁,出版商面临这种趋势需要权衡其现有利益,开放什么样的数据,数据共享到什么程度等都需要再思考。

3.2 语义出版的去中心化实践

在去中心化的环境中并不存在一个具有明确角色的中心节点,所有的节点地位保持平衡。提姆·伯纳斯·李(Tim Berners-Lee)等认为去中心化需要遵循几个原则:数据存储独立于服务提供商、具有交互性、可访问性,以及自由表达和处理网络信任的能力[36]。结合语义出版的发展历史,以及作为一种细粒度结构化的科学成果形式,语义出版物天然符合上述的一些原则,但不是全部。

3.2.1 遵循FAIR原则

在2014年,来自学术界、工业界以及出版界等多个领域的机构人员在荷兰莱顿举办了一次研討会,并设计了一项关于科学数据管理与发布的一组指导原则FAIR(Findable, Accessible, Interoperable, Reusable),这是科学数据管理的最新进展[37]。其中可发现(Findable)是指数据资源需要被赋予一个可识别的标识,具有丰富的元数据并且可以被索引或被搜索到;可访问(Accessible)是指通过标准的访问协议,使用数据的标识符就可以检索到数据资源,并且数据资源的元数据也可以访问,即使数据资源不存在了;可交互(Interoperable)是指数据资源使用形式化的、共享的、广泛采纳的语言来表述知识;可重用(Reusable)是指数据资源需要使用准确的属性来描述,包含清晰的数据使用许可以及具体的数据来源信息,同时也需要满足特定领域的规范。FAIR中每一项原则都具有更细粒度的原则解释。可以看出FAIR原则和提姆·伯纳斯·李等学者提出的去中心化原则存在很大的重叠,FAIR原则是目前包括语义出版数据在内的数据发布过程中广泛采用的实践原则。

FIAR作为一个顶层指导原则,它没有规定具体的技术实现细节。因此,使用FAIR原则对语义出版物进行组织管理以及设计在被各界所认可的同时,也需要通过各种技术手段予以实现。诸如马克·威尔金森(Mark D. Wilkinson )等学者[38]认为交互性是FAIR原则中最难实现的,他们采用W3C的关联数据平台、RDF映射语言、三元组模式片段等技术方案来实现遵循FAIR原则的学术出版实践的底层基础架构,并重点解决出版物交互性原则的设计问题。

3.2.2 语义出版物的可信任性

在去中心化的过程中,可信任性是作为一个需要遵循的原则或一个需要解决的技术问题,这类似于传统电子出版过程中需要解决恶意复制粘贴、剽窃盗版等问题一样。语义出版物的发布,尤其是网络自出版以及纳米出版物等形式的发布,经过网络传播可能会出现很多版本,为了增强出版物的可信度,需要确认所检索或浏览到的语义出版物内容是权威可信的。比如,纳米出版物中的Provenance要素就是为这一目的而设计的,以此表明其所呈现的语义数据的来源,包括该纳米出版物由谁在何时创建、其断言(Assertion)由谁声明、可访问的网络地址、DOI信息等都需要提供以用来保证该纳米出版物信息的真实可靠。然而,纳米出版物采用的RDF的数据组织模式是基于开放世界假设的,这使得任何机构或个人都可以生成自己的纳米出版物信息,而这些信息目前不需要审核就可以发布,同时也可以对现有的纳米出版物进行更改后再发布,这就使得纳米出版物的内容存在“不可信任”的风险。这一点不同于目前主流的出版方式,我们可以通过权威的数据库来获取没有经过篡改的文献。

因此,伴随着数据开放共享以及去中心化的趋势,语义出版物的这种可信任性越来越需要得到保证。基于不可信任的数据基础之上的科学结论是值得怀疑的,不可信任的数据驱动的科学交流是有极大危害的。可信任的语义出版物是伴随着互联网语义数据的增长亟待解决的问题。在语义Web领域中,其实信任(Trust)早已经是其技术栈的一个维度,因此关于Web上的信任机制的技术方案、信息安全领域的认证加密以及区块链[39]等技术都可以被用来设计具有可信任特性的语义出版物。文献[40]实现了一个可信任的URI技术,将URI表征为带有数字资源HASH值的形式来验证该URI对应的资源是否被更改,并将其应用在纳米出版物的设计过程中,以此保证纳米出版物的可信任性。比较有名的语义出版工具Dokieli就是一个去中心化的写作与语义标注网络平台[41],其使用HTML标签来创作以及发布网络文档,使用Schema.org、Web Annotation等元数据及术语来结构化社交用户的标注信息,可以在不同用户之间进行分享以及论文评议。

实际上,可信任性也可视为语义出版物质量的一个维度,传统的科学研究出版过程需要同行评议、编辑审校等环节来保证出版物内容和形式上的准确,语义出版物的发布可以看作这一形式的发展和演变,当然语义出版物的发布有其特殊性,它同样需要解决其内容和形式的正确性问题。目前主流的语义出版实践都十分关注语义出版物的质量问题,比如语义出版挑战赛的任务评估就是通过语义出版数据抽取质量来衡量的[42],通过挑战的方式引入竞争,来提高语义数据的质量,进而促进科学数据价值链的形成[43]。

3.3 真正的语义出版

目前大多数的语义出版实践仍是传统出版物的事后语义增强,比如对文献进行语义标注、语义分割、语义映射以及语义关联等操作,这仍将会在相当长的一段时间内是语义出版的主流。最近几年的语义出版挑战[44]也都是关于如何从科学文献、引文等数据中抽取信息的任务,以及这些实体之间的链接问题,比如2017年语义出版挑战的任务是关于如何从论文表格以及全文中抽取信息、如何关联这些信息等[45]。

真正的语义出版则是在出版物创作阶段就进行各种语义分析与处理,对知识进行语义表达,以语义化的方式对创作的内容进行编辑,文献[46]给出了一个这样的语义出版流程,包括传统出版过程中的语义化预处理、语义内容加工和语义内容审核,以及形成语义出版物之后的自动语义分析。托拜厄斯·库恩(Tobias Kuhn)[47]将这种触及出版内部流程的,直接对知识进行语义表达的语义出版方式称为真正的语义出版(Genuine Semantic Publishing),并给出了具体的实现来证明真正的语义出版的可行性,同时指出肖顿[48]最初给出的语义出版定义的局限性:一方面语义出版物必须和原始的文献同时提供的要求约束性太强,另一方面原始的定义给出的语义实现方法太过于肤浅。真正的语义出版应该更符合人们的直觉,它不要求语义出版物必须伴随着原始的文献一起提供,它可以独立存在,同时认为经过语义表达的内容应该作为语义出版物的首要创建和发布的对象。这样的语义出版物需要覆盖科学研究最主要的声明及发现,并且由其作者创建以保证其权威性,即可信任性,同时可以脱离原始的文献(如果存在的话)而独立存在,并保证其轻量级和细粒度来满足实际的实践需求。与此观点类似,荷兰皇家艺术与科学院士弗兰克·哈姆伦(Frank van Harmelen)[49]也认为我们不仅仅要进行目前主流的通过信息抽取、语义增强的方式来开展语义出版,还应该支持从源头就开始进行语义出版物的生产。

实际上,参照这种对语义出版内涵的直观理解,目前对于语义出版的研究中已经有一些具有所谓的真正的语义出版的意味。诸如纳米出版物就是对原始论文中核心断言的语义陈述,可以独立发布;微型出版物[50]则聚焦于论文的论证网络,也可以独立发布,只是和纳米出版物具有不同的粒度和处理视角;以及SPAR本体、各种文档结构化的元数据和文档交互工具等,都已经在为这种深度的真正的语义出版做铺垫。只不过目前主流的语义出版实践掩盖了这些所谓的真正的语义出版形态而已。

目前普及这种真正的语义出版还有难度,一方面它需要对现有出版流程的各个环节进行重新审视和改进,要求作者、编辑人员掌握知识的语义表达的各种手段,当然很多工具可以开发出来辅助语义出版物的生产,但真正的语义出版物的内容创作类似于传统出版物的创作,是需要作者亲自参与进来的,这一点目前看来似乎不可能被计算机所取代。另一方面语义出版物的出现是为了加速学术交流,促进知识发现,使得知识越来越容易被机器所“理解”,这就带来一个问题,对于已经习惯于阅读叙事型的文字和图像符号的人类而言,阅读这种语义出版物就比较困难。因此,真正的语义出版作为一个研究前沿,仍需要继续探索。

4 结 论

本文从目前语义出版的研究与实践中提炼出语义出版的若干研究热点:语义出版数据的开放共享、语义出版的去中心化实践以及真正的语义出版,分析了各自的内涵及出现的必然性,以及这几个方面对语义出版研究以及学术交流的价值。当然这几个维度是相互交叠的,也的确是整个语义出版研究与实践需要解决和面对的问题和趋势。在开放科学的大环境下,出版数据的开放共享趋势很明显,伴随着开放共享,去中心化也逐渐走入人们的视野,该过程需要逐步推进,少不了出版商利益的权衡。语义出版数据的生产与发布需要遵循一定的原则,FAIR作为最新的数据组织管理原则已引起学者的广泛关注。由于FAIR原则没有规定具体的实现细节,可预见未来对其内涵的解读仍将继续深化,遵循FAIR原则的数据组织管理实践也必将跟进。语义出版物及开发流程在这一原则指导下,也将向更为规范化的方向发展。

从实践上看,语义出版物更多的是一种结构化的知识组织形态,最常见的比如纳米出版物,蕴含了科学成果的断言信息,已被视为科学交流的未来形态[51]。一方面,考虑到人类对叙事型文本、图像等的阅读习惯,也许目前主流的对出版物进行语义增强的方式对用户来说仍是最好的形态。我们也看到已有很多相关的增强用户交互功能的“可执行”文档,如基于Python语言的Jupyter Notebook代码平台[52],可以编辑叙事文字,也可以插入可执行的代码,可以加载后台数据,进行实时的数据结果验证,现已经被广泛应用。另一方面,如果对于语义出版物的编辑、可视化、呈现载体的设计等技术有新的突破,使得细粒度的语义出版物更容易被人们撰写、生产和理解,那么也许不久的将来真正的语义出版物将成为常态,语义出版物不再作为传统科学出版物的衍生品,而是独立发布,即真正的语义出版。

注 释

[1][48]Shotton D. Semantic publishing: the coming revolution in scientific journal publishing[J]. Learned Publishing, 2009,22(2): 85-94

[2]Magazine D L. The five stars of online journal articles—a framework for article evaluation[J]. D-Lib Magazine, 2012,18(1/2)

[3]Schmidt N. Tackling complexity in an interdisciplinary scholarly network: Requirements for semantic publishing[J]. First Monday,2016,21(5)

[4]Pellegrini T. Semantic metadata in the publishing industry–technological achievements and economic implications[J]. Electronic Markets,2017,27(1):9-20

[5]Auer S, Bühmann L, Dirschl C, et al. Managing the life-cycle of linked data with the LOD2 stack[C]//International semantic Web conference. Springer, Berlin, Heidelberg,2012:1-16

[6]翁彦琴,彭希珺. 爱思唯尔(Elsevier)语义出版模式研究[J]. 中国科技期刊研究,2014,25(10):1256-1261

[7][28]Mikroyannidi E, Liu D, Lee R. Use of Semantic Web Technologies in the Architecture of the BBC Education Online Pages[M]//Open Data for Education. Springer International Publishing,2016: 67-85

[8]王莉莉,栾冠楠. 英国广播公司(BBC)动态语义出版模式研究[J]. 圖书情报工作,2017,61(8):126-132

[9]Semantic Technologies in Content Management Systems: Trends, Applications and Evaluations[M]. Springer Science & Business Media,2012

[10]Peroni S. Semantic Publishing: issues, solutions and new trends in scholarly publishing within the Semantic Web era[D]. alma,2012

[11]Peroni S. Semantic Web Technologies and Legal Scholarly Publishing[M]. Springer,2014

[12]SePublica 2014 Semantic Publishing[EB/OL].[2017-12-05]. http://ceur-ws.org/Vol-1155

[13]Di Iorio A, Lange C, Dimou A, et al. Semantic publishing challenge–assessing the quality of scientific output by information extraction and interlinking[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 65-80

[14][34]SPAR Ontologies.[EB/OL].[2017-12-05]. http://www.sparontologies.net

[15][46]徐雷. 語义出版应用与研究进展[J]. 出版科学,2016,24(3):33-39

[16]Semantic Lancet Project. [EB/OL].[2017-12-05]. http://www.semanticlancet.eu

[17]Linked Open Data. [EB/OL].[2017-12-05]. http://lod-cloud.net/versions/2017-08-22/lod.svg

[18]Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015:177-188

[19]Hoekstra R, Groth P, Charlaganov M. Linkitup: Semantic Publishing of Research Data[C]//Semantic Web Evaluation Challenge. Springer, Cham,2014:95-100

[20][33]OpenCitations Corpus[EB/OL].[2017-12-05]. http://opencitations.net

[21]Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, and Zhong Su. ArnetMiner: Extraction and Mining of Academic Social Networks. In Proceedings of the Fourteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(SIGKDD'2008):990-998

[22]Di Iorio A, Peroni S, Poggi F, et al. Recognising document components in XML-based academic articles[C]//Proceedings of the 2013 ACM symposium on Document Engineering. ACM,2013: 181-184

[23]Ronzano F, Saggion H. Knowledge extraction and modeling from scientific publications[C]//International Workshop on Semantic, Analytics, Visualization. Springer, Cham,2016: 11-25

[24]Purohit S, Smith W, Chappell A, et al. Effective Tooling for Linked Data Publishing in Scientific Research[C]//Semantic Computing(ICSC), 2016 IEEE Tenth International Conference on. IEEE, 2016:24-31

[25]Ronzano F, Saggion H. Knowledge extraction and modeling from scientific publications[C]//International Workshop on Semantic, Analytics, Visualization. Springer, Cham, 2016:11-25

[26]Ding Y, Sun Y, Chen B, et al. Semantic web portal: a platform for better browsing and visualizing semantic data[J]. Active Media Technology, 2010:448-460

[27]VISUALIZE NANOPUBLICATION[EB/OL].[2017-12-05].http://dev.biosemantics.org/nanopubviz-old/nanopublication?uri=http://np.inn.ac/RAsGmevw3xWT0ICH2In5VhqUBZQFGLxdW4IXKUaap5DO8.nq

[29]Mina E, Thompson M, Kaliyaperumal R, et al. Nanopublications for exposing experimental data in the life-sciences: a Huntingtons Disease case study[J]. Journal of biomedical semantics, 2015,6(1):5

[30]翟姍姗,许鑫,夏立新,石义金. 语义出版技术在非遗数字资源共享中的应用研究[J]. 图书情报工作,2017,61(2):23-31

[31]I4OC. [EB/OL].[2017-12-05].https://i4oc.org

[32]Peroni S, Dutton A, Gray T, et al. Setting our bibliographic references free: towards open citation data[J]. Journal of Documentation, 2015, 71(2):253-277

[35]Verborgh R. Piecing the puzzle–Self-publishing queryable research data on the Web[C]//Proceedings of the 10th Workshop on Linked Data on the Web. 2017,1809:1-14

[36][41]Lange C, Auer S, Berners-Lee T. Decentralised Authoring, Annotations and Notifications for a Read-Write Web with dokieli[C]//Web Engineering: 17th International Conference, ICWE 2017, Rome, Italy, June 5-8, 2017, Proceedings. Springer, 2017, 10360:469

[37]许洁,王嘉昀. 基于区块链技术的学术出版信任建设[J]. 出版科学,2017(6):19-24

[38]Kuhn T, Dumontier M. Trusty URIs: Verifiable, immutable, and permanent digital artifacts for linked data[C]//European Semantic Web Conference. Springer, Cham,2014:395-410

[39]Dimou A, Vahdati S, Di Iorio A, et al. Challenges as enablers for high quality linked data: Insights from the semantic publishing challenge[J]. PeerJ Computer Science, 2017,3:e105

[40]Vahdati S, Dimou A, Lange C, et al. Semantic publishing challenge: bootstrapping a value chain for scientific data[C]//International Workshop on Semantic, Analytics, Visualization. Springer, Cham,2016:73-89

[42]Wilkinson M D, Dumontier M, Aalbersberg I J J, et al. The FAIR Guiding Principles for scientific data management and stewardship[J]. Scientific data, 2016, 3:160018

[43]Wilkinson M D, Verborgh R, da Silva Santos L O B, et al. Interoperability and FAIRness through a novel combination of Web technologies[J]. PeerJ Computer Science, 2017, 3:e110

[44]Lange C, Di Iorio A. Semantic publishing challenge–assessing the quality of scientific output[C]//Semantic Web Evaluation Challenge. Springer, Cham, 2014: 61-76

[45]Semantic publishing Challenge 2017[EB/OL].[2017-12-05]. https://github.com/ceurws/lod/wiki/SemPub2017

[47]Genuine Semantic Publishing.[EB/OL].[2017-12-05]. http://www.tkuhn.org/pub/sempub/sempub.dokieli.html

[49]The end of the scientific paper as we know it (or not...) FrankVanHarmelen[EB/OL].[2017-12-05]. https://www.slideshare.net/Frank.van.Harmelen/the-end-of-the-scientific-paper-as-we-know-it-or-not

[50]Clark T, Ciccarese P N, Goble C A. Micropublications: a semantic model for claims, evidence, arguments and annotations in biomedical communications[J]. Journal of biomedical semantics, 2014, 5(1): 28

[51]Mons B, van Haagen H, Chichester C, et al. The value of data[J]. Nature genetics, 2011, 43(4): 281-283

[52]Jupyter Notebook. [EB/OL].[2017-12-05]. http://jupyter.org/

(收稿日期:2017-12-06)

猜你喜欢

开放共享去中心化
湖北省科技基础条件资源开放共享体制优化研究
一种去中心化的网络域名服务系统模型
高校实验教学资源整合与开放共享
基于培养应用型人才的大型仪器开放共享及绩效考核模式研究
浅析移动互联语境下中小成本电影去中心化的创作趋向
“去中心化”电子商务背景下大学生网络创业前景分析
加强高等职业院校科研公共实验室建设探析
浅析新媒体视阈下的新闻失实报道
论比特币与人民币的差异及其启示
构建科学的大型仪器设备管理体系研究