APP下载

后MARC时代书目数据关联应用探讨

2014-02-12

图书馆理论与实践 2014年6期
关键词:书目关联图书馆

后MARC时代书目数据关联应用探讨

●梁 亮,陈 琦(杭州图书馆,杭州310016)

MARC;书目数据;关联数据

数字时代,MARC格式的书目数据已无法满足用户服务的需求,本文在对国内外书目数据关联应用案例分析的基础上,探讨如何在这个新旧交替的过程中,运用关联数据理念改造、优化现存的MARC书目数据,使之满足用户服务,并做好向RDA、关联数据等新的数据形式转换的准备。

图书馆采用计算机进行书目编制以来,MARC格式便是图书馆最重要的数据标准,但MARC是一种在封闭环境下使用的元数据,随着时代的变迁,传统的MARC数据已经越来越不适应用户的需求,无法为用户提供更满意的服务,随之而来的对MARC数据改造的理论研究和实践层出不穷。本文从编目员和OPAC用户的视角出发,结合对国内外书目数据关联应用的案例分析,思考和探讨如何运用关联数据的理念去优化、改造、革新现有的MARC格式书目数据,使图书馆的数据尤其是书目数据走出图书馆,融入互联网。

1 关联数据应用概述

1.1 概念阐释

关联数据是万维网的发明人Tim Berners Lee于2006年提出在万维网上发布数据的一种方式,是一种旨在提高网络数据机器可读性的技术框架,它通过建立数据之间的关联来实现数据在网络中的分享与重用。关联数据的核心是将数据和网络融合起来,关联数据给图书馆带来了机会,让图书馆有可能遵循一种泛在的技术规范提供服务,将自身数据与网络世界相关联、相融合,从而真正地将自己融入到整个信息世界中去。[1]作为图书馆原生的书目数据和规范数据无疑是其中最独特、最重要的一部分。

1.2 国外书目数据关联应用案例分析

自2008年以来,国外将书目数据发布为关联数据的图书馆及组织众多。本文选取颇具代表性的瑞典国家图书馆瑞典联合目录(LⅠBRⅠS)及挪威奥斯陆公共图书馆的PODE项目为例,探讨采用关联数据技术后,现有的MARC数据能在图书馆服务上发挥怎样的功能。

(1)瑞典国家图书馆瑞典联合目录(LⅠBRⅠS)。[2]2008年瑞典国家图书馆率先把瑞典联合目录(LⅠBRⅠS)发布为关联数据,瑞典联合目录是瑞典大学图书馆、研究图书馆及公共图书馆的国家联合目录,至今共开放了其200多个成员馆超过650万条书目记录以及20万条规范档。当用户登录LⅠBRⅠS(http://libris. kb.se/)检索某一特定的图书,检索结果页面会显示详细书目信息、电子书信息、相关版本及各图书馆收藏情况,用户可以直接点击到自己喜爱的图书馆网站进一步检索。而同样在各图书馆网站的相应页面,用户还可以链接回LⅠBRⅠS。在主题标目和分类号栏会显示相同主题或类号的文献,在“search further”栏下,点击作者名字就可获得该作者所有相关作品。在“Search outside LⅠBRⅠS”栏下,提供了Google、Google Book Search、Google Scholar、Scirus及LibrsaryThing的链接,将用户引领到了图书馆以外的地方进行资源再发现。

LⅠBRⅠS实现了书目数据之间的关联、图书馆之间的关联、LⅠBRⅠS与外部的关联,使用户通过一站式检索获得不同图书馆、不同资源类型的书目信息并在此基础上获得更多的信息资源,而这些功能都是以关联数据为基础来实现的。

(2)挪威奥斯陆公共图书馆的Pode项目。[3]Pode项目是挪威奥斯陆公共图书馆采用FRBR和关联数据提升图书馆编目系统的实践。它采用挪威科技大学开发的工具,将(NOR)MARC自动FRBR化。通过清理、修正和完善MARC记录,这些FRBR化的数据最终通过XSLT以及DC元数据术语、书目本体、FRBR核心词、FOAF、SKOS等词汇表和本体,被转换成RDF格式成为关联数据。[4]通过这个项目平台,用户可以查找特定作者的完整馆藏,也可以通过元数据的使用发现其他关联的元数据以获取艺术、天气预报、地图、百科全书等相关内容,如用户可以链接到DB-pedia获取与作者相关的更多资源,链接到古登堡计划以获取全文电子书。

PODE项目向我们展示了结合FRBR模型和关联数据技术,确实可以很好的提高我们原有的MARC数据质量,提供给用户更好的服务,这些对处于生命周期末期的MARC来说无疑是一种重生的方式。

1.3 国内应用案例分析

国内的书目数据关联应用尚属起步、探索阶段,以上海图书馆、中国科学技术信息研究所、中国科学院国家科学图书馆为代表的图书馆、研究所是其中的先行者,并逐渐形成了关联数据的核心研究圈。

在书目数据关联数据应用实践方面,上海图书馆试验性地采用关联数据技术,将300条MARC数据与人名规范、馆藏信息合三为一,从而将互不相连的三个数据库:来自Horizon的书目数据、名人手稿馆的名人规范档数据和上海市中心图书馆名录,合成了一个统一的关联数据库。[5]

杭州图书馆尝试书目数据关联数据的应用,虽目前技术和人力无法做到书目数据RDF化,但充分借鉴了关联数据的理念来改造书目数据。编目员采用了各大读书网站的热门标签,将这些标签整理、归类后,重新对MARC数据进行组织,结合新型OPAC技术,使用户能使用自己所熟悉的标签进行文献的检索、浏览,并将每一册图书链接到了豆瓣网站、百度图书等外部网站,扩展了用户信息源。[6]虽然此项工作才刚开始,效果还有待检验,也不是真正意义上的书目数据关联应用,但运用了关联数据的理念,通过“链接”的方式为用户提供了更多的信息资源。

2 以MARC为基础开展关联数据应用的思考

2.1 关注MARC以外的关联数据环境

关联数据的核心之一就是和其他数据集实现数据共享和相互关联,可以将书目数据和其他数据融合起来,使书目信息更加丰富和完整。从国外发布的关联书目数据看,很多国家的书目数据关联到了外部数据集,如Dbpedia、Wikipedia、LCSH、ⅤⅠAF等,大大增加了书目数据的丰富程度。要关注外部关联数据的应用情况,如百度百科将外部的关联数据源与MARC记录中的各项字段内容结合起来,以期与更多的外部关联数据集实现关联。未来的书目控制应当是国际化、协作化和网络化的,书目数据的关联数据应用也应走国际化、协作化和网络化的道路。

2.2 加强图书馆之间的协作

虚拟规范文档(ⅤⅠAF)最初由美国国会图书馆、法国国家图书馆、德国国家图书馆和OCLC共同建设,现移交OCLC统一管理。目前已发布的很多书目数据关联数据都关联到了LCSH、ⅤⅠAF等规范数据关联数据,这些图书馆及图书馆组织间的合作极大促进了书目数据关联应用的发展。在长期的全球性书目控制工作中,图书馆的编目界已形成了一个成熟的、运行良好的全球合作分享数据的机制与模式,这种机制同样可以运用到书目数据关联应用的实践中去。就国内而言,书目数据可以与中图法、中文主题规范数据、中文人名规范数据结合起来开发。

2.3 谋求与不同组织的合作

关联数据的丰富性、社会性要求图书馆的书目数据关联应用不能局限于图书馆,而是出版方、图书馆、用户等多方参与,共同完善。刘炜老师曾提出过一种共建书目数据关联数据的模式,设想由出版商提供图书的原始数据,由国家图书馆或相关权威机构添加书目信息和权威控制,由本地图书馆添加馆藏信息,由用户(包括编目员)添加附加信息如维基百科的链接,而图书馆ⅠT人员为所有这些与本书相关的信息生成页面和链接,如同一个作者的其他著作、同一主题的其他书籍、维基百科、百度百科中的作者生平、读书网站上的读者评论等等。

图书馆的外延在不断扩展,可与之合作的行业、组织也越来越多,从用户服务的角度出发,图书馆的书目数据可以与更多的组织、网站、项目合作,以书目数据为基础拓展到整个人类知识的海洋。

2.4 规范、一致的MARC数据是书目数据关联应用的基础

挪威PODE项目的核心思想之一是图书馆仅仅基于现有的元数据而不是基于提供的元数据的质量,无法创造更好的服务。PODE项目的一个重要步骤是将MARC数据FRBR化,但在具体数据转换、测试中发现细微到MARC数据个别字段指示符的缺失都会直接影响到后续数据转换的正确性。[8]由此可见,书目数据的标准、规范、可靠是关联数据应用的基础。因此,要确保我们能跟上这波关联数据的浪潮,继续产生规范的MARC数据乃至RDA数据,仍是书目数据关联应用的基础。

2.5 通过“链接”拓展服务功能

图书馆采用关联数据技术的最终目的是为了服务,关联数据通过“链接”实现了不同数据集的关联。近年来,通过优化图书馆检索界面,书目目录已经增加了很多书目以外的信息,如国外普遍应用的LibraryThing、Google Book、国内的豆瓣读书、百度图书等为图书馆提供目次、图书封面、内容简介和读者评论的链接。而更多的图书馆和豆瓣读书合作,通过豆瓣的图书馆合作项目,将豆瓣用户链接回图书馆的OPAC页面,吸引用户使用图书馆资源。通过这些“链接”的使用,图书馆极大地拓展了书目服务的功能。

关联数据在图书馆书目数据方面的应用方兴未艾,国内的各级各类图书馆应当有计划有策略的合作开展此项研究和实践。关联数据需要一个社会性的开放的数据环境良好的数据保障机制,图书馆界应努力为书目数据的关联应用打造良好的数据环境和保障机制。未来是数据的时代,关联数据和大数据(Big Data)已初显规模。MARC可能很快会消亡,但它会以另一种数据(如关联数据)方式新生,在未来数据的海洋中占有重要的一席。

[1]林海青,等.图书馆关联数据:机会与挑战[J].中国图书馆学报,2012(1):58-67,112.

[2]LⅠBRⅠS[EB/OL].[2013-05-01].http://libris. kb.se/?language=en.

[3]About the project[EB/OL].[2013-05-01].http: //bibpode.no/?q=node/9.

[4]Westrum,A,et al.Ⅰmproving the presentation of library data using FRBR and linked data[J].Code4Lib Journal,Dec2011,Ⅰssue16:1-7.

[5]夏翠娟.关联数据的技术实现与案例[EB/OL].[2013-05-02].http://wenku.it168.com/d_0008558 63.shtml.

[6]杭州图书馆OPAC[EB/OL].[2013-05-01]. http://my1.hzlib.net/opac3/hotLabel/hotLabelCategory.

[7]白海燕.基于关联数据的书目组织深度序化初探[EB/OL].[2013-05-02].http://www.doc88. com/p-70583489330.html.

[责任编辑]菊秋芳

G254.364

A

1005-8214(2014)06-0019-02

梁亮(1963-),女,杭州图书馆副研究馆员;陈琦(1972-),女,杭州图书馆副研究馆员。

2013-06-17

猜你喜欢

书目关联图书馆
推荐书目《初春之城》
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一带一路”递进,关联民生更紧
图书馆
奇趣搭配
智趣
去图书馆
本刊邮购书目
《全国新书目》2009年1月荐书榜
中央文献出版社等提供869种可供书目