公共图书馆应用关联数据的对策研究
2012-02-15周群英嘉兴职业技术学院图书馆浙江嘉兴314036
●罗 铮,周群英(嘉兴职业技术学院 图书馆,浙江 嘉兴 314036)
1 关联数据及其在国外图书馆中的应用热潮
1.1 关联数据概述
2006年,被誉为互联网之父的Tim Berners-Lee在《关联数据构建笔记》等一系列文章中分析了Web的发展和演化,提出发展数据网络的思想,而数据网络的核心和关键则是关联数据(Linkeddata)。[1]自关联数据的概念提出以来,得到了广泛认同和快速发展,并受到图书馆、政府部门、企业等多方面的重视和关注。关联数据对于我国图书情报界来说尚属于较新颖的研究领域;笔者通过检索发现,我国尚未有关于公共图书馆应用关联数据的研究文献。那么何谓关联数据?一般比较认同维基百科给出的定义:关联数据是语义网的主题之一,描述了通过可链接的URI方式来发布、分享、连接Web中各类资源的方法。[2]我国学者刘炜先生认为,关联数据强调建立已有信息的语义标注和实现数据之间的关联,具有框架简洁、标准化、自助化、去中心化、低成本的特点。[3]关联数据的基本原理是用一种可利用分布数据集及其自主内容格式,基于标准的知识表示与检索协议、可逐步扩展的机制来实现可动态关联的知识对象网络,并支持在此基础上的知识组织和知识发现。因此,关联数据对于公共图书馆的知识组织将起到一定的作用。
1.2 关联数据在国外图书馆中的应用热潮
图书馆拥有大量的结构化数据,国外图书馆界对于关联数据的应用已引起了足够重视并进行大力推广,比较典型的是美国国会图书馆和瑞典国家图书馆。美国国会图书馆以简单知识组织系统(SKOS)格式将国会标题表(LCSH)全部关联数据化,并且提供LCSH词表的下载,成为关联数据应用的成功范例,推动了关联数据在全世界的实用。美国国会图书馆除了将权威文档LCSH发布为关联数据外,还要创建不同资源之间的关联(如LCSH与瑞典联合目录LIBRIS进行关联)。另外,美国国会图书馆的其他词表,如:国会图书馆分类法、人名规范文档等,都可以转化为以RDF表示的关联数据,这就为图书馆数据的发布提供了很好的条件。可以认为,美国国会图书馆已经看到了使用关联数据的潜在好处,如降低服务器的负载,其做法可以作为国际上其他图书馆的实践范例。瑞典国家图书馆早在 2008年便将瑞典联合目录(LIBRIS)发布为关联数据,为大学图书馆和公共图书馆、博物馆和档案馆提供在线编目服务。LIBRIS是世界上第一个被整体发布为关联数据的联合目录,主要由瑞典国家图书馆负责管理,开放其200多个成员馆的大约650万条书目记录、20万条规范文档记录。瑞典国家图书馆已经开始创建从联合目录到维基百科(DBpedia)的链接,为图书馆界开展关联数据的发布及应用提供了宝贵的经验和思路。
2 关联数据为公共图书馆发展带来的新机遇
2.1 公共图书馆将自身资源发布为关联数据,提升其社会价值
关联数据不但减轻了Web网络中整合分布式异构数据源的复杂性,同时也推动了图书馆对关联数据的新应用。关联数据对于图书馆在Web上发布书目数据和规范数据具有重要意义,与网络时代的图书情报工作关系非常密切,是互联网发展到语义网时代,对网上资源和数字对象进行“编目”和“规范控制”的基础性技术,是图书馆进行信息资源发布和建设的核心技术之一。如上文所述,目前国际上已经有一些图书馆开始采用和发布关联数据,如瑞典国家图书馆、美国国会图书馆等。在新信息化环境下,增强公共图书馆的社会服务能力和服务水平显得尤为迫切。知识发现对于公共图书馆服务非常重要,关联数据为公共图书馆的知识发现服务提供了良好的途径。关联数据创造了把公共图书馆的知识和外部世界相互连接起来的机会,可以增强和扩展公共图书馆的知识发现平台,改善公共图书馆的服务面貌,从而提升其社会价值。我国公共图书馆界也应该重视这一技术,及早投入一定的资源和人力进行研究开发和应用推广,使公共图书馆大量的权威数据在互联网上占据一席之地。
2.2 公共图书馆利用关联数据更大地发挥在学术研究中的作用
公共图书馆历来就是学术研究的重要阵地之一。特别是近几年来在公共图书馆设立硕士、博士学位授权点,科研成果不断增多,开展的学术交流活动也不断增加。公共图书馆越来越多地参与出版和学术交流过程中不同阶段的活动。例如,联络馆员帮助研究者发现他们研究成果的引文影响力;同样,图书馆员也开发和利用机构仓储系统来帮助机构保存、管理和再利用那些已经出版的和没有出版的研究资料。目前,已经有一些机构仓储软件开始支持语义服务和关联数据,通过为仓储内的资源提供统一的标识以及资源之间的关系,实现对语义数据的存储和语义服务。另外,类似于其他公共图书馆资源集合,机构仓储也需要考虑系统的互操作性,关联数据将会在应用系统的互操作性方面提供更好的支持。在学术研究过程中,用户希望可以看到研究成果被引用的情况和再利用的情况,希望能够通过研究出版物找到原始文献、原始数据以及发现更多的作者。如果借助于关联数据,公共图书馆可以帮助用户发现更多关于作者的信息以及他们如何得到资助的信息,允许用户下载原始的研究数据。
2.3 公共图书馆利用关联数据更好地实现知识单元的组织
美国国会图书馆以简单知识组织系统格式将国会标题表关联数据化;瑞典联合目录使用的词汇表包含了元数据、简单知识组织和书目本体等,这一点对于我们具有较大的启发:我国公共图书馆界也可以利用关联数据更好地实现知识单元的组织。国外的一些图书馆常常通过实施资源发现服务来扩展其目录检索界面,浏览动态更新的结果,展示更多的馆藏信息。关联数据可以为扩展公共图书馆的书目信息提供结构化的数据基础,为用户提供新的知识访问服务;关联数据允许公共图书馆关联到更广泛的信息资源,不仅可以帮助用户判断是否是所需要的图书、期刊资源,还可以帮助用户获取图书馆以外的信息。公共图书馆还可以将自己的资源发布为关联数据,使用户再链接返回到图书馆。关联数据为公共图书馆提供了知识资源之间的链接,使发现和共享网络中不同类型的知识资源成为可能。关联数据在数据层建立了链接机制,数据的结构信息被很好地进行描述,并通过URI来确保机器能够自动链接各种数据,为信息聚合的智能化和自动化提供了基础。公共图书馆可利用关联数据源中的关联关系,实现有序地组织、集成和关联知识单元,进行知识内容的关联和深层展示,实现多类型知识单元的整合和集成,为用户提供多层次的知识关联集成服务。
3 公共图书馆应用关联数据的对策建议
3.1 充分认识公共图书馆利用关联数据实现资源发现的重大意义
在现代信息网络飞速发展的时代,公共图书馆迫切需要拓展和丰富信息服务的手段和方式,增强自身的竞争力,而知识集成和资源发现已成为图书馆领域的关键问题之一。公共图书馆应该加快提高资源发现内容和传递服务质量的步伐,以帮助用户实现资源发现的相关性和便捷性;而关联数据正是更好地实现资源发现的途径之一。关联数据创造了把公共图书馆的资源和外部世界相互连接起来的机会,可以增强和扩展公共图书馆的资源发现平台,以及支持公共图书馆在学术交流环境下作为创建者和出版者的作用。在关联数据云图中,有许多关联资源可以作为公共图书馆的资源库和知识库,可以利用云图中的关联开放数据进行公共图书馆资源的扩展和关联,为用户提供更丰富、更有意义的检索结果。公共图书馆不仅只是利用现有的关联数据,还可以将一些特色数据发布成关联数据,增加用户返回图书馆的途径。这样,公共图书馆不但可以扩展其关联数据,而且增强自身的社会价值。
3.2 公共图书馆应该重视关联数据的效用
随着国际上图书馆将自身关联数据发布在Web网上的实践,越来越多的图书馆也展开了发布关联数据的尝试。但是,问题也随之出现:关联数据网络中的数据并不是一成不变的,新的数据会不断加入,过时的数据需要修改或删除,数据之间的链接也随之变化。一旦某个数据源有所变动,数据源之间的关联可能会产生断链,这会引起关联数据的应用随之也发生错误,进而导致关联数据失效。目前的一般做法是忽略这些问题,当具体的应用发现断链时再解决。虽然当前的网络结构允许一定数量死链接的存在,但过多的死链接将使客户端发出大量的无效HTTP请求,从而影响数据网络的效率。为了降低应用层对断链的处理,公共图书馆对数据源应该保证关联关系的有效性。同样,公共图书馆对关联数据源也应提供监测和修正机制,以维护数据参照的完整性。
3.3 公共图书馆利用关联数据应改善用户界面,提高交互性能
公共图书馆服务的用户范围很广,类型多样。如何改善服务质量、使不同的用户满意显得特别重要。从用户的角度看,关联数据的最大好处是可以提供多个分布式异构数据源的整合关联的访问。关联数据浏览器允许不同的用户在不同数据源之间进行浏览,不过目前在关联数据的导航和检索结果显示方面还不尽人意,需要进一步完善。例如,关联数据浏览器的导航控制应该为用户提供实体之间的前进和后退功能,关联数据浏览器需要从传统以文件为中心转向以实体为中心的浏览视图,改变为用户提供应用服务的角度和焦点。另外,用户不仅需要查看实体之间的链接,还需要方便地分析公共图书馆的数据源。因此,公共图书馆利用关联数据时应改善用户界面,提高其交互性能。
[1]伯纳斯·李.关联数据开启互联网新纪元[EB/OL]. [2011 互06 互16].http://www.chinaelections.org/NewsInfo.asp?NewsID=169269.
[2]Wikipedia,Linked data [EB/OL]. [2011 互06 互16].http://en.wikipedia.org/wiki/linked_data.
[3]刘炜.关联数据的意义与实现[EB/OL].[2011-06-16].http://202.114.9.60/dl6/pdf/24pdf.