关联数据方向上图书馆管理与创新研究
2018-10-19于小艳
于小艳
摘要:关联数据是语义网的一种实现方式,自提出以来被图书馆界重视,目前我国图书馆界的关联数据研究主要集中在关联数据的内涵研究、关联数据的图书馆应用研究与图书馆应用关联数据的挑战等方面,关联数据的图书馆创新应用服务主要有资源发布、资源发现与资源融合等方式。根据关联数据指出未来的大学图书馆必须以创新为核心,敢为人先,善于突破,坚持泛学科化服务,转型。然后,围绕融入教学、支持科研、再造空间、传承文化、辅助创新、绩效资源、指大胆推行服务生态管理七大方面,对大学图书馆创新与转型发展的趋势进行了预判,进而给出了发展建议。
关键词:图书馆;关联数据;信息资源;创新服务
关联数据(LinkedData)来自于2006年被称为“互联网之父”TimBerners-Lee的万维网体系架构笔记《关联数据笔记》,Berners-Lee在文中分析了Web的发展与演变,提出了发展数据网络的思想,而数据网络的核心和关键就是关联数据,并认为关联数据是致力于建立数据之间关联的一种规范[1]。这种关联构想给一直以来困扰人们的海量信息聚合性不足提供了解决的思路与规则,把图书馆等机构的原本没有关联的数字信息或数据联接起来,构建一个语义化的数据网络成为了可能。因此,关联数据一经提出就受到了图书馆学界的广泛关注。我国图书馆学者近三年来对于关联数据的概念、R2R语言、规则、图书馆应用等进行了较为详细的研究,但对图书馆来说,对关联数据的研究,最终的价值体现与终极目标还是关联数据在图书馆服务中的应用,以满足用户的需求,应用于图书馆的服务质量也才是用户最终的评判标准,因此探讨基于关联数据的图书馆创新服务也将会是关联数据在图书馆应用研究的一大热点。
1.关联数据与图书馆
1.1关联数据概述
关联数据的核心技术是使用资源描述框架(RDF)进行资源的组织与交换。对其的定义不同的学者有不同的见解,如有的学者侧重对语义的认识,如白海燕认为关联数据是用来在语义网中使用URI和RDF发布、分享、连接各类资源,强调建立已有信息的语义标注和实现数据之间的关联[2]。而有的学者则更倾向于认为关联数据是一种信息行为与实践活动,因而对维基百科的定义“关联数据是一种推荐的最佳实践,用来在语义网中使用URI和RDF发布、分享、连接各类数据、信息和知识”更为认可。
1.2关联数据的价值与应用
关联数据有别于万维网的文件互联,通过网络把可能并没有关联的相关数据链接在一起,以让用户发现、关联、描述并再利用,可以说是从一个全新角度重新来定义和发现资源,BBC、世界银行、纽约时报等很快认识到了关联数据在知识发现、信息组织与用户服务方面的价值,纷纷加入到关联数据的出版发布之列。当前国际上关联数据的最典型应用项目代表是LOD(开放关联数据,LinkedOpenData),该项目自启动便得到了W3C语义网的支持,其目标是通过定义已存在并可公开使用的数据集,根据关联数据原则将其转换为RDF并上网发布,进而改善数据网络,项目的早期参与者主要为大学实验室和一些小公司的研发人员,但随着项目的发展?壮大,一些大型机构和政府如BBC、美国政府、英国政府等都积极参与其中,它们或为用户提供关联结构化数据,增强用户对信息行为的控制力度,如Google,或为企业在数据模型交流、整合及查询方面提供方便,解决数据存储和服务等问题,如雷诺[3]。
2.基于关联数据的图书馆创新服务
2.1信息资源的发布服务尽管目前图书馆界非常重视文献信息资源的共建共享工作,并也付诸了诸多的行动,如CALIS、CADAL、共享工程等项目,但还无法真正实现将图书馆所有文献资源共享资源,而如果将图书馆的所有信息发布为关联数据,用户则可以通过URI来查找世界上任何的一家图书馆资源,信息资源也将成为完全共享的开放信息资源。同时,任何机构、个人的有价值的数据,如发展报告等,也可以通过图书馆的关联数据发布实现信息的公开化与最大价值化,因此,信息资源的关联数据发布也将会是图书馆的主要应用服务之一。其实,从图书馆一开始应用关联数据,数据的发布就是主要方式,如,美国国会图书馆以SKOS格式将国会标题表LCSH全部关联数据化,并且提供LCSH词表的下载,并创建不同资源之间的关联(如LCSH与LIBRIS进行关联)[6]。图书馆这种信息资源的关联数据发布,为信息时代的信息资源网络传播与服务拓宽了更加广阔的空间。
2.2信息资源的发现服务当前,通过主题检索等途径实现图书馆信息资源的发现服务日益被重视和应用,发现服务能扩展传统的目录、书目检索功能,并为读者展示更多的馆藏信息。但由于这种发现服务的实现途径更多是局限于传统的书目、MARC数据等,如封面图片、读者评价的链接等,所以知识信息的揭示深度不足。由于关联数据允许用户更大限度的发现、关联、描述并再利用各种数据,因此图书馆的关联数据资源还可以实现更加广泛的信息资源描述、关联与发布而并不局限于资源本身的信息。这种服务不仅可以帮助用户对检索到的书目信息等判断是否是自己所需的,还可以帮助用户获取图书馆以外的信息,发现更多更有用的关联信息资源。
2.3信息资源的检索服务?现有的图书馆检索系统如OPAC等,读者均只能实现作者、主题、题名等检索条件的检索,但不能提供相关链接或关联的知识检索与知识发现等服务,对关联数据的智能化检索则能改善图书馆现有检索系统的服务功能并解决上述问题。因为关联数据的关联特性,读者也往往能根据关联数据的关联知识,也能根据这些关联关系去研究相关知识的网络关系分析,如学科知识的组织与服务网络等。
3结语
随着数字时代的快速发展,“大数据”的话题和研究已经渗透到图书馆服务建设中。针对急剧膨胀的图书馆数字资源建设和日益多元的图书馆信息资源处理挖掘和分析等,自然引起图书馆对大数据问题的思考与探究[2]。而图书馆海量信息资源的数字化本身就是典型的图书馆大数据资源。所以,本文是根据图书馆的服务目标与服务内容,服务需求的个性化、多元化等特点,从图书馆服务、用户服务、管理者与提供者的角度,结合大数据的特性及图书馆工作的实际情况,提出并分析大数据技术应用于图书馆服务建设中的现状、障碍、途径及其策略,可促進图书馆服务技术的变革,为实现图书馆服务的使命提供参考。
参考文献:
[1]Tim Berners-Lee. Linked data [EB/OL].[2012-04-03]. http://www.w3.org/DesignIssues/LinkedData.html.
[2]W3C. Linking Open Data[EB/OL].[2012-04-03].http:// www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/ LinkingOpenData#FAQ.
[3]李琳.关联数据在图书馆界的应用与挑战[J].图书与情报,2011,(4):58-61.
[4]Haslhofer B. Linked Data is an Attempt to Continue theWell -established InformationOrganizationToolsKnown in Libraries [EB/OL].[2012-03-01].http: //tomheath. com /papers/bizer-heath-berners-lee- ijswis- linked- data.pdf.