APP下载

语义网环境下的数字图书馆服务创新

2016-03-26王露露徐军华湘潭大学公共管理学院

图书馆理论与实践 2016年1期
关键词:服务创新数字图书馆

王露露,徐军华(湘潭大学公共管理学院)



语义网环境下的数字图书馆服务创新

王露露,徐军华(湘潭大学公共管理学院)

摘要:通过分析数字图书馆建设中存在的一些问题,探讨在语义网环境下数字图书馆与语义网相结合,在信息检索技术、打破“信息孤岛”、改进用户体验等方面可以进行的技术改进与服务创新。

关键词:语义网;数字图书馆;服务创新

1 引言

2014年10月26日,在京举办的“2014开放学习国际论坛”首次发布了由新媒体联盟会同瑞士库尔技术与经济学院﹑苏黎世联邦理工学院图书馆和德国国家科学技术图书馆共同完成的《新媒体联盟地平线报告(2014图书馆版)》的国内译版。报告显示,未来5年,图书馆馆藏图书资料将只是信息资源的一部分,信息资源借助网络将具有共享性﹑互动性﹑开放性,呈现方式也更加多样化。与此同时,信息技术发展将从根本上改变人类获取知识和利用资源的方式,必然会给图书馆的职能及服务带来全面而深刻的变革。[1]新媒体联盟遴选出了极有可能在未来5年成为驱动图书馆技术采纳和决策制定的六大趋势,其中的一大焦点技术就是语义网。

自2000年Tim Berners-Lee提出语义网的七层模型以来,对于语义网的建设一直在进行中,W3C已出台七层模型的底部四层标准,但逻辑层﹑证明层﹑信任层的研究仍在进行中。事实上,对于语义网研究的参考文献大部分都是外文,国内在图书馆领域的深入研究少之又少。但是,随着七层模型的不断细化和各界关于语义网应用的不断研究,它作为网络发展新的愿景而言,将会无可限量,尤其IBM﹑Google等互联网产业巨头以及美国国会图书馆对于语义网的热衷可见一斑。因此,笔者认为,作为互联网发展催生的数字图书馆,更应该站在技术革新的浪头,更加精心地将处于生长期的“初生儿”——语义网哺育长大。

2 目前的数字图书馆建设中存在的问题

2.1检索系统效率较低

数字图书馆的搜索引擎多以传统的关键字检索为主要方式,这种检索方式虽然一定程度上满足了用户需求,但是由于关键字与其真正语义的含义不在同一层面,导致查询结果往往只是字面意义上的相加匹配,而非我们真正需要的信息,最终导致检准率较低。比如,我们在搜索栏输入“比尔·克林顿的夫人”,搜索引擎只会给出同时包含“比尔·克林顿”和“夫人”两个关键词的一系列网页,只有点链接,逐条阅读,我们才可以找到答案。另外,目前数字图书馆的检索对象仅仅是已经数字化﹑标准化的资源,对于那些数量庞大或是资源还未与元数据匹配的信息却无能为力,最终导致检全率较低。

2.2资源利用效率较低

(1)传统用户利用数字图书馆资源的方式一般是在搜索栏搜索到相关结果,分篇下载或是浏览后,从众多资源中选择自己想要的相关主题信息,信息获取过程繁杂。(2)不同领域之间甚至同一领域之间的知识关联度较差,因为元数据标准﹑信息系统的鸿沟,甚至社会组织之间的交流隔阂,我们很难将其完整收集并整合起来。(3)面向用户的信息载体单一,数字图书馆基本沿袭的都是传统图书馆古老的知识呈现方式,即文字与符号。但事实上,就同一主题,我们可以在google搜索到相关网页新闻,在Youtube搜索到相关视频,在DIALOG联机数据库中搜索到相关论文,在Twitter搜索到相关评论,却没有一个是可以同时搜索到全部格式的信息系统。

2.3用户体验指数较差

Web2.0环境下,数字图书馆用户是以信息集中地“客人”的身份到访的——用户提出需求,再由图书管理员根据用户需求向用户推送信息。用户与图书馆管理员之间沟通不畅,极大削弱了数字图书馆用户的体验指数。因此,克服这一问题的方法就是要想方设法让用户成为“主人”,获取信息就像取家里的物品一样随心随意,而这一切的实现都需要语义网的加入。

3 语义网环境下的数字图书馆服务创新

3.1推动图书馆信息检索平台智能化

语义网不是对Web的重塑,而是在现有Web2.0基础上的延伸,是对现有Web利用价值的挖掘。语义网首先强调的不是语义,而是Web,是让计算机智能化,这对于数字图书馆而言,将会为信息检索平台和检索用户之间创建一种可交流的语言,让信息检索平台可以听懂用户的声音。要实现这一服务,需要应用语义技术,构建智能化信息检索平台。一般有以下两种方法:一是在基于本体的传统信息检索平台的基础上,增加以RDFS﹑OWL等为基础语言的语义层;二是通过引入语义技术,如智能代理﹑Web爬虫等,实现智能聚合﹑组织和处理用户提出的检索项功能,即在原有的系统模型的基础上实现传统检索平台的智能升级。

在语义信息检索过程中,信息推理分析引擎通过本体工程支撑,抽取出用户提问背后的某专业领域所隐含的信息。同时,经过语义描述标准和智能推理技术将检索信息转化为与语义信息检索平台的元数据结构和规则精确契合的检索词,即生成为计算机可以理解的结构化语言,进而在互联网中央大数据库搜索数据,最后通过智能聚合﹑语义排序等操作向用户返回查询结果(见图1)。

图1 语义信息检索模型

3.2打破数字图书馆“信息孤岛”和“社交藩篱”

语义网最大的特点就是提供了打破应用﹑企业和社区之间藩篱的工具,就数字图书馆而言,“界限”这个概念被颠覆。原来所定义的界限是各个信息系统之间的“信息孤岛”,我们对于打破“孤岛”之间的界限问题一直在探索中。当互联网发展至Web3.0阶段,信息资源最大的特点就是开放。一方面,有了语义网的RDF和内容元数据结成的数据标准套件,“信息孤岛”问题将迎刃而解;另一方面,语义网作为“云计算”的孪生子,就像云计算对于数字资源的优化整合作用,语义网不仅可以打破数字资源领域的“信息孤岛”,还可以跨越新浪微博﹑维基百科﹑Youtube等UGC和社交网络领域,实现数字图书馆与应用﹑企业和社区的创新性携手,这样将不会有任何“孤岛”的问题。

3.2.1增强数字图书馆的开放化

提到数字资源的整合和开放化,不得不提到关联数据(Linked Data)。笔者这样理解:它以大量的RDF三元组(主词,谓词,宾词)在数据层与语义层之间形成一种统一资源定位符(URL),但并不赋予语义含义,以此取代各式各样且不断变化的网站地址,从而使得整个互联网变成一个放置在“云”中的大数据库。数字图书馆将其用户模型发布为关联数据实例,建立起不同系统所拥有的同一用户模型片段的关联,呈现具有更多信息的用户全景图,支持用户情景敏感服务优化;[2]不仅开放数据,也开放功能,将图书馆数据真正嵌入到社会信息基础结构中去,使图书馆数据不仅存在于网络,而且成为开放网络的一部分,便于搜索引擎发现和索引。[3]也就是说,在语义网的环境下,数百万种书籍将被扫描传播到世界网络中,有史以来第一次,全世界图书馆用户可以真正通过数字图书馆访问这些书籍内容的章节﹑概念﹑引用﹑公式﹑定理和数字等内容。用户可以真正在几本专业领域的书籍内容之外,用这数百万种书籍中的内容另外搭建一个庞大又精细的知识模型,实现数字图书馆从用户需求到收获结果的“一站式”服务。

3.2.2增强数字图书馆的社交功能

Web2.0带来的全民合作——在维基百科﹑QQ﹑微博微信之类的社交平台上广大用户集体共享智慧与服务的时代,也将数字图书馆初步带入全民社交圈。国内许多高校﹑企业合作的数字图书馆也纷纷开通了微博﹑微信交流平台,说明数字图书馆已经有意识地通过建立社交平台,将本身的信息资源与图书馆用户的评论﹑喜好﹑需求相结合匹配,从而走向数字图书馆社交服务的道路。在语义网环境下,数字图书馆的社交功能将会比现在热门的微信公众平台契合很多,文本﹑标签﹑数据库﹑社交应用等各种格式将实现无缝式链接,用户在阅读时,可以通过一种语义标记获得其他用户的评论,又或是专业研究员关于这一段的科学性探讨。这一功能的实现需要图书馆在移动服务组合领域继续推动创新,以满足用户对核心信息的需求和适应用户自服务的时代特征。比如,通过开发移动网站和移动应用的个性定制功能,增强基于定位和实时活动的服务功能,改进QR扫描技术和电子书阅读体验,实现移动图书馆设备的普及以及扩大与Facebook﹑Twitter﹑YouTube等其他具备成熟移动服务的社交媒体之间的交互性等,[4]从而让用户基于完善的移动端服务,自觉培养起主人的信息共享和参与意识,也让数字图书馆真正打破“社交藩篱”。

3.3带动图书馆用户体验角色的转换

用户体验与个性化需求是现今促进技术创新进步的一大动力,也是Web2.0阶段“以用户为中心”这一显著特征的重要体现。同时,它也是数字图书馆技术进步和服务完善的一大衡量标准,必须引起我们的重视。笔者主要从感官体验动态化﹑知识体验个性化﹑情感体验主人化来介绍语义网将给数字图书馆用户带来的体验及角色转换。

3.3.1视觉体验动态化

语义网在图书馆用户视觉体验上的创新主要表现在以下两方面:一方面,基于FRBR模型,可以识别和定义书目实体﹑属性和它们之间的关系,进而根据书籍内容的相关度和个人记录的搜索信息将多个版本﹑不同载体资源之间的关系进行智能排序和聚合,以一种更丰富﹑准确和有意义的方式呈现给用户。[5]因此,用户在搜索相关内容时,可以通过主题树或标签云更加直接方便地发现与之相关的隐性信息以及主题之间的关系。另一方面,语义网支持在用户界面采用超文本﹑图形接口技术以及Z39.50协议实现不同系统平台的开放互联,支持数字图书馆用户在阅读相关内容时,可以进入图像界面﹑语音界面﹑多媒体界面交流,获得更加生动﹑立体﹑多维的知识体验。

3.3.2知识体验个性化

在语义环境下,数字图书馆主要通过个人偏好库服务实现为用户提供个性化的知识体验。这种服务是基于用户的基本设定以及搜索系统中的历史记录等专为用户建设的偏好库。它面向个体用户,以合并起来的多个大型知识库为信息基础,通过明晰的知识网络模型建立起一个覆盖全网﹑解答角度立体的自适应动态系统。个人偏好库与传统信息定制服务的不同之处在于它解放了用户之间的信息壁垒,展现知识更加广阔﹑立体和动态。在用户搜索时,搜索引擎将提取用户检索信息并记忆此次搜索行动,在语义检索平台上通过RDF的形式语义和推理功能,将非结构化的语言结构化并为计算机所理解,进而通过已搭建的立体知识模型拉取全网偏好库中的有用信息呈现给用户,同时自动更新并发布自身偏好库的最新动态(见图2)。

图2 个人偏好库服务流程

3.3.3情感体验主人化

语义网将推动数字图书馆从以主动“推送”为主的服务进入以用户为中心的“推拉”服务时代,以此实现数字图书馆用户从信息集散地的客人到随心所欲的主人的角色转换。这一角色转换的实现则要依靠基于推拉技术而形成的“智能信息推送”(IIPP)。IIPP技术应用了人工智能(AI)﹑机器学习(ML)方法﹑知识工程(KE)的知识推理搜索方法﹑知识发现(KDD)方法等技术,将“智能信息

推送”(IIpush)和“智能信息拉取”(IIpull)相结合,一方面,提高“信源”对“用户”兴趣的推测水平,实现主动﹑个性化的信息推送服务,另一方面,帮助用户快速﹑准确地从信源拉取信息,提高用户的满意度。[6]这样既使得用户获取信息的主动权得到更大的解放,最大程度地减少了用户需求与获得结果的不一致概率,又避免了图书馆单方面推送信息服务准确率低的现象,减少了用户筛选和过滤无用信息的劳动量和时间,也使得一些没有主动获取信息能力及知识水平较低的受众同样可以获得优质的用户体验。

[参考文献]

[1]张铁道,等.新媒体联盟地平线报告:未来图书馆就在你的指尖[N].中国教育报,2014-12-10(007).

[2]贺德方.基于语义的数字图书馆服务创新[J].情报学报,2012,31(10):1012-1017.

[3]林海青,等.图书馆关联数据:机会与挑战[J].中国图书馆学报,2012(1):58-68.

[4]Lisa Carlucci Thomas.The State of Mobile in Libraries 2012[EB/OL].[2015-03-24].http://www.thedigitalshift.com/2012/02/mobile/the-state-of-mobile-in-libraries-2012/.

[5]KiorgaardD.ResourceDescriptionandAccess[DB/OL]. [2015-03-24].http://www.nla.gov.au/openpublish/index.php/nlasp/article/download/1420/1725/1420-6735-2-PB.pdf.

[6]百度百科.智能信息推拉技术[EB/OL].[2015-03-24].http://baike.baidu.com/view/2638844.htm.

Service Innovation of Digital Library in the Environment of Semantic Web

Wang Lu-lu, Xu Jun-hua

Abstract:The paper analyses some problems existing in the construction of digital library, and further explores the technology improvement and service innovation on information retrieval, information island breakdown as well as user experience improvement with the combinationof digital library andsemantic web in the semantic web environment.

Keywords:Semantic Web; Digital Library; Service Innovation

[收稿日期]2015-04-27[责任编辑]张雅妮

[作者简介]王露露(1993-),女,山西晋城人,湘潭大学公共管理学院电子政务系在读学生,研究方向:图书情报领域;徐军华(1979-),男,博士,湘潭大学公共管理学院硕士生导师,发文30余篇,研究方向:图书馆管理、数字图书馆服务。

[基金项目]本文系2013年度湖南省社科基金立项资助一般项目“数字环境下湖南省高校图书馆业务流程重组的模式研究”(项目编号:13YBA312)研究成果之一。

中图分类号:G250.76

文献标志码:A

文章编号:1005-8214(2016)01-0088-03

猜你喜欢

服务创新数字图书馆
新环境下高职院校图书馆服务创新的实践与思考
基于“互联网+”的业扩双向服务研究与探索
公共图书馆数据库建设与服务创新探索
高校图书馆的未来发展模式刍议
汽车维修服务中心发展连锁经营模式的相关建议
浅析“互联网+”时代的图书馆管理
高校数字图书馆资源整合的初探
基于云计算的数字图书馆建设与服务模式研究
从谷歌案析数字图书馆对作品的使用行为
大数据时代下图书馆的服务创新与发展