数字图书馆馆藏资源聚合模式比较研究*
2015-05-13齐月佟大威黑龙江省图书馆黑龙江哈尔滨150090
齐月佟大威(黑龙江省图书馆,黑龙江哈尔滨150090)
数字图书馆馆藏资源聚合模式比较研究*
齐月佟大威
(黑龙江省图书馆,黑龙江哈尔滨150090)
[摘要]近些年馆藏数字资源深度聚合成为国内外的研究重点。对比可以发现,国外的研究主要集中在框架构建和语义互联技术方面,我国则在理论探讨方面取得了很大的进展。介绍了当前基于本体、关联数据、计量分析的3种实现数字图书馆馆藏资源聚合的主流模式,通过不同资源聚合模式之间的对比,找出其中的发展趋势,期待能为该领域的深入研究提供一些借鉴和参考。
[关键词]数字文献资源深度聚合比较分析馆藏资源
[分类号]G250.76
*本文系黑龙江省艺术科学规划课题共建项目“图书馆微信公众平台信息资源推送研究”(编号:2015D008)成果。
随着我国高校数字图书馆的快速发展,资源的数量庞大,如何高效地利用这些资源是很多学者都在研究的问题。为了解决限制馆藏资源获取和共享的一些困难,国内的很多学者都对馆藏资源的深度聚合进行了比较深入的探索,深度聚合后的图书馆资源能够更好地为客户服务,这样大大提高了图书馆有限的资源的利用率。对于常见的馆藏资源,在数字化文献方面,主要是针对一些期刊、论文、报纸、专利信息、图书和行业标准,大都是一次文献信息资源,馆藏资源聚合的目的就是希望将这些资源的一些内部关联打通,使得检索时能一起获得。因此,对馆藏资源进行简单重组和归类并不是使用者需要达到的目的,在能够快速满足用户搜索的基础上,提供更好的个性化知识聚合才是需要解决的问题。笔者通过对国内主流的资源聚合模式进行分析,对比他们的特点,最终总结出该领域的发展趋势,以期对我国数字图书馆相关的研究可以起到一定的推动作用。
1数字图书馆馆藏资源聚合的研究现状
1.1国外研究现状
通过对大量的国外相关文献进行总结和归类,可以知道目前西方发达国家在数字资源开发利用方面已经有了很大的进展,研究水平比国内领先很多,他们在计算机、数学、生物、教育和信息等相关方面比较集中,而这些领域都是应用型比较强的领域。同时相较理论研究他们更重视实践研究。在相关研究成果的利用方面,他们将原本在图书馆学的研究成果应用到了其他的学科,亦取得了不错的效果。
1.2国内研究现状
国内能够独立进行数字资源聚合研究的高校比较少,这与我国在相关领域的研究起步较晚有关,但也取得了一些成绩。设立了图书馆学相关专业的高校,在研究方面主要依托国家自然科学基金的资助,在关于馆藏数字资源聚合研究方面主要集中在理论上的研究,对于在其他学科内的应用则比较少。
1.3研究现状评述
从国内外相关文献可以看出相关学者的研究重点有很大的差异。国外比较注重应用,偏向于将理论和实际结合起来,对理论的拓展应用水平比较高。国内的学者则注重理论上的深入研究,希望找到一个切入点,从理论上对馆藏资源聚合进行透彻研究。国内在资源整合、聚合方面的研究多从模型的构建和可行性开始。国外的研究条件相对好很多,从理论的整体性上入手,构建基于实际应用的模型,从而方便研究成果的推广。
2数字图书馆馆藏资源聚合的主流模式
馆藏资源传统聚合模式只对文献的一些非常明显的本质特征进行整理,对于资源的内容就无能为力,无法涉足其中。鉴于传统聚合模式的缺陷,馆藏资源深度聚合需要对资源从内容上进行语义聚合,将“联系”上升到知识层面的“关联”,这样就可以对各类文献资源从多个内在的维度进行揭示。目前主流的聚合模式主要分为基于本体的深度聚合模式、基于关联数据的深度聚合模式和基于计量分析的复合聚合模式。
2.1基于本体的深度聚合模式
本体在知识资源方面的作用就是基于馆藏资源,在此基础上建立一个反映资源知识结构的本体概念模型,从而可以根据语言对馆藏资源进行标注,这样各种资源就被集合成了一个网络,有助于实现检索。通过对数量巨大的本体进行构建,组建一个知识的集合体,这样就能将知识进行恰当地表示和组织,同时也可以描述众多的文献资料,最终将题目聚合到一起,这样提供出来的知识就能够有清晰的结构。
数字图书馆是一个大的本体,在为用户构建个性化搜索服务时,要将搜索技术和查询技术有效地结合到一起,最终得出用户需要的结果并呈现出来。当用户需要对馆藏资源进行检索的时候,相关的命令一旦发出,那么信息的采集就要同步进行,基于对用户的建设兴趣模型和相关的查询要求都传到了服务器中,搜索需要将数据的本体进行匹配,最终将处理后的结果呈现在用户面前。在这种聚合模式下,用户的检索要求由服务器进行分析和处理,最终得出一个最符合用户需求的结果。其中,基于本体的深度聚合模式的工作流程如图1所示。
图1 基于本体的数字图书馆馆藏资源聚合模式工作流程
2.2基于关联数据的深度聚合模式
在基于关联数据的深度聚合模式中,作为核心的关联数据是被国际互联网协会所认可和推广的规范,这种模式中讲述的关联数据是一种可以用语义来描述而形成的一种数据,它表达的是各种事物互相之间的一种关系,这些关系可以基于一个标准关联在一起。关联数据可以将意思分散和结构不同的数据,通过重新发布或链接关联起来,这样的机制可以将实际的知识和抽象概念联系在一起,对于目前网络信息的粗粒度与语义性缺失有很大的作用,可以将数据平台进行极大的拓展。
关联数据主要作用在数据层,通过一些复杂的链接机制使得数据的整体结构能被分类描述,这样有助于计算机精确地将相关数据串接到一起,最终为馆藏资源的聚合打下一个基础。这种基于关联数据的聚合模式,有一个很大的优点就是可以将来自不同数据源的同一个对象进行整合,这样从处理对象上降低了难度,有助于资源的聚合。作为图书馆将拥有很大的主动权,一方面可以把自身资源进行开放与其他资源产生联系,另一方面自身的资源也可以在这种聚合模式下联系到其他的信息资源。
2.3基于计量分析的聚合模式
作为资源聚合模式的本体不能重复使用,并且元数据在对语义关系的表达方面非常弱,这都限制了这两种方式的发展,因此考虑将计量分析方法引入馆藏资源的聚合模式的研究当中。基于计量分析的方法来构建聚合模式模型,通过计量学分析可以构建相关的语义之间的联系,结合语义网语言对现有资源之间的关系进行替换,这样就编织了一个用来表示图书馆馆藏资源的元数据关系网。
基于计量分析的聚合模式的语义之间的关系很深,计算机处理的程度也同样比较大。在基于本体的聚合模式中,计算机并不需要进行很大程度的处理,馆藏资源语义化分析过程中在一些领域舍弃了部分关系,这样可以提高计算机的处理效率。我们知道,计算机自动化处理有助于技术的商业化推广,在基于计量分析的聚合模式下,这种分析方法更能够促使馆藏资源满足社会的需求。
2.4三种聚合模式的比较分析
纵观我国目前的研究现状,基于本体的馆藏资源深度聚合的主要方式是构建不同类型的本体知识库,这样从知识的整个层面和本身的语义上对相关的文献知识进行描述,最终达到对资源深度聚合的目的。相关的本体构建模型包含理论整合层、应用拓展层和知识检索层3个层次。这种基于本体的馆藏资源聚合模式,从一开始就需要构建庞大的本体,工程量是非常大的。这个构建过程一旦完成了,就能对所处理的知识进行全方位的解读,最终完成对图书馆馆藏各种异构系统的互操作,精准地分析用户的需求,提高知识共享、利用的效率。
在利用关联数据来作为资源深度聚合模式的研究中,它和传统聚合模式的不同就是这种聚合模式更加灵活,而且操作起来比较简单。用户在使用过程中直接专注于信息本身,那些将外部和图书馆内部资源整合到一起的任务则由图书馆来完成。为达到通过关联数据聚合馆藏资源的这一目的,先要将图书馆的所有资源、信息体系完成关联化改造,具体方法是依据关联数据的逻辑原则,并采用先进的网络技术,将馆藏的实体和虚拟资源的主题词表、分类表、格式文件等流程体系和各种描述元数据都转化为关联数据,纳入Web,而且允许外界查看和搜索。这项工作较为复杂,包括设定通用资源标识符、设立词汇集、建立资源描述框架等工作,也包括关联数据的应用方法和技术手段等问题。
从信息计量学的角度出发,基于计量分析的馆藏资源聚合模式在对检索的语义关系深度上有很大的优势,由于这种方法大大加快了计算机在运行时的自动处理速度,因此在推广方面都有比较好的实用性。在馆藏资源的相关语义化分析中,这种模式不但使数据的利用率得到提高,在促进相关领域的交叉研究方面也有很大的优势。
3数字图书馆馆藏资源聚合模式的发展
从当前的情况来看,在传统聚合模式下的馆藏资源已经不能满足现在的技术要求了,对于用户对不同知识的个性化要求也难以实现。因此,对于馆藏资源的深度聚合显得非常必要。分析目前的馆藏资源在深度聚合模式方面的研究,可以得到一些新的变化。新的研究方向是结合大数据分析对资源进行深度聚合以及对聚合的结果能够个性化地提供可视化表达。
3.1利用大数据技术对馆藏资源深度聚合
基于大数据分析的馆藏资源的聚合,目前还没有很明确的定义,对其进行界定也存在争议。但当前社会处在一个大数据的时代已经无可置疑,数据也不再是单单描述文献信息属性。在这种情况下,一些往常需要进行简单处理的对象就变成了基础资源,这对拥有海量数据的馆藏资源在聚合上遇到的挑战就会成倍增加。图书馆的馆藏资源非常丰富,在结构上有些很典型,有些非常不规则。但对这些海量数据的处理,无论在传统还是现在比较先进的聚合方式下,如果没有大数据处理方式的支持,这些数据在调用、存储和使用上都会存在困难。因此需要对馆藏资源进行语义化处理并建立相应的数据库,将这些数据在统一的标准下进行储存。而在对这些馆藏资源进行细致挖掘的过程中,涉及的信息量也会急剧增加,这样保障这个过程所需要的支撑条件就很艰巨。大数据分析是对资源的全面分析,这样才能使得最终的结果和实际相吻合。而且目前的大数据处理方式,都需要借助云计算的辅助,这样才能做到对馆藏资源的深度聚合,彻底地对现有数据进行深度分析,最终能够为用户提供更好的新知识发现服务。
3.2馆藏资源聚合结果的可视化
计算机图形学和图像处理技术的发展给馆藏资源聚合的研究带来了机遇和发展,在图形化的操作方式下,聚合的结果能够以图像的形式显示出来,这将挖掘出更多的隐性信息。可视化的表示方法有助于用户对结果进行理解和吸收。可视化动态展示可以让用户更轻松地对结果进行了解,各种结果以动态画面展示出来,并且对于动态的数据也能够实时更新。这样,用户可以用一定的方式直接调节结果的可视化过程,比如改变输入的数据,调整输出的方法,这些操作都能在一定程度上满足用户个性化的需求。
4 结语
数字图书馆馆藏资源的聚合,实现了在数字资源之间联系的深度揭示,对知识体之间的联系能更好地分析和利用,从而达到优化检索结果的目的。笔者对目前3种主流的图书馆馆藏资源聚合模式进行介绍和对比分析,探寻数字图书馆馆藏资源聚合的未来发展趋势,并指出在大数据和数据可视化技术迅速发展的今天,基于大数据的数据资源聚合以及资源聚合结果的可视化呈现将是其重要发展趋势,这些技术将大大提高用户使用馆藏资源的效率,进一步推动数字图书馆知识组织和知识服务水平的提高。
参考文献:
[1]杨瑞仙,李露琪.国内外数字文献资源深度聚合研究现状的比较分析[J].图书情报知识,2014(6):68-74.
[2]朱萍.馆藏数字资源整合方案研究[D].郑州:郑州大学,2005.
[3]王博.中美图书馆信息资源数字化环境比较分析[D].郑州大学,2006.
[4]赵蓉英,王嵩,董克.国内馆藏资源聚合模式研究综述[J].图书情报工作,2014(18):138-143.
[5]游毅,成全.试论基于关联数据的馆藏资源聚合模式[J].情报理论与实践,2013(1):109-114.
[6]邱均平,王菲菲.基于共现与耦合的馆藏文献资源深度聚合研究探析[J].中国图书馆学报,2013(3):25-33.
[7]何超,张玉峰.基于本体的馆藏数字资源语义聚合与可视化研究[J].情报理论与实践,2013(10):73-76,39.
[8]李劲,程秀峰,宋红文.基于语义的馆藏资源深度聚合方法研究[J].情报科学,2013(11):100-103.
[9]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究[J].中国图书馆学报,2012(4):79-87.
齐月女,1981年生。本科学历,副研究馆员。研究方向:地方文献及征集。
佟大威男,1981年生。本科学历,馆员。研究方向:数字图书馆。
收稿日期:(2015-05-04;责编:姚雪梅。)