网格环境下数字图书馆异构资源整合分析
2016-01-01卢国强王琳琳
刘 芳,卢国强,王琳琳
(牡丹江医学院,黑龙江 牡丹江 157011)
网格环境下数字图书馆异构资源整合分析
刘芳,卢国强,王琳琳
(牡丹江医学院,黑龙江 牡丹江 157011)
文章主要对网络环境下的数字图书馆异构资源的整合进行分析,介绍了网络环境下数字图书馆的元数据、异构资源检索类型、异构资源同构化的问题、数字图书馆建设的整体协调及未来发展趋势问题。
数字图书馆;网络环境;异构资源
网格是新世纪提出来的一种全新技术模式,这种模式出现的时间为21世纪初。网格背景将科研带到了世界领域,全世界的人们实现了资源的共享,全世界进行学术交流与科研具备了可能性;网格带来了全新的科研方法,新科研方法模式下出现了全新的科学交流方式;网络环境的出现导致科研用户的信息行为以及信息的需求都发生了深刻的变革,科研用户的需求从原来的原始资源的需求转变为资源中知识的转化,需求的类型也越来越多样化,同时希望在享受资源的同时操作也能够更加便捷。
随着时代的发展,网格环境下的数字图书馆功能必将被进一步开拓和发展,本文主要以异构资源作为切入点,重点研究其元数据问题、资源整合问题以及异构资源同构化问题。
1 网络环境下的数字图书馆元数据
1.1元数据是组织网络信息资源的有效工具
所谓的元数据,指的是数据之下的数据,也就是最原始的数据。无论是在任何一种环境下,元数据都是有效的信息资源组织工具,都是利用信息资源的关键部分。网格信息资源包括数据、元数据、指针3部分,指针是一种工具,用来表示数据;元数据是数据集,用来表示数据特征;数据是储存在数字图书馆中的基本信息资源。在数字图书馆中,元数据十分重要,元数据主要描述的内容包括是什么、什么时候、在哪、为什么等。以DC的元数据为例,其主要组成部分为:作者、主题、标题。通过搜索,可以找到不同格式的元数据,由于元数据的格式较多,因此,为了提高搜索效率,在搜索引擎内设置了大量元数据模板,甚至可以搜索到格式不常见的元数据。除了上述分析之外,元数据还需要对数量、区域、距离等内容进行描述。数字图书馆因为其所提供者所处环境的不同,因此,在描述网络信息资源时需要详尽描述信息资源所处的位置。
1.2元数据在数字图书馆中的有效应用
(1)元数据的创建。在数据的搜索与创建阶段,元数据等信息备被以HTML,SGML等形式放置到信息资源之中。在网格信息资源的整个生命周期之内,元数据的信息不是一成不变的,而是随着信息资源的变化而变化的,并保证网络系统能够快速找到精准的信息。
(2)元数据的搜集。在发现网格数字图书馆信息资源的阶段,搜集元数据可以迅速在信息庞大的资源中找到有效信息。元数据的格式有不同的类型,在专用的搜索引擎之内能够找到不常用格式的元数据。
(3)元数据间的映射。MARC,TEL等格式的元数据能够通过传输协议将他们的数据语句与元素等进行转化,达到语义与结构相互兼容的目的。
(4)元数据与系统的建立。网格环境下元数据仓库的技术基础为因特网与网格技术。这种技术背景下建立的元数据仓库不仅具有传统图书馆的检索系统,而且具有数字图书馆的信息资源检索系统。网格技术能够将所有的分布式数据馆藏以及信息资源连接成一个虚拟源数据的馆藏,通过数据馆藏实现元数据的建立、映射以及检索。用户则可以通过网络查询网格中的信息资源,并通过对元数据信息的查询,找到信息资源的实体。
1.3元数据在数字图书馆中的服务流程
为了实现异构资源的有机整合,就需要建立一个公用的数据库信息中心,使用者能够通过统一的网址进行透明的不同数据库的访问。在网格中,每一个数据库都有指定的网格服务保证原数据的采集以及注册,并通过网格服务以及监测查询作为中间层从而实现对元数据的管理以及查询的功能。客户端有多种形式,可以是应用程序也可以是Web的浏览器,后台的数据库异构性被屏蔽,并由统一的服务接口进行访问,用户并不需要关心数据库到底采用哪种类型以及何种访问的方式。
2 网格环境下数字图书馆异构信息资源的有机整合
如何实现网格环境下数字图书馆异构资源的有效整合,是网络环境下数字图书馆信息资源管理重点需要解决的问题。网格环境下的数字图书馆包含着多种多样的信息格式内容,信息具有分散性,并且是比较独立松散的信息空间,每一信息空间都依照自己的方式进行元数据的集中,信息检索模型的建立以及对计费方式的设定等都不相同,因此要实现跨库检索是一件很困难的事情,跨库检索要将这些独立的元数据以及检索方式等等集中到一块,提高数据的检索效率,简单来说也就是将所有的数据库系统进行集成,便于使用者进行检索。
2.1 网格环境下的数字图书馆资源
将数字图书馆中大量的、分散的信息资源进行有效整合,集中到一块是数字图书馆网格思考的问题。网格要实现资源的最大块连通,连通的内容包括计算资源、存储资源以及软件资源等。
2.2构造异构资源统一检索办法
数字图书馆发展得越来越快,图书馆信息资源的不断增多,然而因为各个数据库都有自身的检索界面、检索方式,因此用户在进入到不同的检索库中都需要进行身份验证,频繁的登入或登出。这种情况下即使经常使用图书馆资源的用户也不免抱怨,在信息资源的海洋面前望而却步。因此图书馆的大量资源并没有被有效利用,如何让用户使用多个数据库的集成资源跟检索,保证图书馆的信息资源被最大程度上的使用成为关键。为了解决这个问题,各大图书馆都在开发Web的跨库检索系统。
2.2.1不同图书馆数据库检索界面类型
罗列型。这种检索的界面是将所有的电子资源进行罗列,之后让读者自己去选择一种资源进行注册、登录,随后输入检索词语进行检索,之后换成另外一种检索库进行检索,重新进行注册登录。如果电子资源的种类偏少的情况下,用户还不觉得十分的繁琐,但是如果需要大量的且在不同数据库的电子资源,则很麻烦,造成很多用户不愿意继续使用电子图书馆进行资源的检索。
导航型。导航型是对罗列型的发展,导航型的数据库根据用户的使用习惯以及需求类型等进行分类。分类方法主要包括以下几种:字母顺序类,主体范围类,学科类型类,这几种类别建立一个导航系统,之后用户根据这几种类别对应的电子资源进行内容检索。导航型具有很强的学科性质,对电子资源的类别进行划分,用户根据不同的类别进行资源的查询,并以此登录到每个数据库的网站,进行信息资源的查询。这种分类的方法有很大局限性,对学科不了解的用户来说用处不大。因此采用导航系统的都是有些对电子图书馆使用较多的重点高校,此种类型能够有效节省用户的检索时间,实现一站式的检索。
2.2.2网格环境下的异构跨库检索系统架构
电子图书馆是由一系列数字资源和应用系统构成的。在实际工作中可以将数字图书馆操作划分为两个方面:一是数字悺必须合理解决多个应用系统构成以及其与异构资源的集成;二是不同数字图书馆之间进行相互操作的关系。数字图书馆在网格环境下划分为两个主要构成部分:一是两个或者两个以上的图书馆与单个图书馆之间的交互操作交换。在互联网环境中,数字图书馆的重点是对众多用户和诸多资源进行支持和服务。多个图书馆在网格环境下研究的主要内容集中在图书馆之间的相互操作、集成方式,甚至对分布式用户访问支持方式服务能力。
基于互联网环境的数字图书馆建设应以OGSA规范为标准,在数字图书馆资源领域对网格计算资源管理能力予以适当地运用,同时保障组织模型的开放性、重用性与互操作性等特征。模型可以从3个层面进行子模块的设置,分别为分布资源层、网格服务层与知识服务层。模型的最下层应将图书馆的分布式数字资源囊括在内,借助于网格服务层,可以对这些资源进行虚拟整合。
网络服务层包括网络基础架构和统一资源空间两大部分,网格基础架构主要调度和整合信息资源及服务,自上而下包括信息服务层、数据服务层及计算服务层。信息服务层的主要作用是提供了统一的用户服务接口,通过这个接口可以相互访问不同的异构数据资源,在访问过程中,元数据这一描述信息和异构信息整合的数据集显得尤为重要。该层提供的服务根据系统需求会有有变化。数据服务层的主要服务内容是通过分布式信息资源集中计算与分析管理共享信息资源,其主要内容是管理数据存储、元数据的管理及传递管理等。计算服务层主要提供的服务内容为资源发现以及分配和资源的监控电能。统一资源空间主要包含统一的资源配置以及统一元数据描述,主要负责资源与服务之间的整合。知识服务层主要的作用是整合虚拟资源,资源整合之后通过知识服务层为用户提供服务,不断优化统一资源存储及检所运行的模式。
3 结语
关于网格环境下数字图书馆异构资源的整合,本文建立了一站式检索的模型。一站式检索用户只需要在使用资源的时候输入检索词,之后便能在多个电子资源中检索到自己所需要的信息,不需要在多个数据库中进行切换,反复的登录或登出。通过简单快捷的操作就能够一步到位地检索到需要的信息,是今后电子资源检索的发展趋势。
[1]毕强,沈涌.数字图书馆网格信息资源组织模式研究.[J].图书情报工作,2007(8):10-14.
[2]李晓娴,刘杰.上海研发公共服务平台子系统间协同机制研究[J].科技政策与管理,2006(10):31-34.
[3]胡素青.大数据,向巅峰出发[J].金融科技时代,2012(9):20-23.
[4]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.
Integrated analysis of the digital library of heterogeneous resources in grid environment
Liu Fang, Lu Guoqiang, Wang Linlin
(Mudanjiang Medical University, Mudanjiang 157011, China)
This paper introduces the search type digital library grid environment heterogeneous resources, then focus on the analysis of the meta data and resource integration and grid environment heterogeneous resources digital library is omorphism problem and concluded under the overall coordination of grid environment background digital Library construction and the future of digital Library.
digital libraries; network environment; heterogeneous resources
2015年黑龙江省社科规划项目;项目名称:基于中蒙俄地域优势的区域馆际互借系统建设研究;项目编号:15TQE02。2016年度黑龙江省艺术科学规划项目;项目名称:数字图书馆中异构资源共享平台的研究;项目编号:2016C043。
刘芳(1983— ),女,黑龙江牡丹江,本科,讲师;研究方向:数据库,情报学。