论高校区域馆藏联合目录的构建
2011-03-10张薇
张 薇
(苏州大学图书馆,江苏 苏州 215006)
高校图书馆的职能是为本校师生的教学科研提供文献保障,同时尽可能面向社会提供信息服务,从而使资源效益最大化。随着网络和信息技术的发展,各高校馆通过区域文献共建共享,可以丰富每个成员馆的虚拟馆藏,做到优势互补、利益互惠,从而提高整个地区高等教育的文献保障水平。
联合目录是实现文献资源共知、共建、共享的前提和基础,以集中反映各成员馆的文献收藏内容为特征。通过联合目录系统,图书馆能够准确获取馆藏分布信息,并对资源进行协调配置;读者能够实现跨库搜索,为资源利用提供便利。联合目录更是实现馆际互借和区域流通服务的重要手段。
1 高校区域联合目录的应用
随着高校教育改革的不断推进,高等教育联合体如雨后春笋般成长起来,为配合教联体做好文献保障体系建设,地区高校图书馆联盟应运而生。联盟是按照平等自愿的原则组成的合作组织,通过合作进行信息资源建设、信息存储、信息加工和信息交流。
联合目录能够集中揭示联合体各馆的馆藏书目信息,并对相同的记录进行查重合并处理。有了联合目录,读者可以实现对联合体内馆藏的一站式查询,图书馆也可以及时了解联合体的整体馆藏情况。通过统一的分类标引,图书馆可以建立联合体的学科专业文献目录,为学科建设提供文献导航服务。联合目录准确体现了馆藏结构,包括学科配置、空间布局,有利于协调馆藏,优化学科资源配置。
教联体之间文献共享的重要内容之一就是纸质文献的互通,一般通过区域流通或者文献传递的方式进行。联合目录是开展纸质文献互通的前提条件,在联合目录系统中做好与自动化系统的接口,可以方便读者在网上进行跨馆借阅申请。
2 联合目录的模式
从书本式到网络化,联合目录的内在形式发生了很大变化。当今联合目录主要分为虚拟式和实体式两种模式。虚拟联合目录是一种分布式结构,其书目数据来自成员馆各自维护的书目数据库,通过Z39.50协议或者其他网络编程方法进行动态汇总,从而形成一个虚拟合作的联合目录共享系统。实体联合目录的书目数据也来自成员馆,但数据是集中存储的,通过成员馆的馆藏进行更新,是分馆馆藏数据按照一定规则进行系统整理后的交集。
2.1 虚拟联合目录
虚拟联合目录的文献数据库是各成员馆书目数据库的虚拟组合,数据存储是分布式的,用户通过一个通用界面同步并行检索相互独立的多个馆藏数据库系统,检索结果按照统一格式返回用户界面。虽然没有集中存储,但在用户看来就像是对单一的数据库进行操作[1]。虚拟联合目录数据库的实现方法有很多种,如基于http协议的页面分析,或是使用基于Z39.50等网络协议的中间件程序等。
2.1.1 基于http页面分析实现的虚拟联合目录
基于http页面分析实现的虚拟联合目录系统利用http协议的请求/响应模型,到各成员馆的OPAC Web发布站点获取馆藏数据检索结果的html网页,然后通过进一步的页面分析获取书目数据。系统本身并不涉及对数据库的存取,其直接数据源是动态的网页,来自各个成员馆的OPAC系统。系统实现需经过几个必备步骤:①转换并传递用户检索表达式到OPAC系统;②取回包含检索结果的html页面;③进行页面分析,抽取题名、作者、出版社、书目详细信息的URL链接等相关的基本字段信息;④重新整合书目信息并输出联合目录整合后统一结果页面。
由此可见,通过页面分析获取书目数据并整合输出的虚拟联合目录完全依赖于各成员馆的OPAC系统,所以在实现时要处理好一些动态问题,如考虑到OPAC系统的网络响应速度具有不确定性,要对超时现象进行判断和处理。
2.1.2 基于中间件实现的虚拟联合目录
互联网数据中心(Internet Data Center,简称IDC)对中间件的描述被人们普遍接受。中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。
IDC对中间件的定义表明,中间件是一类软件,不仅仅要实现互连,还要实现应用之间的互操作;中间件是基于分布式处理的软件,最突出的特点是其网络通信功能。
在虚拟联合目录的分布式处理中,可以利用中间件实现统一检索平台到各个馆藏数据库的网络数据通信,前提是各馆藏数据库提供软件接口或开放数据库结构。与基于页面分析的虚拟联合目录不同,检索平台的后台将检索需求发送给各个目标馆的中间件,由中间件和数据库进行通信并取得检索结果数据。中间件程序是独立于图书馆自动化系统进行开发的,可采用Z39.50等协议作为应用层网络通信协议,它摆脱了OPAC系统存在的功能限制,控制更加灵活。中间件一般部署在对各馆文献数据库具有访问权限的内网,中间件和馆藏数据库可以是一对一的关系,也可以是一对多的关系。中间件通过对数据的处理,如排序、合并等,可以减轻联合目录主服务器的压力,将运算分散到多个主机上。
2.2 实体联合目录
实体联合目录是一种集中式联机联合目录,拥有一个中央书目数据库。针对区域高校联合体的应用需求,实体联合目录的数据库不仅要集合各成员馆的书目数据,还要反映各成员馆的馆藏变化情况。
中央数据库的建立使得灵活多样的数据处理成为可能,而一个及时又准确的中央数据库能够为实现各种共享服务提供强大的数据保障。因此,建立实体联合目录的关键在于建立和维护一个数据全面、及时、准确的中央数据库。
中央数据库的书目和馆藏数据来自各成员馆的文献自动化系统,一般采用数据收割的方式集中建库,为保证数据的实时性和准确性,需要处理好中心库和各成员馆数据库之间的数据同步。数据收割需要定义好互操作协议和交换元数据格式,所收割的数据一般包含书目MARC记录和馆藏复本信息,收割上来的数据在入库前要进行查重和归并操作,以避免数据冗余。
3 对比不同模式的联合目录
3.1 实现及维护成本
不同模式的联合目录因其对硬件的要求和软件的复杂度不同,其实现成本有很大差异。实体联合目录需要构建和维护中央书目数据库,对数据安全具有较高要求,需要比较大的存储空间和较稳定的物理性能,还要做好数据备份等工作。在软件实现复杂程度方面,实体联合目录由于需要建立可靠的数据收割和同步系统,其复杂性相对也是较高的。基于http页面分析的虚拟联合目录在系统建好之后,如果成员馆的OPAC系统页面的结构或样式发生了改变,虚拟联合目录系统中的页面分析程序也要随之做相应修改,否则将无法得到正确的数据,因此软件上的维护工作更繁杂一些。
3.2 功能及效率
实体联合目录的数据集中存储在本地,数据在存储的同时可以进行归并处理,可以针对本地数据表灵活建立索引,根据需要形成多种目录,如建立区域的学科目录。依托实体联合目录,馆际互借、资源整合等服务实现起来也更加方便。
在检索效率方面,实体联合目录由于减少了到各成员馆数据库中分别检索的网络环节而具有绝对优势。而基于http页面分析的虚拟联合目录由于额外的页面分析步骤,检索效率相对较低。
目前市场上成熟的图书馆信息管理系统软件品种很多,区域联合体中各成员馆所使用的系统难以保证一致,联合目录常常需要解决跨平台支持的问题。基于http页面分析的虚拟联合目录只需访问OPAC系统的http页面,而不需要处理接口或接触不同的库结构,比较容易解决跨平台的问题。
表1反映了几种模式的联合目录在成本和功能效益方面的对比情况。
表1 3种模式的联合目录对比情况
4 结语
究竟选择何种方式构建区域联合目录系统,要根据实际情况综合考虑性价比和应用需求。总体来说,基于页面分析的虚拟联合目录实现起来成本最低,便于整合异构系统,部署和管理也简单灵活,但检索效率和检索复杂度一般,通常用于以统一检索为主的应用;基于中间件实现的虚拟联合目录在实现成本和功能效率上都比较折中,数据的实时性和准确性较高,更加适合实现基于同一种图书馆文献管理系统之上的馆际互借或区域流通服务;实体联合目录实现的软硬件成本最高,但功能强大,可以实现各种复杂的检索并为各种区域文献共享服务提供统一的检索平台。需要指出的是,实体联合目录的数据库和各个馆的馆藏数据库之间存在一定的不同步,在具体应用时要加以注意。
[1]欧阳剑,李冠盛.元搜索引擎原理在实现分布式虚拟联合目录中的应用研究[J].现代图书情报技术,2006(9):63-67.
[2]罗岚.地区图书馆联盟发展研究[J].农业图书情报学刊,2005(7):3-5.
[3]黄雪梅.联合目录的模式与天津高校联合目录系统的建立[J].图书情报工作,2005(12):48-52.
[4]卢共平,白丽丹.网络环境下联合目录的发展[J].图书馆工作与研究,2001(4):21-23.
[5]张永忠.网络信息环境下图书馆区域联盟的发展趋势[J].科技信息,2008(13):289.
[6]卢共平,汪善建.欧美国家联合目录的进展与我国虚拟联合目录的发展思路[J].图书情报工作,2002(10):84-87.