关于数字图书馆建设策略的思考*
2010-03-20周和玉
周和玉
(武汉理工大学 图书馆,湖北 武汉430070)
关于数字图书馆建设策略的思考*
周和玉
(武汉理工大学 图书馆,湖北 武汉430070)
数字图书馆建设是现代图书馆发展的必然趋势,从建设什么样的数字图书馆,数字资源整合,数据质量和网站建设等几个方面,讨论了数字图书馆建设的策略。
数字图书馆;资源整合;数据质量;数字图书馆网站
目前数字图书馆建设正在各级各类图书馆中兴起,但建设一个什么样的数字图书馆,在建设数字图书馆之前和建设之中应充分考虑和注意那些问题,这些涉及到数字图书馆建设的科学性及使用效率,值得我们深入探讨。本文拟结合数字图书馆建设的具体实践,就以上问题作一思考。
一、数字图书馆建设的科学定位
(一)数字图书馆的概念
数字图书馆概念的提出是在20世纪90年代前后,由于其尚处于发展时期,因此,到目前为止关于数字图书馆的定义还没有形成统一的认识。但从近些年的理论研究和建设实践来看,笔者以为美国科学基金会对数字图书馆的描述似乎更具代表性。“数字图书馆并不仅仅是一个有着信息管理工具的数字收藏的等价词,数字图书馆更是一个环境,它将收藏、服务和人集合到一起以支持数据、信息,乃至知识的全部流程,包括从创造、传播、使用,到保存的全过程”[1]。在这里,数字图书馆是一个环境,是一个平台。它包含了三个最主要的要素,即人、资源和技术。人是指与数字图书馆密切相关的人,包括为数字图书馆提供资源的数据库生产者,建设和管理数字图书馆的图书馆工作人员,以及使用数字图书馆的读者;资源是指数字图书馆上运行的各种信息源,包括各种数据库(全文型数据库、文摘型数据库、数据型数据库、馆藏书目数据库等等),网络资源,自建特色资源等等;技术是指维持数字图书馆运行的各项技术,包括数据库技术,数据挖掘技术,数据推送技术等等。在这三个要素当中,起主导作用的是人,因为是人为数字图书馆提供资源,是人在建设和管理数字图书馆,也是人在利用数字图书馆。如果对数字图书馆没有比较明晰的认识,数据库生产者就不可能很好地为数字图书馆提供合格的数字资源,图书馆工作人员就不可能建设和管理好数字图书馆,读者就不可能充分利用数字图书馆这个平台获取信息、数据和知识。数字图书馆就是把这三个要素集合在一个平台上,进行信息、数据和知识的交换、传递及创造。
(二)数字图书馆建设的必然趋势——开放式数字图书馆
建设什么样的数字图书馆,这是每一个数字图书馆建设者首先要考虑的问题。目前,由于数字图书馆尚处于发展阶段,在理论上还没有一个统一的标准,在实践上也没有统一的数字图书馆模型。再加上各馆在办馆理念、经费、人力资源、文献资源(包括印本和数字资源)、服务对象等方面也大不相同,因此在建设上也就显得不一样。但不管理论、实践、环境等方面有多大差别,建设一个对读者实用的数字图书馆是大家的共识。
那么,什么样的数字图书馆才是对读者实用的呢?从我们的调查和读者反映来看,适合读者需要的数字图书馆应该能全面反映图书馆的各种资源(包括印本的和数字的),各种资源应该充分整合在一起,应能提供全方位的信息服务以及各种个性化服务,使用方便,便于各种信息交流等等。因此,我们可以将数字图书馆理解为一个平台,一个环境,在这个平台上,资源提供者(生产者)、资源管理者(图书馆工作人员)和资源使用者(读者)进行着信息、数据和知识的生产、传递及创造。这个平台是开放式的,可以对外进行数据交换。因此,它是全球数字图书馆联盟(全球各数字图书馆联在一起形成一个大的数字图书馆)的一分子,是全球数字图书馆的一个入口或一个节点,读者在这样一个数字图书馆上,既可获得本地资源,又可以查到其他数字图书馆的资源,进而通过文献传递系统获得异地资源。这就要求我们的数字图书馆不能是封闭的,而应该是开放式的。这就是整体定位应考虑的问题。我们不要求也不可能要求单个数字图书馆包罗万象,但至少要能与其他数字图书馆相互链接。读者在这样一个相互链接的数字图书馆群体——“全球数字图书馆”上,能获得所需的各种各样的信息和服务。笔者以为,这些问题在建馆之初都应该考虑清楚,整体设计时考虑全面一些,才便于之后分步实施。
二、数字图书馆建设的重点:信息资源整合
(一)信息资源整合的内涵
所谓信息资源整合,是指依据一定的需要,对各个相对独立的信息资源系统中的数据对象与功能结构及其互动关系进行融合、类聚和重组,形成一个效能更好,效率更高的新的信息资源体系[2]。图书馆的信息资源多种多样,大致可分为印本资源(包括各种图书、期刊、报纸等等),数字资源(主要包括电子图书、电子期刊、各种文摘数据库和事实数据库等)和网络资源等,这些资源分别由不同的系统管理着,如印本资源由传统的图书馆集成系统管理,各数据库也有自己的管理平台,由于各系统之间没有相互联系,读者要检索印本资源需进入图书馆集成系统,需查找电子图书、电子期刊和其他电子资源又必须进入相应的数据库系统,这样给读者使用带来了很大的不便。信息资源整合的目的是要把这些毫不相干的信息,通过一定的技术和手段整合到一起,使其成为一个相互连接的整体,为读者提供一个知识相互链接和利用方便的平台,这是目前数字图书馆建设的一个主要内容。
(二)信息资源整合的模式和内容
目前,国内外数字图书馆采取的整合方式主要有:基于OPAC系统的整合,基于数字资源管理的整合,基于知识服务的整合[3]。基于OPAC系统的整合就是通过图书馆集成管理系统软件进行MARC编目,将电子图书和电子期刊整合到OPAC系统中,并在OPAC系统中提供超级链接功能,这样读者在OPAC系统中检索到印本图书、印本期刊的同时,还可以检索到相应的电子图书、电子期刊,进而通过超级链接打开全文。基于数字资源管理的整合就是在数字资源当中嵌入印本图书和印本期刊的OPAC信息,从而实现印本资源和数字资源的无缝链接。基于知识服务的整合则是从知识服务的需要出发,直接通过分布式资源间的相互操作,相互链接,将所有的信息资源组成立体、网状的知识资源服务系统。以上各种整合方式有着各自的优缺点,前两种实现起来比较容易,但不能实现所有资源间的知识链接。最后一种整合方式可以实现所有资源间知识的立体、网状链接,但实现起来难度较大。基于以上分析,我们可以看出,就真正的资源整合而言,基于知识服务的整合才是真正意义上的资源整合。因为它可以实现针对分布环境下的电子资源的整合检索和获取目标信息的无缝连接,以及实现各种知识和信息服务的整合。要实现知识服务的整合,通行的做法是在建立本地元数据库的基础上,通过资源调度系统实现资源检索和提供的无缝链接。本地元数据库应包括OPAC数据、商用数据库和网络资源数据,其中OPAC数据为本馆所有,网络数据可以通过加工获得,但商用数据库的元数据则需要数据商提供。目前,这部分数据获得比较困难,也不稳定。这就是我们前面所提到的数字图书馆建设不仅仅是图书馆的事,而是涉及到数字图书馆系统各方面人员的共同努力,才能把数字图书馆建设好。但不管困难有多大,在数字图书馆设计之初,也就是方案设计中,应该考虑未来数字图书馆的可持续发展,为未来的可持续发展预留下足够的空间。
(三)信息资源整合的原则
信息资源整合总的原则应该是科学设计,统筹规划,分步实施。我们说资源整合中要将各种信息资源整合在一起,这是整体上的要求,是整体设计上应考虑到的,但在实施上会遇到很多困难。例如,数据商配合的问题,知识产权的问题,数据量大的问题等等。因此,在具体实施上,可考虑分步实施,先易后难。我们武汉理工大学图书馆采取的是先整合本地资源,包括本馆OPAC,装在本地的电子图书以及自建的一些数字资源,然后待运行稳定和条件成熟后,再逐个解决相关数据库的整合问题。
注重数据和整合方式的标准化、规范化,以使得数据和服务能在数字图书馆之间顺利流动,从而避免形成新的信息孤岛。
三、数字图书馆建设的关键:数据质量
数据质量是数字图书馆建设中不可忽视的一个非常重要的方面,数据质量的好坏,直接关系到数字图书馆建设的成败。在数字图书馆建设中涉及到的数据主要有OPAC数据、商用数据库元数据和网络资源元数据等等。
(一)信息资源整合对数据的要求
一是标准化要求。标准化规范化是实现不同系统间网络信息资源交流的基础,实现数字信息资源整合的关键在于要遵循标准化的规范体系。如果没有统一的数字信息资源建设标准和相应的规范,就不可能实现各分布式资源之间的互操作和信息的共享。在数据库建设中 ,由于缺乏标准规范,往往导致大量异构资源的出现。因此,面对分散异构、不断变化和开放的数字信息资源与服务环境,应采用新的标准规范体系,使各类、各种信息在网络平台之间能自由流动。
二是完整性要求。完整性是实现资源检索和调度的基础,数据项目不完整,检索时容易造成漏检,资源调度时容易产生调度误差,从而影响资源整合的效果。
(二)目前数据质量存在的问题
1.OPAC数据问题。目前国内大多数高校图书馆的OPAC数据是从上世纪80年代末到90年代初图书馆集成系统(或称图书馆自动化系统)应用时开始建立的,在开始阶段,不少馆采取的是“大兵团作战”的方式建立数据,即全馆动员大多数人员参与,在较短的时间内将图书馆借阅流通的图书建立数据库。由于参与人员并非全部是图书编目人员,加上对机读格式并不很熟悉,所以加工的数据质量参差不齐,存在的主要问题是著录项目不全,项目录入错误等等。这些问题往往会导致资源整合和调度中出现差错。
2.商用数据库元数据问题。商用数据库元数据主要存在两个方面的问题,一是难于获取,目前国内一些主要数据库的元数据经过协商,大多数都能获得,而外文数据库的元数据则较难获得,且大多数数据商不开放接口;二是数据更新难,难在数据商不提供接口,增量数据无法自动获取。
(二)解决数据质量问题的途径
对于OPAC数据问题,需要花较大气力清库来解决。目前,比较好的解决方案是将以前的数据逐条对照CALIS或中国国家图书馆的数据套录,因为这两个系统的数据比较规范标准,从而形成自己比较规范标准的OPAC数据。
对于商用元数据问题,鉴于其整合的难度较大,笔者以为,可以采取先易后难的办法解决,即装在本地的资源,其元数据也放在本地元数据库中,进行完全整合。而对于没有装在本地的网络访问的数字资源,可以有两种方式来处理。一是与数据商协商解决元数据本地存放和开放接口,或者由有开发能力和经验的数据商将本地资源整合进相关数据库平台;二是暂时不整合进本地平台,待条件成熟后再整合。
四、数字图书馆的灵魂:资源和服务的有效表达
数字图书馆建设的设计理念以及资源和服务都是通过数字图书馆网站来展现的,读者面对的也是数字图书馆的网站。一个好的数字图书馆网站应该成为图书馆与图书馆,图书馆与读者,读者与读者,读者与馆员,甚至读者与资源创造者(包括作者、数据商、书商等)之间的纽带和桥梁。因此,数字图书馆网站的设计就显得非常重要。在数字图书馆网站设计上应该注意以下几点:
首先,网站设计上应该体现出数字图书馆能为读者提供信息、数据、知识的获取、交换、传递和创造的平台,这些功能应在主页面上反映出来。
其次,在内容展示上,应实行功能分块,要站在读者利用数字图书馆的角度进行设计,使读者一目了然。一个数字图书馆大致可分为以下几个区域,资源揭示区、资源检索区、读者登录区、图书馆概况、读者指南、个性化服务区、消息发布区等等,其中资源检索和资源揭示是读者最感兴趣的项目,因此,这两个区应摆在网页版面醒目的位置。例如,武汉理工大学数字图书馆网站设计就是采取功能分块的,整体上分左、中、右三大块,左上为检索区(资源统一检索、馆藏印本资源检索),左中为消息报道,左下为资源推介;中间为主要区域,分别安排了读者指南(图书馆相关情况介绍、资源使用指南、新生须知等),资料查询(各种印本和电子资源查询、新书通报等),信息服务(参考咨询、科技查新、文献传递等等),资源导航(数据库和电子期刊导航以及网络资源导航等)和特色资源(自建的特色资源和门户等)等;右边安排了用户登录,特色服务,资源利用排行等等。运行两年多来,读者普遍反映良好。
再次,尽量避免使用太专业化的术语(例如:“OPAC检索”等等),网页设计上要尽量简洁。
综上所述,数字图书馆建设对于一个图书馆来说是一件大事,应该从设计理念(建设什么样的数字图书馆),资源整合,数据规范化,网站设计等多方面给予足够的重视,组织馆内相关人员反复认真论证,再联合相关专家和软件开发公司技术人员讨论并实施,为读者建造一个功能齐全、实用的数字图书馆。
[1] 曾 蕾,张 甲,杨宗英.数字图书馆,路在何方?[DB/OL].(2009-11-20)[2010-02-10]http:∥oldweb.lib.sjtu.edu.cn/chinese/teaching&research/1.html.
[2] 崔瑞琴.数字信息资源整合问题研究[J].图书情报工作,2007,51(7):35-37.
[3] 龚亦农.数字图书馆的资源整合[J].图书情报工作,2005,49(7):121-124.
(责任编辑 文 格)
Thoughts on the Strategies of Digital Library Construction
ZHOU He-yu
(Library,WHUT,Wuhan430070,Hubei,China)
To construct digital library is the inevitable trend of modern library development.The strategies of digital library construction has been discussed from the following aspects of what type digital library to construct,integrating digital information resources,data quality and network construction.
digital library;integrating information resources;data quality;network of digital library
G250
:ADOI:10.3963/j.issn.1671-6477.2010.05.033
2010-03-10
周和玉(1957-),男,安徽省枞阳县人,武汉理工大学图书馆研究馆员,主要从事数字图书馆、情报存贮与检索研究。
教育部科技发展中心项目资助(2009113)