APP下载

图书馆数字化建设的若干问题

2011-03-18宋丽斌

图书馆学刊 2011年5期
关键词:馆藏检索数据库

宋丽斌

(营口市图书馆,辽宁 营口 115000)

自上世纪90年代中期以后,我国图书馆界开始步入数字化建设的轨道。十几年来,在建设计算机通信网络、应用先进的信息技术、建设数据库等方面都取得了很大成绩,但同时也存在许多问题。

1 认识问题

1.1 对整体性特征认识不明确

众所周知,数字图书馆不能脱离网络而存在,数字文献的一个重要优势就是能够通过计算机通信网络进行远距离传输,任何脱离网络的数字文献的存储场所都不能称为真正意义上的数字图书馆,这种数字文献的存储场所和传统图书馆没有什么质的区别。网络把各个个体的数字图书馆连成一个整体,从而才能使人们一直向往的文献资源共享有可能真正实现。因此,在进行数字化建设时,必须遵循整体性这样一个重要原则。在信息资源的建设和保存、网络技术的应用、自动化集成管理系统的选择、分类和主题标引、书目数据格式的标准等方面都必须遵循整体性原则。例如CALIS项目的实施以及当前一些地区的图书馆统一采购数据库,实际上正是自然地服从了数字图书馆的整体原则。各图书馆的数字资源建设应该在一个大范围内全盘考虑,不能追求“小而全”、“大而全”,或者因为“条块分割”,造成全文数据库重复建设的巨大浪费。

1.2 对纸质文献和数字文献的关系认识不清

这个问题有广义和狭义两个方面。从广义来看,涉及到对图书馆数字化发展趋势的认识,曾有两种观点。一种认为数字文献最终将会取代纸质文献,而另一种则认为,所谓“数字图书馆”是继20世纪70年代“缩微图书馆”之后的又一个神话,图书馆数字化发展是一种时尚,它将会随着时间的推移而逐渐淡化。这两种观点现在看来并不科学。因为纸质文献和数字文献各有优势,纸质文献便于长期保存、便于阅读;而数字文献能进行远距离传递,检索方便,能被随意编辑,并能同时被数量较多的人使用。所以二者不能互相取代,应该是各成系统,优势互补。从狭义上看,涉及到一个图书馆中纸质和数字两种文献在馆藏中各占多少比例最为合适的问题。这可能与读者的需求、读者的设备条件、网络条件和对各类图书馆的职能要求(如大型的公共图书馆往往担负一个地区的文献保存职能)有密切关系,因此,各类图书馆的比例是不同的。比较而言,公共图书馆数字文献所占的比例应该最低,高校馆要高一些,科学院图书馆最高。

1.3 对实体馆藏和虚拟馆藏关系认识模糊

这个问题涉及到两个方面:一是要接受“能获取,但不拥有”的理念;二是要对各类图书馆的保存职能进行重新探讨,后者实际是前者的延续。虚拟馆藏具有及时高效,又不需添置许多昂贵设备和增加维护人员的优点,但同时具有如果供应方出现问题,就有可能永远失去这部分馆藏的缺陷。虚拟馆藏是数字文献优势的体现,要进行数字化,就必须接受虚拟馆藏,同时接受“能获取,但不拥有”的理念,此外,也要寻找预防失去馆藏的对策。需要重新审视各类图书馆的保存职能,有些馆可以以用为主;有些馆甚至可以只用不藏;而有些馆则应该担负起保存人类文化遗产的职能。比如,在一个地区中,不能所有的图书馆都只有虚拟馆藏,必须有一个馆收藏有同样种类的实体馆藏。这是人类社会赋予图书馆的一个极其重要的职能。以上一些认识问题都是由于忽视对基础理论的研究而产生的。笔者认为,在目前图书馆数字化(或数字图书馆)建设的领域中,存在轻基础理论研究、重技术研究的倾向。这实际上又是一种思想认识上的问题。

1.4 在图书馆数字化建设研究领域中存在唯技术倾向

这种倾向表现在两个方面:一是从整体上来说,较为重视技术问题的研究。有关研究数字信息采集、整理、保存、传递等技术的文章所占的比例较大,这似乎给人们一种印象,研究数字图书馆就是研究和数字图书馆相关的各种技术。二是表现在研究有关理论的时候,完全忽视了图书馆的人文因素和专业人员的作用。如在讨论“数字图书馆”的定义时,很多观点都认为图书馆就是一种网络化的计算机系统。有的认为:“数字图书馆是国际网络将由分布式的计算机节点演进分布式的信息资源。该网络将提供由信息物品相互联结而构成的信息空间。”有的认为:“数字图书馆是一种多媒体制作的分布式信息系统。它把不同载体、不同地理位置的信息资源用数字技术存储,以网络查询和传播的一个大型信息系统。”还有的认为:“构成数字图书馆的基本要素是数字化资源、网络存取和分布式管理。”用户和专业人员的因素在这里都淡化了。

几千年来,人类记录、整理、传播信息的技术手段不断发生变化。从历史上看,每一次技术革新,其难度和复杂程度以及个性化程度都比前一次有所提高,从而迫使图书馆专业人员的参与程度也相应随之提高。例如,对印刷技术和造纸技术,图书馆专业人员基本上是拿来就用,不需要了解和掌握这些技术;然而,缩微技术和视听技术就需要图书馆专业人员不仅要熟悉应用方法,而且还要了解其工作原理,这是因为一方面需要图书馆专业人员能承担起日常维护缩微或视听设备的任务;另一方面是由于这些技术已经使信息的记录具有个性化的特点,所以图书馆专业人员还需要具有利用这些技术制作文献的能力;数字化技术更为复杂,个性化程度更强,图书馆专业人员的参与程度也就更高,图书馆专业人员不仅要知道如何应用,而且还要了解甚至精通有关计算机技术、网络技术、软件技术等等,才能使数字化建设得以顺利进行。因此,在图书馆数字化进程中加强或重视对技术的研究势所必然,无可厚非。

可是,技术问题归根结底还是手段问题,是帮助人类实现某种目的的手段。图书馆是人类社会保存、整理、传播知识的一种机构,图书馆的出现与发展是一种社会现象,因此,在图书馆数字化的进程中,必须深入地研究数字图书馆建设的原则,数字化对图书馆的性质、职能产生的影响,数字化对传统图书馆的管理模式和工作机制产生的影响,读者和图书馆专业人员的关系会发生的变化等基础理论问题,为图书馆数字化建设构建一个完整的理论体系,只重视技术则有可能将图书馆数字化进程引向歧路。

2 技术方面的问题

2.1 数字化转移技术的选择

目前的转换技术主要有两种:图像处理和文本处理,或者两者结合。前者准确率高,制作速度快,又能保持原貌,但占用空间大,不能进行全文检索;后者需要校对时间,转换成本高,但能进行全文检索,占用空间小。最理想的是将两者结合起来,也就是既能看到原貌,又能进行全文检索,但是这样的转换成本就更高。可以说,目前没有一种理想的、成本又低的转换技术。现在要进行纸质文献数字化转化,需要根据文献的不同情况来选择转换技术。一般来说质量较高或利用率较高的纸质文献可以用文本处理或两者结合的处理方法。

2.2 数字文献的整序技术

网络资源的加盟使传统的整序技术无法适应对数字文献整序的需要。为适应这种情况,目前已经出现了很多方法,如利用机器自动抽词,对MARC进行改进等等。可以说目前在对数字文献整序的技术领域中,已经形成了一种多元化的格局。这样将会影响标引的质量和检索利用的效果,为用户和图书馆工作者都带来麻烦,因此需要对这些方法进行整合,根据具体情况制定统一标准。

2.3 跨库检索技术

这里指的是“无缝”跨库检索技术。对用户来说,这种检索技术可以使他们在面对所有相关数据库时,不需要逐一对每个数据库进行检索。跨库检索技术应该不仅使用户能对同一节点的不同数据库同时进行检索,而且也能用于检索分布在不同地域的各种不同的然而又相关的数据库。这样就能节省用户的检索时间,提高检索效率;同时也可以节省图书馆专业人员的时间(不需要对用户逐一介绍每一个数据库的使用方法。

解决跨库检索要做好两项工作。一是各种数据库都要使用通用的程序语言,遵循统一的格式,向标准化发展;另一方面是建立高层信息搜索管理中间件系统。这种中间件系统作为用户界面和数据图书馆底层信息服务的中间层,将用户查询翻译为通用查询语言,根据不同的条件选择并调用合适的信息服务设施,最后将底层返回的信息汇总,提交给用户。具体来说,目前要做的工作有:建立统一的元数据及元对象库;组织开放体系结构的数字对象库,建立通用的库访问协议;实验建立分布式不同数字对象的调度系统;设计实现方便的网络用界面及实用的系统管理界面;数字对象的描述方式要支持不同源的分布式查询和检索等等。

2.4 数字文献的长期存取技术

数字文献要做到长期存取是很不容易的,这是因为载体的寿命有限。目前寿命最长的是光盘,据说有70年,磁盘、磁带一般就只有10多年,其中有技术过时问题。计算机软硬件一直在发展,软硬件环境不同,文献就不能被读出,可靠性较差,容易被不留痕迹地修改,并极易受到外力的干扰和破坏。计算机病毒、磁场、电磁脉冲对数字信息和计算机系统都具有极大的破坏性。由此可见,人们发出“脆弱的数字图书馆”的感叹不是没有道理的。数字文献的长期存取问题如得不到解决,就会成为埋藏在图书馆数字化进程中的一颗定时炸弹。

目前认为最好的解决方法是“迁移”。这种“迁移”不是简单的复制,它是一种随着技术变化定期改变数字信息格式的处理过程。它要将数字信息从稳定性低的媒体迁移到稳定性更高的载体上,从对软件依赖性强的格式迁移到对软件依赖性低的格式上;将数字信息从各式各样的格式上迁移至更容易管理的标准格式中。此外,对计算机系统需要不断加强在安全方面的投入。

[1] 吴志荣.试论数字图书馆时代的新理念和新方法.图书情报知识,2002(1).

[2] 吴传炉.数字图书馆建设项目综述.情报科学,2000(4).

[3] 吕行.关于我国数字图书馆建设问题和对策的思考.图书馆论坛,2004(2).

[4]吴恒岱.关于数字图书馆几个问题的思考.海洋信息,2005(2).

[5]马启花.关于数字图书馆建设的思考.广西社会科学,2002(2).

猜你喜欢

馆藏检索数据库
馆藏
博物馆的生存之道:馆藏能否变卖?
知还印馆藏印选——古印篇
数据库
数据库
专利检索中“语义”的表现
数据库
数据库
介绍两件馆藏青铜器
国际标准检索