谈对图书馆如何走向数字化的研究
2009-08-17赵丹丹
赵丹丹
摘要:图书馆作为信息资源的收集、整理、存贮和交流的中心,要改变以往的工作模式,能够在任何空间、任何时间,准确、快捷地为任何用户提供所需信息,需要图书馆将自己的信息资源数字化,由于各图书馆资金有限,不得不对数字化内容进行选择。
关键词:图书馆 数字化 原则
1 保护知识产权
馆藏资源的产权状态识别与数字化项目实施和数字资源发布所在的国家地区有关,每个国家都有自己的知识产权保护法律。学者针对图书馆信息资源数字化项目制订了产权状态识别模型,目前数字化项目中保护产权的主要技术有:对每个数字图像添加可视水印或版权戳;给每个数字图像添加不可视水印,这种水印标志可以用来证实数字图像的版权身份,也可用来跟踪这个数字图像在因特网上的传播轨迹;对数字图像加密,并仅把密钥发送给注册用户,这种方法会限制公共存取;将公共浏览的图像限制在低分辨率;将公共存取限制在截取数字图像的一小部分之中,这种方法在一些项目中应用得非常成功;将图像的浏览权仅限定在一些注册或被授权的用户。
2 选取最有价值的知识文献
影响原始信息资源的知识价值因素有很多,但主要包括资源的唯一性、相关价值、对相关主题领域理解的重要性、对相关主题领域覆盖的广度和深度、实用性和准确度、特定主题领域中其他载体记录质量差的信息内容、具有强化项目实施的历史价值以及数字化产品潜在的长期价值等。另外,文献知识价值也可能包括管理价值、艺术价值、证据价值和市场价值,文献知识价值的判断具有很大程度的主观性。图书馆不同,对文献知识价值的判断也不相同,在国内,每个高校的图书馆都有自己的基本馆情,他们都积极对馆内自己认为有特色的东西进行数字化。
3 选取适宜于数字化的文献
在数字化内容选择过程中,需要考虑的与原始文献存在状态相关的问题有:原始文献的存在状态是否有利于数字化?其内容是否能被目前的数字化技术完全和充分地抓取?物理材质和形状是否会对数字化过程构成障碍?是否有保存良好的替代品(如缩微胶片)?最常见的物理材质有一般纸张、牛皮纸、草纸、微缩胶片、光学材料、三维物体、玻璃器皿、记录音频的盒带光盘和磁带、视频等。不同物理材质的文献需要不同的技术进行数字化,比如,一般纸张可以采用数字扫描,但三维物体只能采用数码拍照。存在状态对其内容的充分抓取也有重大影响,比如,一般纸张中内容的抓取要比草纸充分得多,甚至,有些物理材质的内容数字化目前还难以实施。所以,只能选择那些当前技术条件下适合于数字化的载体材质馆藏资源,载体的物理尺寸也是影响内容选择的一个重要因素。
4 提高利用率
用户利用的本质就是馆藏文献的利用率,从理论上讲,图书馆信息资源数字化项目应把有限的资金用在利用率高的资源的数字化上,但一些问题需特别关注:其一是要对利用率高的文献的原因进行分析,如果主要用户群体分布在本地,且类似文献又不存在,这类文献的利用率自然可能高,但数字化后发布在网络上,其利用率如何就比较难以判断,因为这时的用户就不仅局限于本地了。其二是文献的利用率有时与文献的知识价值并不一致,有些具有高知识价值的文献由于存放地点和图书馆存取方针的限制或目录的不完整等因素,可能导致利用率偏低,其三是利用率也会与文献的物理状态有关,一些文献的物理状态限制了用户对其的访问,比如易碎载体的文献、古旧的手稿等。其四是在多馆合作数字化项目中,一些大部头的系列文献分散在各成员单位,对这些文献的访问率可能较低,但数字化后可以形成完整的虚拟馆藏,其访问率可能就会提高。其五是一些技术因素不应该成为阻止一些文献数字化的原因,
5 从技术条件上考虑可行性
数字化内容选择将受现有技术条件的限制,我们在选择数字化内容的时候必须要考虑现在的技术是不是能够顺利地把这个内容数字化。考虑的主要因素有:数字化过程中对原始资料识别技术方面的问题,会导致数字技术生成的文献数字版与原始文献包含信息相比出错率很大;数字资源显示在用户终端的质量;图书馆支持的现行平台和网络环境对数字资源的存取能力;数字资源网络传播速度的合理性;对未来用户使用先进设备的预测,以免日后需重新扫描;搜索引擎对图书馆数字资源的索引能力。另外,还要考虑一些特殊资源数字化的技术可行性,如,需要超高分辨率的文献资源、颜色至关重要的原始资源、超大尺寸的资源、三维形态的资源以及易读性很差的资源载体等。
6 对文献资源进行保存
为了保存的需要,数字化内容选择的原则之一是安全数字化(safedigitiza2tion),包括原始信息资源的状态允许被完全数字化;数字化实施过程需要搬运原始资源时,其状态适合于搬运;尽可能扫描原始资源的替代品(如照片),从而减少对原始资源的损伤;数字化的产品必须建档,并制订由于时间和技术变化等因素导致的长期维护策略。数字保存的另一层含义是保护易碎载体的原始资源,数字资源的本身就是原始资源的新版本,可以代替原始资源供用户访问,并由此减少对原始文献的操作从而使其得到保护。如对古籍来说,由于它极其容易被损坏,从这个原则上来讲它是应该拿来数字化的,但在数字化过程中,特别要注意不要将这些珍贵的图书损坏,这也将
对数字化带来很多麻烦。
7 以经济效益为出发点
馆藏文献的数字化成本受众多因素影响。分辨率越高的图像所需的成本也越高,彩色图像的成本要比黑白图像的成本高,数字化生成纯文本文件有助于全文检索,且占用较少的存储空间,但需要OCR识别,并需要大量的人工校对,如果生成带标记的文本文件 (如XML文件),虽然有助于各种分析乃至纳入数据库管理,但成本必然增加。成本也取决于数字化过程,比如,单页扫描比装订在一起扫描成本要低,保存状态良好的资源扫描要比保存状态差的资源扫描所需成本要低,因为后者需要更多的人工处理。从效益角度看,受益最大的是用户。另外,数字化也便于图书馆管理人员对馆藏资源的管理,并能更高效地提供服务,尽可能提高成本效益是数字化内容选择的宗旨。实现相同功能而采用不同方法的成本会有所不同,比如,数字化生成文本文件与生成图像文件,后者加入元数据与图像文件链接,两种方法得到的效果可能差不多,但很明显后者的成本要低些。另外,规模很大的项目单件数字化成本要低,长期保存的费用也会降低。
图书馆在进行数字化内容选择的时候,只有满足了以上的原则,数字化才有价值,才能给图书馆和读者都带来好处。