公共图书馆纸质档案信息数字化探究——以辽宁省图书馆为例
2010-03-22姜欣
姜 欣
(辽宁省图书馆,辽宁 沈阳 110015)
图书馆档案不仅记载着图书馆发展的历史,也是图书馆基础业务、读者服务、现代化建设等工作的真实写照,是图书馆实行内部管理的基石。做好图书馆档案的管理工作,对公共图书馆具有重要意义。信息技术的发展与广泛应用,要求公共图书馆档案实现以数字化的形式收集、存储并进行规范有序的管理。笔者结合辽宁省图书馆工作实际,对如何做好公共图书馆纸质档案信息的数字化转化工作谈几点认识。
1 纸质档案信息数字化的意义
1.1 规范和提高档案基础工作水平
实施纸质档案信息的数字化转化,有利于形成符合图书馆数字化建设要求的纸质档案管理规范和流程,有利于促进档案整理、分类、编目、统计、鉴定等一系列基础工作的自动化管理,从而提高档案基础工作水平。
1.2 提高工作效率,降低管理成本
纸质档案存放占用空间大、检索效率低、耗时、耗力。对纸质档案进行数字化管理,可提高检索效率,降低管理成本。
1.3 保障纸质档案原件的安全
在传统的纸质档案管理模式下,档案利用者只能通过翻阅大量的档案原件才能查阅到相关信息,这样会造成档案出现页面污损、发黄、发粘、发脆、断折现象,加快了档案老化和损坏速度。将纸质档案转化为数字信息,利用者可以通过网络查阅信息,大大减少了对档案原件的调阅次数和复印次数,降低了纸质档案的老化速度,解决了纸张脆化和变质的文献保护问题。纸质档案的数字化转化将进一步保障原始资料的安全。
1.4 与图书馆事业发展相适应
加强档案工作的数字化与网络化建设,符合图书馆事业向科学化、规范化、网络化、信息化发展的整体要求。
2 辽宁省图书馆纸质档案数字化概述
2.1 档案资料情况
辽宁省图书馆按照辽宁省文化厅和辽宁省档案局辽文字[1999]18号文件《辽宁省公共图书馆档案管理办法》,将档案资料按“年度——问题”分类,基本类目分别为:文书档案:保存着从1948年建馆至2009年以来的档案,永久401卷、定期30年757卷、10年367卷;财务档案1807册;基建档案183卷;电子档案165盘。档案资料的载体介质有印刷纸、手写纸、复印纸、晒图纸、照片、底片、胶片、磁带、录像带、光盘等。本馆纸质档案每年都以百余卷速度递增。
2.2 档案资料管理状况
辽宁省图书馆1996年成立了综合档案室,是辽宁省文化系统首家使用由省档案局研制开发的“文档一体化档案管理软件”的单位。目前,已实现了文书档案文件级目录、会计档案和基建档案案卷级目录的计算机管理及模糊查询,但档案的收集、接收、传递、登记、查阅仍采用传统的手工操作。
2.3 档案管理软、硬件环境
辽宁省图书馆在软件方面采用了清华紫光电子档案管理系统THAMS-2006单机版,该软件包括文件管理、档案管理和开发利用3部分,能够满足档案数字化管理的需要。硬件方面已配备扫描仪和计算机、照相机等设备,可以进行初级、少量的证书、图纸等档案的数字化转换工作。全馆系统化的档案数字化工作正处于研究、尝试阶段。
3 纸质档案数字化的工作策略
3.1 强化档案管理现代化意识
档案管理工作是图书馆工作中重要的组成部分,应引起足够重视。必须提高档案工作现代化管理意识,完善软、硬件设备和规章制度建设,这是进行档案数字化建设的重要前提。
3.2 建立健全规章制度
数字化标准规范和管理制度是实现档案数字化的基本保证。要根据《辽宁省档案数字化技术标准》和《辽宁省文书档案目录数据库结构与交换格式(试行)》制定适合本馆的工作程序以及数字化标准和管理制度,包括《档案数字化技术规范》、《电子文件归档管理规定》、《数字档案信息安全管理与利用制度》等。
3.3 加强软硬件建设[1]
配备数字档案信息采集设备,包括扫描仪和计算机、照相机等设备,用于纸质档案的数字化转换工作;配备数字档案信息的存储设备,包括服务器、磁盘阵列、光盘等设备;配备档案综合管理系统软件,如本馆目前采用的清华紫光电子档案管理系统,能够满足档案数字化管理的需要;构建局域网或连接外部网络,这是实现数字档案资源采集、管理、长久保存和共享利用的重要条件。
3.4 合理确定数字化转化范围
确立数字化范围,是开展后续工作的基础,必须予以高度重视。首先要剔除馆藏纸质档案中不应该归档却被归档的档案。其次是参照国家综合档案馆保管期限标准,剔除重复、交叉及冗余的档案。第三是依照国家《纸质档案数字化技术规范》,结合自身工作实际和馆藏特点,制定档案数字化内容的优化策略。如辽宁省图书馆档案数字化工作主要遵循:[2]一是以“我”为主策略,根据馆藏文献的保存价值进行数字化,将保存价值高的馆藏档案优先数字化。二是需求导向策略,根据馆藏文献的利用价值,通过统计分析将馆藏档案中利用频率最高的档案进行数字化。三是特色主题策略,对本馆的特色文献优先数字化,以提高特色服务水平。四是珍贵、濒危档案优先策略,如本馆档案室保存有1996年创建的“辽宁省籍三十年代作家著名作家资料馆”全套档案材料,以及1969年辽宁省图书馆与甘肃省图书馆交接文溯阁《四库全书》工作的珍贵档案。这部分档案多为手写、油印,由于存放时间过长,纸已发黄、发脆、破损。对这类珍贵、濒危档案必须优先数字化。
3.5 规范进行数字化转化操作
纸质档案数字化加工的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。其中的重点和核心环节是档案扫描、图像处理和图像存储,只有进行标准化、规范化操作,才能保障数字化产品的质量。
档案扫描工作应遵守的规范:大幅面档案如基建档案可采用大幅面数码平台扫描,也可采用小幅面扫描后的图像拼接方式处理;对纸张状况较差,以及过簿、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式;页面为黑白两色并且字迹清晰、不带插图的档案,采用黑白二值扫描;页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度扫描;页面中带有红头、印章或插有彩色图片的档案,视需要进行彩色扫描;在条件允许的情况下,为真实、准确、全面地再现档案历史原貌,需永久或长期保存的档案应采用彩色扫描;扫描亮度要根据扫描文件的黄、白、暗等纸质情况来调节,使生成图像清晰,亮度明快。
图像处理应按以下规范:文书档案图像处理应统一使用Photoshop图像处理软件;当所加工档案纸张的大小一致,没有装订孔并且纸张之间没有粘连的现象时,可用Photoshop图像处理软件的批量自动处理功能处理。先将图片导入ITscna软件当中进行批量的图片倾斜校正,然后选择一张图片导入到Photoshop中,对其作一个处理动作,然后利用Photoshop中批量自动处理功能对剩余的图片进行处理;当所加工档案纸张大小不一,而且含有装订孔或纸张之间有粘连的现象时,可以用Photoshop按倾斜校正——去出杂点——对图片中纸张破损的地方进行修补——去出四边的黑边——对图片进行编号——保存流程处理;当所加工的档案为基建档案时,档案张纸为图纸且其尺寸大小不一的时候,一般用VP图像处理矢量化软件来进行处理。首先将图纸扫描成为黑白二值的图片,然后利用VP中的自动去杂点功能输入适当的杂点直径值,以去出杂点直径小于这个值的杂点。
经过加工的图像文件,必须按标准格式存储,才能方便使用。对图像存储格式采用单色模式扫描的图像文件,一般采用TIFF(G4)格式存储;采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储;提供网络查询的扫描图像,采用压缩率高的文件格式,可存储为CEB、PDF或其他格式。
4 纸质档案数字化需要注意的问题
4.1 建立图像文件命名与档号的对应关系
每份文件扫描形成的原文图像文件应存储在按“档号”命名建立的文件夹中,文件夹所包含的扫描图像文件(页)按纸质文件页码顺序命名;“档号”是指档案室在整理和管理档案过程中,以字符形式赋予档案的唯一的一组代码,是存取档案的唯一标志,“档号”格式为全宗号——年度——保管期限——问题——件号。“档号”格式必须与目录数据库中“全文标志”的著录格式一致,档案目录应与原文图像通过“档号”一一对应,实现自动挂接。
4.2 建立电子文件与OA办公系统挂接关系[3]
大部分公共图书馆已利用OA办公系统实现办公自动化,本馆采用Lotus Notes办公自动化软件可实现局域网内文件的发布、传递、接收、回复等工作流程。本单位文件可直接通过Lotus Notes办公软件接收、存储并转入档案管理系统,对上级和本单位各部门下发的纸质文件通过扫描生成图像电子文件并在OA办公系统中运行,也可以转入档案管理系统。因此要注意充分利用OA办公系统的功能,实现与档案综合管理系统自动挂接,实现图书馆档案管理和利用的数字化。
4.3 扫描文件和已有目录数据库对接的关系
图书馆档案数字化建设在某种意义上可以称为“二次建档”。“一次建档”是传统的侧重于档案实体的保存,是对传统的纸质档案分类、组卷、编号、编目等;“二次建档”则以档案信息资源的有效整合为目的,选择有特色、利用率高、可开发、保管限期较长的档案进行数字化。辽宁省图书馆采用清华紫光电子档案管理系统,按《辽宁省文书档案目录数据库结构与交换格式(试行)》中数据库结构《文件级目录数据库结构Ⅱ》标准,已建成文书档案容量为21541条文件级目录数据库。在“二次建档”时,本馆将纸质文件全文扫描形成电子文件后,注意实现电子文件目录通过“档号“与现有目录数据库批量挂接,保证形成目录数据库的档号、年度、题名、保管期限、问题、责任者、卷号、页数与其对应的全文扫描文件完全一致。
4.4 注意做好数字化信息的安全保护与数据备份
纸质文件数字化后,应注意构建全方位的安全保护体系,确保数字化后档案信息的真实与完整,防止被他人窃取、修改、伪造、病毒侵害和恶意攻击,同时还要注意载体寿命、电子计算机软硬件的生存周期和载体所载档案与电子计算机软硬件平台的一致性对档案信息的安全威胁。[4]此外,还必须认真做好数据的备份工作,选择可靠介质,严格按规定时间进行数据备份,确保档案信息的安全与完整。
[1] 辽宁省档案数字化技术标准,2008.
[2] 杜敬民.基层档案室档案数字化建设研究[J].河南科技,2009(1):27.
[3] 李昕.档案数字化之前的准备工作[J].北京档案,2009(7):19.
[4] 车梅芳.谈机关数字化档案室的建设[J].浙江档案,2009(7):42.
[5] 索毓慧,范立梅.对大型企业档案数字化的几点思考[J].黑龙江档案,2009(2):36.
[6] 鄂丽君.图情档案学国家社科项目专著成果出版及利用.图书与情报,2009(5).