纸质档案数字化流程的实践与分析
2020-10-13■刘婷
■刘 婷
一、纸质档案数字化概述
(一)相关概念
数字化,是指将任何连续变化的输入如图画的线条或声音信号转化为一串分离的单元,在计算机中用0 和1 表示[1]。纸质档案数字化是指采用扫描仪或数码相机等设备对纸质档案进行数字化加工,将其转化为存储在光盘、磁带、磁盘、移动硬盘等载体上并能被计算机识别的数字图像和数字文本,并按照纸质档案的内在联系,建立目录数据与数字图像和文本的关联关系的处理过程。
(二)意义
档案数字化是为建立档案信息全文资源库做准备的,即为数字档案馆建设打基础的一项工作。目前,大多数馆藏档案载体仍然是纸质为主,存在占用空间大,保管成本高,档案实体易磨损、易霉变,而且查询效率低,利用不便捷,难以满足用户对信息资源的需求。
档案数字化就可以解决传统管理模式存在的这些问题,让沉寂在库房的档案亮起来,价值得以最大化,具体有如下优势。
1.有利于实现档案信息共享
纸质档案通常以一份存在,不可以同时两人共享,而数字档案则可以实现异地远程利用,不再受“孤本”的限制,可以多人在线查阅,实现档案信息资源共享,将档案增值。
2.有利于档案方便快捷地提供利用
用户可以不用去库房借阅档案,以零跑腿的方式即可在线查阅到所需资料,减少了时间成本,大大提高了工作效率[2]。
3.有利于保护档案原件
档案的原始记录性、凭证性和唯一性决定了档案是真实记录历史的重要载体,因此,保护档案原件是档案工作的重要内容之一。档案数字化后,档案利用从纸质原件转移到数字副本,原件利用率会大大减少,从而得到了更有效的保护。
4.有利于档案信息资源的开发利用
进入档案信息管理系统可以了解档案各个年代,各个阶段的历史全貌,通过网络终端随时查阅、整合、编辑丰富的档案资源,为档案人员开展编研工作提供方便,为用户了解企业发展的情况,以及产品设计的过程等专业需求提供途径。
二、纸质档案数字化的基本原则
(一)遵守法规、遵循标准
库藏档案的数字化,必须遵守国家档案公开和保密的法律规定以及其他相关规定,必须符合企业各层级档案和保密相关规定与要求。同时档案数字化的开展应以国家、行业、企业的相关标准为基础。
(二)注意保密、保障质量
项目实施过程中应谨守“保密”红线,严格按照保密工作要求开展档案数字化加工和电子文件工作,加强管理和制度保障,对档案人员及外包单位进行保密培训,强化保密意识,重点考查外包单位保密资质、确保全程监控等。为保障项目实施效果的质量,编写实施方案及一批项目实施过程中需要使用的规范性工作文件,明确填写要求,最终作为验收备查资料一并留存。
(三)价值优先、便于利用
数字化对象的鉴选以价值性、利用率为原则,即优先对属于归档范围且永久或长期保存、对企业科研生产活动利用价值更高的档案进行数字化,为用户提供更加方便、快捷、多元的使用方式和途径。
三、纸质档案数字化的流程
在进行档案数字化工作时,必须梳理出流程框架,明确具体操作方法,做到心中有数,开展起来才能得心应手,下面从项目调研策划阶段、合同签订阶段、实施阶段三方面进行介绍。
(一)调研策划阶段
档案管理人员对行业内多家单位的数字化工作进行调研,掌握多家外包单位的扫描状态,选择最优保密资质的数字化加工公司。从扫描效果、经费、进度、交接、人员、场地、保密七方面对外包单位加工情况进行比较分析。
例如了解用户对数据档案PDF 的单双层需求,双层PDF 的优势在于可以对电子档案的内容复制、粘贴,也可以搜索关键词进行全文检索。根据图纸的清晰度确定扫描的分辨率,一般情况下300DPI 即可,对于清晰度低的文件或大幅面的蓝图需要扫描分辨率600DPI。获取外包单位的具体报价情况,及人员配备和软硬件设备是否到位,根据本企业的预算及进度需求选择加工单位。承包给外包单位扫描,单位内均需设专人负责此项工作,包括与外包单位的沟通协调、合同签订、整理出库、数据导入、质量控制、瀚海挂接、目录与实体核对、组卷上架等相关工作。根据企业内的条件选择场地,确定将档案送出去扫描还是请外包人员进驻现场扫描,并全程跟踪监控。外包单位必须具有完备的业务资质、保密资质和履约能力。扫描后的数据如何储存内网,一般分两种方式,一种是通过光盘传输返回,再将光盘里的数据档案导入内网,另一种是外包公司派人自带设备直接入驻企业内,组建局域网进行数字化加工,通过部门硬盘导入内网。
(二)合同签订阶段
与外包单位商谈价格、进度、交接等方面的内容后,制定外包方筛选方案,通过单一来源采购、邀标、谈判、公开招标等方式选择合适的承包方。签订书面合同,形成正式的委托与被委托的法律关系,合同条款内容应符合单位合同管理的相关要求。签订合同后,在企业内完成合同审批表、涉密档案数字化保密协议书流程。
(三)实施阶段
开展档案数字化工作时,首先完成扫描对象、载体形式、数量等统计工作,确定数字化范围,结合企业档案的密级性、保管期限、价值性,进行出库前处理,最终真正实现所有库藏档案的数字化。
1.电子文件转换挂接
对既有纸质档案又电子版本的情况,将系统中的电子版下载挂接。下载转换前,需要先确认每份文件的技术状态和版本,若只有一个版本,后续也未曾更改,则可直接下载、转换;若存在多个版本,则需要找相关人员进行版本确认,确保下载的版本属于该归档阶段所需版本。对于已经在档案管理系统或网盘存有的非PDF 格式的档案,需要信息化手段进行转化和挂接。
2.纸质档案出库
对于纸质档案出库必须由专人负责并成立档案数字化小组开展项目的实施,负责出库管理,具体有以下四方面的操作步骤。
(1)档案管理系统中将数字化加工范围各门类的目录导出,并按照档案出入库登记表进行整理,作为与外包单位的移交凭证,在后续工作量统计、档案实体状况检查、档案归还等工作中都将以此为重要参考文件。
(2)开展纸质档案调取、清点、登记等前期准备工作。统计并检查出库档案的密级、纸张幅面、页码顺序、页数、页面质量等,确认无误后在计算机上补充填写。
(3)开启档案出入库登记表的审批流程,经相关部门负责人批准后,与档案数字化实施人员共同清点无误后,办理出库交接。
(4)为确保档案的安全性,需要双人将出库的纸质档案运到数字化加工场所,按照登记表与外包单位核对、签字、移交。
3.目录数据库建设
目录数据库建设与数字化前档案整理登记工作同步开展,按照DA/T18《档案著录规则》的要求,完善各门类档案著录项[3]。在档案出库登记阶段,每一份目录数据都需两人交叉互查,采用互查方式对目录数据的质量进行检查,确保著录项目的完整性、著录内容的规范性和准确性等,发现不合格的数据应及时修改并加以标注。
4.实物与目录数据一一核对
档案数字化前处理工作,首先逐份逐页梳理归档资料,将纸质档案实体与档案管理系统的目录数据库一一核对,保障在库档案的系统性、准确性、完整性,并进行目录数据更改,确保每份档案的档号、题名、密级、份数、页数保持一致,如发现有冗余档案进行剔出,鉴定销毁,如有光盘,将其整理存放光盘柜,最终进行系统梳理。
项目实施阶段开展的工作相互配合、互相补充、共同推进,实现库藏档案的全部数字化、电子文件归档的科学规范化,建立档案全文信息资源库。
5.返回档案核对入库上架
外包单位将扫描后的数据以卷为单位,每份以档号命名进行打包传输,并填写纸质档案数字化成果移交清单移交。双人负责将送到外包单位的纸质档案与档案出入库登记表核对无误后运回档案库房,按原库位规划整理上架,并将返回的数据导入网盘备份。及时完成数据与纸质档案逐份逐页核对,有问题及时反馈。
6.档案数据瀚海挂接
成立验收小组,借助批量挂接软件进行档案管理系统中的目录数据与对应数字图像的挂接,以实现目录数据与数字图像的关联[4]。逐条对挂接结果进行检查,包含目录数据与图像对应的准确性、已挂接数字图像与档案实体和实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时纠正。
数字化加工的基本流程、各流程责任者及每个环节的主要工作内容如上图。
纸质档案数字化基本流程图
7.成果验收
档案数字化成果质量达到验收指标要求,予以验收“通过”。验收未通过应视情况进行返工或修改后,重新进行验收。验收完成后须经验收组成员签字。验收“通过”的结论,必须经相关领导审核、签字后方有效。验收结论应与其他数字化工作文件一并归档留存。
返回的电子档案需要质量审查,数字图像不完整、图像歪斜、清晰度差或失真度较大导致无法识别时,应重新扫描;对于漏扫、重扫、多扫等情况,应及时改正;图像的排列顺序与档案原件不一致时,应及时调整;对图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,不符合图像质量要求的,重新进行数字化加工,重新进行图像处理,无误后,再与档案管理系统目录一一对应进行核对挂接[5]。
信息技术的飞速发展,海量数据的不断产生,传统的档案管理模式已不能满足大数据时代的需求。通过近些年的工作探索与实践,纸质档案数字化流程逐渐成熟,在企业发展中的应用日渐广泛,形成一种以“智慧档案馆”为目标,“精细化流程、信息化管理”为手段的管理模式,也为建立档案信息资源库、用户提供利用、档案编研储备资源,建设数字档案馆做准备。