纸质档案数字化流程和要求
2021-10-12方草地
方草地
摘要:随着我国档案事业的飞速发展,纸质档案难以满足日常利用和保管需求。而档案结合现代化技术进行数字化处理后,能进行异地查看、异地保管等,也更有利于档案的保护和利用。本文对纸质档案数字化流程和要求进行了简单的介绍,希望对档案工作者有所启发帮助。
关键词:档案;档案数字化;数字化流程
1组织与管理的确定
在《纸质档案数字化规范》DAT 31-2017中,明确提出一、应建立纸质档案数字化工作组织,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等,确保数字化工作的顺利开展。二、应配备具有相应能力的工作人员,包括熟悉档案业务并具有较高的调查研究水平和良好的组织领导能力的管理人员。三、基础设施(一)配备专用加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。(二)、加工场地的选择及温湿度等环境的控制有利于档案实体的保护。场地内应配备可覆盖全部场地的防火、防水、防有害生物、防盗报警、视频监控等安全管理的设施设备。(三)合理规划、配备和管理纸质档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。四、工作方案(一)在充分调研的基础上,制定科学合理的工作方案,确保纸质档案数字化工作达到预期目标。(二)纸质档案数字化工作方案应包括数字化对象、工作目标、工作内容、成本核算、数字化技术方法和主要技术指标、验收依据、人员安排、责任分工、进度安排、安全管理措施等内容。数字化对象的确定应综合考虑档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素。
只有做好前期工作的组织与管理,配备相应的人员和设施设备,制定符合要求的办法,才能对工作流程进行控制,才能对数字化质量进行把关。组织与管理的确定,人员设备和场地的选择,直接关系到档案数字化工作的全过程,相关人员需要提高认识,编制对应的工作规划和方案,才能满足数字化工作的要求。
2数字化前处理
在进行数字化前,还要做相应的数字化处理工作,以便于数字化工作的开展。其中有:确定扫描页、编制页号、目录数据准备、拆除装订、技术修复等内容,另外还需注意每一步工作都需要严格按照工作要求、岗位制度要求来进行。员工岗前需要进行专业培训和保密培训,并且需要签订保密协议等,入场工作人员不能携带手机、硬盘、相机等,禁止私自拷贝、上传工作图片。
3目录数据库建立
目录数据库的建立主要有:目录数据库数据规则、数据库选择、数据库结构的设计、录入数据库。内容重点为数据库的选择上数据字段长度、字段类型、字段内容要求等,在纸质档案目录准备与目录数据库建立工作中均应严格遵守,避免后续挂接对应不上。数据库除特殊要求以外也应考虑转换为通用数据格式,以便于数据交换和利用。在结构上还要注意保持档案的内在联系,有利于管理和利用。
4档案的扫描
4.1扫描设备
档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,在设备的选择上要注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。对于超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描(如工程图纸),也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理,如果采用拼接方式处理的,需要留有足够的重叠区域,采用软件拼接的,重叠部分不应小于三分之一。
4.2色彩模式
为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。如果页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。如果页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。
4.3扫描分辨率
综合考虑数字图像后期利用方式等因素的前提下选择扫描的分辨率,通常要求扫描分辨率不小于200dpi;一般的屏幕閱读,采用黑白二值、灰度、彩色几种模式对资料进行扫描时,其分辨率选择300dpi;需要进行OCR汉字识别的资料,选择分辨率为300dpi;特殊情况下,如文字偏小、过于密集、清晰度较差等,可适当提高分辨率。
4.4存储格式
纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF或双层PDF等其他格式。需要注意的是,采用OCR识别的需要存储为双层PDF,同一批档案应采用相同的存储格式。
4.5图像的命名和处理
图像命名方式的选择应确保图像命名的唯一性,应以档号为基础进行命名,另外还需考虑是单页存储或者是多页存储,选择对应的方式命名。
图像在处理时,要考虑图像的实际情况,选择图像拼接、旋转及纠偏、裁边、去污等操作工序进行处理,以保证图像的质量。并且,处理完的图像应进行质量检查,发现不符合质量要求的,要及时重扫并重新处理检查。
5数据挂接与验收移交
在完成扫描工作后应借助相关软件对数据库中的目录数据与其对应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。挂接完成后,应逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。
档案部门应成立专门的验收组对数字化成果进行验收,采用计算机自动检验与人工抽查的标准进行检验。采用计算机自动检验的,需要合格率为100%,不能采用计算机检验的,人工检验率不得小于5%,其中数据库与图像的对应上,合格率为100%,其他内容合格率为95%。
6结束语
通过本文我们知道了档案数字化工作的流程和要求,在2021年1月1日实施的《中华人民共和国档案法》中,特别提到各级人民政府应当将档案信息化纳入信息化发展规划,保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用。档案馆和机关、团体、企业事业单位以及其他组织应当加强档案信息化建设,并采取措施保障档案信息安全。所以作为档案工作者,提高对数字化工作的认识是必不可少的,希望本文对相关工作人员在档案数字化工作中有所帮助。
参考规范
[1]《中华人民共和国档案法》
[2]《中华人民共和国保守国家秘密法》
[3]《纸质档案数字化规范》DAT 31-2017