APP下载

档案数字化扫描质量及安全控制

2022-02-14李如岩

兰台内外 2022年1期
关键词:纸质图像数字化

文/李如岩

根据《纸质档案数字化规范》的相关规定,数字化是指利用计算机技术将模拟信号转换为数字信号的处理过程。档案数字化是将纸质、图片、录音、录像等不同载体档案资源转化为数字化档案信息,它是随着数字摄影技术、数据库技术、多媒体技术、扫描线性CCD技术、计算机技术、扫描技术、OCR技术和存储技术的发展而产生的一种新型档案信息形态。档案数字化是数字档案建设的一项最基础性工作,是将各种形态档案以数字化形式存储、以网络化形式互连,并利用计算机技术进行管理,从而构建起有序结构的档案信息库,实现档案信息资源共享。

由于各类档案形成的历史沿革不同,以纸质档案为例,其形成的纸质载体种类多样,有宣纸、麻纸、再生纸等,若需要满足档案扫描后图像符合查阅浏览要求,就需要根据不同纸质载体质地、类型、大小、字迹的扫描技术条件,通过前端、中端、末端全过程质量控制,切实提高档案数字化质量。此外,档案数字化形成大量电子档案数据信息,与传统档案管理面临的安全形式不同,需要切实提高档案数字化安全控制能力和水平。

1 档案数字化扫描全过程质量控制原则

从档案数字化前端、中端、末端全过程质量控制的内容、要求和特点来看,应坚持全过程质量控制的原则,把这些原则和要求贯穿于档案数字化扫描全过程。

1.1 质量控制原则

所谓质量控制是指为达到质量要求所采取的作业技术和活动。就档案数字化扫描而言,就是要通过质量控制,使纸质、照片等不同载体形态的档案扫描达到数字化标准和要求。这就需要坚持全业务流程、全员、全方位质量控制原则。认真梳理档案数字化扫描业务流程节点,确定节点质量、标准和要求、业务人员与其关系、档案流转情况、工序内容等,通过“工序环节”为基础的质检和“业务人员”为基础的管理两套流程体系,全面、全员、全流程把控档案数字化扫描质量。

1.2 问题导向原则

所谓问题导向,就是把“问题”作为研究制定政策的落脚点,把解决最突出的矛盾作为着力点,系统分析、研判档案数字化过程中各类风险隐患,明确影响质量控制的各类因素,从而在后期数字化实施过程中进行有效规避。从档案数字化扫描前端、中端、末端的分析来看,其风险因素包括管理、规范、业务、技术、机构及安全等六个方面,每一个方面中又涉及若干情况,需要具体问题具体分析。

1.3 价值、保护和利用优先原则

档案数字化扫描是一项规模浩大的系统性、基础性工作,需要按照价值从优、保护从优和利用从优的原则,循序渐进、稳步实施。价值优先,即,优先将特殊馆藏、字迹褪变、年代久远的珍贵档案优先进行数字化扫描。如河东区档案馆档案数字化扫描优先将珍贵历史资料29223卷、照片档案78册2596张进行整理以及数字化扫描。保护优先,一方面要求对字迹模糊、破损等具有高灭失风险的档案优先进行扫描;另一方面则是要求始终把保护放在首位,贯穿于档案数字化全过程。利用优先,则是指根据馆藏档案借阅登记、查询利用情况的分析,确定高频利用档案范围,优先对其进行数字化扫描。如,河东区档案优先将教育、就业、医疗、养老、社保、不动产等档案优先进行数字化扫描。

1.4 适宜性原则

档案扫描数字化应用到各种先进技术,有些档案因技术制约而暂时达不到预期转化效果;或达到转化效果而因容量大、传递速度慢、利用不便又不适宜档案数字化。这时就需要暂缓对这一部分档案数字化,待技术发展成熟再进行数字化扫描,总之,档案数字化扫描应始终坚持适宜性原则,综合考虑成本、技术等各方因素。

2 前端控制:档案数字化扫描前质量控制

档案数字化扫描前端质量控制,是指在纸质档案等档案转化为电子档案信息之前进行适时的前端控制、干预,保证档案齐全完整、数据信息长期可用和安全。在开展档案数字化扫描之前,需要开展一项十分重要的基础性工作,需要通过拆卷、修复、整理等对数字化档案的对象进行梳理和界定,为档案数字化做好各项准备工作。

2.1 成立工作机构

档案数字化扫描涉及诸多业务、技术和法律问题,尤其是技术应用,需要拥有过硬业务能力的人才能承担。人员素质直接关乎着档案数字化扫描工作质量。因此,在开展档案数字化扫描工作前,应成立高质量的档案数字化工作领导小组,小组负责人由单位主要负责人担任,领导小组成员由分管负责人、相关技术、法律及档案管理人员组成,定期研判档案数字化质控过程中遇到的问题,及时予以解决。如,某档案馆成立档案数字化工作领导小组,领导小组下设设计组、数据组、编码组、测试组、文档组合服务组,各小组按项目流程协同工作,在领导小组领导下分工负责、各司其职。

表1:档案数字化人员安排表

2.2 把准工作需求

在正式开展档案数字化扫描前,需要对馆藏档案资源数量、类型、利用等方面的现状进行深入调研,结合档案馆自身的经济能力、技术储备等进行准备。既不能蛮干硬上,无论档案是多是少“先数字化了再说”,也不能毫无目标、漫无目的地为了数字化而数字化。需要在充分进行现状调研的基础上,进一步地分析研判或通过发放征求意见表等形式,开展档案数字化需求调研,并制定档案数字化进程时间表、任务书等,掌握进度,控制质量。

2.3 选定工作对象

按照价值优先、保护优先、利用优先和适宜性原则,选定档案数字化扫描对象,结合本次档案数字化工作,进一步明确馆藏档案中哪些档案资料需要数字化,哪些档案资料不需要数字化,及时剔除无价值、应销毁的档案,将宝贵的档案管理资源应用到关键处。在选定档案数字化扫描之后,根据数字化目标要求,进一步确定档案数字化顺序,保证档案数字化扫描工作循序渐进,压茬推进。

2.4 制定工作方案

制订详细的档案数字化实施方案,涵盖档案内容及数量、档案数字化环节及质量要求、档案验收、档案安全要求等档案数字化需求分析;人员及设备配套等档案数字化实施准备;档案借出、分卷、录入、检查、扫描、处理、挂接、刻盘、入库等档案数字化项目实施流程质量要求;以及现场安全事项。总之,档案数字化方案应是针对整体档案数字化全过程中各环节、因素制订详细计划、程序,用以指导档案数字化工作有序开展。

2.5 严控工作流程

从调卷、核对、整理和目录对接等四个方面全流程把控质量。例如,调卷,需要以“年度”为单位,安排专人负责将馆藏档案原件调出至数字化工作现场,并逐一进行清点、核对和登记。再如,核对,由工作人员认真核对即将进行数字化扫描的档案材料,按照年度、机构、目录号逐件、逐卷、逐页核对清点。还如,整理,在核对无误后,将领取的档案根据扫描需要进行平整、分页、纠正等整理工作。最后是目录对接,即档案材料与档案管理系统中的目录一一对应。

3 中端控制:档案数字化扫描中质量控制

扫描工作是档案数字化工作的核心和关键,其质量控制直接影响到档案数字化工作整体质量,就纸质档案扫描而言,需要把控好档案扫描、图像预处理、图像处理、图像质检等工序环节中的每个流程质量关,严把流程质量控制点。

3.1 档案扫描

根据馆藏档案纸张幅面大小、破损程度确定相应规格及型号的扫描仪,例如,对纸张状况较差且保存年代久远、出现严重破损的纸质档案推荐使用平板快速扫描仪,在后期扫描过程中应将纸质档案端正放置,避免前后纸张出现重叠的情况,可确保扫描的纸质档案内容完整,而相对于纸张状况保存较好、保存年代较近的纸质档案,建议使用高速扫描仪,增强纸质档案扫描的速度和效率。

3.2 图像预处理

在纸质档案扫描后、分配给图像处理人员图像处理前,还需要对扫描后的图像进行相应的预处理。先是要对纸质档案图像进行矫正倾斜度,去除纸质档案中的杂点、黑边,提升纸质档案文字效果等自动批量化处理,要保证图像经预处理后的倾斜度<90%,处理后的图像杂点、黑边被大面积去除。

3.3 图像处理

经过预处理之后,还需要根据档案保存标准和要求,进一步做好图像的相关再处理。逐页检查扫描后的图像,即,要做到扫描图像文件检查全覆盖,对仍然存在黑边、倾斜、网纹的扫描图片要进一步做好去黑边、纠偏、去网纹等技术性处理,要保证扫描图像正文内容、页眉页脚、印章、注释等内容与原纸质档案内容一致。进一步清除干净因扫描过程中操作不到位而留下的黑线、阴影及指印等。对于分开处理的图片档案,经相关处理后,还需要对其进行拼接,确保纸质档案扫描图像的完整性。

3.4 图像质检

纸质档案经扫描、预处理、处理后,档案数字化质检人员应按照规定,以不低于50%的比例抽检处理后的纸质档案。纳入抽检范围并经过抽检的图像文件,要确保经99%以上的质量合格率。未达到这一合格率的,需要将不合格图像进行返工处理,交由档案扫描人员和图像处理人员重新进行处理,经质检合格的图像文件则进入下一步工序。

4 末端:档案数字化扫描后质量控制

档案经扫描、预处理、处理和质检合格后,还需要进行一系列“后期”处理,这一环节的质量控制也十分关键,直接影响到前期档案扫描成果,以及后期档案数字化利用及安全。

4.1 图像挂接

经质检合格的图像文件按照卷内目录意义对应的原则,挂接于专门的档案管理应用系统,且,挂接完成的图像文件应保持与卷宗中的实物档案顺序一致,即,扫描的图像文件与档案条目数据之间保证对应关系,挂接准确率应保证在100%。

4.2 挂接质检

为了保证图像挂接准确率达到100%,需要进一步做好挂接质检工作,以免影响到档案数字化结束后档案利用效果。质检的内容既包括图像与条目数据质检是否一一对应,也要检查挂接的每一张图片是否达到可读性、正确性、完整性,以及是否满足相应的技术处理的相关要求。

4.3 档案整理

为满足档案扫描的现实需要,需要对档案文件进行相应的拆卷、修补等工序,经扫描完成后,需要按照归档标准对其进行整理。例如:原文顺序是否准确,破损纸质文件是否修复、装裱,不合格的装订物是否进行了更换,“三孔一线”装订后是否存在压字、缺页、顺序颠倒、装订不齐、脱页等情况,以及卷皮、卷内目录与原文不一致等情形。

4.4 数据备份

数据备份旨在进一步加强档案信息的安全性,通常选用移动硬盘备份或者一次性写入光盘备份,且至少应备份2套。

4.5 成果验收

主要是将扫描后的实体档案验收和数字化扫描成果的成品总验收。档案数字化扫描完成相关的图像挂接、质检、数据备份等工序后,需要将实体档案归还,要做到当日领卷当日归还,主要验收归还的档案卷数、件数是否与实际一致,是否存在应归还未归还的情况。另一方面的验收,就是按照档案数字化的标准和要求,验收目录录入准确率、图像挂接正确率、图像处理及档案材料扫描质量、破损文件材料修复,以及实体档案和移交数据的完整性。经验收合格的,需要交验双方签署“成品数据提交清单”,验收不合格的,就要纠正。

5 档案数字化扫描安全控制

近年来,随着经济社会的快速发展,尤其是技术进步、更新迭代加快,数字档案馆建设步伐加快,档案数字化成为时代发展的趋势和要求。与传统档案管理相比,档案数字化过程中也面临着许多非传统的安全因素威胁,应综合施策,确保纸质材料及电子数据安全,从人、物、技三个方面织密安全网。

5.1 人防:增强安全保密意识

建立档案数字化安全保密领导小组,加强安全保密知识培训,增强安全保密意识及能力。根据档案数字化扫描前、扫描中、扫描后的工序特点,采取针对性、精细化的安全保密法则培训。例如,扫描前要重点做好环境、制度等方面安全保密培训,严禁私自带入移动存储工具进入工作场所;扫描中要做好档案本身安全;扫描后,则要重点做好网络利用等安全,委托第三方数字化扫描的,应及时将数字化成品信息载体或复制件返还、销毁。

5.2 物防:营造良好工作环境

为保证档案数字化扫描工作的安全、高效进行,需要建立与之相适应的软硬件环境,做好物防。如,做好服务器、网络交换机、计算机选用,空调、恒温机、除湿机也是安全设施的重要保障,购买高质量一次性可读写光盘或移动硬盘。及时做好数据迁移和载体更新,避免因技术升级不及时或设备载体老化影响档案数字化安全。

5.3 技防:注重技术保障应用

运用先进技术,建立完备的档案数字化安全风险监控体系。例如,运用好计算机病毒检测、入侵检测、防火墙、漏洞扫描、网络监控、安全审计、身份认证等技术手段,安装操作系统,及时更新查杀病毒软件,防止非法访问。重要涉密档案数字化信息应与互联网物理隔离,使用密钥、单导盒等,阻止网络攻击。

猜你喜欢

纸质图像数字化
推动内部审计工作数字化的探究
数字化起舞
高中数学“一对一”数字化学习实践探索
为什么要读纸质书
高中数学“一对一”数字化学习实践探索
A、B两点漂流记
电子疲劳
独立书店浪漫的纸质生活
名人语录的极简图像表达
一次函数图像与性质的重难点讲析