国内纸质档案数字化成果质量现状研究
2018-01-23李艳娟
文·李艳娟
当前,国内的档案信息化已进入全方位、多层次实施阶段,存量数字化、增量电子化是档案信息化建设的两大数据来源。然而,以利用为主导和目的的档案数字化,质量体系还存在较多不足,数字化成果的质量还有待于进一步提高。笔者就当前档案数字化成果质量普遍存在的问题做一简要分析,以求与专家同行共同探讨提高。
一、影响档案数字化质量的因素分析
影响数字化档案质量的因素有多种,比如,数字化建设方和加工方是否共同制定有合理的质量计划,数字化加工方是否有完善的质量保证措施和严格的质量控制过程,数字化过程中加工方、监理方、验收方等各环节是否协助密切良好等。
(一)加工环节
在数字化加工环节,数字化加工服务单位针对数字化的机制和各项工作制度是否完善,项目经理数字化加工过程中管理经验是否丰富,数字化加工流程是否得到充分优化,数字化加工流程各环节上的加工人员是否得到足够的培训和技术指导,是否有专门的质量检验环节,质量检验工作是否科学、高效、准确,以上所述均为影响数字化加工成果质量的重要因素。
1.项目经理因素。实际工作中,数字化加工服务单位很多会同时担负多个建设单位的数字化任务,导致有经验的项目经理紧缺,一些仅仅参加了管理培训的人员被推上了项目经理的岗位,致使项目经理角色在项目上应有的作用发挥不出来,特别在数字化加工现场这种动态变化的场合,数字化加工流程各环节在人员、设备、技术等方面的优化上,就会显得生疏、死板或无计可施。
2.具体操作人员因素。数字化加工流程各环节操作人员的技术成熟度和认真度,对数字化成果的质量至关重要,毕竟成果是这些人员的共同操作的结果。前处理人员若漏编页码或编页有误,就会直接影响目录著录人员的著录页码或页数有误;目录著录人员需要严格按照相关著录标准实施著录工作,一走神可能就会有错字生成、目录串行、数字误差、时间不符逻辑等问题产生;由于纸张薄弱再加上翻页较快,扫描人员也可能会产生漏扫情况;图像处理环节会出现漏裁边,等等。这就让作为数据质量把关的质检环节显得尤为重要。由于集中到此的数据量巨大,人工质检任务繁重,若再没有较好的自动质检工具进行辅助,如此交付的数字化成果质量将会大打折扣。
(二)监理环节
档案数字化监理的作用不可小觑,对数字化成果质量的监理应是其工作中最重要的一部分。从加工方交付过来的包括目录数据和数字化原文数据在内的大量数据,在严格按照建设方要求的情况下,会大大占据监理方工作人员的时间而无暇顾及其他监理活动。如果监理方因成本限制而削减人员的投入数量,或在监理成效和监理进度上作出权衡,将会对数字化成果的监理效果起到一定的消极作用,原本可能该百分百监理的数据,变成了一定程度的抽检,高抽检率变成了低抽检率。
再者,很多监理单位纯靠人工进行数据检查,而没有成熟的自动化工具的辅助,大大削减了他们的监理能力。原本很多可进行标准化检测的项,如漏扫、漏著录、页数页码错误、时间错误、图片不可读、分辨率不够、漏裁边、密级有误、档案件重复等,完全靠人力而非自动进行检测,会大大浪费人力资源和降低工作效率,且会有相当一部分质量问题项被非人为地埋没或忽略掉。
(三)验收环节
建设方一般组织自有人员成立验收小组对监理交付过来的数据进行最终验收。而多数情况下,验收方式会采用一定比率的抽检。人工抽检和自动工具抽检并用的方式,当然是较为理想的方式,但据笔者了解,相当多的建设方验收环节都是纯人工验收,他们或没有使用自动抽检工具的意识,或找不到理想的自动抽检工具,验收效率可想而知。
二、数字档案馆系统测试工作中的档案数字化
为促进我国数字档案馆建设向更深层次发展,2014年12月国家档案局发布《数字档案馆系统测试办法》(以下称为《办法》),并于2015年开始在全国实施“国家级数字档案馆”和“国家级示范数字档案馆”测评工作。《办法》中把馆藏纸质档案数字化率作为档案馆能否参与测试的硬性指标之一,而测评指标的100分中有33分是针对纸质档案数字化的,5分是针对数字化档案质量的。由此可见,档案数字化加工成果质量在数字档案馆建设中占有很重要的地位。可以说,全国范围内的数字档案馆系统测试工作,正有力推动着各级档案馆加强对数字化档案质量的重视程度。
对于已经完成纸质档案数字化工作的档案馆,要想通过“国家级数字档案馆”或“国家级示范数字档案馆”测试,对数字化成果质量的再检测并对查出的问题进行修正,已成为系统测试前的一项重要工作。而人工检测+自动检测已成为各级档案馆数字化档案质量检测方案中的一个标准检测模式。
而未开始或正在纸质档案数字化进程中的档案馆,也急需一种强大的自动检测工具,减轻人工质量检测工作的负载,帮助他们高效率地提高数字化档案的质量,以期顺利通过数字档案馆的系统测试。
三、数字化档案质量检测工具现状分析
档案行业的信息系统,一直以来被认为小众系统而不被计算机特别是软件行业的大小巨头所看中,随着国家档案局对数字档案馆建设的不断推动且在全国范围内遍地开花,大小巨头们都逐渐把更多的注意力投向档案行业。分别基于局域网、政网和外网的档案系统,国内有几家软件行业的大佬已向市场提供较为成熟的产品。而谈到数字化档案质量检测方面的软件系统,基本被市场忽略或不屑一顾。原因很简单,一是质量检测只是档案行业档案数字化工作众多工作环节的其中之一,体量偏小而容易被轻视;二是针对数字化档案质量检测,国家目前还没有出台相应的检测标准;三是对软件行业来说,不像电子档案那样,只要根据国家的关于档案“四性”检测的相关规范,研发符合电子档案归档规则或电子档案封装规范的检测系统即可,数字化档案的情形就稍显复杂,出现质量问题的可能点较多,所以开发数字化档案质量检测系统的难度就偏大一点;四是软件行业的产品经理和工程师们无暇顾及数字化档案质量产生的相关细节,所以也无法有针对性地研发数字化档案质量检测方面的软件工具。
笔者曾参与或观摩过本地几个档案部门的档案数字化工作,也曾与几个数字化加工和监理单位的负责人沟通交流,普遍反映自己没有拿来即用的检测工具,即便有,也是针对某个档案馆(室)特定的需求而临时开发的。这些检测工具具有以下特点。
(一)检查不全面
数字化档案的质量问题种类较多,如,JPEG图片漏扫,PDF原文漏页、目录漏著录、页数与实际原文不对应、目录与数字化原文挂接串位、起止页码(如果有)著录有误、密级有误、形成时间逻辑错误、图片不可读、PDF原文不可读、图片分辨率不够、图片漏裁边、图片倾斜度过大、图片不清晰、档案案件重复、案卷整卷漏扫、目录中错别字、责任者不对应、文号有误、文号漏填、年度(如果有)有误、形成时间误差、标题与原文内容不对应等20余种。数字化加工方或监理方或验收方所使用的检测工具,很多仅仅包括上述质量问题的一小部分,很多方面的质量问题无法检测而被交付到了数字化成果库,给以后的数字档案馆系统测试埋下了隐患,更加影响档案的公众利用。
(二)普适性较差
目前绝大部分数字化档案质量检测工具都存在普适性差的弱点。表现在,在一个档案数字化场合能够正常使用,而到另外一个档案数字化场合使用时,遇到几个增加或稍有变化的自定义档案目录字段就基本瘫痪;能够实施自动检测,但无法用于人工检测;数字化加工方、监理方、验收方等都能单独使用,但三方(多方)同一个检测系统中无法协作使用,缺乏统一的质检流程上的管理。
档案数字化最终成果的好坏,是多环节多方面共同作用的结果。数字化加工服务单位在其中扮演的角色是最主要的,制度优良、管理人员经验丰富、团队训练有素是合格的数字化加工服务单位必备的条件;监理工作能为档案数字化成果质量的提高保驾护航,锦上添花;自动质检和验收系统作为一种重要的质量保证手段,不仅能够提高效率、节省人力,更能在发现关键质量问题上起到不可或缺且无可替代的作用。传统档案的数字化工作,其完整的质量体系,应为数字化加工方、数字化监理方和数字化验收方三方,在各自质量体系的基础上,共同制定形成的,在整个数字化过程中统一实施并进行控制的质量措施。