APP下载

基于图像扫描的电子档案生成系统的运用分析

2019-11-11马丽张雪

卷宗 2019年30期

马丽 张雪

摘 要:受档案数字化浪潮影响,基于图像扫描的电子档案生成系统受到我国档案管理业界的广泛重视。基于此,本文将简单介绍基于图像扫描的电子档案生成系统,并深入探讨基于图像扫描的电子档案生成系统运用要点,希望研究内容能够为档案管理人员带来一定启发。

关键词:图像扫描;电子档案生成系统;图像扫描设备

为满足档案数字化管理需要,档案信息采集问题的解决极为关键,基于图像扫描的电子档案生成系统因此应运而生。电子档案生成系统可通过扫描仪将各类纸质档案转化为电子档案,档案管理工作可由此更好适应时代发展,而为了实现对电子档案生成系统的合理使用,正是本文围绕该课题开展具体研究的原因所在。

1 基于图像扫描的电子档案生成系统

基于图像扫描的电子档案生成系统一般由电子档案生产软件、服务器、数据录入设备、计算机设备、光盘柜组成,计算机设备包括图像扫描工作站、识别校对工作站、数据服务器,电子档案生成系统的图像扫描设备一般可挂接市面上主流的高速图像扫描设备。电子档案生成系统采用的软件主要有信息卡表格描述、数据输出描述、校对处理、智能数据识别、多种图像格式存储等。光盘柜则主要由光盘镜像服务器、光盘刻录机组成,用于图像、数据的存储,并能够提供检索服务。在电子档案生成系统的具体应用中,表格描述、图像处理、条码识别、智能识别、OMR识别、逻辑检查、数据处理均属于系统所具备的具体功能,充分应用这类功能与图像扫描技术,即可保证基于图像扫描的电子档案生成系统较好服务于档案数字化发展[1]。

2 基于图像扫描的电子档案生成系统运用要点

2.1 合理选用图像扫描设备

为保证基于图像扫描的电子档案生成系统更好为档案数字化管理提供支持,图像扫描设备的合理选用必须得到重视。对于一般单位来说,图像扫描设备的选用需在一定程度上考虑成本节约,因此应在充分利用原有扫描设备的基础上,考虑是否需要引进新型扫描设备,这一过程需考虑档案数字化管理的具體需求。以某单位为例,该单位曾在2005年购入一台平板扫描仪,型号为EpsonGT15000,至今仍保持良好工作状态,可满足一般文档、尺寸不规则文档、纸张较薄的纸质档案扫描需要,能够在一定程度上满足电子档案生成系统的运用需要。但为了进一步提升档案数字化管理水平,充分发挥电子档案生成系统优势,该单位基于经费充足考虑,在2018年购入了一台新型扫描仪,型号为EpsonD60000,这一扫描仪带有馈纸器,支持自动进纸双面高速扫描与手工平板扫描,基于图像扫描的电子档案生成效率因此实现长足提升。配合同时采购的成册扫描仪(M2030-PR0),电子档案生成系统在应用中可能出现的文字识别功能故障可有效规避,并满足更为多样化的图像扫描需要。

2.2 合理选择扫描加工人员

扫描加工人员在基于图像扫描的电子档案生成系统运用中发挥着关键性作用,这是由于该工作本身具备较高专业性,因此扫描加工人员的选择必须从文字录入、图像处理、故障诊断等方面的技能掌握情况出发。结合档案数字化管理需要,不同单位需参考自身实际需要,打造相对稳定的扫描团队。如档案扫描工作量相对较少,单位可采用临时招聘纸质档案扫描人员的方式,这类人员的劳动成本较低、扫描加工效率较高,如档案保密度较高、扫描工作量较大、录入时效性要求较高,则需要设置专业的档案管理人员负责档案扫描加工,配合针对性的专业培训与讲座,即可保证扫描加工人员较好使用电子档案生成系统,更好发挥图像扫描技术的应用优势[2]。

2.3 严格制定和落实扫描标准

在应用电子档案生成系统的过程中,必须严格制定扫描标准,扫描分辨率、颜色模式选择、扫描文件格式均需要得到明确。一般情况下,采用300dpi扫描5号以上字体,在满足文字识别需求的前提下,可降低空间占用、提高扫描速度。对于5号以下字体或模糊字体,多采用600dpi扫描,打印文本清晰度、文字识别率可由此大幅提升。因此单位需针对性控制扫描分辨率,以文字清晰为标准,准确权衡文字清晰度、文字识别率、文件大小间的关系;黑白、灰度、24位彩色均属于电子档案生成系统图像扫描常用的扫描色彩模式,单位需基于档案内容合理选择不同的扫描色彩模式,如黑白模式适用于普通文字纸质档案,灰度模式适用于含有较多图表及插图的纸质档案。24位彩色模式适合用于含照片、印章、红头的纸质档案扫描,其色彩保真度较高;扫描文件格式需采用双层PDF,以此满足档案的数字化与数据化需要,档案的全文检索需求可由此得到满足。

2.4 合理选用扫描辅助软件

为保证基于图像扫描的电子档案生成系统更好服务于档案数字化,扫描辅助软件的合理选用极为关键。随着电子档案生成系统的不断完善,配套的集成扫描软件可实现自动化的档案扫描各环节管理,如清华同方的OCR文字识别软件、ABBYY Fine Reader软件均属于其中代表,这类软件多具备文字识别、图像处理、扫描管理、双层PDF生成等功能,可较好服务于电子档案生成系统的效用发挥。一般来说,ABBYY Fine Reader软件在使用成本、识别率、版面还原率、图像处理、双层PDF生成等方面的表现较为优秀,因此本文建议采用该软件辅助电子档案生成系统。此外,PDF-ToolsPortable、2345Renametool、Files2Folder等软件也能够为电子档案生成系统的应用提供支持,这类软件可提供PDF制作、文件批量重命名、特殊目录结构生成等服务。

2.5 图像处理实用技巧

基于图像扫描的电子档案生成系统应用还需要重点关注图像处理环节,这是由于现阶段的电子档案生成系统尚无法实现自动化的高水平图像处理,在具体的扫描工作中,无法后期处理扫描档案图像的情况极为常见,污迹较多、灰黑背景、文档倾斜等问题属于其中典型。在电子档案生成系统使用过程的图像处理中,需利用ABBYY Fine Reader软件的图像处理功能,以此实现梯形失真校正、图像歪斜校正的自动检测,由于OCR识别属于软件的设计基础,因此其能够较好服务于多数档案扫描件的扫描需要,仅要求原始档案扫描件质量不是过差,配合软件的自动化运行与手动化操作,即可较好满足文字清晰度增强、原始文档颜色信息保留、图像去污操作简化需要,档案扫描成本可由此实现有效节约。此外,PHOTOSHOP软件也能够较好为电子档案生产系统的应用提供支持,如灵活运用软件的动作功能、合理应用“CTRL”键的多选功能,档案图像的自动批量处理效率和质量可由此得到保障,纸质档案扫描加工专业性也能够由此不断提升。

3 结论

综上所述,基于图像扫描的电子档案生成系统运用需关注多方面因素影响。在此基础上,本文涉及的合理选用图像扫描设备、合理选择扫描加工人员、严格制定和落实扫描标准、合理选用扫描辅助软件、图像处理实用技巧等内容,则提供了可行性较高的电子档案生成系统运用路径。为更好发挥电子档案生成系统运用优势,各类新理念、新技术、新设备的引入和应用必须得到重视。

参考文献

[1]赖雯.档案数字化图像自动检测技术的研究与应用[J].科技与创新,2018(12):149-150.

[2]田支斌.高校档案资源低成本数字化实践与探索[J].资源信息与工程,2018,33(01):197-198+201.