基于智能 OCR 识别技术的档案管理系统开发与应用
2022-04-29刘思阳
摘要:文章介绍了对档案信息资源数字化管理前置进行处理优化的过程,通过应用智能OCR识别技术,将相关识别软件与OCR识别接口串接到一起,从而实现对海量档案信息资料的有序划分。在结合C/S架构和B/S架构的基础上,通过Java EE开发平台对档案信息进行收集与整理,并最终通过验证表明该方法的有效性,特别是与传统档案信息管理方法相比,采用人工智能技术会使档案管理更具精准性与高效性。
关键词:人工智能;数字化加工;数字档案馆
中图法分类号:TP391文献标识码:A
Development and application of archives management systembased onintelligent OCR recognition technology
LIU Siyang
(Tangshan Personnel Examination Center,Tangshan,Hebei 063000,China)
Abstract:This paper introduces the process of processing and optimizing the digital management ofarchives information resources. By applying the intelligent OCR identification technology,therelevant identification software and the OCR identification interface are connected in series, so as torealize the orderly division of massive archives information materials. On the basis of combining theC/S architecture and the B/S architecture, the archive information is collected and organized throughthe Java EE development platform, and the validity of the method is finally verified throughverification,especially compared with the traditional archive information management method,Theuse of artificial intelligence will make file management more accurate and efficient.
Key words: artificial intelligence, digital processing,digital archives
本文提出通过应用人工智能技术来对大型企业档案数字化管理系统进行设计的方法,再结合应用 C/S 架构和 B/S 架构制定一套具有前置数据处理系统的综合数字档案管理方案,以达到对档案的高效管理目标。
1前置处理
大数据时代下,大型企业更应顺应社会的發展潮流,充分利用高科技技术(如人工智能技术)对海量档案信息资料进行数字化处理,并最终实现档案智能编研的开发与应用。近年来,我国的人工智能技术发展速度较快,无论是自然语言理解技术还是文字模式识别技术等都可应用到档案的电子文件处理中,从而使电子档案的信息管理进入智能化管理模式中,使其成为一个整体化作业流程(图1)。
2系统结构
为了将人工智能技术应用于大型企业的档案数字化管理系统中,就要注重系统运行环境的生成。换言之,就是要借助技术以及网络来达到档案数字化管理的设计需求。通过应用智能 OCR 识别技术,将相关识别软件与 OCR 识别接口串接到一起,可以实现对海量档案信息资料有序划分的目的。首先,可以通过扫描设备,将档案信息进行精准性扫描,经过与原有档案信息进行比对后,便可借助 C/S 架构来实现对企业档案信息的科学化管理,包括数据导入、数据比对、以及数据分析等。在经过一系列信息处理后,系统便可将优化过的信息进行自动存储。结合 B/S 架构以及 Java EE 技术,档案信息资料便可自动生成,并随时可生成数据化交换,而这只是人工智能档案数字化管理系统功能模块中的一小部分。待数据全部录入完毕,便可通过终端服务器对数据进行存储。
当然,若要实现上述操作,要保证硬件设施齐全,特别是要配备前后端的研发工具,以有效保证系统正常运行。在对档案信息资料进行管理过程中,可借助智能化手段对角色权限进行设定,以保证数据的安全化管理。将 XML 的报文交换数据接口标准,以 Web Service 服务描述标准开发统一数据接口平台,这不仅能有效保证数据分析的精准性,也能实现对档案数据的高效管理。例如,可以借助档案信息资料中的词频进行信息提取,由算法服务来进行分析,这能精准地对档案信息资料进行分类。此外,我们也可建立测评信息标签,并将标签数据进行分类,随后生成与之对应的模型,以实现对档案信息的相关操作,如手写档案识别、档案分类、自动转录等[1]。
对于档案信息管理的操作要支持在线或离线以及单个或批量的数据信息化处理方式,为了实现这一目的,就需要构建前置采集处理系统,实现精准对应不同的档案文件,寻找相应的标签信息,以达到精准划分的目的,从而有效避免信息丢失。在客户端采用 DELPHI 开发工具优化系统功能,方便实时共享数字信息资源,利用 OCR 智能识别技术,档案数据信息便可自动录入系统(图2)。
基于图2系统,可以对所录入的档案信息进行进一步优化,并且在该系统中可以对档案信息进行细分处理,即通过添加 C/S 结构的电子档案数据源,利用 B/S 平台层完成数据之间的交换与共享。换言之,在该档案信息处理结构系统中,所包含的结构类型不仅有 C/S 结构的 client 端 exe 主程序,还包含 B/S 平台服务管理模块以及档案数据中心等。它们都是作为档案信息系统的重要功能模块而存在。这也是人工智能技术应用于档案数字信息管理系统中的一个重要标志。
通过该系统,可以对档案信息进行平台化操作。通过设置用户权限,可以实现对档案管理的安全性操控[2]。用户在最初进行注册以及身份认证的过程中,会被赋予相应的使用权限,当面对各种档案信息的决策处理时便可以利用该权限来完成。其中,数据交换层也可接收来自表现层的数据信息,之后数据信息便可以提交到数据层。B/S 平台下所包含的内容会直接影响数据的交换与共享,而 C/S 结构的客户端被纳入档案标准的规范体系中。
通过上述结构框架的建立,能有效实现对大型企业档案信息的科学化管理,特别是对档案信息的精准化操作和处理。
3系统软件结构优化
为了能够将大型企业档案信息实现数据化信息处理,可结合档案管理系统软件的框架结构来实施精准部署。在此,使用“客户端+浏览器”模式,从而对海量的档案信息进行采集以及优化处理。数据资源会通过 B/S 平台服务进入企业的总部系统中,然后经过总部系统的共享,从而使下属部门也能够获取相应的数据资源。在这一过程中,企业总部将作为档案信息数据的系统中心对海量信息进行维护与优化处理。而下属部门通过权限设置,可以实现数据信息共享。
通过以上步骤,能够对档案信息进行初步管理。利用Java EE 技术和 Html5技术建立网络平台。在这一过程中,可以使用人工智能技术对海量档案资料进行有序管理,以实现对档案资料的精准分类。其中,功能模块可借助查询接口来完成对所需档案的提取与共享(图3)。
图3中,数据管理功能模块会转换为数字化存储模块,以完成对档案信息的整理。与传统档案信息管理方式相比,它更具高效性与精准性[3]。因为它能够结合 OCR 软件与现有的归档系统进行对接,并进行二次开发,这可对档案信息中所存有的标签性信息通过接口的精准性衔接来进行提取,大大降低错误率。利用人工智能技术可以将档案信息资料进行精准处理,而随着功能模块的建立,更能有效提升索引的精准度。
4档案数字化管理的实现
只有通过建立数据库才能够方便对数据信息进行提取以及共享。因此,在建立数据库的过程中,用户可通过注册来实现不同部门对不同信息资料的提取,使具有管理员权限的用户能自由进入网站,对功能模块进行管理,也可对用户的权限进行设置,从而实现对数据资源的有效管理。通过设置不同的用户权限,可以将数据资源按照不同种类进行划分,也可通过信息模块将权限纳入用户的使用过程中[4]。普通用户仅限于对所需的数据资源进行搜索;特殊用户则可实现对普通用户的权限设置,以保证档案信息得以安全储存。在用户对档案信息进行检索的过程中,会通过相应的流程来完成。利用上述操作方式,可以对海量的档案信息进行高效管理—不仅能精准搜索所需的信息内容,还可以有效提升信息搜索效率以及搜索的精准度。
5应用实验
为了能够使实验所得到的结果具有精准性,建议对所使用的实验环境以及设备进行统一管理。其中,以 MATLAB r2010b 为实验平台;以 Windows Server 2012/Windows 7为实验系统;数据库为 SQL SERV?ER2015;C/S 开发工具为 Delphi;数据库接口为 ODBC;服务器 OS 为 Windows Server 2012/Database: MySQL5.0;浏览器为 IE11.0及 IE;开发环境为 jdk8; B/S 开发工具为“ My Eclipse10+JDK1.8+Tomcat8.0+ MySql5.0”。选取某大型建筑企业的档案信息资料作為实验的参照对象,与传统检测方法相比,应用人工智能技术对档案资料信息进行管理,不仅能够实现精准化与高效化的管理目标,还能有效降低错误率,特别是对海量档案信息资料进行处理时更为方便、快捷。
6结束语
为了对大型企业所产生的海量档案信息资料进行精准管理,可以利用人工智能技术对其进行分析和整理,从而有效实现档案资料的管理、开发和利用。实验表明,借助人工智能技术,不仅能使档案资料检索更为方便,还可提升档案资料的整理速度和信息提取效率。
参考文献:
[1]任杰.基于 RFID 的档案管理系统设计与实现[ J].办公室业务,2022(6):169?170.
[2]赵紫毫,薛四新.测评视角电子档案管理系统质量治理方法研究[J].中国档案,2022(3):68?69.
[3]赵玉萍.论档案管理系统与 OA 系统之间的无缝链接[J].信息系统工程,2022(3):36?39.
[4]王岳,王明杰,李文杰.基于物联网的数字档案管理系统设计与实现[J].信息技术,2022(1):158?162.
作者简介:
刘思阳(1989—),本科,中级馆员,研究方向:档案管理信息化建设。