APP下载

浅谈OCR技术在干部人事档案管理工作中的应用

2021-01-10张颖李雪益希春

科学与生活 2021年28期
关键词:干部人事档案

张颖 李雪 益希春

摘要:大数据时代背景下,干部人事档案数字化是大势所趋。推进档案数字化建设,有利于减少对纸质档案原件的损坏,有效防止档案涂改造假,提高档案查阅利用效率,提升档案管理的科学性和规范性。OCR技术是近年来人事档案数字化的一种新兴技术手段,它的应用具有便捷性等优势,也存在一定技术局限和应用难点,值得深入研究探讨。

关键词:OCR技术;干部人事档案;OCR技术应用

档案OCR是通过信息技术对纸质档案数字化副本等图像文件中的字符形状进行识别、文字转换和文本输出、呈现的过程。是档案从数字化向数据化转化的重要步骤,对于提高工作效率和准确性,加快自动著录、全文检索、数据分析等功能更好实现具有重要意义,已广泛应用于会计凭证档案等综合档案数字化工作中。在干部人事档案管理工作中的应用还刚起步,这是由干部人事档案的固有特殊性决定的。

一、干部人事档案的特点

(一)干部人事档案具有全面性

干部人事档案形成于一系列人事管理活动之中,它收集了干部履历、自传、鉴定、学历、职称、入党入团、奖惩、任免、工资等方面的有关材料。它是干部个人信息的储存库,集中反映了干部个人成长经历、德能勤绩和工作表现、政治面貌、家庭情况等全貌。一般最早形成于干部的初高中时期,贯穿其一生,时间跨度较长。

(二)干部人事档案具有现实性

人事档案材料虽然是在人事管理活动中形成的历史记录材料,却具有很强的现实效用。直接为现实工作服务是人事档案区别于其他档案的重要标志 ,它是组织人事部门考察和了解干部的重要依据。在人事管理活动中,经常会有意识、有目的的查阅利用干部人事档案。

(三)干部人事档案具有真实性

真实性是人事档案现实性的基础和前提,也是其生命力所在。人事档案的真实性是指文件形成的真实性、内容的准确性,档案材料没有涂改造假,没有与实际情况不符合的信息。凡是归入人事档案的材料都应该经过严格鉴别审核,确保真实准确、全面规范、鲜活及时。

(四)干部人事档案具有动态性

人事档案始终处于“动态”之中,它的动态性主要表现在三个方面:档案材料的数量会随著个人社会实践活动的增加而不断递增;档案内信息的可变动性,如职务、薪酬待遇、学历、职称、科研成果、奖惩、健康状况、退休等,都会使档案信息发生变化;人事档案的保管单位并不是固定不变的,随着人员的不断流动,人事档案的隶属关系会发生转移,即“档随人走”。

(五)干部人事档案具有机密性

人事档案是记述和反映干部个人情况的专卷,内容涉及个人一生的经历,其中不乏个人隐私,这些内容一定时期内是保密的,只能由组织上掌握,不得随意公开与扩散。因此,干部人事档案在保管和利用等方面都有严格的保密要求。数字档案在利用、转递和保密等方面要按照纸质档案的相关要求管理。

二、OCR 技术在干部人事档案管理工作中的应用需求

(一)人工智能的高速扫描技术在档案数字化中应用

扫描是纸质档案转变成数字化档案的第一步,也是耗费时间较长的一个环节。干部人事档案材料纸张情况复杂多样。如何避免在扫描过程中对档案造成损毁,又能充分利用人工智能的高速扫描技术提高效率,是档案数字化工作中面临的难题。基于目前的技术水平,对于人事档案中纸张适应性强的材料,可以采用日处理量较大的直通型走纸扫描系统,利用人工智能技术实现人事档案中书本式材料的翻页扫描。纸张较脆弱的材料由人工运用高拍仪或平板系统进行扫描,缩短扫描用时,提高工作效率。

(二)语音识别技术在档案电子目录中的应用

创建档案电子目录是干部人事档案整理工作中的一项基础性工作,目前主要是手动录入为主,费时费力,又容易出错。档案电子目录随着档案材料的增加,也一直处于动态变化中。特别是一些年代久远的档案,往往没有电子目录,需要重新创建,这对管档人员而言,工作量是非常大的。如果能运用语音识别技术,实现档案电子目录的自动录入,并通过OCR识别将年代久远的纸质版目录形成电子目录,将提高档案编目效率,将管档人员从繁重的著录工作中解放出来。

(三)OCR技术在档案信息检索中的应用

OCR技术一方面可以对档案目录数据库进行检索,通过相关条目定位到所要查找的档案信息。另一方面可以对档案全文进行检索,但人事档案的机密性决定了,不需要全文进行OCR识别,只需识别检索与人力资源信息系统匹配的关键信息即可,这样既可以为人力资源信息系统的数据准确性提供支持,又可以确保档案信息的安全保密。

(四)OCR技术在档案数字化系统中的应用

数字化人事档案管理系统是档案数字化后的主要应用场景,可以满足管档人员在人事档案接收、查借阅、转递、统计、利用等日常各环节的工作需要,也可实现对日常工作的全过程记录。人工智能OCR可采用独立式或嵌入式等方式应用在数字化人事档案管理系统中。独立式是作为独立软件使用,或者通过应用程序接口(API)进行数据交互,不依赖于数字化人事档案管理系统。嵌入式是将OCR模块嵌入数字化人事档案管理系统,作为其功能的一部分,实现数字化人事档案和文本式数据文件的双套管理,为组织人事部门管理人才、数据统计分析提供便利条件。

三、OCR 技术在干部人事档案管理工作中的应用难点

(一)干部人事档案识别场景复杂多样

干部人事档案文字及载体存在多样性,包含手写、机打、信笺纸、A4纸、B5纸等不同字体,不同尺寸大小,不同书写形式、不同排版方式的各种材料,其中近半数材料是个人手写而成,甚至部分早期材料存在破损、折皱、残缺、模糊等问题。如此复杂多样的识别场景,如何降低OCR识别的出错率,确保识别的准确率,是人工智能OCR技术需要解决的难题。

(二)OCR识别抓取关键信息的准确性

前文提到,人事档案数字化图像不需要OCR全文识别检索,只需要匹配关键信息检索。如:干部人事档案电子目录的“标题”一项对字符的总长度有限制要求,如何在保证字符长度要求的前提下,还能确保提取信息的准确性。另外,对于人事档案中关键信息的定位抓取,OCR标志性文件逻辑前提的设定是否能够准确全面的涵盖所有信息点,都是需要解决的技术难题。

(三)干部人事档案信息情况复杂多样

干部的“三龄两历”信息量大且情况复杂多样,人工审核的难度都相对较大,某些特殊情况,OCR标志性文件逻辑前提的设定比较困难,抓取相关信息的准确性无法保证。机器识别文字的能力与人工理解图像中文字内容的能力差距较大,在人工确认干预的环节,可能会造成工作量增加,这也是需要解决的技术瓶颈。

四、结语

综上所述,OCR技术在人事档案数字化过程中有其独特的应用,如何更好地解决技术难题,将该技术合理运用于人事档案管理最需要的地方,是值得我们思考的问题。只有将OCR技术运用得恰到好处,才能更好地服务于干部人事档案管理工作。希望未来OCR技术将融入更广泛、更深层次的人事档案管理工作中,真正成为人事档案数字化的得力帮手。

参考文献:

[1]许呈辰.档案数字化过程中OCR技术应用[J].档案管理,2011(1):38-40

[2]刘明英.档案数字化过程中OCR技术的应用分析[J].中国高新技术企业,2017(5):55-56

[3]冯雪.纸质档案数字化中需要注意的几点问题[J].办公室业务,2016(4):167

猜你喜欢

干部人事档案
加快长江航运干部档案信息化建设对策思考
谈中职学校干部人事档案管理现状与管理策略
干部人事档案任前审核中存在的问题及对策
关于干部人事档案管理的几点思考与对策
浅谈干部人事档案的整理工作
浅谈人事档案管理问题及措施
浅谈事业单位干部人事档案信息化管理
浅析干部人事档案数字化的安全问题
小议事业单位干部人事档案的管理工作
新时期以专项审核为契机完善干部人事档案功能