APP下载

新时代基于内容的人事档案数据化

2020-04-14郭怀珍

陕西档案 2020年1期
关键词:数据库数字化内容

文/郭怀珍

在具体数据化实践基础上,参照人事档案数据化的国际实践与标准,在分析构建新时代基于内容的人事档案数据化内容的基础上,给出了相应的原则和关键内容

信息技术的突飞猛进发展与风生水起的广泛应用,推动人类社会进入了数字经济时代,并继“物理空间”“人类社会”之后,又产生了“信息空间”。同时,人事制度的改革也在不断深入进行,这些都不断推动和促进着作为人事管理关键环节的人事档案管理的数据化建设。利用数据库技术、数据压缩技术、高速扫描和照相录像等数字化技术、计算机应用技术、(移动)通讯技术、互联网技术、人工智能、大数据等信息技术的最新成果,根据档案管理理论与技术以及信息化时代档案管理的新情况、新原则和新理论,确立信息化网络社会中档案管理、利用与服务的基本流程、框架和基本方法等,以纸质文件、声像文件等传统介质的实体文件和已归档保存的电子档案文件等虚拟档案,构建、组织、开发具有有序结构的、基于内容的系统化档案数据库,最终建立人事档案管理信息系统(或平台),最大限度地实现纸质档案和电子档案信息的数据化管理,进而实现人事档案的个性化和社会化利用与服务。这便是人事档案管理的数据化建设。其实质是档案管理、利用与服务从以档案实体为中心的管理模式到以档案数据化信息为中心的管理模式的转变。

人事档案的数据化管理、利用与服务,符合中国特色新时代的发展潮流,并能在构建智慧社会的浩荡时代大潮中提升人事档案现代化管理水平、智慧服务作用和基于知识的辅助决策功能。因此,人事档案部门应及时转变人事档案管理理念,加快数据化建设,形成实体管理与数据化管理并举的管理、利用与服务模式,最终实现人事档案的数据化和智能化管理、利用与服务,提高其相应的水平、效能与作用。

图1 人事档案信息化建设基本过程与内容

除了人事档案数字化建设的意义之外,人事档案数据化建设的主要意义在于:(1)便于人事档案的安全利用和远程服务,进而切实为推动人事档案的信息化管理和社会化应用建立基础;(2)真正起到保护纸质人事档案的作用;(3)根本转变人事档案的管理、利用与服务理念,转变工作模式;(4)有利于进一步融合人事档案管理信息系统、人事管理信息系统和公务员信息库等,便于对本单位的人事信息进行统计、分析与挖掘,形成相应的知识,为人事管理提供可靠的决策科学数据。因此,人事档案的数据化建设,不仅具有提高管理效能的现实意义,而且可以进一步为人事管理提供统计数据、处理分析结果和挖掘人事知识,将无结构的实体材料转变为人事管理中的有用知识。正因为这样,研究新时代大数据基础上的人事档案的数据化建设,不仅重要,而且具有时代迫切性。

一、人事档案数据化建设

随着人事管理制度的不断改革和完善,规范而科学化的人事管理制度建设,与规范化和科学化的人事档案管理,二者互相促进,相辅相成。如果建立基于内容的人事档案管理信息系统,那么不但可以实现人事档案的信息与载体之间的分离,而且还可以使人事档案的管理更加规范、科学和准确,可以杜绝人为的主观篡改,从而显著提高人事档案的真实性和可靠性。

人事档案的数字化是人事档案的数据化的基础和前提,人事档案的数据化又是建立基于内容的数据库和数据化目录的基础。人事档案信息化建设中这四个方面之间的关系如图1所示。

1.数字化。纸质、胶片等人事档案数字化技术已经比较成熟,而且国内外都已经有了成功的案例,并建立了标准、规范等。数字化是数据化的基础和前提。为了进行后续的数据化、建立数据库等操作,对数字化后的图像等多媒体数据需要进行必要的处理,以图像为例,需要对图像进行剪切边框、纠偏、增强(高清转换)、变换、优化等处理,然后将处理后的图像,按卷存入预先准备好的存储介质,例如按档案的卷存入光盘或者磁盘中,妥善保存。需要说明的是,对于重要图像,例如个人照片、公章等,需要进行抠取图像处理,分割出重要照片等。如果需要,还要将每卷的数字化文档打包存储。

有时,也可使用已有的“干部档案数字化软件”完成干部职工实体档案的数字化和部分数据化,即利用已有的专用人事档案数字化软件,直接完成人事档案实体的数据化。例如,使用北京航行公司开发的干部人事档案数字化软件、超星尔雅、智慧树、百度云端等,以及一些大数据与云计算平台等。

2.数字化档案的数据化。经过数字化后,人事档案主要转换成一些高清图像或者其他多媒体数据,其中的主要内容图像也只能依靠管理人员的阅读识别,才能转化为有用的人事档案信息。数字化并进行处理后的人事档案文件实际上是电子文件——数字化电子文件——即这些以一定的数码格式记录于磁带、磁盘、光盘、硬盘、固态硬盘等数字信息载体上,依赖于计算机系统等数字设备读写、处理、识别,并可以在通讯网络上传输的数字代码序列文件,也叫数字化档案文件(或者电子文件)。如果要利用计算机进行人事档案信息的处理、统计、分析等,还必须将数字化后的以图像为主的数字档案信息进一步转化为内容数据。就是人事档案的数据化,即把数字化后的人事档案信息变为内容数据。换句话说,人事档案的“数据化”就是把数字化的人事档案转变为可制表和分析的量化格式数据的过程。从而使得人事档案数据不仅仅可以读写,而且还可以用计算机等机器对相应的内容数据进行操作,或者使其可执行(machine-actionable)。因此,将档案数字化后,如果档案部门希望进一步提高人事档案管理、利用、服务的水平,将人事档案管理、利用和服务提升到相应的知识层面,利用统计分析、机器学习、人工智能以及大数据分析方法处理、统计、分析人事档案信息,那么还需要将这些电子文档数据化。实现数据化后,人事档案数据可能包含结构化数据、半结构化数据、非结构化数据以及全数据处理对象,此时可以用计算机对人事档案数据进行统计、分析和深入的数据挖掘等,实现知识层面的服务与共享,并使档案管理与服务深入到数据层面,真正推动人事档案的信息化建设,改变管理理念和模式。

自然,人事档案的数据化也包括人事档案检索工具(档案目录)和人事档案全文内容的数据化。从数字化到数据化的转换过程,首先可以利用现有的图像识别软件进行识别,确定基本数字内容,然后进行人工校对。而且必须遵循数据化后的档案与原始档案的一致性。

3.建立基于内容的人事档案数据库。人事档案信息化的终极目标是将人事档案的各种信息,在计算机中表示为结构化和半结构化的形式,按照所确定的标准,建立人事档案数据库,进行统一存储和管理,最后构建人事档案的管理信息系统,按照技术性方法,实现新时代基于互联网的信息化、网络化、知识层次的管理、服务与共享。实现了人事档案信息的内容数据化以后,需要对多源异构的多种源数据进行抽取和集成,确定结构化数据和非结构化数据,然后进行数据清洗,最后按照选定的数据库,建立完整的人事档案数据库。这样,就可以进一步开发出基于数据内容的人事档案管理信息系统,运用统计分析、语义分析、人工智能、机器学习、知识图谱等数据分析与计算技术,进一步实现人事档案信息的处理、统计、分析和挖掘,形成本单位人事档案的知识,让数据分析与挖掘成为档案馆知识服务体系创新及完善的重要支撑,将人事档案的管理、服务和共享提升到知识管理层面。从而使人事档案管理与服务真正从传统模式提升到基于数据分析和数据挖掘的知识服务体系。

4.建立人事档案数据化目录。为了能对已经存入数据库的人事档案的各种信息进行检索与查询,特别是内容数据的检索与查询,按照人事档案管理规范,还需要建立数据化的档案目录。即按照人事档案编目条例、著录规则,参照《中国文献编目规则》,在原有人事档案检索工具(档案目录)的基础上,以方便检索、查询为原则,著录详简级次得当的、完整的人事档案数据化目录。

在人事档案目录数据化过程中,要在元数据中明确区分不同数据元素,并予以不同标识,以标识不同性质的资料及其属性,例如插图、个人照片、图章等的属性,影音资料的属性以及食物材质的不同特征的数据。

二、新时代人事档案数据化建设的原则与关键内容

数据化是在数字化基础上所进行的,因此,除了要遵循数字化阶段的基本原则外,还应该做好数字化阶段关键工作。下面主要说明新时代人事档案数据化建设的关键内容。

1.基本原则。中共中央办公厅印发、并自 2018 年 11 月 20 日起执行的《干部人事档案工作条例》,具体规定了干部人事档案工作应当遵循的基本原则,即:党管干部、党管人才;依规依法、全面从严;分级负责、集中管理;真实准确、完整规范;方便利用、安全保密。另外,2017年7月1日,国家标准化管理委员会第15号公告颁布了关于批准发布《干部人事档案数字化技术规范》国家标准规定了技术性基本原则:真实性、完整性、可用性、安全性原则,并确保数字化档案与纸质档案一致。这些都是人事档案数据化建设的基本原则。

2.数据基础设施建设。为了建立基于内容的数据化检索工具,即著录数据化目录;建立基于内容的数据化人事档案数据库。这都牵扯到人事档案的主题词、分类号、基础知识库、本体词表等数据基础设施的编制与建设。这不但要熟悉国内的相关标准、规范等,还需要借鉴国际上相应的标准、规范以及实践,这对传统的人事档案管理与研究人员是一大挑战。采取什么具体措施,相对简单、高效地进行人事档案数据化的基础数据设施建设,并满足数字化或者数据化人事档案管理信息系统的需求,是目前人事档案数据化工作中的难点。

3.建立人事档案数据化的模型、规则和格式。建立相应的模型、规则和格式后,可以确定数据化后人事档案信息的表示与处理方式。

4.人事档案数据化的标准与规范。与数字化一样,数据化也需要建立一系列的标准与规范。

5.人事档案数据化建模。构建人事档案的元数据标准,即数据结构标准、数据内容标准、数据取值标准和数据交换标准共4类。

6.人事档案中实体及其名称在计算机中的描述与表示。在人事档案数据化后,要运用数据统计与分析方法、机器学习、大数据的方法与技术,用计算机等机器进行自动化处理、分析人事档案的数据时,必须区分人事档案的实体及其名称,并在计算机中描述和表示它们,并建立实体——关系模型等。这实际上是将人事档案管理、利用与服务提升到知识化层次时必须进行的工作,这是人事档案数据化建模的关键内容,是人事档案数据化的关键,也是人事档案信息化建设的基础和关键一步。

干部人事档案的数据化都是新时代干部人事档案管理的关键环节。做好这些工作,可以提高人事档案的管理水平、效率以及知识型服务,转变人事档案管理与服务模式,增强档案业务部门的管理与服务水平,为档案内部管理及面向客户服务提供高效率、高深度、知识型的全面服务。

猜你喜欢

数据库数字化内容
内容回顾温故知新
家纺业亟待数字化赋能
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数据库
主要内容
数据库
数据库
数据库