APP下载

面向知识服务的干部人事档案知识库构建初探

2023-07-22李泽锋焦浩叶丹云郑州航空工业管理学院信息管理学院

浙江档案 2023年6期
关键词:知识库本体检索

李泽锋 焦浩 叶丹云/郑州航空工业管理学院信息管理学院

干部人事档案是组织人事部门对干部进行任免、调配、教育培养、考察监督、职级晋升等的重要依据,是反映干部个人德、能、勤、绩、廉等方面情况的全面原始记录,在组织人事工作中发挥着重要的凭证查考、辅助决策作用。在知识经济时代,如何提升干部人事档案的利用服务效能、满足用户的知识需求已经成为档案领域关注的重点问题。档案知识库可对档案资源进行整合加工处理,实现语义关联,形成知识资源为用户提供相应的档案知识服务[1]。由此可见,档案知识库为革新干部人事档案的利用服务方式提供了解决方案。

国内外关于档案知识库的相关研究呈方兴未艾之势,对相关研究进行梳理后发现,国内研究成果主要围绕档案知识库建设的理论基础研究[2-3]、实践路径研究[4-7]以及各类知识库研究[8-10]等;国外相关研究则集中于档案知识库理论[11]、架构[12]以及相关技术[13]应用等方面,由此可见国内外关于档案知识库的研究已初具规模。进而对干部人事档案知识库有关研究进行梳理,发现仅有周娟娟等[14-15]构建了符合干部人事档案特征的知识图谱,探究了服务方式向知识决策转变的可行性,为创新干部人事档案的服务方式提供了借鉴。依据现有研究来看,尽管我国档案知识服务和知识库研究已经有所发展,但是关于干部人事档案知识服务的研究仍处于初步探索阶段,亟需学者进行深入的探索。因此,本文从知识服务的视角,探索干部人事档案知识库的构建及应用,助力干部人事档案的利用服务建设。

1 干部人事档案知识库价值阐释

1.1 保障干部人事档案服务质量

干部人事档案服务质量的高低是衡量干部人事档案是否有效发挥其作用的体现,其本质是档案信息满足规定或潜在需求(需要)的程度和水平。《干部人事档案工作条例》中明确要求档案信息应“真实准确、完整规范、方便利用”。现阶段已有部分干部人事档案完成数字化工作,可以通过干部人事档案管理系统以关键词检索等方式查询干部个人信息。但检索结果多显示为粗粒度的文档,无法精准定位用户所需信息以便利用。且档案审核工作皆由人工开展,受制于审核人员的技术和算力,审核工作更多是针对材料的真实完整与否进行判定,难以展开内容数据层面的关联推算从而形成数据真实性、完整性的科学研判。干部人事档案知识库以数字化档案为原材料,经过加工、组织加上一定的推理规则组成[16],通过引入数据挖掘领域相关技术,将各类档案资源整合在一起,深入挖掘分析档案内容,能够在语义和知识层面细粒度地组织关联干部人事档案知识内容,既能实现细粒度的档案知识表征,形成可视化的干部个人数据链、个人关系网、领导班子与领导干部整体情况分析图,又能对数据真实性、完整性等进行智能研判,为组织人事工作提供真实、全面、可视化的档案知识资源,保障干部人事档案服务质量。

1.2 提升干部人事档案利用效率

干部人事档案的主要内容和分类涵括履历类、考核鉴定类、学历学位、专业技术职务(职称)、学术评鉴和教育培训类等十大类材料。由于各类干部人事档案中具有交叉关联的内容,传统干部人事档案管理系统通常以简单的分类标引方式进行条目著录以提供利用服务,将会影响用户的查阅效率。干部人事档案知识库担负知识提供者的重任,以关联组织、可视化的干部人事档案知识服务用户,辅助组织人事部门及其干部人事档案工作机构、因工作需要查阅档案的用户快速深入地了解干部个人信息或者领导班子情况,进行科学高效的决策,在满足用户知识需求、提升档案利用效能的同时,提升干部人事档案服务效率。

1.3 创新干部人事档案服务方式

在知识经济时代,干部人事档案的利用服务仍主要以经过加工扫描等技术手段形成的数字图像和数字文本为主,停留在信息服务层面,未能深入挖掘干部人事档案的信息和数据,无法充分发挥干部人事档案蕴含的知识价值[17]。然而组织人事部门在研判干部职级晋升、进行政治审查等工作时,通常需要的是分散在不同文档中的知识片段,亟需高效率整合的知识服务。干部人事档案知识库开拓了档案知识服务方式、方法的新思路,打破了以往的粗粒度档案信息服务方式,深度挖掘与开发档案数据资源,实现以知识为导向的干部人事档案智能知识服务,提升组织人事部门的决策效率。

2 干部人事档案知识库逻辑架构设计

干部人事档案知识库以干部个人为核心,以各类档案数据为载体,将组织、人、时、地、事五大要素作为数据维度对离散、碎片化的知识片段进行组织关联,形成可视化的知识网络,从而实现智能化知识服务。本文结合干部人事档案数据的特征和知识需求,采用分层架构体系结构,将干部人事档案知识库自底向上划分为知识获取层、知识组织层、知识服务层,如图所示。

2.1 数据获取层

数据获取层是干部人事档案知识库逻辑架构的基础,主要负责采集、保存和鉴定干部人事档案数据,并进行序化处理以形成粗粒度知识单元,为知识组织层夯实数据资源基础。该层涵括数据采集模块、数据加工模块和数据鉴定模块。

2.1.1 数据采集模块。数据采集模块的主要功能是准确地识别、提取与干部个人相关的不同来源和格式的历史记录数据,为知识组织提供知识来源。中央组织部统一制定了干部人事档案的管理体制、具体内容和分类标准等,形成了较为规范的数据存储格式、档案目录数据库、元数据信息等,为数据采集提供了便利。数据采集来源主要涵括两个方面,一是经过数字化加工形成而保存于干部人事档案管理系统的结构化数据、半结构化数据和非结构化数据;二是与税务、公安、社保、征信等系统平台互联互通的干部个人数据[18],如个人征信报告。这些数据信息虽未归入干部人事档案的类别,但是却与和干部个人密切相关,对于干部人事管理具有重要的价值。

2.1.2 数据加工模块。数据加工模块主要是对干部人事档案数据进行预处理,采用标准通用的数据格式保存、描述档案数据。借助光学字符识别(OCR)、自然语言处理(NLP)、实体识别、关系抽取等机器学习技术,实现字段级别的档案数据化,形成细粒度的档案资源,将干部人事档案数据中的组织、部门名称、人名、时间、岗位、业务等实体要素及其关系抽取出来,形成粗粒度的档案知识单元。同时,智能化的档案知识服务要求档案数据高度形式化[19]。为使干部人事档案数据达到机器可读、可交换和共享重用的格式要求,将其转化成符合W3C语义网规范的资源描述框架(RDF)三元组形式。以RDF三元组形式描述档案数据资源,重组为细粒度的档案知识元,形成结构规范的档案语义关联数据集。

2.1.3 数据鉴别模块。数据鉴别模块的主要任务是对采集和加工后的关联数据集进行数据分析,运用统计学、模式识别、数据抽象和机器学习等计算机技术对其展开挖掘,通过实体关联关系抽取、关键要素对比查缺等手段,完成干部人事档案数据真实性、完整性等的鉴定工作。基于数据加工模块抽取出的实体要素例如人名、时间、岗位等及要素间关系展开智能分析与比对,对识别出的异常数据进行标记与反馈,以机器自动识别辅以人工检测的方式进行数据真实性与完整性判定,经鉴别存在问题的数据需经过核验及处理后方可流入下一层。

2.2 知识组织层

知识组织层是干部人事档案知识库的核心层,借助知识组织技术和方法对采集、保存和鉴定后的干部人事档案数据进行知识化分析、组织和语义关联推理,将干部个人档案数据转化为知识。本体作为概念描述的重要工具,能够清晰表述知识库中的概念及其关系,有利于知识的重用和共享及知识库的维护和共建[20]。在知识组织层,主要借助本体构建工具进行知识组织,实现档案知识之间的深层次语义关联,形成干部个人数据链、关系网等知识网络。知识组织层主要包括本体构建模块和知识推理模块。

干部人事档案知识库模型

2.2.1 本体构建模块。本体构建模块实现干部人事档案语义层面的整合,支持档案数据资源重组和知识管理。干部人事档案本体构建注重档案数据的重用和共享。目前本体构建的主流工具是protégé本体编辑工具,利用其进行干部人事档案本体的构建及其可视化,具体步骤包括:确定语义本体的干部人事档案的领域、明确领域核心概念、定义概念间关系或类间关联、定义类的属性和创建本体[21]等,形成包括实例对象、关系及逻辑规则等的初始知识库。干部人事档案语义本体的构建,注意参考复用现有术语词表如《中国档案主题词表》《政务文书档案专业词表》《综合电子政务主题词表》等,建立和完善本体分类等级体系,并采用核心扩展方法确定本体的领域概念,如“组织机构”“部门名称”“人名”“职务”“时间”“业务”等核心概念,概念之间独立互斥且涵盖该本体完整的干部人事管理知识;利用RDF三元组形式组织和描述本体的干部人事档案知识,注意与其它相关干部个人信息关联,确保实现语义互操作与语义融合。

2.2.2 知识推理模块。知识推理模块是在已有知识的基础上,通过一定的方法来预测当前尚未显现出的隐含知识,比如潜在相关的实体、关系,并将其逐步加入知识库中,以达到扩充、优化知识库的目的[22]。知识图谱能够将领域内外的知识单元编织成庞大的知识网络,实现高效的知识问答与推理。基于知识图谱的知识推理需与特定的本体模型相结合,基于本体定义与知识结构实现知识图谱的补全与语义实体融合[23]。从干部人事档案本体库中挖掘推理出缺失的以及深层的潜在实体及关系,并对干部人事档案知识库进行补全并去噪,从而完成档案知识的推理。

2.3 知识服务层

知识服务层是干部人事档案知识库的接口层,需要根据用户需求、应用场景来提供相应知识服务。干部人事档案主要应用于教育培养、选拔任用、管理监督干部和评鉴人才,其知识库的核心功能是为用户提供决策服务所需的知识。知识服务层需要满足用户的知识服务需求包括:能通过关键词检索所需知识、可依靠分类导航栏目进行浏览以及智能提供决策方案等。因此,知识服务层主要包含的知识检索模块、知识导航模块以及知识决策模块。

2.3.1 知识检索模块。知识检索模块可为用户提供自然语言检索选项和关键词检索选项。用户选择自然语言检索功能时,系统将自动识别用户所输入的自然语言,并与系统中预设的分词词典、同义词表进行比较,此间不断与决策者交互[24],由此获得能准确表达用户真实知识需求的自然语言。知识库根据用户的知识需求,基于知识推理等技术,将检索到的档案知识准确反馈至用户。关键词检索功能主要面向需要决策咨询服务的机构或部门,使用关键词检索需要检索者对档案知识库的知识组织原理具有深度了解,能够从用户提交的咨询内容中提取出对应的关键词。基于知识库的推理模块实现全面系统检索和高效知识问答,提高决策咨询服务的质量和效率。

2.3.2 知识导航模块。知识导航模块的主要功能是为用户快速、清晰地查找与浏览所需知识提供便捷。导航模块的类别划分基于用户的知识需求、认知水平和利用习惯等因素,以用户能够方便快捷地找到解决问题的档案知识为分类原则。干部人事档案由中央组织部主管,各地区各部门各单位按照干部管理权限分级负责、集中管理。其归档和利用工作遵循“来源原则”,因此用户可以通过“来源导航”的方式获取知识服务,按图索骥地查找所需的档案知识。同样地,根据档案种类和性质的不同设置“类别导航”方式,根据档案形成年度的不同设置“时间导航”方式,根据干部职级或档案密级的不同设置“权限导航”方式等。

2.3.3 知识决策模块。知识决策模块是提供知识服务的核心功能模块,此模块旨在向用户提供精准的知识决策服务,发挥辅助决策功能。具体功能实现路径分为以下两种:一是针对用户需求向用户提供多项知识决策方案,同时附以推荐指数排序和排序依据,知识决策方案的生成需要决策模块提取检索和导航模块用户输入的知识服务需求,经过运算推理后,依据用户提交的知识需求结合相似问题的历史解决方案,生成若干知识决策方案并进行智能排序,一并推送给用户供其参考。

二是提供干部人事档案知识的可视化呈现,多维度展现干部相关信息辅助决策判断。可视化呈现是以干部个人为中心点,关联与干部个人相关的组织机构、职能部门、人物、时间、地点、业务等要素,立体化、多维度地展示干部个人数据链、关系网以及领导班子与领导干部整体情况。在时间维度,可视化呈现干部个人基本信息,形成展示干部学习经历、工作经历、参加党团、职级变化等信息的时间树,同时对干部个人能力进行分析;在空间维度,对领导班子和干部整体情况进行全方位、多视角的动态分析和展示,对省、市、县各级单位领导班子基本信息、超缺编情况、党外干部配备情况等进行综合分析,同时对领导班子的年龄结构、性别比例、学历结构、职级分布、业务特长、考核监督、政治面貌等进行统计和可视化展示;在社会网络维度,关联分析干部的社会关系,以干部为核心点,网络化展示干部的亲属、同乡、同校、同班子、同培训等情况,并且扩展显示可通过间接第三个人产生关联的间接关系。

3 干部人事档案知识库应用场景分析

干部人事档案知识库通过语义检索、智能问答、可视化呈现等档案知识服务方式实现具体的知识应用和知识服务。根据干部人事档案的特点和作用,干部人事档案知识库服务主要服务于干部选拔任用、审核监督、社会信用体系构建的场景。

3.1 辅助干部选拔任用的决策服务

干部人事档案知识库通过对干部人事档案数据及其相连数据的深度挖掘分析、知识单元抽取、知识元关联表示,形成干部个人数据链、关系网和领导班子架构网络。干部人事档案知识库提供的干部个人数据链可以汇总分析干部的学习能力、业务能力、创新能力、个性特点、内在素质等,展示干部在德、能、勤、绩、廉方面的主要表现,形成干部个人画像。领导班子的可视化分析有助于了解各单位班子架构,呈现班子编制、学历、年龄、培训、考核、监督等信息,实现选任岗位的智能推荐、匹配和班子配备优化服务。同时,党政领导干部的选拔任用实行任职回避制度和选拔任用工作回避制度,需要明确干部的夫妻关系、直系血亲关系、三代以内旁系血亲以及近姻亲关系等[25]。知识库提供的干部社会关系网络刻画了干部之间的关系,实现科学、公平地任免干部。干部和领导班子架构多维度智能分析研判的知识服务,帮助组织人事部门最大限度地合理配置干部人力资源,实现人岗匹配,营造干部人事档案工作的“青山绿水”,优化干部选拔任用工作生态,为干部选拔任用的决策提供充分的依据。

3.2 面向干部审核监督的管理服务

组织人事部门坚持“凡提必审”“凡进必审”“凡转必审”三原则,在干部动议、考察、任职前公示,人才引进,军队转业(复员)安置,档案转递、接收等环节及时做好干部人事档案审核工作[26]。根据干部人事档案对干部的“三年两历一身份”如出生日期、参加工作时间、入党时间、学历学位、工作经历、干部身份等信息进行审核,确保见档识人、人档相适。知识库通过整合、挖掘、关联干部人事档案离散的知识片段,形成立体的干部信息网络。绘制关于干部的经历成长图,展示干部的出生时间、参加工作时间、参加组织时间、公务员身份等;挖掘梳理干部的成长经历,以时间树的方式呈现干部的学历学位、工作经历、专业技术职务、职级变化等信息,并链接相关的档案数字化副本,方便组织人事部门及其干部人事档案工作机构的档案工作人员及时、快速地定位到档案审核所需的内容,为审核干部人事档案提供便利,为干部队伍的宏观管理提供精准高效的知识服务。

3.3 助力社会信用体系的构建服务

个人信用档案数据治理的对象至少应包括个人身份情况数据、金融信贷数据、社会公共信用记录数据和互联网替代数据[27]。干部人事档案是记载干部基本信息、成长经历、德才表现等方面的原始记录,是个人信用档案数据的重要组成部分。随着我国社会信用体系建设的不断推进,干部人事档案知识服务将与社会信用体系构建紧密相连。知识库不仅有效整合了原始的干部人事档案数据,提升信用评价的权威性和可靠度,还通过知识组织技术对其进行挖掘、组织和可视化,提升干部人事档案数据的语义关联程度,深化干部人事档案知识服务的内容,全方位、立体化地反映干部个人全貌,实现档案数据可溯源,问题可监测,有助于及时整改和处理干部人事档案发现的问题,推动社会信用体系的构建。

猜你喜欢

知识库本体检索
2019年第4-6期便捷检索目录
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
基于本体的机械产品工艺知识表示
高速公路信息系统维护知识库的建立和应用
专利检索中“语义”的表现
《我应该感到自豪才对》的本体性教学内容及启示
基于Drupal发布学者知识库关联数据的研究
专题
Care about the virtue moral education
国际标准检索