用知识管理创新企业档案利用服务方式
2024-04-16曾博文中核核电运行管理有限公司
曾博文 / 中核核电运行管理有限公司
企业档案是企业经营过程中员工在设计、生产、经营、管理工作中的真实历史记录,是企业重要的知识资产[1-2]。中核核电运行管理有限公司(下文简称秦山核电)历经30多年的发展,积累了丰富的核电工程建设、生产运行、设备维修、技术改造等方面的档案资源共24万卷222万件。进入新时代,信息技术发展突飞猛进,新一轮科技革命和产业变革带动数字技术、数字经济正深刻改变着传统的经济发展模式,企业档案工作也正在从手工操作接收管理纸质档案进入到接收管理电子档案信息化,从管理档案实体过渡到管理档案数据,档案信息资源开发利用方式也在发生根本性的变革。在庆祝中国共产党成立100周年的重大历史时刻,习近平总书记高瞻远瞩对档案工作作出了“四个好”“两个服务”的重要批示,为做好新时代企业档案工作指明了方向。秦山核电档案室借助数字化改革,全力推进档案资源数字化、档案服务智能化和档案利用知识化,构建档案数字化应用场景,撬动档案治理、资源、服务体系全方位、系统性的变革,推动企业档案工作整体智治、高效协同和智慧应用。通过引入知识管理新技术、新方法,以用户为中心,在内网建设核电档案知识管理平台,提升了档案利用效率,为企业档案工作创新发展注入了新活力。
秦山核电为夯实基础,打造数字档案资源的外部环境,编制了《电子文件四性检测方案》《电子签名与时间戳工作规范》《电子文件封装工作规范》《电子文件归档接口技术规范》《电子文件备份规范》《电子档案长期保存规范》等技术规范,为档案工作数字化改革创造了良好的外部环境。在严格遵循各项规范的前提下,秦山核电稳步开展了档案“存量数字化”和“增量电子化”等一系列工作。
作为我国核电事业的先行者,“数字核电”建设的倡导者,“智慧核电”档案管理领域建设的探索者。秦山核电以电子档案管理系统(ECM)为核心的业务系统建设运行长达10年,沉淀了非常宝贵的档案,包括核电工程建设全过程、核电厂运营全周期内各阶段所产生的工程项目档案、生产运行档案及其他各种经营管理档案,除文书文件、财务文件、合同文件等内部敏感文档外,共约426万件已同步映射到档案知识管理平台,并实现和电子档案管理系统(ECM)同权管控,及时更新。系统内涵盖了生产、经营等多领域的档案,以及支撑核电厂从设计、建造、调试、运行、维修、退役全周期的档案资源,实现了档案知识的分享与利用。秦山核电采用ETL数据抽取、自然语言处理(NLP)、AI大语言模型、自动聚类、动态标签索引、自然语言智能检索等先进技术,在企业内网部署了核电档案知识管理平台,全面提升档案利用服务“智能化”水平,为一线人员提供了便捷的查阅和利用途径。
本文将从四个层面深入剖析秦山核电在档案利用方面探索的新模式,旨在为读者提供借鉴与思考。
1 丰富核电档案知识管理平台底层支持
1.1 健全完善核工业语义库
核工业语义库从档案中来,应用到档案中去。该语义库由词库、对象库、知识库三部分组成。通过命名实体识别优化、基于TF-IDF与Bi-LSTM+CRF的新词发现模型、语义标签标注等方式在秦山核电现有的档案库中抽取概念关系词,进行语义网络、上下位词构建,不断丰富核工业语义库,目前语义库已经收录词条6946393条,涵盖核电领域绝大多数的词语,并建立了词语之间的关联关系,作为底层支撑为核电档案知识管理平台的智能检索、智能问答、智能推送等功能提供语义识别支持,让检索和问答更具有核电特质。
1.2 自动绘制档案关联关系图及档案可视化知识图谱
通过动态标签和自动聚类实现了档案信息与设备的有机关联,将搜索内容溯源。在查找某件档案的时候,通过图谱关联(见图1),可以直接找到该件档案的附件文档、依据文件、参考文件、被引关系、下游文件等内容,极大地提升了档案查询效率。
图1 档案关联图谱
1.3 不断丰富档案知识管理平台底层数据库
档案知识化,不光要着眼于自身档案的管理和利用,也需要引入外部支持,秦山核电与“中国知网”“万方”等国内知名厂商合作引入知识镜像库不断完善内部知识资产,以便员工能及时了解企业外部动态。同时开发基于“RPA+AI”技术的档案机器人智能挖掘核电情报、核电前沿信息,主动收集整理来自合作伙伴和竞争对手的动态,将获取的信息通过邮件的形式进行外网到内网的穿透,然后通过内网机器人对邮件进行解析后录入档案知识管理平台数据库,利用内外部档案资源不断丰富秦山核电知识数据库,使外部信息获取更高效,激发企业员工技术创新活力,服务领导智慧决策,提升企业市场竞争能力。
1.4 档案权限继承
档案知识管理平台全面继承了电子档案管理系统(ECM)的权限,这一特点在提高档案应用效率的同时,更重要的是确保了档案的安全性。为进一步便捷用户使用,平台设有借阅功能,对于用户无权查阅的档案,在经过借阅审批后,可赋予阅读或下载权限。这一举措既保证了档案的保密性,又满足了用户在学术、工作等方面的需求。
2 运用知识管理技术推动智能应用的融入
2.1 引入智能检索功能
通过对搜索引擎进行优化,以及对档案检索模式的重塑,本系统借助语义库专业词汇与高效搜索算法为用户呈现最优检索结果,提升了检索精确度。档案知识管理平台具备标题、主题词、作者、年份、图谱等基础检索功能,同时支持将重要属性与全文进行组合提取生成主题字段,进行权重分配后应用于检索。根据用户输入情况,系统可动态智能提示可能的检索词,在426万份电子文件和档案中,单份档案的检索时间由过去的10秒缩短至1秒以内。此外,系统实现了“单点登录、智慧查询、一站办理”的全场景服务。
2.2 智能推荐让档案自动寻找“利用人”
通过知识管理的用户画像功能,为不同岗位建立360度画像,接入到智慧文档检索平台(iDoc)中,一方面结合核工业语义库600万余条词典和知识图谱功能将知识文档精准推送给公司员工。另一方面在公司核心业务流程中嵌入知识推荐功能,如在数字运行规程系统(iDom)中,现场人员在执行某一份操作规程时,系统会自动推荐该项操作对应的历史经验反馈、良好实践等,有效规范了现场操作,减少了人员失误。将传统的被动式的档案服务逐步过渡到主动的、智能化的知识服务。
2.3 建立核电专题档案库进行专业化服务
依托知识管理先进技术手段创建门类齐全、内容丰富的核电专题档案库。像管理知识一样管理档案,秦山核电通过档案工作与业务工作的深度融合,结合各类智能技术,建立专题档案库,精准服务于生产。基于人工智能技术,根据业务需求,开展面向文档知识服务的数据治理,分析文档著录项和电子文件内容实现自动聚类,建立各类专题档案库,在不改变原档案分类的基础上,扩展档案关联维度,利用档案标题、元数据信息及电子标签等进行数据分析、加工与处理,将文档自动挂接到相应的专题树中,通过信息化手段实现虚拟组卷,目前形成八个体系化、专业化的专题档案库,如内部的OLE(秦山核电320Mwe机组运行许可证延续项目)项目专题、数据中心专题、管理创新专题等。这些文档专题能够帮助用户快速、全面地了解某一个重大项目或者专题,实现了数字文档资源的快速传播和利用,使档案“活起来,动起来”。
3 探索热点技术在档案知识管理平台的应用
3.1 开发档案智能编研机器人“秦小智”
采用智能化方法开展档案编研,省时省力省心。我们大胆探索办公自动化在文档领域的应用,创新性地分析各类用户对档案利用的需求,自动搜集与编研主题相关的档案。通过解析后创建编研文件清单,到各业务系统抓取清单文档,并进行整理、排版等操作生成编研文件,待专业人员审核后纳入秦山核电知识数据库供用户查阅,此举将档案编研效率提升了一倍。目前已成功编制了秦山核电大事记、秦山核电十大技术问题汇编、秦山核电文件汇编三期文件,并获得用户好评。“秦小智”正是利用知识管理技术整合关联各种编研资源,实现档案信息、技术信息等资源的共享,减少重复劳动,避免人力资源的浪费[3]。“秦小智”的上岗是秦山核电在档案管理工作中开展的一次有益探索,也是本公司文档管理数字化转型的典型应用案例。
3.2 构建核电领域档案知识问答应用
在秦山核电内部部署AI大语言模型,借助该模型的人工智能技术,主动挖掘与提取档案中的设备编码等关键信息,替代人工整理和提炼知识,实现实体抽取、知识更新、关系抽取及知识补全,高效绘制核电设备知识图谱(见图2),实现知识的可视化展示,同时建立实体与档案内容之间的关联,并借助大语言模型卓越的语义理解功能,实现智能知识问答,为用户提供更为精准的问答服务。
在核电企业中,标准文件和管理程序(核电内部操作手册和规范)是应用非常频繁的档案类型,我们将这些常用档案进行XML碎片化处理,分解为多个独立的XML片段,每个片段都包含一个特定的主题或知识点,利用这些片段构建一个问答系统,以实现对核电企业内部信息的快速检索和理解。问答系统可以根据不同类型的问题,如是非类、陈述类、求值类、范围类、时间类和统计类问题,直接在片段中寻找答案。例如,当员工需要了解出差某地的住宿费报销标准时,问答系统可以根据操作手册中的XML片段,直接给出答案,大大减少了翻阅文档的时间。
4 建立档案知识管理平台“驾驶舱”
让档案数据“活”起来。为便于管理,开发档案系统数据驾驶舱,直观展示档案数量、年份、种类、分布以及利用情况等各项数据,提升了档案信息资源管理效率,增强了档案信息资源可用性,挖掘了档案信息资源利用深度[4]。通过档案驾驶舱,公司领导和档案管理部门可以实时了解企业档案的运行现状,同时借助底层应用数据分析,为档案知识管理平台的后续优化提供指导,从而更好地服务用户。