APP下载

基于人工智能的核电文档知识管理探索与实践*

2024-01-02詹超铭

山西档案 2023年5期
关键词:华龙漳州知识库

詹超铭

(中核国电漳州能源有限公司 漳州 363300)

随着科学技术的飞速发展,大数据和人工智能已经成为引领时代的两大核心力量,要贯彻落实好档案法和习近平总书记“四好”“两服务”的重要批示,就必须坚持“科技是第一生产力”,主动适应开启全面建设社会主义现代化国家新征程的要求,将档案工作融入科技革命的浪潮,深入探索大数据和人工智能在档案工作中的应用。文档知识管理,就是核电企业在档案信息化建设过程中,不断融合知识管理的新产物。本文以中核国电漳州能源有限公司(下文简称漳州能源)为例,探析核电企业在核电文档知识管理中的创新实践。

1 文档知识管理的研究现状

随着人工智能的快速发展,文档领域的信息化建设越来越注重人工智能技术对电子文档的管理的智能化提升与优化,并取得了一定的研究成果。邢高生采用实体识别、关系抽取、知识表示等技术对HKBZ领域的文档进行数字化转换,提升了文档数据的检索效率与质量,并构建了完整的文档知识管理体系,提高了文档的利用率,实现知识的关联与共享。[1]杨强、胡心宇等人基于图像识别技术对电子文档进行文字识别,从而辅助文档管理人员进行日常管理,即通过图像识别技术拆分文档中的原始信息,并与文档录入信息进行自动对比,保证了文档的准确性,提升了员工的工作效率。[2]华为对其档案管理工作的重视程度,提出了“四位一体”的全球化文档管理框架,即一套规则、一套流程、一站式平台、一套组织和一套运营体系,其目的是简化业务流程,促进企业合 法合规运行。推进了文档知识数字化管理,有效提升档案管理工作水平,对于充分发挥文档知识信息资源的作用具有重要的现实意义。[3]

虽然文档知识管理在企业管理过程中有较为突出的研究,但面对核电领域庞大的知识体系,核电文档知识管理的研究仍然存在较大的问题。例如:核电企业业务系统多,系统集成少,大量的数据、信息和文档分散在各个系统中,容易形成“信息孤岛”,不利于信息查询;中核在文档知识关联方面比较薄弱,程序计划的编制、审批和变更以及程序生效后的培训等业务流程都是在线下进行,程序之间的关联弱,上游程序的变动在人工未干预的情况下无法触发下游程序的升版,无法有效落实核安全文化强调的相关要求。

2 核电文档知识管理的实践现状

在数字经济时代,新技术的成功应用为我国核电企业开展文档知识管理研究实践提供了参考和借鉴。

首先,江苏核电新一代信息技术在文档管理中的应用。江苏核电以支撑公司发展战略为目标,打造高效便捷、全流程贯通的文档管理体系,围绕文档管理内部外用户的实际需求,利用大数据、人工智能、移动技术、云计算等先进科学技术来实现文档管理的标准化、高效化和智能化。[4]实现了信函智能分发、文档资源整合利用、移动上架、业务系统文件自动归档、工程文件自动交换等应用场景,为后续智慧档案馆建设奠定基础。其次,三门核电基于机器学习的核电文档个性化推荐系统建设。三门核电面向提升文档利用及服务水平的需要,采用基于机器学习的个性化文档推荐方式来提升用户使用文档的便利性,让系统可以根据用户历史的输入或者行管岗位人员的输入以及用户对于搜索结果的反馈来综合推荐出用户想要的搜索结果,变被动搜索为主动推荐,实现知识的快速获取,最大化发挥文档资源的价值。[5]最后,福清核电基于机器人技术在文档管理中的应用。福清核电将“AI+RPA”技术引入文档管理领域,打造“文档管理、综合利用、数据分析”服务型、智慧型机器人,以服务档案业务、数据采集、数据管理、数据分析。以“华龙一号”建设运营阶段文档数据为基础,尝试使用文档智能机器人对核电行业使用最广泛的文种进行智能化管理的探索和研究,实现对纸质文档、电子文件等不同来源的文档数据原料的采集及预处理,将日常文档管理中繁琐、重复性的工作,遵照成熟的技术规范与标准,通过智能机器人的“眼+脑+手”技术达到全部或部分取代的效果。[6]

总之,江苏核电、三门核电、福清核电对于文档知识管理的研究实践切实提高了文档管理效能,有利于文档资源的检索利用,具有一定的推广价值,但研究内容局限于文档工作本身,与核电其他业务的融合度不高,赋能业务作用有限。

3 漳州能源文档知识管理探索与实践

漳州能源初步构建了核电文档知识管理体系,建设了漳州能源文档知识管理平台——“华龙智库”知识管理系统(下文简称华龙智库),为员工提供学习、共享知识的平台,并依托华龙智库建设推动文档与业务创新融合,以核电程序体系管理为试点,探索建立文档与业务双向驱动的核电文档知识管理长效机制。

3.1 顶层设计

漳州能源围绕研究目标,制定了“统筹规划、以点带面、分步实施”的文档知识管理实施总体战略,以满足对核电数据的全生命周期管理为主线,结合文档知识管理过程,从数据、技术、知识、应用四个维度进行分析,制定了“一线四核”的技术路线(见图1)。

图1 技术路线图

以需求为导向。在华龙智库的顶层设计上,漳州能源充分调研了用户需求、市场需求和技术趋势,将分析结果转化为系统的设计需求,并对华龙智库的业务架构、应用架构、数据架构和技术架构进行了详细规划。业务架构主要关注系统的业务逻辑和流程,数据架构主要关注数据的结构、数据之间的关系以及数据的存储、访问、管理和保护等方面,应用架构主要关注系统有哪些子系统、子系统之间如何分工和合作,技术架构主要关注系统的高可用、高性能、可扩展、安全性和稳定性等非功能性特征。先形成业务架构,再根据业务架构,做出相应的应用架构,最后技术架构落地实施。

3.2 系统功能

系统功能是用户使用系统时最直接、最关键的体验。华龙智库具有智能检索、程序智库、知识地图三大功能模块。

3.2.1 智能检索

智能检索是华龙智库的核心功能,但要实现智能检索,首先需要整合、构建一个全面的、结构化的知识库。

3.2.1.1 知识库

整合、构建知识库需要对大量的文档数据进行清洗、分类、归集和存储,这就需要运用到自然语言处理、数据挖掘、信息抽取等人工智能技术(见图2)。华龙智库采用自然语言处理技术,将业务系统中已有结构化和非结构化的文档数据进行解析提取,通过数据同步技术将解析后的数据定期同步存储,通过数据挖掘和信息抽取等技术将文档数据的实体、属性、关系进行抽取,利用算法推理技术挖掘数据之间的关系(例如文档与文档间的关联关系,如参考文件、依据文件等),构建出知识图谱(见图3),最终以图数据库的形式将知识进行存储,形成知识库。

图2 知识库构建

图3 知识图谱构建

3.2.1.2 检索引擎

知识检索引擎要根据知识库进行开发。基于Elastic Search 搜索框架、大数据分析引擎和已建立的知识图谱,将海量数据在搜索引擎中进行搜索模型构建、快速索引、智能分词和模型调优,零代码嵌入现有业务系统,解决系统文档查询速度慢的问题。

大数据分析引擎可以对系统采集的海量的用户行为进行分析计算,结合协同过滤算法和系统设定的规则,实现基于用户行为的智能推荐(见图4),用户检索次数越多,系统智能推荐的文档越准确。

图4 基于用户行为的智能推荐

3.2.2 程序智库

华龙智库开发的程序智库业务模块,功能包括程序的计划管理、编制管理和上下游关联关系管理,程序生效发布后的培训管理、变更管理和定期审查管理,实现了程序从编制到升版内循环的闭环管理和全流程电子化管理,以文档+业务的模式推进程序体系管理提升,实现程序业务一体化、程序编制智能化、程序培训信息化、数据统计自动化、文件变动关联化、意见系统专业化和程序管理敏捷化。

3.2.3 知识地图

基于文档知识库和知识图谱,华龙智库创建了知识地图模块,便于用户浏览和寻找自己所需的知识。用户进入知识地图以后,可以选择按核电领域或程序层级展示程序体系,再通过点击体系地图中的节点查询该程序的相关知识。根据知识管理试点范围,目前仅开发公司管理制度体系这一类基于概念的知识地图,同时具备扩展功能,用于后续开展其他类型的知识地图开发。

3.3 实践的创新性

3.3.1 构建文档知识关联关系,实现文档知识高效检索

华龙智库通过知识抽取、算法推理、知识融合等技术,建立了文档和数据之间的知识关联模型,为用户提供了定义检索、关键词检索、组合检索、全文检索等多种检索方式,同时,华龙智库会采集用户的行为数据(检索、查看、收藏、下载等)和个人信息(部门、职位、领域等),通过大数据分析引擎和机器学习算法,结合用户偏好为用户智能推荐文档知识。此外,华龙智库自动提取了文档的目录结构,并根据规则关联了依据文件、参考文件等上游文件和文档的附件,为用户提供了快速定位文档章节和一键跳转浏览关联文件的功能,大大提升了用户文档浏览体验。

通过构建文档知识关联关系,华龙智库实现了文档知识检索效率质的飞跃。用户进行文档检索时,可以通过定义搜索、组合筛选和全文检索的方式得到更为精确的检索结果,系统会结合用户行为数据和个人信息智能推荐其他文档知识;用户在线浏览文档时,可以通过点击目录章节快速跳转浏览页面,快速查看和下载关联上游文件和文档附件。相较于ECM,华龙智库从检索速度、结果准确度和文档关联度三个维度实现了检索效率的提升,不仅解决了用户的痛点,还提升了用户对于文档知识的浏览体验。

3.3.2 建设核电企业级知识库,实现文档知识高度归集

华龙智库将ECM、ASP-1 系统、经验反馈系统等所有会形成文档的业务系统作为知识挖掘的主要对象,进行文档知识库的集成,并通过自然语言处理等人工技能技术,将企业结构化、半结构化和非结构化的数据进行整合和解析,构建了核电企业级知识库。

通过建设核电企业级知识库,华龙智库集成了漳州能源主要形成文档的业务系统,针对性地实现了文档与经验反馈的知识互联互通。用户在开展业务工作时,可以通过华龙智库快速获取与该业务工作相关的管理程序、技术文件和经验反馈等文档知识。华龙智库高度归集了漳州能源各业务系统的文档和知识,统一了用户文档知识的检索平台,结合搜索引擎和知识模型实现了对知识库的高效整合利用,为后续建设服务于公司全局的系统性知识库奠定了坚实的基础。

3.3.3 推进程序体系管理电子化,实现文档+业务创新融合

华龙智库将程序计划的编制、审批、变更和程序文件的编制、审批、分发、培训、升版等程序体系管理全流程进行了电子化,并基于数字孪生概念构建了程序体系知识地图,强化了上下游程序之间的关联关系,地图在程序体系发生变更时会自动更新。此外,华龙智库在浏览页面中设计了程序意见反馈栏,促进用户个人隐性知识显性化。

通过推进程序体系管理电子化,华龙智库将文档工作与体系管理进行了基于数字孪生概念的创新融合。用户在编制程序时,华龙智库会根据编制或导入的程序计划自动为用户生成程序编制任务,并提供一键排版和协同编辑等程序文件编制功能,当程序的上游文件发生变化时,华龙智库会自动识别并触发分析任务至编制处室,确保程序始终满足上游管理要求;用户在查阅程序时,可以通过页面中的意见反馈栏反馈程序存在的问题,将个人隐性知识显性化。华龙智库不仅实现了程序体系管理业务流程电子化,也为建立文档与业务双向驱动的核电文档知识管理长效机制提供了有效范例。

4 实践成效与不足

华龙智库是漳州能源开展核电文档知识管理探索与实践的核心成果,为用户提供更加智能的文档知识服务。

4.1 实践成效

华龙智库自2023年3月29日上线运行以来,日均文档浏览量超过550 次,直接取代了ECM 成为漳州能源文档检索利用的核心系统,运行处和维修处等生产部门的系统访问量遥遥领先。从局部看,原先用户想要从ECM 检索到某个知识,平均需要大约5 分钟的时间,而通过华龙智库的智能检索,用户仅需大约10 秒钟的时间就可以得到检索结果,华龙智库有效解决了漳州能源文档检索利用效率低的问题。从全局看,漳州能源规划建设6+2 台核电机组,系统用户将有2000 余人,在项目连续建设直至全部建成投产发电的过程中,每年新增加各类文档数量约有3-5T,按文档知识管理体系治理入库的知识约有2-3T,华龙智库将持续帮助漳州能源积累智力资产,推动企业文档工作的现代化进程,从而助推漳州能源实现高质量创新发展。

4.2 问题与不足

漳州能源知识管理实践成效显著,但实践过程中也存在着一下问题和不足:

一是前期缺乏明确的知识管理策略。知识管理项目团队对于知识和知识管理的认知不统一,导致知识管理工作一度推进缓慢,这个问题在明确项目负责人,统一思想后得到解决。

二是知识管理流程尚不规范。知识管理需要规范化的流程来确保知识的有效传递和利用,漳州能源以程序为试点推进知识管理工作,华龙智库上线以后,程序仍可以通过ECM 进行审批,未制定明确的业务流程切换时间点,导致用户在使用过程中产生疑惑。

三是知识库数据同步不及时。根据策略,知识库会在每天零点同步业务系统的数据,受ECM 的权限设置影响,有些文档分类下的文档和知识无法下载,导致数据同步失败,用户在访问这些文档时就会跳转到ECM。

四是知识共享意识有所不足。在知识管理实践中,知识共享是至关重要的,漳州能源作为在建电厂,正面临1、2 号机组生产准备,3 号机组即将开工的工程建设紧张时期,同时又处于中国核电集约化改革时期,导致员工忙于日常工作,在知识共享方面有所欠缺,导致知识无法有效传递和利用。

4.3 改进方向

漳州能源未来的知识管理改进方向应包括新技术的迭代升级和优化,提高数据抽取的质量,建立标准化和规范化的知识管理流程,进一步统一和明确管理要求,并制定激励机制,鼓励员工分享自己的知识和经验,促进知识的有效传递和利用依托国家档案局科技项目——“基于系统工程的核电文档知识管理体系构建研究”继续推进漳州能源文档知识管理工作。

5 总结

随着国家治理活动的丰富,档案工作正通过各种方式,为党和国家各项事业建设与发展提供真实凭据、历史经验、记忆媒介、文化源泉、信息支撑,为国家立足当下和面向未来提供战略性信息资源、基础性文化资源、支撑性知识资源、特殊性经济资源、工具性治理资源等支持,促使档案工作成为国家治理体系和治理能力现代化的基础性、支撑性和保障性力量。在这样的时代背景下,核电企业通过开展文档知识管理探索与实践,提出了一种基于人工智能的核电文档知识管理系统,建立了文档与业务双向驱动的核电文档知识管理长效机制。持续推进文档知识管理,有助于核电企业更好地管理和利用企业自身的知识资源,提高知识的共享和利用率,增强企业的竞争力和创新能力。

猜你喜欢

华龙漳州知识库
好好去爱
我国第二台“华龙一号”核电机组并网发电
华龙引领 国之重器
华龙一号海外首堆成功并网发电
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
南康漳州龙
福建漳州面煎粿
漳州:原中央苏区的重要组成部分
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究