基于生成式人工智能的电力企业档案智能辅助决策系统设计与应用
2024-10-22吴边胡志华郭方杨沛
摘要:档案作为电力企业重要的信息资源,对企业决策具有重要意义。随着智能技术的发展,档案服务智慧化和智能化成为档案工作的必然要求。为此,论文将生成式人工智能技术应用于决策服务场景,开发了电力企业档案智能辅助决策系统,设计了情报简报自动生成、档案知识库、智能问答、数据大屏、一站式智能检索、信息识别与自动分类等功能,并探讨了生成式人工智能在电力企业档案智能辅助决策系统中的应用要点,旨在促进电力企业档案价值的充分开发,实现企业决策的提质增效。
关键词:企业档案 生成式人工智能 智能辅助决策系统
电力企业档案是指在电力生产、分配、传输及销售、运营、管理等过程中形成的各种形式和载体的信息记录。在现代电力企业中,档案已成为支持日常运营和战略决策的重要基础。高层决策者在制定科学、合理的策略时,经常需要对复杂数据进行全面分析。在这一过程中,对市场趋势、政策变化及技术革新等战略环境的评估依赖相关档案数据,凸显了迅速访问海量档案并从中提取关键信息的迫切需求。
当前,许多电力企业已经初步实现了档案数字化转型,但随着数据量的急剧增加和信息处理需求的多样化,传统的档案信息服务方式已难以满足企业高效决策的要求。基于此,生成式人工智能(Ar? tificial Intelligence Generated Content,AIGC)技术的引入为电力企业档案价值的开发提供了新的解决方案。生成式人工智能基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过对已有数据的学习和识别,以适当的泛化能力生成相关内容。该技术把数据要素提到了核心资源的位置,能够对庞大的档案数据集进行分析和解读,为企业决策提供基于历史数据的深入洞察和趋势预测,帮助决策者管理资源、评估风险,从而提高决策质量。
一、人工智能赋能电力企业档案信息开发与利用的现状
近年来,在我国电力行业中,人工智能技术与档案管理的结合已经取得了显著进展。电力企业不仅将智能技术融入传统的档案收、管、存、用全过程,而且在积极探索自动化和智慧化的运作链路。例如,国网江苏电力公司于2019年启动了智慧馆库系统与国网档案系统的数据共享项目,初步构建了“1+ N”智能库房云体系,为公司的数字化转型提供了有力支持。[1]此外,国网信通产业集团于2021年成立了电力人工智能创新中心,搭建了电力人工智能平台,采用智能技术支持业务系统的开发。[2]2023年,南方电网公司推出了电力行业首个自主可控智能电力大模型,该模型具备意图识别以及管控安全风险等能力,已在广东等五省区的发、输、变、配、用电领域的80余个场景中得到应用。[3]
国外电力企业在智能技术赋能档案信息开发方面,则逐步在往决策支持方面发展。如美国杜克能源公司利用人工智能预测电力需求,并优化电网运营。该公司还用历史数据分析、识别和预防设备故障。[4]德国电力公司将人工智能用于优化可再生能源,并使用数据分析提高电网的稳定性和可靠性。[5]日本东京电力公司则利用人工智能和机器学习技术分析档案数据,从中提取出有价值的电力企业发展趋势和模式。[6]
整体来看,尽管高度依赖数据分析进行创新的电力行业在业务数据查询、检索、分析与可视化方面应用了智能技术,但在系统性的知识关联、整合以及内容智能生成方面仍有拓展空间,尚未从核心技术层有针对性地探究大模型与档案工作的结合点、结合方法与系统性影响,[7]也未充分发挥新一代智能技术在高层决策支持中的潜力[8]。基于此,本文将生成式人工智能技术应用于决策服务场景,通过智能分析自动生成战略环境扫描报告,以可视化动态数据监测企业运营,采取多轮问答与决策者形成思维互动,以期进一步促进档案价值的开发和实现,增强企业的战略决策能力。
二、基于生成式人工智能的电力企业档案智能辅助决策系统设计
基于生成式人工智能的档案智能辅助决策系统的设计,包括系统总体架构和系统功能设计。
(一)系统总体架构
档案智能辅助决策系统总体架构分为环境层、支撑层、数据层及应用层,如图1所示。
1.环境层。环境层为系统的运行提供基础环境保障,包括服务器、安全设备、网络设备、运行平台及操作系统。环境层的稳定性和安全性直接影响系统的整体性能和可靠性,可以确保系统在各类网络条件和硬件配置下均能稳定运行。
2.支撑层。支撑层为上层应用提供所需的算法模型和工具支持,包括AIGC大模型、ELK架构(Elas? ticsearch、Logstash、Kibana三大开源框架组合)、数据可视化及流程引擎等。AIGC大模型以智能问答和文本处理为核心任务,提供电力情报简报的自动生成和知识咨询服务,具体功能包括内外部多源文本的理解、摘要定向生成及连续多轮对话;ELK架构可以建立集中式日志收集系统,提高定位问题的效率,满足多场景的应用;数据可视化主要借助图形化手段,清晰有效地传达信息,将数据属性值以多维形式表示;流程引擎则可以实现各类数据流转的规范化。
3.数据层。数据层为系统提供内外部数据及数据的预处理。数据源主要来自三个部分:一是外部数据,爬虫获取的政府网站、行业网站/公众号及智库类期刊上的新闻资讯等;二是基础信息数据库,包括企业资源管理系统、电网调度管理系统、电能服务管理平台;三是档案数据及业务数据,包括档案管理系统、营销地理信息系统、计量生产调度平台、设备运维精益管理系统、供电电压自动采集系统、财务管控系统等。数据层采集和存储原始数据,完成结构化数据解析,并对数据进行预处理,以便为后续智能分析提供可靠的数据基础。
4.应用层。应用层作为档案智能辅助决策系统输出的功能模块,直接面向决策者或决策服务者开展智能信息交互,并与实际的工作场景对接,如为决策服务部门(智库)提供情报简报自动生成、档案知识库、智能问答、数据大屏、一站式智能检索、信息识别与自动分类等服务。
(二)系统功能设计
基于生成式人工智能的档案智能辅助决策系统通过情报简报自动生成、档案知识库、智能问答、数据大屏、一站式智能检索、信息识别与自动分类六大功能模块,实现电力企业档案数据的集成化、可视化和内容生成式服务。
1.情报简报自动生成。情报简报为高层决策者提供快速获取关键行业动态、政策变更、市场趋势、竞争对手行动以及技术进展的概览。这种战略环境扫描,涉及行业方针和相关法律法规、电力行业产业结构调整措施、新兴技术与绿色低碳产业深度融合相关信息等。由于信息来源多样、类型复杂,并和企业内部档案数据存在密切关联,为缩减情报生成工作的环节和工作量,在系统设计中情报简报自动生成模块,通过自然语言处理和机器学习技术从多样化的信息源中按简报模版要求和内容提取规则进行筛选与分类,识别出对电力行业具有重要影响的信息。数据预处理后,生成式人工智能技术对这些数据进行深度分析,用决策算法探索数据中的潜在模式和关联,最终基于分析结果自动生成情报简报。
2.档案知识库。档案知识库模块不仅要实现文档共享和管理,还要进行语义保存和多模态异构信息来源的整合。[9]在档案知识库的构建中,向量数据库发挥了关键作用,文本、图像、声音等多模态档案知识通过嵌入模型将上下文环境编码到同一向量空间,转化为一组低维稠密向量,使档案知识能够荷载多层语义信息。同时,它为大模型提供了一种“长期记忆”,使其能够存储和回忆大量的领域特定知识。向量数据库能将预测分析与机器学习算法结合,深入分析数据内容,识别趋势和模式。
3.智能问答。智能问答模块借助大语言模型以及生成式人工智能文本生成技术,再加上应用程序框架LangChain,使得档案智能辅助决策系统在处理用户知识需求时,除了进行用户主动输入的关键词搜索外,还能处理用户在问答区的提问。在跟踪对话上下文方面,生成式人工智能可记忆之前的讨论主题,并基于这一主题继续生成相关回复,保持人机对话的连贯性。[10]通过不断学习,智能问答系统可以提高解析语义、处理歧义的能力,使回复更加精准地满足用户的需求。以解读国网“三重一大”决策制度为例,系统会基于文本相似度表征模型获取输入问题的表征,依靠表征寻找相似知识段落文本,然后输出当前问题的结果。
4.数据大屏。数据大屏基于系统知识库中的海量基础管理数据、档案数据、业务数据以及外部信息,用文本挖掘技术将知识进行分类、聚类、关联规则挖掘、语义分析、标签识别与内容关联,并通过ECharts可视化技术手段直观展示。用户可通过数据大屏实时查看信息云图,以知识图谱的形式发掘历史数据,跟踪行业进展,了解行业新兴主题、热点话题、发展趋势,预测未来的电力需求、价格波动等,提高关键信息的利用率,[11]为企业的战略规划提供依据。
5.一站式智能检索。档案智能辅助决策系统能结合大语言模型与Elasticsearch的技术优势,为实现检索增强生成提供解决路径,全方位提升档案知识检索性能。大语言模型通过训练大量文本数据,能够准确地理解查询的语义,并生成与查询相关的自然语言文本。系统将大语言模型与Elasticsearch结合使用,先解析查询请求,再生成描述这些查询的关键词或短语,然后快速从大规模数据集中找到与查询最相关的信息,提高检索的相关性和精确度。结合这两种技术,智能辅助决策系统可以在检索时提供更加深入和广泛的数据分析。
6.信息识别与自动分类。信息识别与自动分类依靠人工智能技术强大的计算能力和先进的算法模型得以实现。信息识别阶段,利用如自然语言处理、图像处理或语音识别等技术,对内网发布的档案信息及外网动态信息进行分析,通过提取信息中的关键特征来形成对信息的理解。信息分类阶段,深度学习算法模型通过对大量标注数据进行训练,学习如何根据信息的特征将其归类到正确的类别中,[12]使得数据更加有序和易于管理。经初步测试,系统在外网获取的行业资讯借助大语言模型完成内容、时间、来源等特征的自动分类,相比传统人工分类更省时省力。此外,生成式人工智能技术还可结合电力企业档案面向决策场景的特定需求进行定制开发,将自动分类后的信息进行可视化呈现,为企业决策提供直观的关于发展走势或者模式的参考。
三、基于生成式人工智能的电力企业档案智能辅助决策系统应用要点
为进一步提升系统性能,在应用中需重视决策需求与档案数据服务资源的耦合,保障人工智能生成内容的真实性与准确性,实现数据的同步化和集成化以及面向用户交互进行的系统迭代与优化。
(一)决策需求与档案数据服务资源的耦合
顺利实施和应用智能辅助决策系统的前提是系统提供的档案数据应与决策需求高度相关。系统应识别决策者所需的数据类型、数据详细程度及更新频率,并整合内外部信息资源进行映射和序列化,以便能快速响应。[13]在决策需求与服务资源成功映射后,系统需要动态地整合这些信息,以形成对决策有直接帮助的分析报告和建议。通过大模型和生成式人工智能,系统能够从多源数据中自动识别文档中的关键信息,如事件、人物、时间节点等,且不同数据之间的知识元素可以形成丰富的知识体系,从而为决策提供更加全面的知识支持。
(二)人工智能生成内容真实性与准确性的保障
生成式人工智能可以“编造”看似可信的答案(有时称为“幻觉”),而系统输出内容的可靠性是建立决策用户信任的关键,也是确保决策科学性的基础。[14]因此,在满足决策需求的基础上,要保证生成式人工智能生成内容的真实性和准确性。目前人工智能生成内容主要基于机器理解生成自然语言文本,生成结果会受到人为指令或算法偏见的影响。对于尤其关注安全的电力行业决策部门,更应考虑到不精确输出的潜在危害。针对这一状况,需使用高质量的数据源,采用透明和可解释的算法以及进行持续的系统监控和优化。[15]智能生成内容的对话者——决策者要加强对技术的理解,注重人的主体性的发挥。系统的开发主体要完善数据筛选机制,加强生成信息的质量检测和验证来调整性能并结合其他工具客观地评估输出的准确性。系统的管理主体要建立健全企业档案数据管理的业务标准、数据标准、安全管理体系,关注信息隐私风险。
(三)数据的同步化和集成化
在多系统环境下,数据同步和集成是实现档案智能辅助决策的必然要求。现有的信息系统如企业资源管理系统、电网调度管理系统以及其他基础数据管理系统应无缝集成。通过高效的中间件和应用程序接口(Application Program Interface,API)管理,可以确保数据在各系统间的准确传输和即时更新,对于保持决策内容的时效性和相关性至关重要。[16]数据同步采用事件驱动架构和消息队列以确保在各系统间的实时同步,这样可以在源数据发生变更时能立即反映到决策支持系统中,使决策依据总是基于最新的数据。在数据集成化过程中,可以采用数据的一致性和恢复机制来确保所有系统中的数据的一致性;可以设置数据回滚和恢复机制以应对可能的系统故障或数据错误,保障决策数据的准确性和系统的可靠性。
(四)面向用户交互的系统迭代与优化
为了提升系统的实用性和决策满意度,建立有效的用户交互和反馈机制必不可少。系统应提供直观友好的用户界面和交互设计,使决策者能够轻松访问和理解决策支持内容。同时,在基于生成式人工智能技术的用户互动页面(如智能问答)中,让用户对回答内容的质量进行评价,以此来收集用户的使用体验和偏好信息,对用户进行画像。系统还可以提供用户定制化选项,如可调整的数据仪表板和个性化的报告格式等,促进用户参与。要注意的是,在用户与大模型交互过程中,生成式人工智能会产生一些带有感情色彩的回应,与人共情,并在长期借助大数据的深度学习中,对用户的了解越来越深,可能导致用户的心理依赖和决策引导偏差风险,因此互动时要尽量在技术和情感方面达到一种相对平衡的状态。
*本文系国家档案局科技项目“面向智能辅助决策的档案价值增殖研究——以国网武汉供电公司为例”(项目编号:2022-X-057)阶段性研究成果。
注释及参考文献:
[1]林越陵.国网江苏省电力公司档案智能管理中心举行揭牌仪式[J].档案与建设,2019(10):2.
[2]刘慧波,伍臣周,王舒.人工智能赋能电网数字化发展[N].国家电网报,2022-01-11(005).
[3]杨彬.电力行业人工智能创新平台及自主可控电力大模型发布[EB/OL].(2023-09-26)[2024-01-06].https:// mp.weixin.qq.com/s/2EUM7aVPZfoKuyUf5dEDdg.
[4]IDC.出海市场洞察|全球电力行业数字化支出重点领域[EB/OL].(2024-08-02)[2024-08-30].https://www.idc. com/getdoc.jsp?containerId=prCHC52499024.
[5] Toolify.ai.德国智能化发展:AI在德国的创新应用和潜力[EB/OL].(2024-02-16)[2024-02-16].https://s.b1n.net/uxNSo.
[6]KOBAYASHI Y, KOBAYAKAWA T. TEP? COIntegrated Report 2023[R].Tokyo:TokyoElectric Power Company Holdings,2023:50-52.
[7]牛力,金持,黎安润泽.大模型在档案工作数智转型中的应用:新机遇、新模式和新转变[J/OL].档案学通讯,2024:1-11[2024-09-02].https://doi.org/ 10.16113/j.cnki.daxtx.20240511.001.
[8]McKinsey & Company. Beyond the hype: New opportunities for gen AI in energyand materials[EB/OL].(2024-02-05)[2024-09-02].https://www. mckinsey.com/industries/metals-and-mining/our-in? sights/beyond- the- hype- new- opportunities- forgen-ai-in-energy-and-materials.
[9]钱毅.从保护到管护:对象变迁视角下的档案保管思想演变[J].档案学通讯,2022(2):82-88.
[10]谭雅琼.智赢现在,致胜未来——构建多元数据融合的新型企业智库[J].企业管理,2023(2):107-112.
[11]刘伊玲,王胡燕,杨本富,等.智能小档:基于深度学习的智能化科技档案管理的应用研究[J].山西档案,2023(5):136-142.
[12]李广建,潘佳立.人工智能技术赋能情报工作的历程与当前思考[J].信息资源管理学报,2024,14(2):4-20.
[13]李豪,周爽.基于三维知识超图的电力智库知识服务平台建设[J].智库理论与实践,2022,7(3):84-92;99.
[14]陈艳红,李健.新一代人工智能生成内容档案身份的认定风险及规制研究——基于对ChatGPT生成内容的思考[J].档案学研究,2023(5):4-12.
[15]郑慧,李家和.智慧档案馆档案信息智能化服务模型构建:要素、要求和路径[J].北京档案,2024(6):27-31.
[16]周枫,金波.基于PDCA模型的档案数据质量治理研究[J/OL].情报科学,2024:1-18[2024-09-02].http://kns. cnki.net/kcms/detail/22.1264.G2.20240506.1623.006.html.
作者单位:1.国网湖北省电力有限公司2.国网湖北省电力有限公司武汉供电公司3.湖北大学历史文化学院