基于ChatGPT的问答式财务知识库构建与应用
2023-09-12金源正高级会计师魏振李成智
金源(正高级会计师),魏振,李成智
一、引言
2022年,科技部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,指出要以需求为牵引谋划人工智能技术应用场景,融合人工智能模型算法和领域数据知识,推动人工智能场景创新。2023年7月,国家网信办等七部门联合公布的《生成式人工智能服务管理暂行办法》也指出,国家鼓励探索优化生成式人工智能技术应用场景,构建应用生态体系。
2022 年11 月底,OpenAI 发布基于GPT(Generative Pre-Training,生成式预训练)语言模型GPT-3.5 Turbo构建的智能聊天机器人ChatGPT。ChatGPT 是继数据库和搜索引擎之后的全新一代“知识存储和调用方式”,是当前AIGC(AI-Generated Content,人工智能内容生成)领域的代表性技术。ChatGPT 凭借精准的语义理解能力、强大的语言表达能力、严谨的逻辑思维能力,对新闻媒体、教育培训、客户服务与支持、法律服务、会计审计等行业均造成一定程度的冲击,引发全社会热议。
为积极应对ChatGPT 对会计领域的冲击,已有多位学者思考并探讨了ChatGPT对会计科技(金源和李成智,2023a)、会计行业变革(刘勤,2023)、智能财务(金源和李成智,2023b)等方面的影响,并且积极探索其在财务咨询、审计、税务管理等具体财务场景的应用可行性。然而,现有研究多集中在理论框架构建和实践构想层面,对ChatGPT在财务场景中落地实践的研究尚存在空白。
在数字经济蓬勃发展的时代背景下,财务RPA、数电发票、智能财务、ESG等新概念层出不穷,会计行业对于知识更新迭代的要求也越来越高。财务人员需要及时、精准地获取前沿的财务知识以更好地完成本职工作,赋能企业管理决策。然而,当前财务人员基于搜索引擎和内部知识库的知识检索模式存在着信息过载、检索质量参差不齐、信息更新滞后、难以满足个性化需求等诸多痛点,这些痛点严重制约了财务人员获取和使用财务知识的效率。基于以上背景,本文提出基于ChatGPT 构建问答式财务知识库的可行框架,并以H 公司的问答式财务知识库ChatDoc 作为案例,具体呈现了问答式财务知识库在财务部门的落地路径及其在赋能财务知识管理过程中的应用价值。本研究为AIGC 时代企业财务知识库的构建提供了新视角。此外,本文的研究方法和思路,也为其他垂直领域知识库的建设提供了参考与借鉴。
二、DIKW 视角下财务知识管理的演变逻辑
DIKW(Data-Information-Knowledge-Wisdom)模型是被广泛应用于知识管理领域的模型,它指出人类决策智慧的形成经历了从噪声中分拣出数据,再将数据转化为信息,升级为知识,最终升华为智慧的过程。在这一过程中,数据的“清楚、简明、完整、正确”程度在不断提升,对于数据理解的深度也在逐层增加。金源和李成智(2023c)研究指出,数据驱动下的财务决策支持工作本质上也是从业财数据到决策有用的信息和知识,最终再到决策智慧的加工收敛过程。在该过程中,数据沿着财务金字塔(财务核算、业务财务、战略财务)由下至上被逐层传递,传递内容的数量不断下降、质量不断提升(如图1所示)。
图1 数据沿着财务金字塔被逐层加工
在上述过程中,财务相关工作也经历着从数据管理、信息管理再到知识管理以及智慧管理的演变。数据管理主要关注数据收集、存储和处理。信息管理则更进一步,关注如何从海量数据中提取决策有用信息并进行有效管理。知识管理的关注重点是将信息转化为可复用、可传播的知识,以持续支持组织的决策和创新。智慧管理是知识管理的下一阶段,包括对决策智慧、高级财务管理人员经验等的管理。在财务领域,上述四阶段体现如下:
第一阶段:数据管理。财务领域最初的数据管理体现为对纸质凭证、文档的保存和归档。自1979 年开始,我国财务管理进入电算化阶段,数据开始被存储在电子表格或小型数据库中,使得数据的存储、检索和分析更加方便,同时也保障了数据的安全性和完整性。
第二阶段:信息管理。20世纪90年代,随着ERP(Enterprise Resourse Planning,企业资源管理计划)的普及,我国财务管理进入信息化阶段,业财数据实现初步整合,ERP系统在财务管理中的应用使得企业的各项资源配置更加合理,管理者可以依照多方有效信息来进行更为科学合理的决策。2005年财务共享模式的兴起以及2008年XBRL(可扩展商业报告语言)中国地区组织的成立,使得财务信息管理的标准化程度进一步提高。
第三阶段:知识管理。2016 年,德勤和Kira Systems宣布将人工智能引入财会领域,标志着我国财务管理进入智能化阶段(刘勤和杨寅,2019)。刘勤(2021)指出,由于存储在人类财务专家头脑中的财经知识大多具有隐性特点,因此如何借助有效的知识表示方式,将人类专家的知识转化为计算机可以自动处理的显性知识并使之得到有效应用,就成为财务智能化建设中的关键问题。为解决上述问题,部分企业的财务部门开始将财务知识库、专家系统和知识图谱等技术引入财务领域以实现财务知识管理的集中化、显性化。
第四阶段:智慧管理。在DIKW 模型中,智慧是对知识的深入理解和应用,是对复杂问题的洞见和创新性解决。在财务管理领域,智慧管理表现为将决策者的个人智慧与财务预测模型、异常告警与归因模型的机器智慧进行人机协同,以发现问题背后的隐藏模式,预测未来发展趋势,提出业务优化建议。
以上从DIKW 视角对财务领域的知识管理模式演变进行了梳理,而ChatGPT的问世为财务工作拓展了更大的想象空间,使得财务知识管理模式从单向管理向双向智慧问答演变。例如:在数据管理方面,微软的Microsoft 365 Copilot(微软365 智能副驾),可以对Word、Excel、PowerPoint、Outlook、Teams 等应用中的数据和文档以对话的形式进行增删改查;在信息管理方面,微软的Dynamics 365 Copilot可嵌入ERP系统中实现对于库存信息、供应商信息的交互式查询;在知识管理方面,可将ChatGPT 与财务知识库结合构建起问答式财务知识库;在智慧管理方面,GPT-4 的Code Interpreter(代码解释器)插件通过双向对话和零代码的形式极大地降低了财务人员进行海量数据处理的门槛。如表1所示。
表1 ChatGPT推动财务知识管理模式演变
三、基于ChatGPT 构建问答式财务知识库的必要性与可行性
ChatGPT 的出现为财务人员提供了一种通过自然语言与大模型交互进行知识检索的模式,但ChatGPT 直接用于财务知识检索仍存在着以下问题:①对于财务专业纵深领域知识的理解不足。ChatGPT 在不利用财务知识进一步微调(Fine Tuning)的情况下,仅基于其预训练(Pre-training)所习得的知识可能无法准确理解财务工作中一些复杂的术语、流程和实践。②受限于过高的算力成本,企业利用财务领域数据对大模型进行微调或训练财务垂直领域的大模型在当前可行性较低。③ChatGPT在中文语境下训练不充分,该缺陷会进一步加剧对财务术语的误解。④对会计准则和税务法规溯源不准确,该缺陷将影响相关法规查询结果的可靠性。
由于以上缺陷的存在,无论是单独基于搜索引擎、内部知识库还是ChatGPT,均无法较为完善地实现财务知识库功能(如表2所示)。但单独看来,三者又各有所长:ChatGPT 相较于传统搜索引擎和聊天机器人,具有深度学习、多模态理解、长文本生成、上下文感知、自我学习和良性价值观等突出特点;内部知识库具有知识精准度高、“实务经验类”知识丰富、准则和法规溯源准确等突出特点;搜索引擎具有实时更新、覆盖范围广等突出特点。因此,本文认为可将三者的核心优势相结合,构建基于ChatGPT的问答式财务知识库。
表2 三种知识管理方式对比
四、基于ChatGPT 的问答式财务知识库框架设计
问答式财务知识库的构建目的是提供一个自助、便捷、精准的个性化财务知识查询平台,使得财务人员可以通过多轮对话,就日常工作、管理决策和技能学习过程中遇到的各类问题,依据个人需求和偏好实现个性化检索。
(一)财务知识库的系统架构
本文认为,基于ChatGPT 的问答式财务知识库系统至少需由文档库、组件库、向量数据库、OpenAI的API接口、日志系统和用户界面六大模块组成,如图2所示。文档库是财务知识库的核心模块,用于存储财务领域的相关知识,如会计准则、税法以及财务理论知识等。组件库(包含文档分割、数据连接、索引构建、查询接口等相关组件)用于对文档库中的文档进行一系列操作,将其切分、加工为计算机易于处理的向量格式。向量数据库则用于存储经组件加工而生成的特征向量,以便后续高效地依据文档相似度进行匹配和检索。OpenAI的API接口是财务知识库用于调用ChatGPT 等其他服务的通道,从而可以基于ChatGPT 的自然语言处理能力,实现对用户问题的解析并给出自然语言形式的回答。日志系统用于记录用户的查询行为和系统的运行情况,以便开展后续的数据分析、性能优化和可追溯审计。用户界面是用户获得财务知识库服务的系统入口和人机交互界面。
图2 基于ChatGPT的问答式财务知识库系统架构
接下来,本文将对上述系统架构中最为核心的文档库、组件库中文档分割组件、向量数据库展开进一步解释。
1.文档库。文档库是问答式财务知识库最为核心的部分。通常文档库至少需包含以下方面的知识:一是外部的规章制度,包括国家和地方政府颁布的各种规章制度和政策,以及通行的企业会计准则、税法、会计人员职业道德规范等。二是通用型的财务知识,例如财务经典理论知识(会计恒等式、杜邦分析法、投资组合理论、成本性态分析法等)和财务前沿知识(数电发票、财务RPA、智能财务等)。三是公司财务部门内部总结的经验和知识,包括财务人员在日常工作中逐步积累、总结和提炼出来的各种财务管理的技巧、方法和经验,以及财务管理中一些常见问题和解决方法。
2.文档分割组件。受到模型结构、算力等因素的影响,ChatGPT具有一定的输入输出长度限制,例如GPT-3.5 的提问加回答的总长度限制为4096 个token,GPT-4扩展为32768 个token(token 是GPT 处理文本的基本单位,指一个句子中的最小词元,它可以是一个字、一个词或是一个特殊符号)。由于上述限制的存在,用户无法将大型文档一次性发送给ChatGPT,文档分割组件的主要作用是将文档库中的大型文档按照段落、句子或关键词等方式进行分割,以便于后续的向量化操作和问答匹配。
3.向量数据库。在计算机科学中,向量数据库是区别于常规数据库的一种特殊数据库。常规数据库以数据作为存储和检索的对象,而向量数据库存储和检索的对象是计算机更容易处理的向量,并可高效地依据向量间的相似性进行检索。如果将文档库视为一个储存着海量商品的仓库,向量数据库存储的就是这些商品的“标签”,“标签”与商品间存在着索引关系,可以通过“标签”快速地检索到对应商品。
当用户向问答式财务知识库提问时,系统会首先将提问转化为向量表示形式,并在向量数据库中匹配与该向量最相似的文档向量,再根据索引关系从文档库中提取相应的文本段落,将该段落作为背景知识,与用户的提问共同拼装为提示词(Prompt)发送给ChatGPT,让Chat-GPT基于提示词里的用户原始提问以及依据提问从文档库中匹配到的背景知识给出回复。该方法在提高ChatGPT回答精准度的同时,也妥善解除了输入上限的限制。
(二)财务知识库的运行过程
本文认为,问答式财务知识库的运行过程可以分为文档准备和用户问答两个阶段。在文档准备阶段,财务知识库将各类财务文献和报告等信息资源导入文档库中,并通过文档分割组件和调用OpenAI 的词句转向量(Word to Vector,Word2vec)API接口,提取其中的关键信息和特征,形成文档的特征向量,存入向量数据库。在用户问答阶段,用户可以通过输入文本的方式向系统提出问题,系统将解析用户的问题并返回最佳答案。在此过程中,系统会利用向量数据库中存储的特征向量进行相似度匹配和检索,以确保返回的答案尽可能准确和全面。两阶段的具体流程如图3所示。
图3 问答式财务知识库两阶段运行过程
1.第一阶段:文档准备阶段。文档准备阶段主要是对文档库里的文本进行预处理,包括转换格式、分割、使用OpenAI 的Word2vec 功能把文本转换成向量。各环节的具体操作如下:
(1)转换文档格式。由于ChatGPT 是一个基于NLP(Natural Language Processing,自然语言处理)的大语言模型,比较擅长理解文本语言,所以如果文档库里存在PDF格式的文档或电子表格数据,则需转换为纯文本格式以便ChatGPT理解。以转换Excel电子表格为例,可以把电子表格另存为csv格式,这样电子表格的表头和每一行的数据信息就被转化为一串以逗号隔开的文本。
(2)分割文档。如前文所述,ChatGPT一次对话可处理的token数量存在上限,对于大文档就需要使用文档分割组件将其分割成小块(chunk)。此外,为了满足每个小块都有完整语义的要求,在分割过程中要使用技术手段保证块与块之间存在一些重合。
(3)使用OpenAI 的Word2vec 功能把小块(chunk)的文本转换成向量,用以表达该段文本的语义,处理完成后再将计算出来的向量存入向量数据库。
2.第二阶段:用户问答阶段。从用户向财务知识库发起提问到最后系统将回答呈现在用户界面的全过程中,系统内部经历了如下流程:①寻找最相关文本。系统调用OpenAI 的Word2vec 功能把用户提问文本转换成向量,通过相似度计算,从向量数据库中匹配最相关的文本向量。②依据向量数据库和文档库间的索引,查询相应的背景知识。③将背景知识和提问组合成提示词(Prompt),通过接口传输至ChatGPT。④系统把提示词发给Chat-GPT,在获得ChatGPT的回答后,将回答呈现至用户界面。
(三)财务知识库的日常维护
问答式财务知识库构建后,后续还可能面临外部会计准则和税务法规更新、新文档入库以及旧文档废弃等情况,此时就需要建立知识库的维护规范,持续对文档库进行更新。
首先,在知识入库时需要对文档进行分类管理,制定标准化的入库流程,以确保知识能够被高效地记录和管理。为了保证高频更新文档的入库效率,可以采用RPA技术,通过批量下载法规文档或者对文档进行预处理的方法,将知识快速地录入文档库中。以RPA 辅助税务法规入库为例,RPA 可以定期访问指定网站,先浏览并抓取法规清单内容(包括法规的标题、正文、发布日期等),再将抓取到的法规清单与在库法规清单对比以形成一张新增法规清单,之后依据新增法规清单逐个浏览法规页面、抓取法规内容并写入一个文本文档,再通过RPA 把本次下载的法规文本文档上传到财务知识库的文档库里,最后RPA更新在库法规清单以便用于下次比对。
其次,知识更新和弃用也是财务知识库维护的重要方面。在知识更新方面,可以利用RPA技术定期检查法规的有效状态,确保知识库中的信息始终保持最新、准确和可靠。而在知识弃用方面,需要确保知识库中的信息经过充分的筛选和审核,将不再适用或不准确的信息标记为弃用,以避免给用户带来误导或困扰。
五、H 公司问答式财务知识库ChatDoc 实践案例
(一)案例背景
H 公司是我国领先的科技公司,聚焦于为各行各业客户提供数字化解决方案,助力客户数字化转型,为客户持续创造价值,多年来在数字化方面积累了大量经验。作为财务数字化转型的持续探索者,H 公司目前已应用多种数字化技术构建起一套先进的财务管理体系。随着ChatGPT 的推出,H 公司同时成立了多个项目组对其应用积极地展开探索,问答式财务知识库ChatDoc 是其中的一个项目。通过该项目,H 公司旨在提升财务人员检索知识的精度和效率。
(二)ChatDoc的系统结构
H公司搭建的问答式财务知识库架构图如图4所示。
图4 ChatDoc的系统架构
ChatDoc 的系统组件包括:OpenAI 的Embedding 模型(用于实现前文所述的词句转向量功能)、ChatGPT 模型(负责基于问题和背景知识给出回复)、LlamaIndex 组件(负责读取并切割文档资料,构建索引,检索并匹配向量相似度,查询并转接信息)、文档库(负责存储文档资料)、向量数据库(负责存储文本信息的向量)。
1.知识库的运行过程。H 公司ChatDoc 系统的运作过程如下:①文档库管理员通过财务知识库用户交互界面上传文档到文档库。②LlamaIndex 读取文档资料,把长文档切割成小块文本信息,并建立索引。③LlamaIndex把小块文本信息发给OpenAI 的Embedding 模型,并接收被Embedding 模型转换好的文本向量。④LlamaIndex 把文本向量按照之前建立的索引存入向量数据库,以备用户提问时查询使用。⑤用户通过用户交互界面提出问题。⑥LlamaIndex 把用户问题发给OpenAI 的Embedding模型,并接收被Embedding 模型转换好的用户问题文本向量。⑦LlamaIndex 根据问题文本向量,从向量数据库中找到相似度高的文本向量。⑧LlamaIndex 把用户问题文本与文档文本组合成提示词发给ChatGPT 模型,并接收ChatGPT的回复。⑨用户在用户交互界面接收到问题的答案。
从以上运行过程中可以发现,最终发给ChatGPT 的提示词(Prompt)不仅包含用户最初输入的提问文本,还包括从文档库中检索出的背景知识。此外,为了尽可能规范ChatGPT 的回答,保证输出结果的稳定性,H 公司还在知识库中内置了固定的Prompt 模板,该模板规定了ChatGPT 回答的格式、依据和方式。在此基础上,将用户原提问、从文档库中检索出的背景知识、固定的Prompt模板三者组合成最终的组合提示词。组合提示词的实例如下:
(固定的Prompt 模板)你是一个提供财务咨询的专家。你会拿到下面的一段背景知识和一个问题。请基于这些上下文提供一个对话形式的回复。如果你在这些上下文中找不到答案,就说“对不起,我不知道答案。”不要编造答案。如果这个问题与上下文的内容无关,那么就礼貌地回复你被训练的能力是只能回复与上下文有关的问题。请用中文回复。背景知识和提问信息如下所示:
上述组合提示词里第一段为固定模板,背景知识文本和用户问题文本是LlamaIndex 在每次用户提问后插入进去的文本,其中背景知识文本是借助向量相似度运算从文档库里匹配出来的。如此一来,就可以让ChatGPT基于本地文档库进行回答,从而使得ChatGPT 在回复用户提问时给出一个更加理想的答案。
2.用户交互界面的设计。ChatDoc 的用户交互界面被设计成文档列表区、文档内容展示区和问答区三个部分。在文档列表区,用户可以上传文档,并可查看文档索引的状态,在系统完成对文档的索引后,用户就可以选择多个文档,并且基于这些文档进行提问。在文档内容展示区,用户可以查看文档内容预览。在问答区,用户可以提出问题,问题会被实时展示在对话框里,在短时间的延迟后,用户就能获得回复。
(三)ChatDoc的应用场景
1.实现公司财务制度查询。ChatDoc 可作为智能财务客服,帮助员工便捷、迅速地查询和理解公司的财务政策,常用场景包括:①报销查询:员工经常需要报销工作相关的餐费、差旅费等费用,用户可通过ChatDoc查询公司报销政策涉及的细节,如可供报销的费用类别、差标额度、出差天数计算方式、所需提供证明等。②薪资政策查询:员工可以向ChatDoc 提问薪资的计算方式、发放日期、税务处理等薪资政策相关问题。
2.实现会计准则、税法精准溯源。目前直接使用
ChatGPT 进行会计准则、税法查询时,由于其本身训练数据的限制,会导致ChatGPT 回答我国企业会计准则和税法相关问题时出现凭空捏造准则、法规的情况,该问题严重影响了ChatGPT 在应用于财务实务工作时的可信度。H 公司的ChatDoc 在回答准则和税法相关问题时可精准溯源回答所参考的准则或法规,包括它是在哪个文件中提及的,是由哪个机构发布的,以及发布和修改的日期等信息。
3.实现跨文档查询。跨文档查询是指用户可在Chat-Doc文档列表区同时勾选多个文件,让ChatDoc综合参考多个文件给出回答。例如,在进行投资决策时,财务人员需要对多份公司财报、行业报告等进行对比分析。通过跨文档查询,财务人员可以更全面地理解信息,从而做出更明智的投资决策。又如,在进行会计分录编制时,会计人员需综合考虑准则要求、适用税率、业务背景等相关文档,通过跨文档查询,ChatDoc可在综合考虑以上信息的情况下给出编制某一业务相关会计分录的参考建议。有研究表明,目前ChatGPT 受限于逻辑能力,在中文语境下,其分录编制能力大约在中级会计师水平,因此在上述场景中ChatGPT难以胜任较为复杂的分录编制场景。
4.实现财务专业理论查询。ChatDoc 可用于专业财务理论的查询,如财务理论(有效市场假说、莫迪格利亚尼—米勒定理等)、投资理论(现代投资组合理论、CAPM模型等)、财务模型(贝塔系数、DCF 模型等)。ChatDoc还可在此基础上提供实例对理论给出进一步阐释,以便于财务人员理解。
5.对公开财报进行分析。目前,ChatDoc支持用户上传pdf、xlsx、csv格式的报表文件,并可进行初步的财务报表比率分析(营利性分析、流动性分析、偿债能力分析、杜邦分析等)和趋势分析。
(四)ChatDoc的实践成效
H 公司通过将ChatDoc 小范围投入测试并搜集反馈后发现,基于ChatGPT 的问答式财务知识库弥补了原有基于搜索引擎和内部知识库的知识检索模式存在的不足,能为用户提供更精准的答案,使用户获得更佳的使用体验。具体表现在如下方面:
首先,ChatDoc 可以更精确地理解用户的问题和意图,提供更为精准的答案。传统的知识库系统往往只能匹配用户输入的关键词,无法理解用户的意图和上下文,用户往往需要多次尝试才能得到满意的答案。而Chat-Doc 则可以凭借ChatGPT 的自然语言理解能力,更好地理解用户意图。这不仅有利于提高用户的满意度,还能节省用户的时间和精力。
其次,ChatDoc能够提供更加个性化的答案。传统的知识库系统往往只能列出相关的规则和条款,而无法根据用户输入的问题给出符合实务场景的答案。ChatDoc不仅可以提供个性化的答案,还可以根据规则库中的知识,给出一个详细的逻辑推理过程,用户可以通过查看推理过程来判断答案的可靠性。
最后,ChatDoc减轻了财务人员的工作压力。在财务日常工作中,H公司财务人员除了需承担本职工作,还要为公司员工提供有关报销政策、报销进度等方面的咨询服务。通过ChatDoc,员工可以便捷地咨询报销制度等内容,这种自助查询服务将减轻财务人员的工作压力。例如,员工可以在知识库中查询报销规则和计算出差天数的方法,无须等待人工客服的回复。这种自助服务不仅可以提高效率,也可以提高员工对公司财务规则的理解和遵守程度。同时,H 公司还将ChatDoc 集成到办公软件中,用户可随时随地通过手机、电脑接入ChatDoc自助获取服务。
在研究中,H 公司还注意到,当前ChatGPT 本身能力的不足也在一定程度上限制了ChatDoc 的价值发挥,具体体现在如下方面:①ChatGPT 对文本以外的资料理解并不好,比如在处理复杂表格数据时存在取数不准的问题,在编制复杂会计分录时会存在逻辑错误,这会影响财务报表编制和财务分析相关知识问答的效果。②H 公司也注意到用户提问的提示词(Prompt)对于答案的可靠性至关重要。用户就同一个问题使用不同的提示词,从财务知识库中获得的答案有时是对的,有时是错的。甚至在使用相同提示词时也会出现答案不一致的情况,这种情况被学界称为“大模型幻觉”。对此,H 公司通过加入要求ChatGPT给出推理过程和严格依据背景知识的提示词,以便用户核实所获得答案的可靠性。
六、结论与展望
(一)结论
本文创新性地将ChatGPT 应用于问答式财务知识库的构建,并通过理论框架搭建和案例研究验证了该方法的有效性和实用性。通过研究得到以下结论:①设计基于文档库、组件库、向量数据库、OpenAI 接口、日志系统、用户界面的体系框架是当前阶段构建基于ChatGPT的问答式财务知识库行之有效的一种方式。②基于Chat-GPT构建财务知识库可以提高财务知识的管理效率和问答的可靠性,还可以实现动态知识更新,从而保证知识库的时效性和全面性,为财务人员和其他领域的从业者提供更加高效和准确的知识管理和智能问答服务。
(二)展望
财务部门作为连接企业采购、生产、运营、销售等经营行为的关键枢纽,汇集并管理着企业从业务前端到财务管理后端的海量核心机密数据,因此在基于ChatGPT构建财务知识库的过程中,数据安全必须引起高度重视。尽管文档库和向量数据库可以储存在企业本地,但是在问答过程中系统会把提取的文本发给ChatGPT,虽然OpenAI承诺不会使用这些数据用于训练,但不能保证数据在传输过程中不会发生泄露。本文认为,解决该问题的第一种可行方案是严格限制可纳入文档库的资料范围,对机密资料进行脱敏处理后再纳入文档库。第二种可行方案是将ChatGPT替换成其他可以本地化部署的大模型,从而使得所有的文档和传输均在企业本地,然而,企业本地化部署大模型的硬件成本、软件成本叠加服务成本通常在千万元级别,企业需要权衡成本收益后审慎决定。数据安全是财务系统建设的红线和底线,未来企业知识库的建设要注意守住底线、提升上限、优化体验,朝着助力财务人员转型升级、赋能财务管理的大方向稳步探索。
【 主要参考文献】
陈虎,郭奕.数据价值体系推动财务数字化转型[J].财会月刊,2022(8):37~42.
金源,李成智.ChatGPT+Acctech:ChatGPT对会计科技的影响研究[J].商业会计,2023a(7):4~10.
金源,李成智.ChatGPT 对智能财务体系的影响:场景优化、技术革新与人员转型[J].财会月刊,2023b(15):23~30.
金源,李成智.数据驱动下的财务决策支持研究[J].财会通讯,2023c(3):140~147.
刘勤,杨寅.改革开放40年的中国会计信息化:回顾与展望[J].会计研究,2019(2):26~34.
刘勤.ChatGPT 及其对会计工作的影响探讨[J].会计之友,2023(6):158~161.
刘勤.智能财务中的知识管理与人机协同[J].财会月刊,2021(24):15~19.