财务共享服务中心的大语言模型应用探究
2023-08-04李闻一
李闻一
【摘 要】 大语言模型基于Transformer架构对大量文本数据进行学习,能够结合上下文提示对用户需求进行自然语言处理,具备大数据、大算力、大标注、强算法等能力,受到财务共享领域的广泛关注。文章首先讨论了大语言模型概念及特征,并对国内外五大语言模型进行比较;其次,结合财务共享服务中心的客户支持、运营分析、业务支持、文本信息处理、海外核算管理、档案管理六大场景详细分析了大语言模型在财务共享服务中心的应用,并对其使用风险进行探讨;最后,得出财务共享服务中心需要合理使用大语言模型等结论,以及财务共享服务中心在应用大语言模型时需制定安全保障体系、因企实施、建立人机协同模式等启示,期望给财务共享服务中心大语言模型的应用提供理论指导和实践经验。
【关键词】 大语言模型; 财务共享服务中心; ChatGPT; 应用场景
【中图分类号】 F230 【文献标识码】 A 【文章编号】 1004-5937(2023)15-0002-09
一、引言
《“十四五”数字经济发展规划》明确提出“到2025年数字经济迈向全面扩展期”,党的二十大报告进一步指出“要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”,这迫切需要通过数字化带动实体经济转型升级。大语言模型(Large
Language Models,LLMs)作为一种新型的生成式AI工具,通过千亿级别数据预训练的涌现能力、文本与图像自动生成的幻觉能力、单一语言文本数据转化为多种语言数据的迁移能力以及逻辑性极强的自然语言处理能力,运用到财务等领域[ 1 ],实现了企业降本增效。同时,财务共享服务中心作为企业数字化转型和组织创新变革的有效手段[ 2 ],已被世界500强和大型集团企业采用。那么,大语言模型在财务共享服务中心有何应用场景,对财务共享服务中心的客户支持、运营分析、业务支持、文本信息处理、海外核算管理、档案管理等有何影响和存在哪些风险,成为国内外会计理论和实务界关注的热点,对其展开讨论具有重要的理论和现实意义。
基于上述讨论,本文首先从大語言模型的概念及特征出发,对国内外五大模型进行比较,为大语言模型选择应用提供方向。其次,以ChatGPT和文心一言两大模型为例,讨论了大语言模型在财务共享服务中心应用的六大场景,探究了大语言模型在财务共享领域应用的可行性。最后,讨论了大语言模型在财务共享服务中心应用的安全风险和创新影响,得出财务共享服务中心必须拥抱大语言模型和应用中可能存在风险两大结论,以及需要制定安全保障体系、因企实施、建立人机协同模式三大启示。
二、大语言模型概念及特征
(一)概念
大语言模型是一种基于深度学习技术,在大规模文本预料上训练、包含千亿级别参数的自然语言处理模型。这些模型使用神经网络架构处理输入文本并生成输出文本,在自然语言处理、语音识别、对话型AI等许多领域发挥了重要作用。
作为近年来神经自然语言处理的核心研究之一,国内外对大语言模型进行了诸多研究,并得到了大量的研究成果:Meta(BlenderBot)、OpenAI(ChatGPT)、Google(LaMDA)、百度(文心一言)、阿里(通义千问)等。大语言模型虽然在语言理解推理、对话生成等多个任务上已经达到甚至超越了人类的平均水平,但是对于大语言模型能否正确响应人类所提出的指令、满足用户的合理请求以及生成内容是否符合人类的价值观,其研究仍然处于起步阶段。大语言模型发展历程如图1所示。
(二)特征
1.模型性能
大语言模型的性能经历了“基于概率预测的模型—基于Transformer架构的预训练语言模型—大模型”的转变,这主要由其规模来衡量。基于概率预测的模型规模较小,其性能提升和参数增长基本呈线性,符合比例定律。大模型的出现打破了这一定律,参数规模达到千亿及以上级别,模型性能实现了质的飞跃,这也被称为大模型的“涌现能力”。
2.模型使用方式
传统的预训练语言模型是对模型参数在上下游任务上做微调,比如完成上游任务进行下游任务时,对模型参数重新训练,预训练词向量无法随上下文动态变化。而大语言模型参数量巨大,且已经具备强大的学习能力,因此提示学习是激发大语言模型性能的更好方式。
3.自然语言处理的范式迁移
自然语言处理的范式迁移经历了由分类范式到生成范式的转变,实现了“预训练+微调”到根据下游任务修改自身描述的转化。生成范式主要指自回归式的给定前缀生成下一个单词或根据文本提示生成代码的大语言模型。这一转变使得任务本身更靠近自然语言的形式,从而激发预训练模型的潜在能力。
三、国内外五大语言模型的比较
(一)交互上的差异
语言聊天机器人是一项新兴技术,因此对于交互上的差异,五大语言模型很难直接比较。于是,本文采用安全渗透测试(用于测试计算机系统的可访问性和安全性的测试)的方法[ 3 ],调查并比较以上语言模型,从而评估这些模型的潜在优势和局限性。
LaMDA提供了有限形式的交互,限制了提问问题的类型和范围;BlenderBot通过生成具有特定任务的假设代理为用户提供了不同的上下文情景;ChatGPT为用户提供了单一的上下文情景,但是它可以重新生成与它所呈现的对话略微不同的观点;文心一言与通义千问对上下文场景链接相对较弱,单一问题回答较详细,观点明确。
(二)回答问题能力与系统深度上的差异
LaMDA的有限访问版本提供了有限的LaMDA视图以及可以向系统提出的问题;BlenderBot的回答范围最有限,对许多问题无法解答;ChatGPT在回答问题与系统反应上相对较好,但有时也会存在文不对题或者错误解答的情况;通义千问在中文语境下回答能力较强;文心一言预训练语料和数据质量稍强,但整个模型的调优、模型训练的算法和数据的精标相对于通义千问较弱。
基于提出问题的能力和系统的反应,ChatGPT是最强大的模型。然而ChatGPT有时并不知道它的回答是错误的,尽管是错误的答案,但模型还是以一种看起来一定是正确的方式显示信息。此外,ChatGPT的回答就像机器人一样,没有提到专业知识的来源和进一步讨论的深度。
(三)实际用途上的差异
五大语言模型都是国内外自然语言处理领域的顶尖模型,它们在不同的实际应用场景中各自都表现出了卓越的性能。LaMDA最有想象力,它能帮助人们解决实际问题并向人们提供重要信息,但由于其设计的功能限制,目前只能回答一组特定的问题;BlenderBot知道逻辑因果和时事,可以进行人机对话,但有时不能完成它在对话中指定的内容;ChatGPT拥有丰富的学术和企业方面的知识,能帮助解决学术和企业管理中的实际问题;文心一言与通义千问作为中文语言生成模型,在中文语境下对比国外三大模型回答清晰,更贴合中国用户。
四、财务共享服务中心的大语言模型应用场景
(一)财务共享的客户支持专家
大语言模型具有优秀的文本应用能力、语言沟通能力及强大的文本数据能力,在财务共享服务中心能够与客户对话,为内外部客户提供专业化财务信息服务,解答客户问题。例如回答内部分子公司财务信息、提供分子公司财务分析报告、帮助分子公司和员工等分析问题原因、指导分子公司和员工等进行系统操作,从而为财务共享服务中心节省大量的人工时间和精力,减少人力资源的消耗,提高工作效率。
本文分别采用文心一言和ChatGPT就“费用报销流程”问题进行回答,如图2和图3所示。虽然两者都对费用报销流程进行了解读,但是回答问题的角度略有不同,并对目前的流程不甚了解,不具备时效性。
对于“供货未收到款项的原因”的回答,文心一言从延迟、意外、供应链、资金四个方面解答,ChatGPT从财务状况、合同争议、行政程序、财务漏洞四个方面解答。两者基本能为财务共享客户提供思路。
(二)财务共享的运营分析专家
大语言模型通过为财务共享服务中心运营关键点提供分析思路,指导企业抓住要点和痛点。首先,通过分析财务共享服务中心运行产生的业财数据,寻找运营存在的问题;其次,运用大语言模型的大算力和强算法,建立业财流程指标计算体系并提供代码支持,进行自然语言模型建构;最后,进行分析结果解读,生成分析结果的统计学和会计学含义报告,为运营分析提供支持。
1.分析需求要点
在“财务共享运营分析关键点”问题回答中,文心一言认为财务共享运营关键点有定期评估、监控成本、分析数据、制定改进措施四个方面,ChatGPT认为有目标设定、成本效益分析、绩效考核指标、风险管理、组织架构、技术支持、培训与沟通七个方面。ChatGPT相对于文心一言,对关键点的解读较为详细。两者分析角度不同,不过都有借鉴意义。企业财务共享服务中心按照以上要点进行运营,能够实现降本增效,从而提高企业竞争力。
2.分析代码支持
ChatGPT“用Python实现某决策树模型的示例代码,该代码以输入的员工编号、月份和处理凭证数量作为特征,输出该员工在该月份下處理凭证时的差错率预测值”问题回答,如图4所示。它根据业务场景编写代码,将定量分析的方法省时省力运用到财务共享服务中心运营过程中。文心一言代码能力相对较弱,对本问题没有给出相应的代码支持。
3.自然语言模型建构
文心一言和ChatGPT关于构建决策树模型的回答,如图5和图6所示。ChatGPT运用决策树方法构建了凭证处理差错率模型,并做出了解释,能够识别财务共享服务中心运营过程中的风险。文心一言以文字的形式对决策树模型进行说明,没有以数据的形式将场景需求展现出来。ChatGPT的模型构建能力相对于文心一言更好一些,能够运用模型进行风险预测和分析。
(三)财务共享的业务支持专家
1.投资分析
大语言模型可以运用其大数据和大算力从多个角度进行投资分析,将投资分析结果以报告的形式传输给相关分子公司。关于基本面投资建议的回答,ChatGPT能够从财务状况、技术实力、市场竞争对比亚迪和宁德时代进行投资分析,但是文心一言未分点列出,只笼统回答。同时,两者的投资选择结果不相同,ChatGPT选择的投资对象是宁德时代,文心一言选择的投资对象是比亚迪,但两者都强调投资者需结合自身其他情况进行投资决策。企业可以根据两者提供的分析基本点,结合自身情况做出正确投资判断。
2.分子公司财务分析
大语言模型可以对财务共享服务中心的数据进行简单分析,同时对统计学的分析结果有一定的解释力。当财务人员利用财务数据分析时,如果遇到复杂分析结果,那么可以借助大语言模型进行解读。
ChatGPT可以利用大数据和AI技术对公司的销售、库存、生产等数据进行分析和预测,为分子公司和集团战略财务等提供决策参考。此外,财务共享服务中心积累了大量数据,但往往需要花费很多时间和精力采用PowerBI等工具进行分析,而ChatGPT可以有效利用这些存量数据生成管理报告,为企业管理者提供更加准确、全面的数据分析结果。
3.智能决策顾问
大语言模型在商学、法学、技术、编程等测试中均有较好的表现,因此随着其后台规则的逐渐优化和回答的逐渐规范,财务共享服务中心人员可以借助其商业逻辑和分析能力获取关于决策的参考,从而做好集团和业务一线的决策顾问。比如,对于“比亚迪公司财务共享服务中心选择”问题,ChatGPT从地理位置、劳动力市场、物流和基础设施、税收政策多个角度选定三个地点,并结合个性化需求做出了单一选址判断,决策智能。
(四)财务共享的个人秘书
1.个人秘书
大语言模型可以帮助财务共享服务中心的员工提高文本处理能力和专业答疑能力,从而胜任个人秘书的工作。比如以数字员工的身份运用其大标注能力负责文本信息整理、宣传邮件编写、财务运营客服等文本和沟通类工作任务。在需求发现阶段,大语言模型可以确定需求范围,并列出需求清单文档;在流程整理阶段,大语言模型可以对业务流程进行梳理,对工作步骤进行详细解读;在问题分析阶段,将会议讨论等产生的语音通过专业软件转化为文本后,大语言模型可以对会议纪要进行提炼,进行文本信息整理,确定最终需要解决的关键问题。另外,在方案设计时,它还能给出建议,并进行文档错误的检查,保证文档的准确性和规范性。
2.个人技术助理
在财务共享服务平台应用、数据分析代码编写、系统和流程优化等方面,大语言模型可以充当个人技术助理。大语言模型可以根据企业需求提供定制化的RPA解决方案,如将文心一言或ChatGPT集成到RPA产品中以降低开发门槛。在问题发现阶段,大语言模型可以根据业务部门的实际情况进行需求发现,并进行流程整理与问题分析,实现需求的重构与翻译;在开发阶段,大语言模型可以进行方案设计,将需求转化为机器语言,实现代码编写,通过RPA实现代码的运行;在技术评估与方案完善阶段,大语言模型可以对运行结果实现技术评估,并进行方案完善,将机器语言转化为业务部门易于理解的通俗语言;最后将方案结果返回到业务需求部门。ChatGPT+RPA解决方案如图7所示。
(五)海外财务共享的业务支持和核算处理专家
大语言模型几乎支持全部语种的交流,并且翻译的逻辑性和流畅度高于普通翻译软件,为海外财务共享的业务支持提供了极大的语言便利性。同时,大语言模型具有强大的信息承载能力,可以迅速查询到各国会计和税收等政策法规;在进一步学习各国的会计准则、税法制度、银行监管制度和营商环境制度后,大语言模型可以成为精通各国会计知识的业务支持专家和核算处理专家。
关于“制造型企业在美国、越南、印度的企业所得税税率”问题,ChatGPT和文心一言的回答有所不同,企业需要运用搜索引擎做出判断。关于“服务型企业在美国、英国、日本向银行贷款1 000万的贷款利率及费用”问题,文心一言给出了具体的贷款利率,没有对具体费用进行计算;ChatGPT给出的是利率区间,对问题中1 000万没有标明的货币单位,根据不同国家的货币进行计算。关于“向A公司购买设备1 000万元,用银行存款支付,在不同国家如何进行凭证处理”问题,ChatGPT能够根据不同国家的语言进行会计分录编写,文心一言只能编写中文分录。
(六)财务共享的档案管理专家
1.档案信息智能检索
大语言模型的主要思路是,通过利用大数据、大算力、大标注和强大算法能力,对用户提供的查询语句进行分析和理解,从而匹配最佳的档案记录。匹配过程可以根据查询语句和档案记录之间的相似度自动完成,从而帮助用户快速准确地检索到所需的档案信息。比如,为了使ChatGPT能够更好地理解财务共享服务中心的业务要求,它需要进行会计档案、财务制度、会计准则、合同管理等的大量自我学习,从而提升对财务共享服务中心工作流程和工作结果的理解以及对档案知识的认知。在财务共享服务中心的应用,主要表现为单、票、证、账、表等的整理和检索,能快速将大量信息反馈給用户,归档示意如图8所示。
条形码作为信息载体,可以快速获取凭证全业务数据,并实现双向循环定位。这种技术方案可以有效促进不同来源、异构、碎片化、离散性强的业务数据之间的整合集成,使数据在存储过程中能够保持匹配关联,形成具有归档功能的档案包。大语言模型根据财务共享服务中心相关凭证和单据自行分类,智能匹配,形成案卷,具体流程如图9所示。
2.档案信息知识问答
档案材料中蕴含着丰富的知识价值,但这些知识往往分散,需要提取和整合才能形成完整的知识体系。为此,大语言模型可以发挥其自然语言处理和自监督学习能力,对财务共享服务中心大量的会计档案文本及图片进行处理和分析,并提取相关信息实现数字档案化。同时,大语言模型还可以通过学习和提取大量的单、票、证、账、表等会计档案数据,建立档案知识库。通过智能问答的形式,回答调阅者提出的问题,并从会计档案材料中提取相关的知识和信息,帮助用户快速解决问题并获取所需信息。这样的应用方案,极大地提高了会计档案查阅的效率和准确度,还可以帮助企业更好地管理和利用档案知识。
五、财务共享服务中心大语言模型应用的安全风险和创新影响
(一)安全风险
1.专业认知存在偏差
尽管大语言模型能够解决许多自然语言处理任务,但并不保证在回答所有学术问题和常识问题时都能保持正确,比如在处理某些问题时,大语言模型可能会混淆训练数据中不同人物实体的背景和关系,导致回答出现偏差。此外,对于某些专业领域和垂直领域的问题,大语言模型还不能替代专用模型的作用。比如ChatGPT对“生产部门的管理人员工资归类到什么会计科目”问题回答时,将其归类到管理费用中,而正确的应该是计入制造费用,出现了专业知识性错误。
2.“杜撰”现象
大语言模型可能会编造虚假信息,且输出通常是真实信息和虚假信息混合的结果,这可能会误导那些无法获取更多信息源的人群。对财务共享服务中心来说,这样的情况会对准确性工作带来一定的阻碍。比如,使用ChatGPT搜索某供应商信息,发现其会出现信息套用情况。
3.认知价值观存在偏离
ChatGPT等国外大语言模型的训练语料主要来自西方语言体系,因此其在价值观层面存在一定的偏向,生成的内容可能不符合中国的价值观。这是因为在处理某些问题时,大语言模型可能会受到其训练语料的限制,表述时无法充分考虑到中国文化和价值观念,导致生成的内容与传统的中国文化和价值观存在偏离。比如,在进行会计科目回答时,ChatGPT等国外大语言模型会使用基于美国会计准则的会计科目,不符合中国的会计准则以及报表编制要求。
4.信息安全存在风险
目前大语言模型的关键技术掌握在少数国外机构之中,这意味着其应用可能会受到这些机构的限制。比如,ChatGPT只提供云服务和应用程序接口(API),且其训练与测试过程均在美国服务器上部署。在训练过程中,ChatGPT可能会收集使用者的信息并记录使用者的反馈和使用习惯,这种数据收集方式可能会导致严重的信息泄露和用户隐私保护风险。因此,财务共享服务中心的大语言模型应用可能会对企业部分财务数据造成泄露。
5.生成内容责任承担缺位
与搜索引擎相比,大语言模型对其生成内容是否承担责任,目前还难以确定。比如,大语言模型在为财务共享服务中心人员解答或提供客户支持时,其输出结果能否代表企业的观点,企业是不是相应内容的责任人,急需国家层面的界定。
(二)知识复制抑或创新激发
1.以“个性化”培养破解“普遍化”困境
大语言模型提供大量的文本、代码、模型等使得财务共享服务中心员工产生惰性,容易形成普遍化的答案[ 4 ],影响员工的个性化思考,阻碍了逻辑思维的培养,从而减少财务共享的个性化创新。同时,目前大语言模型本身也存在普遍化的特点,对一个问题的回答,不同的语言模型往往输出大致相同的结果,未来应该加强对大语言模型的批判性分析能力,使其能够更好地解决复杂问题,也需要提高模型在处理海量知识时的甄别能力,以便更准确地回答用户的问题。此外,增强AI机器人之间的协作和创新能力也非常重要,这有助于为大型语言模型向现实问题提供个性化解决方案奠定良好的基础。
2.以“思想性”引领超越“技术性”局限
虽然目前大语言模型已经得到很大发展,但其还是不可避免地存在很多技术上的局限。财务共享服务中心的工作人员作为大语言模型的使用者,本身也应更具有学习性、革新性,努力提高自己的创造性思维。同时,随着大语言模型的发展,人类的独立思考能力面临着挑战。因此,财务共享服务中心需要不断改进教育技术,以更好地契合人类的伦理价值观,并确保大语言模型的可控性、可靠性和可信度。这样才能够实现大语言模型技术和道德要求相一致的目标。
六、结论与启示
(一)结论
首先,财务共享服务中心的未来应用必须拥抱大语言模型。大语言模型具有丰富的语言理解、情景分析、代码写作、模型构建等能力,在财务共享服务中心主要表现为会沟通的财务客服、多功能的分析工具、自动化的报告助手、全天候的财务秘书、个性化的技术助理、懂语言的全球化人才、智能化的决策顾问。这从多方面提升了财务共享服务中心的工作效率及业务创新、数字化和全球适应能力,为建设一流企业提供了新的基础。
其次,大语言模型在财务共享服务中心的应用可能存在风险。财务共享服务中心的工作具有严谨性、保密性,但是大语言模型存在专业知识偏差、“杜撰”、认知价值观偏离、数据泄露、生成内容责任承担缺位等风险。
(二)启示
第一,制定安全保障体系。针对大语言模型可能存在的风险,设置人员、流程、数据等方面的安全保障。在人员方面,作为财务共享服务中心的员工,需要对问答信息做出基于专业知识的正确考量,确保传输给客户的信息不出现专业知识和伦理等方面的差错。在流程方面,应制定流程优化、流程审批和流程试用等控制机制。在数据方面,企业应设置大语言模型使用准则,对涉及企业内部机密的数据和场景应慎重使用大语言模型。
第二,应用大语言模型要因企实施。财务共享服务中心是基于企业的自身发展战略、职能,实现不同的应用场景,为组织提供创新性支持。比如,部分财务共享服务中心支持海外业务,可以借助大语言模型了解不同国家的会计准则、会计科目,以及不同国家的税率等财务数据。同时,对于被取代的人员及业务功能,要做到岗位职责调整,确保人员适配,不浪费人力资源。
第三,建立人机协同模式。由于大语言模型具有大数据预训练涌现能力、自动生成幻觉能力、多语言数据迁移能力及自然语言处理能力,需要财务共享服务中心员工与其进行良好沟通,并对其进行监督,从而达到大语言模型辅助人、人辅助大语言模型,大语言模型监督人、人监督大语言模型的新型人机协同方式,优化人机比例配置[ 5 ],实现财务共享服务中心与大语言模型相互赋能。
【参考文献】
[1] 刘勤.ChatGPT及其对会计工作的影响探讨[J].会计之友,2023(6):158-161.
[2] 姜一涵.财务共享服务中心建立与会计信息透明度提升[J].经济问题,2022(10):120-128.
[3] O'LEARY,DANIEL E.An analysis of three chatbots:BlenderBot,ChatGPT and LaMDA[J].Intelligent Systems in Accounting,Finance and Management,2023(1):41-54.
[4] THORP H H.ChatGPT is fun,but not an author[J].Science,2023,379(6630):313.
[5] 李聞一,汤华川.基于财务共享视角的人机协同研究[J].会计之友,2022(23):22-27.