APP下载

大模型在金融领域的应用探索、挑战与发展建议

2024-09-03柴洪峰潘润红杨涛黄程林

清华金融评论 2024年5期

伴随现代信息技术的快速发展,科技创新不断催生新产业、新模式、新动能,成为发展新质生产力的核心要素。金融业作为数字化、智能化的先行者,在大模型应用实践方面取得重要进展,有望成为大模型技术落地的最佳领域之一。

当前,以生成式人工智能为代表的关键技术取得重大突破,正引领新一轮智能化发展的热潮,为各行业技术革新、提质增效注入新动能。调研显示,目前金融大模型还处于起步阶段,面临诸多问题挑战,需要多方持续发力。

大模型在金融领域的应用探索取得积极成效

大模型产业的蓬勃发展得益于人工智能领域数十年的积累。金融业高度重视大模型的应用创新与实践,积极探索落地路径与应用场景,已经取得初步成效。

大模型金融应用主要流程

金融机构大多选择在自有服务器上部署大模型,以符合个人隐私保护和数据不出域等相关要求。金融机构私有化部署大模型主要包含以下步骤:一是明确需求,梳理业务情况,调研业务系统,识别关键业务痛点,从而明确大模型应用需求,并选择适合的试点场景;二是预评估,选择基础大模型,并对大模型的能力和应用效果进行预评估;三是场景测试,准备测试数据,构建提示语(prompt)测试集,评估大模型在该场景下的效果,对出现的问题进行分析,确定后续的训练及部署方案;四是模型训练,建立大模型计算集群,部署基础大模型,准备训练数据,对基础大模型进行二次训练或微调;五是模型优化,采用人类反馈强化学习(RLHF)等技术优化模型,调整prompt,并对模型性能、效果和安全性等方面进行综合评估;六是测试上线,将大模型迁移至真实业务场景,同时进行业务效果跟踪和问题记录,以持续地更新迭代模型。在此期间,金融机构需要组建专门的团队来确保大模型顺利落地应用,包括组织保障、软硬件生态建设等方面。

大模型金融应用场景探索

基于金融机构业务流程及当前主要场景探索实践情况,大模型金融应用领域可分为业务支持、市场营销、客户服务、产品运营、风险管理等。

业务支持

金融机构可以利用大模型技术为研发、运维、办公等多个场景提供支持,提高工作效率和交付质量,从而为员工创造更加舒适的工作环境,进一步提升员工的工作效率,降低运营成本。

在研发方面,大模型不仅能够在系统设计、代码生成与补全、代码翻译与注释、辅助测试等多个关键环节为技术人员提供帮助和支持,还能够通过与商务智能(BI)等系统的深度融合,实现数据查询分析结果的自动化呈现。这使得非技术人员能够更加直观且深入地理解并利用数据,从而有效降低技术门槛,促进跨部门协作与创新。例如,邮储银行在研发移动金融类APP的过程中,利用大模型、机器学习等技术构建“研发测试大模型”,实现对智能研发的全流程覆盖。这包括使用多模态大模型生成界面设计(UI)稿、使用代码生成模型自动编写代码和执行单元测试等。

在运维方面,大模型凭借其良好的语义搜索能力,能够协助运维人员高效地处理各类结构化、非结构化数据,快速定位问题所在,从而缩短故障排除时间。此外,大模型还能辅助运维人员完成代码攻防测试、明文检测等关键任务。例如,中国银行通过对大语言模型的微调,为运维人员提供便捷地获取私有运维知识、精准地进行故障预测和快速地响应问题的能力,从而降低运维成本并提高了系统的稳定性和可靠性。

在办公方面,大模型作为高效的办公助手,充分发挥其出色的文本生成能力,辅助完成报告生成、邮件起草、公文润色、纪要撰写、审核纠错等多项任务,大幅提升工作效率。例如,达观数据将大模型与金融领域知识相结合,根据输入的金融主题、目标和上下文,自动生成结构化、规范化的文档,提高金融行业的写作效率和准确性。该模型可广泛应用于金融行业的各种场景,包括信贷、投行等业务条线,输出债券募集说明书、信贷调查报告、投资研究报告、信用评级报告、财务分析报告等。

市场营销

大模型能够提升客户营销服务体验,为客户提供全渠道、个性化、有温度的金融服务。当前,金融机构在客户营销方面仍面临线上客户需求的精准捕捉与及时响应程度不够、内容供给与风险控制的匹配度与精细化程度不足、客户营销服务转化率待提高、平台客户服务体验跟踪保障能力不足等问题。通过对金融行业特有语料的适应性训练,大模型能够在客户意图识别、需求分析与行为预测、营销话术及文案生成、客户交互辅助等方面提供全面支持,有助于客户更快获取最新资讯和产品信息,实现针对特定客户的贴心、高质量、有创意的精准营销,从而进一步提升客户转化率、营销效率和客户满意度。例如,中国银联针对展业过程中遇到的“获客难”“经营难”“销售难”三大痛点,运用大模型,围绕数据、平台、场景、安全等方面建立标准,打造客户私域增长解决方案,为客户提供快速智能的图片自动生成与文本式在线问答等服务,实现了全渠道的客户引流和新客户增长。

客户服务

传统的智能客服系统主要依赖于规则匹配和基于大量标注的垂直领域AI小模型等技术。然而,这种方式存在标注人力需求量大、不同业务场景之间模型兼容性差、基于客户意图的差异化和精准化服务能力不足等问题,在实际操作中,坐席人员往往需要依赖自身的经验和判断来进行决策。

大模型具备优秀的自然语言理解和业务场景泛化能力,使得一些长期困扰客户服务领域的问题得到有效解决。大模型能够对用户的问题进行综合分析处理,准确识别用户意图,并快速、精准地回应用户需求,升级真诚话术,提供全天候的多语言支持,有效提升用户对话体验,提高服务质量。例如,建设银行利用大语言模型,为客服人员提供参考答案,辅助进行工单智能总结,并实现工单要素的自动抽取、分类与填写等功能。

产品运营

金融机构可以利用大模型技术为投研、投顾、信贷等多个方向的产品提供有力支持,自动化处理繁复的日常工作,释放人力资源,使得员工能够专注于更高价值的工作。

在投研方面,大模型能帮助投研人员从海量、分散庞杂的报告中自动搜集、整理、挖掘和提炼关键信息,智能生成资讯报告和投研简报,大幅提升金融研报数据和内容的准确性、时效性和质量,为投研人员提供投资、风控等决策辅助。例如,工商银行综合应用大模型的核心信息提取、智能文本生成等能力,实现金融报告的自动生成,有效将投研简报生成时间从1小时缩短至5分钟,提升了投研人员对海量文本数据的整合归纳提炼效率。

在投顾方面,基于大模型的投资顾问助手能够辅助投资者从海量投资产品中迅速筛选出适合自身的投资品种,提高投资效率。同时,大模型可根据客户的个人情况和市场变化,持续优化和改进服务,为投资者提供更加精准、个性化的投资建议和组合优化方案,从而进一步提升服务效率和服务体验。例如,国泰君安探索打造基于国产芯片的证券行业垂直领域大模型,完成基于数字化、策略化的智能投顾服务平台,以大语言模型为核心、以人工智能为基础实现投顾内容挖掘和沉淀,辅助员工生产优质内容,提供智能机器人7*24小时客户服务。

在信贷方面,大模型通过分析差异化区域数据、历史不良数据,完成模型预测、归因分析与模型试算,帮助金融机构前瞻预测、防范控制贷款不良规模或生成,对银行预警风险和指导决策有重要价值。例如,邮储银行提出一套基于大模型的全面催收辅助系统。在催收通话过程中,该系统可自动提取关键字,帮助催收员迅速、准确了解客户需求,提升沟通效果,并提供相关建议和提示,使催收员能够更灵活、果断地应对客户反馈,提高催收成功率。通话结束后,系统会对催收通话内容进行深度分析,实现催收记录的自动生成。

风险管理

风险控制是金融业的核心要务,对于维护整个行业的稳定性和安全性至关重要。然而,传统的风控方法往往依赖于预设的规则和专家经验,难以应对复杂多变的金融风险。大模型的出现为解决这些问题提供了新思路。

大模型基于大量交易数据的训练和学习,实现对异常交易行为的实时监测和精准定位,有效提升金融机构对欺诈、虚假陈述、洗钱等高风险行为的预警、识别和防御能力。此外,大模型在合规知识问答、法律审查、真伪核验等方面也发挥了一定作用,降低人为疏漏的概率,显著提升法务人员的工作效率。例如,交通银行基于Transformer模型构建了一套人工智能反欺诈应用,用于挖掘账户异常行为模式并进行异常预警。该方法同时考虑了实体之间的交互信息与时序信息,更符合实际的金融场景。

大模型在金融业应用面临诸多挑战

金融应用规范与指南亟须完善

当前,针对大模型在金融领域的应用尚且缺乏明确的实施标准和指导原则。同时,对于应用过程中的权责划分也不够清晰,且缺少对生成内容的问罚机制,以及针对大模型广泛应用后可能出现的无序商业行为的有效监管措施。

大模型应用场景不够丰富

大模型金融应用仍处于起步阶段。金融机构对大模型的能力边界和应用场景有了初步探索,但目前的应用场景相对单一,主要集中在辅助性功能上,如智能客服和代码助手,而对于核心业务的深度挖掘仍有待加强。

高质量金融训练数据欠缺

金融大模型依赖于高质量、多领域的金融数据,其性能受计算量、参数量和数据量影响。金融数据具备多样性特征,统一处理和建模较为困难,需要耗费大量的人力和时间。同时,金融数据及知识的私密性导致其难以共享,单一机构数据资源有限,一定程度上也限制了应用效果。

训练算力支撑普遍不足

由于金融数据高度敏感,金融机构倾向于私有化部署大模型,这需要高效的计算能力、大规模的存储资源、昂贵的硬件采购及维护费用。我国AI芯片虽可支持推理任务,但在模型训练上与国际水平仍有差距,面临着计算能力不足、产业生态不成熟以及适配性不佳等问题。

大模型在金融业应用发展建议

加强金融应用的指导与管理

建立全面的监管框架与标准体系。该体系应覆盖训练数据、算法设计、内容生成和风险治理等关键环节,明确金融业涉及大模型使用的各类主体的责任和义务,制定关键人物和系统的审核与风险评估规则,并形成合理的问责机制,以确保大模型在金融领域的应用符合法规与道德要求。

有序推动金融应用场景落地

金融机构在现有大模型应用的基础上,深入分析需求场景及解决方案,优先选择风险等级低、适配应用难度小、业务提升效果明显的场景进行试点落地,再逐步将试点应用场景迁移到真实、复杂的业务场景中,进一步探索大模型与金融业务整合所需的基本条件和能力界限,从而实现规模化推广和复用。

积极构建高质量金融数据集

金融机构探索建立一套面向大模型的数据“采集、清洗、管理、应用”的数据管理机制,并加强敏感数据的审计检查和分级处理,做好大模型私域管理和权限隔离,以确保数据的可溯源性和安全性。同时,建议增强产学研联动,提升大模型的可解释性,共同构建更强大的金融垂直领域基础模型。

产用协同共筑AI算力基础设施

金融机构结合自身需求,通过构建多源异构算力资源池来保障算力平台供给稳定性,并在保障模型效果的前提下,通过模型压缩、小样本训练等方式进一步降低应用成本。产业机构加大我国AI芯片的研发与推广力度,保障大模型算力资源的供给并提升硬件的安全可控水平。加强产学研用协同创新,共同推动大模型软硬件生态建设。

(柴洪峰为中国工程院院士,潘润红为中国金融电子化集团副总经理,杨涛为中国社科院国家金融与发展实验室副主任,黄程林为金融信息化研究所副总经理。责任编辑/周茗一)