大语言模型在金融领域的应用
2024-09-03张晓燕吴辉航
作为人工智能在文本处理领域的最前沿技术,大语言模型历史性地站在了时代的风口,并为金融行业带来重大改变,未来还将继续渗透金融工作者决策的方方面面,并帮助广大投资者分析和理解金融市场。本文从大语言模型简介、大语言模型对于金融行业的重要性、大语言模型在金融场景落地的前沿案例和大语言模型在金融场景落地的监管五个方面探讨大语言模型在金融领域的应用前景。
2023年召开的中央金融工作会议提出做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章,对数字金融高质量发展提出了新要求。为了取得突破,必须把握数字技术革命的契机,促进金融与数字技术的深度结合,努力提高金融服务对实体经济的支持效率,加强全面性风险的防范措施,并持续满足社会经济进步及公众对金融服务的期望,以加速推进金融强国的建设进程。
大语言模型作为人工智能在文本处理领域的最前沿的技术,历史性地站在了时代的风口,正在对人类经济社会发展带来智能化浪潮的颠覆性猛烈冲击。这类模型依托深度学习和大数据技术,具备了对人类语言的深入理解和生成能力,在内容生成、机器翻译等多种应用场景存在巨大的发展潜力。金融业具备服务业的基本性质,存在大量的语言交流和文件处理需求,且金融行业时刻都在产生海量的金融数据,这使得金融业成为大语言模型的极佳应用场景。自2022年11月ChatGPT问世以来,金融业界对大语言模型给予了高度重视,各大金融机构加快大语言模型的部署以及应用落地,国内多家科研机构也先后推出经过金融语料微调的,更加适用于金融场景任务的金融大语言模型。大语言模型将助力金融业以及经济发展,根据高盛研究团队估计,大语言模型将在未来10年向全球经济提供额外的1.2%左右的增长率。
将大语言模型深入应用于金融行业正是做好数字金融这篇大文章的重要实践。但是目前中国大语言模型在金融行业的落地尚处于早期探索阶段,很多金融企业都对大语言模型有着浓厚的兴趣和希望,能直接转换并应用到实际业务场景的并不多。因此,为了更好地促进大语言模型在金融领域的应用,本文详细讨论了哪些金融领域和金融场景适合大语言模型的落地,并给出了一些具体的实践案例供读者参考。具体而言,文本将从大语言模型简介、大语言模型对于金融行业的重要性、大语言模型在金融场景落地的前沿案例和大语言模型在金融场景落地的监管五个方面进行深入分析和探讨。
大语言模型简介
大语言模型是一种能够处理、理解和生成自然语言文本的机器学习模型,是以未标注文本作为训练集的、经过自监督或半监督学习的深度神经网络模型。这些模型通常基于Transformer架构,能够捕捉文本数据中的语法、语义和上下文关系,从而实现对文本的高质量生成和理解。参数规模大、算力要求高是大语言模型的显著特点,之所以消耗大量算力来应用如此大规模的模型,是因为模型的各项语言能力会在模型规模突破一定阈值之后,迎来飞跃式的增长。相比传统的机器学习模型,大语言模型在处理另类数据时需要更少的人工数据清洗和标注工作,是处理非结构化数据的利器。在实际应用中,大语言模型被广泛用于机器翻译、文本生成、情感分析、问答系统等多个自然语言处理任务。它们不仅能够理解人类语言的复杂性,还能生成富有创造性和逻辑性的文本,为人机交互和自动化处理提供了强大的工具。
政策方面,我国政府对人工智能和大语言模型的发展也给予了极大的重视。早在2017年,我国政府就发布了《新一代人工智能发展规划》,明确提出了包括自然语言模型在内的多项人工智能技术发展的目标、路径和政策措施。“十四五”期间,我国针对人工智能的未来发展陆续出台了相关指导方案和激励支撑政策。2023年3月,科技部等6部委发布《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》。意见指出,要以促进人工智能与实体经济深度融合为主线,探索人工智能发展新模式新路径,以人工智能高水平应用促进经济高质量发展。2023年7月,中共中央政治局会议指出,要推动数字经济与先进制造业、现代服务业深度融合,促进人工智能安全发展。同月,网信办等7部委联合发布《生成式人工智能服务管理暂行办法》,鼓励生成式人工智能技术在各行业、各领域的创新应用。政府对大语言模型高度重视,多项政策并举,为我国大语言模型发展及其金融场景应用保驾护航。
大语言模型对于金融行业的重要性
大语言模型不仅可以处理海量的金融数据,还能够从中提取出有价值的信息和见解,并自动生成相应的金融文本或金融决策。从智能客服到风险管理,再到市场分析和个性化服务,大语言模型都发挥着关键作用。它们帮助金融机构提高效率、降低风险、改善客户体验,同时为决策者提供更深入的市场洞察和决策支持。随着技术的不断进步,大语言模型将继续在金融领域发挥重要作用,成为金融创新和数字化转型的关键驱动力。
投资决策
首先,大语言模型能够通过分析大量的新闻报道、财务报表和宏观经济数据,提供关于特定投资机会的深入见解和建议。例如,大语言模型可以自动化地搜索、抓取和分析全球范围内的新闻报道,从而帮助投资者及时了解市场动态、行业发展趋势和公司业绩表现,为投资决策提供参考。其次,大语言模型可以深入分析公司的财务报表,评估公司的财务状况、盈利能力和成长潜力,帮助投资者更全面地了解公司,并做出更明智的投资决策。此外,大语言模型还可以分析宏观经济数据,如国家的经济增长率、通货膨胀率、利率水平等,从而帮助投资者更好地把握市场趋势和风险。
风险评估
在金融领域,大语言模型也广泛应用于风险评估,帮助金融机构更准确地评估潜在的风险。首先,大语言模型可以通过分析个体或企业的信用历史、财务状况等数据,来评估其信用风险,帮助金融机构更好地管理借款人的信用风险。其次,大语言模型还可以分析市场数据和宏观经济指标,识别出市场波动的趋势和规律,帮助投资者更好地理解市场的风险情况,并做出相应的投资决策。此外,大语言模型还可以分析历史数据并建立模型,来预测信贷违约的可能性。通过对大量的历史数据进行学习和训练,它可以识别出导致违约的主要因素,并预测未来可能出现的违约情况,为金融机构提供预警和风险管理建议。
市场分析
首先,大语言模型可以利用其强大的自然语言处理能力,分析包括新闻、社交媒体在内的各种信息源,以捕捉市场情绪和趋势,从而帮助交易员和研究者做出更明智的决策。例如,大语言模型可以自动抓取、解析和理解大量的新闻文章,以识别出与市场相关的重要信息和事件。其次,大语言模型还可以监测社交媒体平台上的讨论和评论,从而感知市场参与者的情绪波动和舆论倾向。此外,大语言模型还可以结合其他信息源,如财务报表、行业研究报告等,进行综合分析,为交易员和研究者提供更全面、更深入的市场洞察。
文档处理
大语言模型可以利用其自然语言处理和理解能力,自动化处理各种金融合同、报告和其他文档,从而提高工作效率并减少错误。例如,它可以自动识别合同中的条款和条件,提取报告中的数据和指标,从而减少人工处理文档的时间和成本。此外,大语言模型还可以利用自然语言生成技术,自动生成金融报告、摘要和其他文档,从而提高文件生成效率和质量。
自动化客户服务
首先,大语言模型通过利用其自然语言理解和生成能力,以用于构建智能虚拟助手和自动化客户服务机器人,以回答客户的常见问题,执行基本的交易操作,并提供金融建议。例如HN16ROxPjqGW+uL1GNlheA==,当客户在网站或应用程序上输入问题时,大语言模型可以自动识别并理解这些问题,从而为客户提供相应的回答或解决方案。其次,大语言模型还可以与金融系统集成,执行基本的交易操作。例如,当客户需要转账、支付账单或查询交易状态时,大语言模型可以自动与金融系统进行交互,并执行相应的操作,从而实现自动化的客户服务。最后,大语言模型还可以提供个性化的金融建议。通过分析客户的账户信息、交易历史和投资偏好,大语言模型可以为客户提供定制化的投资建议,帮助他们做出更明智的金融决策。
舆情分析
通过对新闻和社交媒体内容进行情感分析,大语言模型可以帮助管理机构和研究者跟踪热点事件的舆论走向,从而更好地了解公众对特定事件或话题的态度和情绪。首先,大语言模型可以分析社交媒体上的内容和评论,以获取公众对特定事件的即时反馈和情绪表达,识别出热点话题和关注度较高的事件。其次,大语言模型可以分析新闻报道中的情感倾向,如正面、负面或中立,从而帮助管理机构和研究者更准确地把握舆论倾向。(见表1)
大语言模型在金融场景落地的前沿案例
捕捉市场情绪
大语言模型通过对实时新闻和社交媒体的分析,可以迅速捕捉到市场的情绪变化和潜在的市场动态,从而预测可能的市场波动。例如,当某公司发布了重大新闻或政策变动,模型可以根据新闻公告文本,迅速分析相关报道的正面/负面情绪,为投资者提供即时的市场趋势预测。
具体而言,大语言模型能够快速、全面地分析文本内容,把非结构化的文本数据转化为向量表示的若干特征。相比传统的自然语言处理方法,大语言模型更好地结合语境编码词向量,充分捕捉语义和情感信息。由此形成的结构化数据,显著地根据语义聚集为不同类别,进而开展的情感分类,其准确程度大大提高。芝加哥大学修大成教授的研究团队利用多个大语言模型分析了全球上市公司的新闻文本,其情感分析的准确率已经足以构建一个有相当盈利能力的投资策略。团队指出,大语言模型能准确捕捉新闻中有情感倾向的关键词,基于大语言模型的投资策略取得了优异的投资回报,在美股2004—2019年可达到49%的年化收益。清华大学五道口金融学院的张晓燕教授团队将国内外大语言模型应用在A股上市公司新闻中,在A股市场上,大语言模型得出了较高的情感分析准确率以及优异的投资表现。(见图1)
宏观经济预测
2023年4月,Joseph Lupton等摩根大通经济学家运用基于ChatGPT的语言模型来检测政策信号的期限,运用美联储过去的25年来发布的历次声明和官员讲话数据微调模型,并建立“鹰-鸽”指数对政策信号进行了从宽松到紧缩的评级。其中,鹰派通常倾向于更严格的货币政策,包括提高利率,以控制通胀和稳定经济。相反,鸽派更倾向于宽松的货币政策,保持低利率以刺激经济增长和就业。“鹰-鸽”指数通过深入分析美联储官员的言论、声明、投票记录和其他公开可获得的数据,为每位官员分配一个数值评分。“鹰-鸽”指数反映了美联储官员在货币政策上的立场,从而帮助投资者、经济学家和政策制定者更好地理解美联储的政策走向和未来可能的经济影响。研究者将各国先行一周的“鹰-鸽”指数与该国一年期国债利率的变化率进行回归,在美国、欧盟、英国均取得了显著的t值(15.5, 13.4, 7.6)。回归系数表明,“鹰-鸽”指数上升10分,预示一周后的美国一年期国债利率上升14bp,欧洲央行一年期国债利率上升12bp,英国一年期国债利率上升12bp。(见图2)
大语言模型在金融场景落地的监管
数据安全问题与应对
金融领域大语言模型的输出存在数据安全隐患。在推介风险产品时,并应充分披露决策信息和产品风险。面向投资者,模型输出应确保遵守相关金融法规和指导原则,如不发布误导性投资建议,不进行违规的股票推荐等,确保投资者权益。此外,大语言模型的输出内容还应公平合规,不包含任何偏见,避免涉及用户隐私。大语言模型的训练数据集中经常包含大量互联网数据,而此前在互联网上泄露的个人信息随之进入大模型。大语言模型的使用者可以通过特定的提问方式,诱导大模型透露隐私数据,表现出对社会少数群体的偏见和歧视。模型的输出质量取决于训练数据集的质量。应当不断提升训练数据语料的安全性,排除有毒语料和不当内容;不断增强训练数据的代表性,使用平衡和多元化的数据集。
我国已经针对上述问题初步形成监管办法。2023年7月,网信办等7部委发布《生成式人工智能服务管理暂行办法》(以下简称《办法》)。《办法》强调要在使用生成式人工智能的过程中,尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;保护他人知识产权、肖像权、名誉权、荣誉权、隐私权、个人信息权益等合法权益。
模型安全问题与应对
大语言模型面临透明度低的模型安全问题。大数据模型的“黑箱”特性导致其解释性不足。提高金融领域大语言模型的透明度和可解释性,是金融工作者和大语言模型有效交互的前提。金融市场有多样的影响因素和复杂的运作机制,当需要大语言模型直接给出金融决策时,大语言模型应当能够展示清晰明确的决策逻辑和准确的决策信息,这对大语言模型的透明度提出了更高要求。《办法》规定:“基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。”
针对大语言模型透明度的问题,学界与业界正在尝试多种解决方法。例如,通过设计问题链来引导大语言模型进行逐步推理,形成完整的推理过程;通过参数可视化理解大语言模型的注意力机制;通过模型蒸馏理解模型各个部分捕捉了哪些规律等。
大语言模型监管的国际经验
美国总统拜登于2023年10月30日签署的行政命令,确立了人工智能安全的新标准,标志着拜登政府在对人工智能技术的管理方面采取的第一项具有约束力的重大行动。这一行政令要求共享模型的安全测试结果和关键信息,完善模型标准和测试工具,制定严格的合成生物学检查标准,建立人工智能生成内容检测标准,建立先进的网络安全计划,研发制定关于人工智能与安全的国家安全备忘录。这一行政令的实施,反映出美国政府对于人工智能技术发展速度和影响范围的重视,同时也显示了在确保技术进步的同时维护国家安全和公共利益的决心。通过这些措施,美国政府旨在推动人工智能技术的健康发展,确保技术进步在不损害公众利益和国家安全的基础上进行。
欧盟同样注重大语言模型发展的安全性和合规性。欧盟人工智能法案(EU AI Act)由欧盟委员会于2021年4月提出,旨在为欧盟范围内的人工智能(AI)使用制定法律框架。该法案致力于在所有行业(军事应用除外)中为AI创造共同的法律环境。法案采用基于风险的方法,根据AI系统对人权和价值观的潜在影响对其进行分类和监管。在2023年12月9日,欧洲议会与欧盟理事会就欧盟人工智能法案的最终版本达成一致。这标志着世界上首个全面的人工智能法律框架的诞生。欧洲AI法案基于风险对模型进行分类,对于不同类别的模型施以禁止、上市前评估审核、透明度要求审核等措施,并对不合规行为引入重罚。
好的监管框架有利于保护公民权利、推动技术创新、确保技术安全,甚至引领全球技术标准。参考大语言模型的国际监管经验,我国也应指定更加细致、健全的大语言模型监管体系,确保大语言模型的健康、安全、高质量发展,推动大语言模型成为下一个经济增长点,持续激发经济增长活力。
大语言模型在金融领域的应用场景广阔
大语言模型已经为金融行业带来重大改变,未来还将继续渗透金融工作者决策的方方面面,并帮助广大投资者分析和理解金融市场。当前,大语言模型正向多模态、领域化、小型化等多个方向发展,将在另类数据处理、金融特定领域应用以及可得化、易用化等方面有进一步提升。持续发展大语言模型应用,加强大语言模型监管,引导金融大语言模型开发,中国金融市场将能在数字化、智能化方向得到更大的进步,为广大投资者带来福祉。
(张晓燕为清华大学五道口金融学院副院长、金融学讲席教授,吴辉航为清华大学五道口金融学院博士后。责任编辑/周茗一)