ChatLONGYING:大语言模型在银行财富管理领域的应用研究
2023-05-24吴永飞叶广楠刘森王彦博
吴永飞 叶广楠 刘森 王彦博
ChatGPT对话机器人于2022年11月由OpenAI推出,能够学习和精准理解人类的语言,并以接近人类的智能水平进行对话和互动,引发了全球广泛关注。2023年2月,复旦大学发布了国内首个类ChatGPT大语言模型——MOSS,该模型可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。MOSS与ChatGPT相比,最大的差异是参数规模,MOSS的参数量小了一个数量级,这使得大语言模型面向垂类应用的私有化部署、微调训练及有效应用更加便捷。本文提出基于MOSS等产生了涌现现象的开源大语言模型,面向银行应用领域中的財富管理场景,通过输入个性化数据及微调模型,成功打造并应用ChatLONGYING商业银行私有化大语言模型的方案,以期为金融行业广泛落地部署大语言模型及相关应用发展提供借鉴。
人工智能与AIGC发展回顾
全球人工智能发展经历了三次大繁荣,分别是:20世纪50年代至70年代,以1956年达特茅斯会议为标志事件,符号主义和逻辑推理为主要研究内容的第一次人工智能浪潮;20世纪80年代,以特定领域“专家系统”实现人工智能实用化,以及“专家系统”所依赖的知识库系统和知识工程为研究方向的第二次人工智能浪潮;20世纪90年代至今,以基于统计学习方法的人工智能算法,以及图灵奖得主、深度学习先驱Geoffrey Hinton于2006年提出的深度学习算法并推动人工智能在多个领域超出人类水平为主要脉络的第三次人工智能浪潮。
自21世纪始,大数据和大算力为人工智能应用提供了更加强大的支撑,以生成对抗网络(GAN,Generative Adversarial Network)为代表的深度学习算法在诸多理论和实践上加速突破,人工智能生成内容(AIGC,Artificial Intelligence Generated Content)或称其为“生成式AI”迎来爆发期。AIGC通过人工智能算法自动或辅助生成创作和修改编辑文字、图像、音频、视频、游戏、代码、模型等数字内容,形成了新型数字内容生产方式。其中,ChatGPT对话机器人作为AIGC模式下的产物,是以GPT(Generative Pre-trained Transformer)为主要框架的人工智能大语言模型,是迄今为止最接近通用人工智能(Artificial General Intelligence,AGI)的技术,开启了由弱人工智能到强人工智能的阶跃,将对人类社会带来深刻的变革,产生深远的影响。
以ChatGPT为代表的大语言模型技术发展
业界发展动态
以ChatGPT背后技术为代表的人工智能大语言模型正在催生新一轮人工智能浪潮,在全球范围掀起人工智能大语言模型科技竞赛,科技巨头加快布局,生成式AI领域风起云涌。从2018年至今,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3、InstructGPT、ChatGPT和GPT-4。微软、Google等科技巨头加速跟进,其中,微软率先将GPT-4应用于New Bing(新必应)搜索引擎,可更加精确地理解用户的查询需求,并提供与之相关的实时信息。与此同时,以百度、华为、阿里、商汤为代表的国内人工智能领军企业加快大语言模型的研发和商业应用,并在NLP、OCR、计算机视觉、语音识别等多个领域开展模型实践,初步形成端到端的全栈大语言模型技术应用能力。以复旦大学、清华大学为代表的高校科研机构,面向市场纷纷开源自主研发人工智能大语言模型,积极推动生态构建。传统云厂商基于在云计算领域多年积累的技术优势,优先构建基于大语言模型的智算基础设施,有望形成MaaS(模型即服务)模式,并赋能产业,推动企业数智化升级,以期全面带动产业数字化转型发展。作为数据密集型行业,银行业一贯是先进科技应用的先锋军,以工商银行、农业银行、华夏银行为代表的商业银行纷纷探索人工智能大语言模型在金融领域各场景的应用落地。
ChatGPT的优势和特点
ChatGPT基于大规模预训练模型GPT-3.5的强大语言理解和生成能力,引入RLHF(Reinforcement Learning from Human Feedback)技术,它将人类的反馈纳入训练过程,为机器提供一种自然的、人性化的互动学习过程。从人类得到反馈,以更广泛的视角和更高的效率学习,从更专业的知识中学习并规范其价值导向。ChatGPT模型技术,通过文本、代码、图像、视频等单模态和多模态内容生成,形成高效率的数字内容生产方式,开启了数字内容生产革命,极大地提升了生产力;通过精准理解用户意图,调用已有的软件工具、算法模型和第三方服务,满足用户各类需求,形成更高效的人机交互方式,让人人都拥有属于自己的AI助手成为可能;通过高效的信息聚合和知识提炼,并结合专业知识库或搜索引擎,极大地提升了回复内容的准确性和实时性,有望形成新的知识表示、调用和获取方式,为信息搜寻和知识获取降本增效。目前,ChatGPT在知识问答、语言翻译、信息搜索、内容创作、代码生成、简单推理和数据分析等领域达到人类基本水平。此外,ChatGPT在金融领域表现出了广泛的应用前景,覆盖了风险管理、欺诈检测、财务规划、营销自动化、智能客服、增强知识图谱、提高客户活跃度及法律合规等众多应用场景。
ChatGPT的局限性
尽管ChatGPT具有强大的语言理解和内容生成能力,但仍存在一些局限性,包括但不限于以下三个方面。
输出内容缺乏时效性。ChatGPT通常基于历史数据进行训练,并不具备实时获取和处理新数据的能力,难以即时更新模型中的知识储备。对于一些实时性较强的最新资讯或即时消息,模型可能会输出不准确或错误的信息,而要让训练数据囊括最新的资讯信息,对训练的时间和成本消耗都非常大,更新速度会远慢于搜索引擎。
输出内容的可靠性有待进一步提升。ChatGPT输出内容仍会存在事实性错误,它本身无法核实数据来源的真实性,不具备验证引用数据来源的能力,可能会输出一些虚构或错误的信息。此外,尽管ChatGPT技术具有极其优秀的语言“创造”能力,以及看起来极具逻辑性的“逻辑推理”效果,但ChatGPT的推理和生成答案依赖于“统计概率”方法,因此不足以准确地处理逻辑问题。不仅如此,如果没有灌入特定专业领域数据开展训练,ChatGPT在特定专业领域上的垂类应用表现也不尽如人意。
模型伦理道德边界存在模糊空间。ChatGPT是基于现实世界的语言数据预训练而成的,若数据存在偏见和有害内容,以及标注人员的偏见性,会导致模型输出带有歧视、偏见等违背伦理道德的有害内容。尽管模型开发者有意避免上述问题,但经过一些诱导或不当操作,模型输出有害内容仍有可能发生。
对人工智能大语言模型应用模式的思考
人工智能大语言模型应用模式分类
ChatGPT背后的人工智能大语言模型技术将催生新业态,带来新机遇。在云计算时代,IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)帮助企业将业务更快地迁移至云端,实现信息化发展目标。在人工智能时代,MaaS(模型即服务)将向企业提供模型能力,支持企业和产业实现数字化转型及智能化改进。因此,如何将人工智能大语言模型快速应用落地,是赋能实体经济、便利人们生活及促进企业数智化转型的关键。
从企业实际应用人工智能大语言模型的方式来看,可以分为公有云模式和私有云模式。
公有云模式主要是科技巨头通过构建人工智能大语言模型基础设施向市场提供模型能力,实现MaaS(模型即服务),满足不同开发能力的企业和个人需求。具体而言,主要包括直接调用推理服务、模型微调服务、模型托管等方式:第一,直接调用推理服务。用户可以通过付费订阅等方式,直接访问通用大语言模型的核心推理能力,获得推理结果。第二,微调服务。用户可以根据自己的需求,使用少量的领域数据,在通用大语言模型的基础上,以相对较低成本的方式训练出一个定制化的大语言模型。第三,托管服务。用户可以将通用大语言模型或微调后的行业及专业领域大语言模型直接部署到云端。这样,用户只需要调用大语言模型,无需关心部署和管理的复杂性,同时保证了大语言模型的可用性、效率和安全性。
私有云模式主要是出于对敏感信息和重要数据的保护以及合规的需要,企业将人工智能大语言模型部署于本地私有云,供企业内部用户使用。人工智能大语言模型构建要求极高的算力,非一般企业或个人能够承担。从建设成本和难易度等因素考虑,企业构建人工智能大语言模型主要包括但不限于以下三种方式:第一,合作部署。通过将模型服务商的通用AI大语言模型私有化部署本地,供企业内部使用。这种方式下,模型参数一般高达千亿级别甚至更高,具有较高通用智能,但建设成本较大,企业定制化需求难以满足。第二,“大语言模型+微调”方式。通过选用中等规模人工智能大语言模型(百亿级参数)或将超大规模大语言模型进行剪枝、量化、蒸馏,并结合企业私有数据,对大语言模型进行微调,使之适用于具体垂直行业、领域和场景。第三,“预训练+微调”方式。企业通过大规模“预训练﹢微调”范式,自主构建大语言模型。该方式下,对企业算力成本、核心技术掌控力等方面有很高要求。
人工智能大语言模型应用模式的优劣势对比分析
人工智能大语言模型应用模式情况的对比分析详见表1。
对于商业银行而言,数据安全保护必须符合国家法律和行业监管要求,调用外部厂商大语言模型服务需要依赖AI模型服务商提供的安全保障,可能存在数据被第三方访问或窃取的风险。因此,商业银行应优先考虑以私有云模式推动人工智能大语言模型应用落地。其中,在合作部署模式下,私有化部署模型服务商的通用AI大语言模型的建设成本较高,且难以满足商业银行定制化需求;在“预训练+微调”模式下,大语言模型的开发、训练、推理部署的门槛非常高,通常需要大规模算力进行模型训练,企业需要负担相对高昂的GPU等硬件成本,且技术难度大,存在较大实施与应用风险;而在“大语言模型+微调”模式下,考虑建设成本和技术复杂度相对可控,当前商业银行可优先考虑运用中等规模通用大语言模型开展相应的应用落地工作。
在私有云“大语言模型+微调”模式下,具体有两种可能的实现路径:一是通过对现有模型服务商的通用AI大语言模型(一般是千亿级参数)进行裁剪、量化和蒸馏,形成中等规模大语言模型(百亿级参数),并结合本地数据进行微调。二是直接应用中等规模通用大语言模型,基于模型通用智能涌现现象和泛化能力,并结合多种垂直行业和业务场景需求进行模型微调及应用适配,构建面向垂类应用的大语言模型,从而摆脱传统AI能力碎片化、作坊式開发的束缚。
商业银行人工智能大语言模型应用建设
复旦大学MOSS大语言模型的技术发展。复旦大学MOSS大语言模型是国内首个插件增强的开源对话语言模型。该模型拥有约160亿个参数,支持中英文双语和多种插件,如搜索引擎、计算器、解方程、文生图等。复旦大学MOSS大语言模型在约7000亿中英文及代码单词上预训练,并基于此进行插件增强的多轮对话有监督微调,使其具备多轮对话能力、指令遵循能力及规避有害请求的能力,覆盖有用性、忠实性、无害性三个层面,提高对话质量和用户满意度。MOSS开发的基本步骤包括自然语言模型的基座训练及理解人类意图的对话能力训练两个阶段。并且,相较于1750亿参数的GPT-3模型、1760亿参数的BLOOM模型以及500亿参数的BloomBergGPT模型,MOSS模型不仅小巧而且精悍。它在模型量化后能够轻松进行终端设备部署,在FP16精度下可在单张英伟达A100/A800或两张RTX 3090显卡运行,在INT4/8精度下可在单张RTX 3090显卡运行,做到了能耗低和碳排放量小,并方便用户交互;同时它也可以在进行垂直领域数据微调时,较大程度地避免过拟合及记忆训练数据等问题。此外,MOSS大语言模型能够从各类金融实时数据(如股票、债券等)、各类知识图谱(如产业链、供应链等),以及研报、财报等非结构化文本信息中学习多源异构知识,通过多种方式增强MOSS模型的金融专业领域智能对话能力,可在银行财富管理等金融场景中发挥其应用价值。
基于MOSS等大语言模型构建ChatLONGYING。本文综合考量数据安全、定制化、技术难度、建设成本等因素,提出商业银行可优先考虑选用产生了涌现现象的中等规模通用大语言模型作为私有云应用基础,结合垂类应用场景需求进行微调,并集成商业银行现有的自然语言处理、计算机视觉、智能语音、知识图谱等多个AI核心技术能力,打造商业银行AI大语言模型能力体系,实现AI从“手工作坊”到“工厂模式”的转变,由此高效地进行模型生产与服务,赋能商业银行数字化转型与智能化发展。本文主要基于MOSS大语言模型并辅以其它开源人工智能模型,面向银行应用领域中的财富管理场景,通过输入个性化数据及微调模型,利用SFT(Supervised Fine-Tuning)微调技术在学习过程中融入了人类专家的知识和经验,提高智能体的学习效率和性能,并利用Prompt技术在模型使用时限制领域知识范围,提升模型生成效果,从而成功打造并应用ChatLONGYING商业银行私有化大语言模型。
人工智能大语言模型在银行财富管理领域的应用探索
银行财富管理需求痛点分析
商业银行在财富管理领域存在诸多痛点。一是从智能投顾视角看,财富管理专业人才匮乏。传统财富管理服务的门槛较高,商业银行能够为客户提供专业咨询和资产配置建议的专业人员较少,基于运营成本考虑,相关人员往往优先服务高净值客群,难以覆盖长尾客户。二是从智能投研视角看,传统数据分析和投研效率较低。多数理财顾问只能提供一些基础的产品介绍和推荐,缺乏对规模庞大、维度多样、瞬息万变的金融市场数据开展全面、深入、灵活、有效的分析,投研效率不高。三是从智能投资视角看,难以满足客户的不同风险偏好和差异化资产配置需求。金融市场的复杂化和多元化增大了资产配置难度,投资风险分析和投资策略制定等业务具有较高的专业性,且不同客户风险偏好、投资策略不尽相同,相关业务人员难以有效应对。
ChatLONGYING在银行财富管理领域的应用探索
面向智能投顾场景。一是可应用于客户画像。ChatLONGYING通过分析客户的风险偏好、投资目标和资产状况等信息,生成与客户需求相匹配的资产池,通过与客户进行自然语言交互,ChatLONGYING可以更好地理解客户需求,为客户提供个性化的投资建议。例如,理财经理可以询问ChatLONGYING:“请告诉我50岁、男性、工程师、月收入2万元的新客户会比较偏好什么类型的基金产品?”在此场景中ChatLONGYING可以为特定客群给出适宜性建议并提示投资风险。二是可应用于投资知识普及。ChatLONGYING可通过智能问答系统,解答客户关于投资业务的疑问,提高客户对投资市场的认识和理解。通过与客户进行自然语言交互,ChatLONGYING可以更好地理解客户问题,提供简单易懂的投资知识。例如,客户可以询问ChatLONGYING:“我觉得最近经济形势向好,想买一些易受经济周期影响的行业,可否帮我罗列一下?”在此场景中ChatLONGYING会罗列出受经济影响较大的行业,并尝试给出各行业受经济影响的相关分析。三是可应用于产品接续提醒。自动化地管理投资组合,针对需要定期调整投资组合的资产配置,ChatLONGYING可以根据客户设置好的信息进行智能化提醒,以确保投资组合的风险和收益水平符合客户的需求,提高投资效率和准确性。例如,客户可以要求ChatLONGYING:“请在我目前购买的产品到期前3天提醒我,准备续接新的产品。”在此场景中ChatLONGYING可以通过调用APP、短信、邮件等方式帮助客户进行后续智能化提醒操作。四是可应用于客户服务支持。ChatLONGYING可通过智能问答系统解答客户关于机构内评分、评级及投资建议的疑问,提供技术支持和投资建议,通过与客户进行自然语言交互,可以更好地理解客户问题,提供个性化的客户服务。例如,客户可以询问ChatLONGYING:“机构为我建议的RP1是什么意思?”在此场景中ChatLONGYING会根据机构评级给出释义,展示出对应风险等级的投资产品,并阐述风险意愿与风险能力差异,为客户答疑解惑。
面向智能投研场景。一是可应用于数据分析挖掘。通过自然语言处理技术,ChatLONGYING会从大量的投资数据中自动化地挖掘出关键信息和趋势,帮助分析师更快地了解市场变化和投资机会,从而更好地做出投资决策。例如,客户询问ChatLONGYING:“上市公司A的净利润是否超预期?”在此场景中ChatLONGYING会通过搜索未公布年报时A机构给出的预测利润及公布年报后的实际数据,给出问题的回答。二是可应用于研究报告检索。根据客户需求,ChatLONGYING通过与信息检索技术的整合,自动完成投资研究报告检索工作,自动化地整合和分析大量数据,提供研究报告的内容和结论,从而大大提高研究报告的质量和效率。例如,客户可以询问ChatLONGYING某公募基金交易范围,如“510021是否可以交易港股?”在此场景中ChatLONGYING会对研究报告的智能检索给出交易范围、直接与间接交易差异,并提示交易公募基金风险。三是可应用于指标计算。ChatLONGYING可使用算法对投资数据进行分析和计算,根据给定数据提供最佳的投研建议,并帮助投资者了解相关的评价指标,以更高效地完成投资研究。例如,客户可以询问ChatLONGYING某理财产品近四年的最大回撤,而不再因受到时间段限制需要手动计算。四是可应用于情报监测。通过对投资市场的实时监测和分析,ChatLONGYING可自动化地发现市场风险和机会,提醒投资者关注市场变化和风险,使投研结果更快地匹配现实场景。例如,询问ChatLONGYING:“161725基金经理最近两年有变动吗?”在此场景中ChatLONGYING会给出基金经理任期变动、是否在客户圈定范围内发生了变动、目前基金经理任期时长等相关信息。
面向智能投资场景。一是可應用于资产配置。根据投资者的风险偏好和目标,ChatLONGYING会自动化地生成最佳资产配置方案,通过机器学习算法和大量的投资数据,为投资者提供最优的投资组合,以达到最大化的投资回报和最小化的投资风险。例如,可以询问ChatLONGYING:“接下来的市场行情不错,我想更加激进一点,可否帮我推荐一个含有ChatGPT概念的股票列表。”在此场景中ChatLONGYING会给出相应概念的股票列表并提示其主营业务。二是可应用于编写策略代码。ChatLONGYING可通过机器学习算法和实时的市场数据,提供最佳的交易策略,根据市场趋势和投资者的需求,提供买入和卖出的建议,以最大化投资回报和降低交易风险。例如,可以要求ChatLONGYING:“请帮我写一个Python策略,策略思路为均线MA5超过MA10且年化波动率小于15%。”在此场景中ChatLONGYING会将相对应的代码呈现出来,包括数据、策略主题、回测表现等全流程信息。三是可应用于实时投资监测。ChatLONGYING可通过实时的市场数据和投资组合监测,为投资者提供实时的投资决策建议,帮助投资者了解市场变化和趋势,及时做出投资决策,以最大化投资回报。例如,给出自己的投资组合后询问ChatLONGYING:“在我自己的股票组合中,最大回撤超过5%时减仓合理吗?”在此场景中ChatLONGYING会给出最大回撤对组合的负面影响,减仓的正面效果及其他投资建议。四是可应用于风险管理。通过自动化的风险评估和监测,ChatLONGYING能帮助投资者降低投资风险,根据投资者的风险偏好和投资组合,提供最佳的风险管理策略,以保护投资者的本金和收益。例如,当投资者希望自己的组合收益长期达到8%,但是最大回撤不超过5%时,可以询问ChatLONGYING如何操作。在此场景中ChatLONGYING会根据投资者的输入信息给出操作步骤及相应的投资建议。
结语
本文回顾了人工智能大语言模型的发展历程及当前的进展,在深入研究人工智能大语言模型应用模式的基础上,提出商业银行可优先考虑选用产生了涌现现象的中等规模通用大语言模型作为私有云应用基础,结合垂类应用场景需求进行微调,并集成商业银行现有的自然语言处理、计算机视觉、智能语音、知识图谱等多个AI核心技术能力,打造商业银行AI大语言模型能力体系。
尽管人工智能大语言模型具有语言理解、内容生成等强大能力,但当前的模型应用仍面临着安全风险挑战,主要体现在三个方面:一是科技伦理风险引争议。如人工智能自动生成内容,甚至人工智能取代某些人工工作,是否会出现违反人类伦理、道德、法律的问题,这存在很大争议,目前尚无对相关技术的监管共识与标准。二是被恶意使用或误用的风险。人工智能大语言模型的使用过程如不加以监督,也可能被用于生成违反法律法规、违背道德准则的内容,被利用于网络炒作、制作恶意不实信息、编写恶意软件、实施不正当商业营销等,或者泄露客户个人隐私及保密信息等。三是恶意的提示注入攻击。黑客可能针对生成式人工智能系统开发破解方法和提示注入攻击,使用精心设计和提炼的句子而不是代码,利用系统弱点绕过内容过滤器的安全检查,将恶意数据或指令嵌入到AI模型中,使人工智能系统生成违背伦理道德、产生歧视性或误导性甚至非法的言论等。
面对安全风险的挑战应采取有效的防范措施,一是健全完善生成式AI安全应用相关制度。面对科技伦理风险,应通过建立有效的内容审核和监管机制,防止生成及传播不良和违法内容;通过建立合理的知识产权保护制度,保障各参与方的合法权益;通过建立严格的数据保护规范,保护客户的数据安全和隐私权。二是强化大语言模型应用的技术监管和审查。面对可能利用人工智能大语言模型进行网络犯罪的问题,有关部门应加强对人工智能大语言模型的监管和审查,防止其被滥用,建立可行的检验方法来确保模型给出的回答是真实可靠和没有危害的,避免数据泄露、虚假信息、侵权等问题。三是探索大语言模型实际应用落地的具体风险防范措施和手段。面对可能发生的内外部恶意攻击,金融机构应根据自身业务,选用可信的人工智能大语言模型并采用私有云模式,实施必要的模型应用管理办法和网络控制手段,从而减小对外风险暴露面,稳妥开展人工智能大语言模型面向具体业务场景的应用落地。
(本文作者向中国工程院院士、复旦大学金融科技研究院柴洪峰院长对本文的指导表示感谢。复旦大学周宇航、曾倩如、甘云荟,以及龙盈智达﹝北京﹞科技有限公司陈生、杨璇、刘骊、刘曦子、关宇航、王一多、陽少杰、闫括、高新凯、李维、刘洁菲、李广龙、覃辉、刘微、王月超和单石磊对本文亦有贡献)
(作者单位:华夏银行股份有限公司,复旦大学)
责任编辑:董 治