APP下载

应对ChatGPT的六招

2023-06-22埃森哲

21世纪商业评论 2023年6期
关键词:人工智能语言模型

ChatGPT 推出仅两个月,月活跃用户就达到1亿,成为有史以來增长最快的消费应用程序。

所有人,所有地方,都将切实感受到这项技术的颠覆性潜力。

ChatGPT背后的大语言模型,正在凭借两项优势改变着市场规则:

第一,这类模型破解语言复杂性的密码,机器拥有前所未有的能力,可以学习语言、上下文含义和表述意图,并独立生成和创建内容。

第二,在利用大量数据(文本、图像或音频)进行预训练后,这些模型能够针对众多不同的任务做出调整或微调。用户可以多种方式,对模型按原样重复使用或稍加修改后再次使用。

商界领袖们普遍认识到了这一时刻的重要性。

例如,我们研究发现,所有行业中40%的工作时间,都将得到GPT-4等大语言模型的协助。

大语言模型具有处理大规模数据集的能力,所有用语言记录传达的内容,如应用、系统、文档、电子邮件、聊天、视频和音频等等,都将进行创新、优化和重塑,最终走向全新的高度。

语言任务占企业人员工作总时长的 62%,其中65%的时间可借助人员强化和自动化技术来提升工作活动的生产力。

时机就是一切。

最近一项技术趋势调研中,225名受访中国企业高管里面,有72%对人工智能基础模型带来的新功能表示非常、或极为兴奋,比例略低于全球平均水平。

越来越多的中国企业,正在积极探索生成式人工智能技术,开始应用大型语言模型来实现更多的创新和效率提升。

在中国,大语言模型应用方式主要有三种:SaaS、私有云部署、本地化部署,成熟度依次从高到低排列。

目前,SaaS化的部署方式是最为成熟的,以国外Azure Open AI Services为标杆。

在国内市场,百度的文心一言和阿里的通义千问,正在参与到激烈的竞争中。与 Azure 提供的服务相比,国内厂商提供的 SaaS服务,更具有数据安全和合规性上的优势,尽管在综合能力上还有待加强。

私有云部署方式同样以百度为领先。

相较于SaaS 服务,私有化部署更具有数据和模型自定义能力和垂直行业定制化能力。

这种方式可更好地服务于相对较为专业的客户,可充分利用客户提供的行业知识,同时保证不对竞争对手可用。更柔性的服务器使用策略,也让这种方式相较于本地化的前期投资大为降低。

综合来看,这是目前国内垂直行业客户最可行的实现方式。

本地化部署方式有非常多的选择。

学术界中提供的有清华大学的ChatGLM、斯坦福提供的Alpaca,商业公司提供的有Databricks的Dolly、Scale.ai的图像专精的大语言模型等等。

本地化部署存着成本高昂、无法确定使用效果等两个问题。目前处于非常早期的阶段,是否可以进一步使用有待后续观察。

总的来说,大语言模型正处于快速发展的阶段,其未来的形态无法被预测,可以肯定的是,大规模的应用一定是必然的趋势。

我们对生成式人工智能的了解越来越深入,它将颠覆传统的工作模式。大多数工作者都将拥有得力的“助手”,从根本上改变工作的完成方式和完成内容。

企业需要像技术投资一样,持续投入不断发展的业务运营和人员技能培训。彻底重新构想工作的完成方式,并帮助员工紧跟技术驱动型变革

积极迎接生成式人工智能时代,存在六大技术应用要点。

业务驱动

即使创新技术有诸多优势,在整个组织中全面推广并非易事,尤其当新技术会彻底改变现有工作方法时,会遇到特别多的阻力。

企业可以先通过尝试生成式人工智能的诸多功能,累积早期成功并得到变革倡导者和意见领袖的支持,不断提高员工对新技术的接纳程度,为进一步普及创造所需条件,进而启动转型和技能再培训议程。

企业必须双管齐下地进行尝试:

其一,专注于容易获得的机会,使用可消费的模型和应用迅速实现回报;其二,着力使用根据自身数据定制的模型来重塑业务、客户洽谈、以及产品和服务。

业务驱动型思维,是定义并成功建立应用模式的关键。

随着企业深入开展人工智能重塑业务的各种探索,他们将切实收获价值,明确各种应用场景下最为匹配的人工智能类型,厘清投资规模和复杂程度。

他们还能测试和改进有关数据隐私安全、增强模型准确性、防止偏见和保护公平的方法,并知晓何时需要采取“由人主导迭代”(Human in the Loop)的保护措施。

举例,一家大型欧洲银行集团启用微软Azure云平台和GPT-3大语言模型,来帮助员工进行电子文档检索。

这一举措,使用户可以快速获得问题的答案,大大节省了时间,并提高准确性和合规性。

为了进一步提升员工技能,这家银行构建了三年创新计划,后续还会在合同管理、对话型报告、以及票据分类等领域应用生成式人工智能。

图1:生成式人工智能技术堆栈的每一层级都将迅速进化

此举不仅将内部知识库进行升级、帮助员工获取所需信息,更有助推进自身向数据驱动型机构的目标迈进。

以人为本

为了使生成式人工智能取得成功,企业需要像重视技术那样,关注人员及培训工作。

他们应当大幅增加对人才的投资,以应对两类不同的挑战:创建人工智能和使用人工智能。

这意味着, 要在人工智能设计、企业架构等技术能力方面培养人才;同时培训整个组织的人员,使他们有效地与人工智能化的流程合作。

例如,在对22个工作类别的分析中,我们发现,大语言模型會影响所有类别,最低程度为每个工作日的 9%,最高可达63%。在22种职业中,有5种可以利用大语言模型来革新一半以上的工作时长。

即使是现实世界中精通如何应用数据的各领域专家(例如,医生对患者健康数据的解析), 也缺乏足够的技术知识来了解这些模型如何工作,以及相信技术能成为“工作伙伴”。

企业还将设立全新的岗位,包括语言学专家、人工智能质 量控制员、人工智能编辑和提示工程师。

对于生成式人工智最有前途的领域,企业应当首先将现有工作分解为基础任务组合,然后评估生成式人工智能可能影响每项任务的程度——完全自动化、人员增强,抑或与之无关。

筹备数据 

为了定制基础模型,企业需要使用特定领域的企业数据、语义、知识和方法。

在生成式人工智能时代到来之前,企业可以通过以应用模式为核心的人工智能方法,从人工智能中获得价值,无需对其数据架构和资产进行现代化改造。

现在情况已经截然不同。基础模型需要大量精心组织的数据来学习,因此,破解数据挑战,已成为每家企业的当务之急。

企业需要采用一种战略性、规范化的方法,获取、 开发、提炼、保护和部署数据。

具体而言,应依托云环境构建现代化的企业数据平台,其中包含一组可信赖、 可重复使用的数据产品。

凭借此类平台的跨职能特征、企业级的分析工具、以及将数据存储在云端仓库或数据湖当中,数据能够摆脱组织孤岛的束缚,在整个企业中普遍使用。

随后,企业可在某一地点或通过分布式计算策略(如数据网格),统一分析所有业务数据。

打造基础

为了充分满足大语言模型和生成式人工智能的大规模计算需求,企业需要考虑自身是否拥有合适的技术基础设施、架构、运营模式和治理结构,同时密切关注成 本和可持续能源消耗。

他们必须设法从成本和收益的角度,评估比较这些技术与其他人工智能或分析工具,后者可能更适合特定的应用模式,并且成本仅为前者的几分之一。

企业需要建立一套强有力的绿色软件开发框架,在软件开发生命周期的所有阶段,考虑能源效率和材料相关排放。

人工智能还可以发挥更广泛的作用,使业务更具可持续性并实现环境、社会和治理(ESG)目标。我们调研发现,在生产和运营环节成功减少排放的企业中,70%都使用了人工智能。

寻找伙伴

创建基础模型很可能是一项复杂、成本高昂的计算密集型工作。

除了全球顶级企业外,几乎所有组织都无法仅凭一己之力完成该任务,这超出了他们所掌握的能力和方法。

令人振奋的是,得益于超大规模云服务机构、科技巨头和初创企业的海量投资,企业可借助新兴生态系统的威力。

仅在2023年,全球对人工智能初创公司和成长阶段公司的投资,预计就将超过 500 亿美元。

这些合作伙伴能够带来经过多年打磨的最佳实践,并为特定应用模式下如何高效而有效地使用基础模型提供宝贵洞见。

拥有恰当的合作伙伴网络——包括技术企业、专业服务商和学术机构,将成为驾驭快速变革的关键。

构建体系

生成式人工智能的快速采用为所有企业提出了新的紧迫工作:建立一套稳健、负责任的人工智能合规体系。

这包括两方面的事项——建立控制流程,在设计阶段评估生成式人工智能应用方式的潜在风险;制定明确措施,在整个业务中嵌入负责任人工智能方法。

我们研究表明,大多数企业仍任重而道远。

我们2022年面向全球850名高管人员的调研显示,受访者普遍认识到负责任人工智能和人工智能监管的重要性。仅有6%的企业认为,自身已打造了充分稳健的负责任人工智能基础。

企业的负责任人工智能原则应当由高层定义和领导,并转化为有效的风险管理和合规治理架构,包括组织原则和政策、以及适用的法律和法规。

负责任人工智能的使用必须由CEO引领,从加强培训和意识培养开始,然后扩展至关注执行与合规。

早在数年前,埃森哲就已率先采用这种方法来管理负责任的人工智能,不但设置了由CEO领导的议程,现在进一步出台了正式的合规计划。

我们自身的经验表明,原则驱动的合规方法既能提供护栏,又足够灵活,可以随着技术的快速发展而更新,确保企业不会始终疲于“追赶”。

为通过设计来实现负责,企业需要从被动响应的遵从策略,转向主动开发完善的负责任人工智能系统。

这必须借助一套综合框架,其中涵盖:原则和治理措施;风险管理、政策和控制手段;以及技术、赋能因素、文化和培训工作。

本文改编自埃森哲最新发布的《生成式人工智能:人人可用的新时代——ChatGPT 背后的技术将深刻改变工作模式,重塑商业形态》,编辑略有改动,经授权发表。

猜你喜欢

人工智能语言模型
一半模型
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
语言是刀
2019:人工智能
人工智能与就业
让语言描写摇曳多姿
数读人工智能
累积动态分析下的同声传译语言压缩
3D打印中的模型分割与打包