ChatGPT研发门槛竟在“财大气粗”？

2023-05-05段永利,马思遥

科技创新与品牌 2023年3期

自2022年11月30日ChatGPT横空出世以来，世界人工智能界的焦点都聚集于此。每隔一段时间就在社交平台引起一波讨论，几乎每次的的话题和阅读量都能够达到“爆”的程度。

在国内的社交平台搜索相关内容，ChatGPT相关的话题，阅读量达到了“亿”次，话题内容也日渐丰富：“ChatGPT让苹果急了”“美国89%的大学生用ChatGPT做作业”“ChatGPT两个月活跃用户破亿”“ChatGPT有多靠谱”“ChatGPT曾回答如何毁灭人类”……据瑞银集团2月3日的一份报告显示，在ChatGPT推出仅两个月后，它的月活用户已经突破了1亿，成为史上用户增长速度最快的消费级应用程序。短短一周之后，ChatGPT的官方网站已经无法登陆，官网已处于“满负荷”状态。

因“太智能”惨遭封杀

面对ChatGPT的火爆，中国工程院外籍院士、前任世界首富、微软的联合创始人比尔·盖茨曾直言：不论曾经多么火爆，他本人并不看好Web3和元宇宙，但是ChatGPT则让他“窥见了未来”，ChatGPT方法和创新速度都令他印象深刻。在人工智能业内，ChatGPT出现的意义被很多人视为：等同于“互联网”的诞生。

人工智能技术发展到今天，从概念诞生到成果研发，再到实际应用及场景下沉，仅有短短70年左右，但是其底层技术已相对成熟，甚至早已经融入到我们生活的方方面面。比如随口而来的“siri”“小度小度”“小爱同学”等对话机器人就是最典型的代表。如果进行宽泛的归类，风靡全球的ChatGPT亦在其中。不过凡是使用过这些智能机器人的用户肯定都遭遇过“命令理解不清”的尴尬。用户提问后，被智能机器人的一句“对不起，我没有明白你的意思”拒之门外。

ChatGPT技术领先的地方就在于强大的理解能力，虽然它同样会被一些提问卡住。但基本上绝大多数提问，ChatGPT都能给出令人满意甚至超乎想象的回答。

2023年2月，美国知名全科学习网站Study.com针对1000名学生进行了一项调查，结果显示超过89%的学生使用ChatGPT完成作业。最令人感到意外和震惊的是，北美密歇根大学哲学系教授Antony Aumann在审阅作业的时候发现了一篇他认为自己教师生涯中“有史以来最好的论文”，这篇文章结构完整、逻辑缜密、言语简介清晰、举例恰当精准。但是最后Aumann发现，这篇文章是由ChatGPT完成的。因此，美国教育界对ChatGPT全面封杀，学术界对于ChatGPT的使用也慎之又慎，而且严禁将其列为“合作著者”。可见ChatGPT的智能化程度已经远超同类的人工智能，甚至足以适应社会生活中的部分脑力劳动场景，如写论文、编程代码等。

“图灵测试”让ChatGPT像人一样思考

ChatGPT的技术关键就在后缀上。所谓“GPT”是“Generative Pre-trained Transformer”的缩写，即“生成型预训练变换模型”的缩写。ChatGPT使用的就是第三代GPT模型，此前还有GPT和GPT-2。

在GPT-3诞生之初，开发者就对其进行了“人工智能基本考核测试”——图灵测试。图灵测试，指的是是验证一台人工智能机器人是否需具有“类人智慧”的最基本测试，该测试是由人工智能之父艾伦·麦席森·图灵提出，一般指的是人类和人工智能装置在被隔开的情况下，人向人工智能装置提问，如果被测试装置回答的问题，让测试者超过30%的几率“误判”对方是“人”，那么即认为该装置通过了人图灵测试，是具有“人类智能”的设备。

结果发现，GPT-3不仅顺利通过了图灵测试，而且它的回答自然流畅，相较于其他的人工智能大模型，它更像是个“人”。甚至测试者惊呼：“如果在十年前用同样的问题做测试，我会认为答题者一定是人。现在，我们不能再以为AI回答不了常识性的问题了。”

其实ChatGPT并不是第一个通过图灵测试的人工智能机器人，早在2014年，就有AI通过了图灵测试，实现了“类人化”的进步。2014年6月7日，英国皇家学会举行的2014图灵大会上，人工智能机器人尤金·古斯特曼冒充一名13岁的乌克兰男孩，回答了评委一系列问题，其中有33%的评委被“骗过”。这是1950年图灵测试被提出之后首次有人工智能通过该测试。

2018年5月，Google I/O 2018大会上，Alphabet董事长 John Hennessy公开表示，谷歌的AI系统打电话给一家美发店以真人对话的形式，成功预约了理发服务。在狭义上说，本次实验中谷歌的AI系统通过了图灵测试。从技术层面说，这一测试确认了人类已经初步实现让人工智能“骗过人类”的算法。而如今ChatGPT的出现，则进一步深化了这一项“能力”，甚至在某些智能工作、技术领域出现了取代人类的趋势。

技术趋于成熟，攻坚点在训练

GPT-3作为人工智能大模型，其开发者是美国人工智能公司OpenAI。GPT-3的神经网络包含了1750亿个参数，发布之初是当时世界上最大的神经网络。2020年9月22日，微软宣布取得了GPT-3的独家授权，这也为ChatGPT的诞生奠定了技术基础。

虽然GPT仅仅是一种语言模型，并不能像其他AIGC，如Dall-E 2那样直接制作视频，也无法像Midjourney一般绘画出《太空歌剧院》这样的艺术品，但是仅凭借语言、文字再加上1750亿神经参数的加持，GPT的学习能力和理解能力极强，能够理解提问者的问题，并给出最正确的回答，因此显得更加智能。

正如前文所言，人工智能机器人的真正的难点在于如何让它学习、训练，逐渐模仿人类的思维模式甚至是交流习惯，然后回答出符合提问者心理预期的答案，这需要巨大的训练量。此外，除了庞大的训练量之外，维持GPT运行的成本更算得上是天文数字，也成为横亘在诸多科技公司面前的一座大山，底层逻辑和基层技术很多公司都已经具备，但是面对庞大的训练量和运营成本，所有的野心都只能望而却步。

随着ChatGPT的火爆，其背后的运营成本也被逐层扒出。据了解，OpenAI为了能够让GPT-3的表现更接近于人类，用了45TB的数据量、1万亿个单词来训练它，平均每运算一次都要花费450万美元。人工智能企业小冰公司为微软全球最大的人工智能独立产品研发团队，其CEO李笛表示，若用ChatGPT的方法，以小冰框架当前支撑的对话交互量计算，每天成本将高达3亿元，一年成本超过1000亿元。对于这样的研发成本，放眼全球都不见得有几个公司能够拍着胸脯说敢尝试，更何况还要承受研发失败的风险。

既然技术层面上已经成熟，中国何时能拥有如此自己的“ChatGPT”？可以明确的是，ChatGPT的研发门槛在于“钱”。试问有几家企业敢于承担失败的风险，投入巨大的人力物力开发出市场应用场景尚不明晰的人工智能呢？此外，近些年来西方国家在芯片上对我们的制约也在一定程度上限制了我们的技术进步。中国的创新之路，任重而道远，我们所要承担和承受的远超乎想象……