GPT-4落地之快,将远超前辈
2023-04-04张书琛
张书琛
如上所述,将GPT-4 大模型的能力接入微軟Office 全家桶并不是一件容易的事,它不是一个随便的GPT 接口,而是一个系统性的工程。微软AI 办公套件的推出因此被业内人士视为GPT-4 大规模商用的“iPhone时刻”。
在OpenAI 透露的信息中我们也可以看到,类似的商业落地应用,即自然语言处理大模型的实际应用表现已经取代参数规模的扩张成为新的宣传重点。
OpenAI 在官网上给出了6 个GPT-4 的应用案例,包括语言学习软件Duolingo(多邻国)嵌入GPT-4 模型,扮演语言学习老师解答问题;与应用程序Be My Eyes 合作,通过图像理解能力为视障人士提供生活帮助;以及微软旗下的Bing 浏览器一个多月前已经嵌入了GPT-4 大模型,为用户提供更智能的搜索结果。
这些案例足以说明OpenAI 已经意识到,大模型的规模扩张边际回报递减,“越多人用,成本越低”,因而比起在规模上持续扩张,探索如何在学习率、批次大小(迭代所需样本数量)等方面精进成为了突破的重点。
GPT-4扩展了文字处理能力
AI Dungeon玩法
另一方面,这次没有公布任何GPT-4 相关模型参数数据、算力或训练方式的OpenAI,已经越来越像一个营利性科技公司,GPT-4 也更像是一个产品而非研究成果。那么在商业落地上,GPT-4 想象空间究竟有多大?
共创游戏剧情
比起元宇宙这个宏大缥缈的概念,GPT-4 模型对于游戏行业整个生态的影响将会更加直观,游戏创作、数字营销、数据和模型训练等环节将首当其冲,经历新生产工具的洗礼。
其实早在ChatGPT 大热之前,游戏厂商就已经尝试通过AI 优化用户体验、降低研发成本。尽管游戏产业在全球坐拥超30 亿玩家,整个市场加起来的产值将近2000 亿美元,但对于游戏厂商来说,研发和后续的运营、维护费用都是一笔巨款,且越成功的作品越烧钱:《塞尔达传说:旷野之息》成本达1.2 亿美元,3A 手游《原神》的研发成本约1 亿美元,上线后每年还得花2 亿美元保持稳定更新。
米哈游曾利用AI 完成游戏角色口型和声音匹配,完全由AI 合成输出的声音也被用在了其推出的虚拟偶像“鹿鸣”身上;在美术绘画辅助方面,ChilloutMix+LoRA 等模型融合进化已经能够实现较为真实的图像生成,对于角色创意、场景概念等高耗时环节的冲击深远。
一位大厂外包的游戏原画师透露,一些小厂为了减少成本,“能用AI 出图就用AI,游戏UI 的图标很多都是AI 画的,反正都是垃圾小游戏,厂商也不在乎细节。”据华泰证券研报指出,已有工作室通过应用AIGC 将制作100 名角色由5 万美元的开发成本及6个月的工时缩短至1 万美元及1 个月,节省成本及时长超80%。
游戏反过来也会帮助AI 模型底座走向成熟。从简单的扑克游戏再到需要更复杂策略和操作的多人在线策略游戏,高复杂度、高挑战性、强协作性环境的游戏场景,都为AI 的训练提供了理想的环境。腾讯AILab 就曾在《王者荣耀》中训练策略协作型AI“绝悟”,并联合游戏建设“开悟”训练平台为科研人员提供人工智能研究训练时所需要的大规模运算。
GPT-4 作为多模态自然语言模型,同样可以大幅提升游戏制作的生产效率,并降低游戏研发维护的成本。用新科技做出来的游戏,不管在玩法还是交互上,都与以往的游戏不同,类似于《西部世界》这样的游戏也不再只是科幻。
细分来看,GPT-4 不仅可以自动生成剧本创作、角色对话、任务设计,还能够通过学习和理解游戏测试数据,自动生成游戏测试脚本;在全球推广环节,GPT-4 也能基于强大的翻译功能和对不同文化背景的理解帮助开发者优化游戏内容,实现本地化。
而这一大模型最直观的应用其实是游戏中的智能NPC(非玩家角色),《头号玩家》等影视作品中都已经展现过这一未来场景。但限制在于,如今搭载了GPT-4 的ChatGPT 虽然在聊天方面几乎达到了人类心目中的“自然”,但距离真正的“人工智能”还差得多。
“目前技术还远不够成熟。作为游戏NPC,GPT-4 一是很难产生连贯沟通的真实感,二是做不到有趣。”在算法工程师林楠看来,后者是问题的关键,“玩家期望的NPC 是一个既能与玩家自由互动,又能拓展游戏体验的载体,但GPT-3 都还没有做到流畅感,不知道GPT-4 可以提升玩家体验到什么程度。”
在游戏中大规模应用GPT-4 的另一个阻碍在于软件使用和维护成本高昂。基于GPT-3 开发的文字冒险类游戏《AI Dungeon》就因为高昂的成本,不得不放弃了GPT 转投更便宜的语言模型。
由初创公司Latitude 开发的《AI Dungeon》玩法与GPT-3 十分契合。参与者可以通过输入任意内容,《AI Dungeon》都能识别并创作后续故事,参与者再根据AI 创作的后续故事进行人为创作,如此循环往复。而在2021 年玩家数量创新高时,Latitude 每月都需要支付OpenAI 近20 万美元以换取GPT-3 接口,这对于小型游戏厂商来说并不轻松。
不过,国内资本雄厚的大厂如腾讯、网易都已经跃跃欲试,希望将自家AI 技术成果应用于游戏世界。腾讯已经公布了自家的类ChatGPT 对话型产品“混元助手”,网易则宣布在今年6 月即将推出的手游《逆水寒》中,将实装类ChatGPT 对话模型,玩家可以体验与NPC 的开放式对话。
GPT-4能否顛覆制药环节?
在生物医药领域,AI 的作用更多体现在制药环节。毕竟AI 技术本质上是一种高级建模方法,借助各类算法与规则,AI 能自动计算出特定问题的最优解,在药物发现环节,越来越强大的AI 很有可能会开启一个突飞猛进的时代。
最近广受关注的深度学习模型正是一种较为通用的算法体系,基于GPT-3 的生成式AI 产品能够快速预测药物的化学结构、生物活性和药物靶点。通过高效分析大量生物医学文献,AIGC 产品可以帮助研究人员迅速找到具有治疗潜力的候选化合物,乃至通过对分子、细胞、器官、动物、临床等不同层面数据的整合分析,实现药物研发流程的整体优化,从而加速新药研发过程。
网易《逆水寒》将接入“智能NPC”
Alphafold是Google旗下DeepMind开发的一款蛋白质结构预测模型
“如果没有新的技术手段,有些靶点可能100 年后都找不到合适的分子,而现在用ChatGPT 就可以短期迅速验证大量可能性。”新型药物研发平台水木未来CEO 郭春龙认为,过去一百年人类在生命科学上的探索,相当于盲筛,而现在X 光、冷冻电镜、Alphafold(与GPT 类似的深度学习模型,用于预测蛋白质结构)和ChatGPT 等工具将会完全改变制药行业。
这里需要解释一下靶点的重要性,药物靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶等生物大分子。现代新药研究与开发的关键首先是寻找、确定和制备药物的分子药靶。
针对新靶点,AI 会首先从巨大的化合物空间中初步筛选出一系列可能有效的化合物;随后,使用AI 与基于量子化学原理的算法,乃至分子和细胞层面的实验,对通过初筛的化合物做更精细的筛选。此轮精细筛选后,AI 又以这少数化合物为基础,在化合物空间中进行再一次筛选,形成循环。
尽管AI 还没有真的制造出可以用于临床的药物,但不妨碍医药企业和技术公司进场押注。目前,全球销售额超过200 亿美元的药企均在AI 领域与不同初创公司达成合作协议,与此同时,AI 制药初创公司的数量也在迅猛增加。截至2022 年第三季度,全球约有600家AI药物研发公司,同比增长21.6%。
不过在幻想通过新技术延缓衰老之前,我们也需要意识到,AI与传统制药企业的结合仍需要突破数据的壁垒。
AI领域发展强调“开放”二字,其成长取决于训练数据的广度和质量,但药物研发中最核心的数据往往掌握在药企手中,亦成为AI优化药物研发行业的掣肘。发展数百年的国际大型制药企业虽然数据积淀丰厚,却壁垒森严,希望这些企业分享涉及核心知识产权的数据难度极高。
因此,我们认为GPT-4 短期内还很难颠覆制药行业生态,但随着技术的发展,作为辅助工具,AI 一定可以精简无效环节,为制药工业开辟更多捷径。