百度文心一言：让智能涌现

2023-05-16江川

中关村 2023年4期

江川

“生成式AI和大模型的智能涌现，是全新的计算范式带来的新机会。这意味着，AI技术已经发展到一个临界点，各行各业都不可避免地被改变。”——李彦宏

3月16日，在OpenAI发布GPT-4两天后，百度召开新闻发布会。百度CEO李彦宏宣布正式推出大语言模型、生成式AI产品“文心一言”，并面向个人用户和企业用户邀约测试。截至3月17日早9点，排队申请百度文心一言企业版API调用服务测试的企业用户达7.38万家。

平安证券表示，百度发布文心一言，吹响了国内大模型应用的号角。伴随着文心一言的催化，国内AIGC产业链将迎来空前的市场机会。长江证券认为，百度文心一言掀起了新一轮AI产业链的浪潮，有望带动底层基础设施环节、底层数据资源环节、基础模型环节、上层应用环节的发展。

对标ChatGPT

百度此次推出的文心一言，具备包括文学创作、商业文案创作、数理推算、中文理解、多模态生成在内的多项通用能力，不仅做到了整体上的“人有我有”，还在某些局部做到了“人有我优”。

先看文學创作能力。在发布会现场，李彦宏一连问了六个有关《三体》的问题，包括“《三体》作者是哪里人？”“可以总结一下《三体》的核心内容吗？”“如果要续写的话，可以从哪些角度出发？”文心一言的回答总结了《三体》的第一部在讲什么，第二部在讲什么，第三部在讲什么，续写又是角色的塑造、情节设计、文化背景、哲学思考。李彦宏继续追问“如何从哲学角度来进行续写？生命的意义，人与宇宙的关系，道德和伦理，价值和信仰，科技和人文的关系”“电视剧《三体》的演员都有哪些？”文心一言都比较准确地列出了一系列参与的演员。这6轮对话，体现出文心一言各方面的能力，比如总结分析的能力、推理的能力。“事实性的东西对于一个搜索引擎来说不是那么难，但是对于一个生成式预训练大模型来说，出错的概率还是挺高的，这些问题都答对相当不容易，因为百度文心一言采用了知识增强和检索增强。我们有5500亿的事实知识在训练数据里，所以可以保证事实性的问题回答比较准确。”

再看商业文案创作能力。李彦宏问：“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司，应该给它起个什么名字？”文心一言回答：信智科技、数智云图、云集科技、意向科技、魔方科技；问：“给我起一个公司的服务slogan，来表达共赢的概念”。答：“数智共赢智慧未来”；问：“帮我生成一篇公司成立的新闻稿，数智云图，以共赢的服务理念，用大模型来服务中小企业的数字化升级，要求是600字左右”，文心一言也生成了相应的新闻稿。这里涉及相应的理解能力、表达能力、创意创作能力。这些能力都是没有办法教文心一言的。那么文心一言是怎么做到的？李彦宏解释，其实还是要有好的技术，要有大的数据。“人们说读书破万卷，文心一言可能读了千亿万亿的页面，用了几十亿的搜索请求，用了很多的图片，用了我们全部知识图谱的5500亿的事实，在不断地训练过程当中，逐步具备了一些比较通用的能力。大模型当参数达到千亿量级，又有足够多的训练语料数据来进行训练时，就会发生智能涌现，就是没有教过它的能力它也会。”

文心一言是要对标ChatGPT，甚至GPT-4，这个门槛无疑是很高的。基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久，新版本GPT-4又迅速发布。无论是速度还是呈现效果，都足以让科技巨头拉响警报。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符，是ChatGPT的8倍。

李彦宏坦言，在内测的过程当中，文心一言的能力还算不上完美。但是为什么现在要发布？李彦宏给出的理由是有市场需求。百度的各个产品线，从搜索到智能云到自动驾驶到小度，都在等着要用这样的技术。大语言模型产品一旦发布出来，它就会获得真实的用户反馈，而有了用户反馈，它的迭代速度就会非常快，它的能力提升就会非常快。

值得肯定的是，在全球的大厂当中，百度是第一个发布大语言模型产品的。微软是直接调用OpenAI，Google、Facebook、Meta、Amazon现在都没有真正发布同类型、同级别的产品。

持续高投入

大语言模型、生成式AI产品意味着背后的大资金投入。无论是OpenAI还是百度，在这方面的投入都是数百亿级别。OpenAI两次共获得微软110亿美金的投资。据国盛证券报告估算，GPT-3训练一次的成本约为140万美元，每一次训练任务都耗资巨大。仅参照Chat GPT来看，Chat GPT其大模型GPT经历了三次迭代，参数量一度从1.17亿增加到1750亿，预训练数据量从5GB增加到45TB，整体运行所需的投入达到百亿。

在人工智能界，百度是中国大厂中投入最多的。2022年百度核心研发费用达到214.16亿元，占百度核心收入比例达22.4%。其实百度在过去的十几年当中，一直在AI的研发上坚持投入。

在人工智能刚开始被大家讨论的时候，百度就已经在该领域开始默默耕耘。2014年百度涉足智能驾驶领域，2015年上线世界首个大规模神经网络机器翻译系统，比Google早了一年多。2016年百度正式发布“百度大脑”并开源中国第一个深度学习框架飞桨。飞桨的出现打破了Google和Facebook的垄断，现已跻身全球前二。

做AI讲究“软硬兼具”，百度“软”有飞桨，“硬”有昆仑。2018年百度自主设计、2019年流片成功、2020年实现量产、2021年升级的百度昆仑AI芯片已经得到大规模应用。此外，百度还研发出鸿鹄语音芯片，打破了卡脖子问题，使中国公司不再完全依靠外来输入。从算力、算法到数据，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心大模型，百度在各个层面都早有关键自研技术，给文心一言提供了强大的技术支持。

而百度的文心大模型和OpenAI的GPT模型类似，早在2019年就已推出，且经过了多次的迭代，从刚开始单一的自然语言理解延伸到目前的多模态，包括视觉、文档、文图、语音等多模态多功能，因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。

在发布会现场，技术出身的李彦宏分享了IT领域最近发生的一些变化。过去，IT的技术栈分为3层，底层是芯片层，中间是操作系统层，上面是应用层或者软件层。“在PC时代、移动互联网时代都是这样，但是当我们进入AI时代，IT技术栈从3层变为了4层，即芯片层、框架层、模型层、应用层。芯片层过去以CPU为主，未来很可能会以GPU为主。文心一言处在模型层，AI时代的应用会基于这些大模型来进行开发。”

李彦宏谈到，在全球范围内，芯片、框架、模型、应用这4层都有领先产品的公司，百度是绝无仅有的那一个。百度的优势非常独特，这个优势在未来文心的迭代速度上会有明显的感受。事实上，从2月7日百度正式官宣文心一言要发布以来，仅仅一个多月的时间，已经有650家企业宣布接入文心一言的生态，这意味着很多企业其实已经明白，这是一个大机会。

生成式AI，它是代表了一个新的技术范式，它会带来市场需求的爆发性增长，商业价值的释放会是前所未有的指数级。正如李彦宏所畅想的，在通用的基础模型之上，在4层结构上可以有能源大模型、交通大模型、媒体大模型，等等。可以做成适合于千行百业的、服务各种各样应用的模型。文心一言依托它超强的自然语言理解能力、表达能力以及推理能力，可以使得任何一个公司都能离自己的客户更近，做出更好的客户体验，从而更好地建立竞争优势。

大模型带来了AI产业的变革，也将是未来十年的主流趋势，这已经成为了业界共识。想要入场分羹的选手不少。自去年12月ChatGPT发布之后，无论是一级市场，还是国内外的大厂，都在发力大模型，研发类ChatGPT产品。前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬，都在杀向大模型赛道。国内大厂们更是如此。除了百度之外，阿里、騰讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。

对于百度而言，另一大优势是赢在了时间。正如李彦宏所说：“无论是什么样的公司，都不可能在几个月的时间里靠突击做出来这样的技术。文心一言是百度十几年超大规模的研发投入，慢慢积累出来的。”