APP下载

百度文心一言:让智能涌现

2023-05-16江川

中关村 2023年4期
关键词:文心李彦宏三体

江川

“生成式AI和大模型的智能涌现,是全新的计算范式带来的新机会。这意味着,AI技术已经发展到一个临界点,各行各业都不可避免地被改变。”——李彦宏

3月16日,在OpenAI发布GPT-4两天后,百度召开新闻发布会。百度CEO李彦宏宣布正式推出大语言模型、生成式AI产品“文心一言”,并面向个人用户和企业用户邀约测试。截至3月17日早9点,排队申请百度文心一言企业版API调用服务测试的企业用户达7.38万家。

平安证券表示,百度发布文心一言,吹响了国内大模型应用的号角。伴随着文心一言的催化,国内AIGC产业链将迎来空前的市场机会。长江证券认为,百度文心一言掀起了新一轮AI产业链的浪潮,有望带动底层基础设施环节、底层数据资源环节、基础模型环节、上层应用环节的发展。

对标ChatGPT

百度此次推出的文心一言,具备包括文学创作、商业文案创作、数理推算、中文理解、多模态生成在内的多项通用能力,不仅做到了整体上的“人有我有”,还在某些局部做到了“人有我优”。

先看文學创作能力。在发布会现场,李彦宏一连问了六个有关《三体》的问题,包括“《三体》作者是哪里人?”“可以总结一下《三体》的核心内容吗?”“如果要续写的话,可以从哪些角度出发?”文心一言的回答总结了《三体》的第一部在讲什么,第二部在讲什么,第三部在讲什么,续写又是角色的塑造、情节设计、文化背景、哲学思考。李彦宏继续追问“如何从哲学角度来进行续写?生命的意义,人与宇宙的关系,道德和伦理,价值和信仰,科技和人文的关系”“电视剧《三体》的演员都有哪些?”文心一言都比较准确地列出了一系列参与的演员。这6轮对话,体现出文心一言各方面的能力,比如总结分析的能力、推理的能力。“事实性的东西对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,出错的概率还是挺高的,这些问题都答对相当不容易,因为百度文心一言采用了知识增强和检索增强。我们有5500亿的事实知识在训练数据里,所以可以保证事实性的问题回答比较准确。”

再看商业文案创作能力。李彦宏问:“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,应该给它起个什么名字?”文心一言回答:信智科技、数智云图、云集科技、意向科技、魔方科技;问:“给我起一个公司的服务slogan,来表达共赢的概念”。答:“数智共赢智慧未来”;问:“帮我生成一篇公司成立的新闻稿,数智云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是600字左右”,文心一言也生成了相应的新闻稿。这里涉及相应的理解能力、表达能力、创意创作能力。这些能力都是没有办法教文心一言的。那么文心一言是怎么做到的?李彦宏解释,其实还是要有好的技术,要有大的数据。“人们说读书破万卷,文心一言可能读了千亿万亿的页面,用了几十亿的搜索请求,用了很多的图片,用了我们全部知识图谱的5500亿的事实,在不断地训练过程当中,逐步具备了一些比较通用的能力。大模型当参数达到千亿量级,又有足够多的训练语料数据来进行训练时,就会发生智能涌现,就是没有教过它的能力它也会。”

文心一言是要对标ChatGPT,甚至GPT-4,这个门槛无疑是很高的。基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久,新版本GPT-4又迅速发布。无论是速度还是呈现效果,都足以让科技巨头拉响警报。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符,是ChatGPT的8倍。

李彦宏坦言,在内测的过程当中,文心一言的能力还算不上完美。但是为什么现在要发布?李彦宏给出的理由是有市场需求。百度的各个产品线,从搜索到智能云到自动驾驶到小度,都在等着要用这样的技术。大语言模型产品一旦发布出来,它就会获得真实的用户反馈,而有了用户反馈,它的迭代速度就会非常快,它的能力提升就会非常快。

值得肯定的是,在全球的大厂当中,百度是第一个发布大语言模型产品的。微软是直接调用OpenAI,Google、Facebook、Meta、Amazon现在都没有真正发布同类型、同级别的产品。

持续高投入

大语言模型、生成式AI产品意味着背后的大资金投入。无论是OpenAI还是百度,在这方面的投入都是数百亿级别。OpenAI两次共获得微软110亿美金的投资。据国盛证券报告估算,GPT-3训练一次的成本约为140万美元,每一次训练任务都耗资巨大。仅参照Chat GPT来看,Chat GPT其大模型GPT经历了三次迭代,参数量一度从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,整体运行所需的投入达到百亿。

在人工智能界,百度是中国大厂中投入最多的。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。其实百度在过去的十几年当中,一直在AI的研发上坚持投入。

在人工智能刚开始被大家讨论的时候,百度就已经在该领域开始默默耕耘。2014年百度涉足智能驾驶领域,2015年上线世界首个大规模神经网络机器翻译系统,比Google早了一年多。2016年百度正式发布“百度大脑”并开源中国第一个深度学习框架飞桨。飞桨的出现打破了Google和Facebook的垄断,现已跻身全球前二。

做AI讲究“软硬兼具”,百度“软”有飞桨,“硬”有昆仑。2018年百度自主设计、2019年流片成功、2020年实现量产、2021年升级的百度昆仑AI芯片已经得到大规模应用。此外,百度还研发出鸿鹄语音芯片,打破了卡脖子问题,使中国公司不再完全依靠外来输入。从算力、算法到数据,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心大模型,百度在各个层面都早有关键自研技术,给文心一言提供了强大的技术支持。

而百度的文心大模型和OpenAI的GPT模型类似,早在2019年就已推出,且经过了多次的迭代,从刚开始单一的自然语言理解延伸到目前的多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。

在发布会现场,技术出身的李彦宏分享了IT领域最近发生的一些变化。过去,IT的技术栈分为3层,底层是芯片层,中间是操作系统层,上面是应用层或者软件层。“在PC时代、移动互联网时代都是这样,但是当我们进入AI时代,IT技术栈从3层变为了4层,即芯片层、框架层、模型层、应用层。芯片层过去以CPU为主,未来很可能会以GPU为主。文心一言处在模型层,AI时代的应用会基于这些大模型来进行开发。”

李彦宏谈到,在全球范围内,芯片、框架、模型、应用这4层都有领先产品的公司,百度是绝无仅有的那一个。百度的优势非常独特,这个优势在未来文心的迭代速度上会有明显的感受。事实上,从2月7日百度正式官宣文心一言要发布以来,仅仅一个多月的时间,已经有650家企业宣布接入文心一言的生态,这意味着很多企业其实已经明白,这是一个大机会。

生成式AI,它是代表了一个新的技术范式,它会带来市场需求的爆发性增长,商业价值的释放会是前所未有的指数级。正如李彦宏所畅想的,在通用的基础模型之上,在4层结构上可以有能源大模型、交通大模型、媒体大模型,等等。可以做成适合于千行百业的、服务各种各样应用的模型。文心一言依托它超强的自然语言理解能力、表达能力以及推理能力,可以使得任何一个公司都能离自己的客户更近,做出更好的客户体验,从而更好地建立竞争优势。

大模型带来了AI产业的变革,也将是未来十年的主流趋势,这已经成为了业界共识。想要入场分羹的选手不少。自去年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬,都在杀向大模型赛道。国内大厂们更是如此。除了百度之外,阿里、騰讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。

对于百度而言,另一大优势是赢在了时间。正如李彦宏所说:“无论是什么样的公司,都不可能在几个月的时间里靠突击做出来这样的技术。文心一言是百度十几年超大规模的研发投入,慢慢积累出来的。”

猜你喜欢

文心李彦宏三体
李彦宏的AI观
冬天来啦
文心杂记
请不断修炼你的“文心”
基于遗传算法的三体船快速性仿真分析
基于7.1 m三体高速船总强度有限元分析
李彦宏冒险之前先算一算
“三体联动”构建应对反倾销的会计功能衔接机制