文心一言，生逢其时

2023-04-04陈邓新

电脑报 2023年12期

关键词：文心算力百度

陈邓新

对标GPT-4，文心一言底气十足

文心一言，终于揭开了神秘面纱。

2023年3月16日14时，百度在北京总部召开新闻发布会，宣布正式邀请测试基于百度新一代大语言模型的生成式AI 产品文心一言。

百度创始人、董事长兼首席执行官李彦宏表示：“百度希望和大家一起，推动人工智能技术进步，让所有人都能使用最先进的生产力工具，让所有人都能从中受益。”

时代，变了。

2023年3月15日凌晨，OpenAI正式发布了升级后的GPT-4，具备了图像处理，尽管如此仍有不足之处：在新版本中，AI 依旧存在社会偏见、捏造事实、对抗生成等问题。

而一天之隔，百度的“文心一言”也横空出世。

巧合的背后，则是棋逢对手，标志着AI 正式迈入“iPhone 时刻”，拉开新时代的序幕。

事实上，文心一言虽然对标GPT-4，却大有不同：走了一条“人有我有，人有我优”之路，寻求差异化竞争力，与GPT-4 形成错位竞争。

具体来看，文心一言对人类意图的理解颇深，在现场展示的互动中，准确性、逻辑性与流畅性已逐渐接近人类的水平。

此外，文心一言也有独到之处。

一方面，大模型更懂中文。

中文博大精深，同一个词汇，在不同语境或有不同的意义，这对AI 是一个巨大的挑战，但难不倒文心一言。

毕竟，作为一家中国公司，百度天然占据中文语境的优势，再叠加持之以恒地深耕，从而对中国文化的理解更深：文心一言大模型的训练数据包括万亿级网页数据，数十亿搜索数据和图片数据，百亿级语音日均调用数据，以及5500亿事实的知识图谱。

一言以蔽之，百度的文心大模型扎根于中国本土，比国外开发的大语言模型更适合中文语境和中国市场。

另外一方面，多模态更丰富。

相比GPT-4，文心一言可以生成视频与方言语音，前者降低了视频制作的门槛，一次创作，触及文本、图片、视频等全域内容生态；后者覆盖不同地区的群体，方便用户流畅地进行智能互动。

百度多模态的实力，可见一斑。

未来，百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。

厚积薄发，才能水到渠成

需要注意的是，Open Al 为美国创业公司，而正式发布对标GPT 产品的，百度是全球大厂的第一个，值得高看一眼。

这并非突击数月就办得到的，而是厚积薄发的结果。

首先，十年投入超千亿元。

2013年起，百度陆续成立了百度美国研究院、百度深度学习研究院、大数据实验室、硅谷人工智能实验室，从此不断加码勇攀AI 技术的高峰。

这十年来，百度在AI 累计投入了超1000亿元，其中核心研发投入占核心收入比例连续多个季度超过了20%。

以2022年为例，百度的研发费用为233亿元，占核心收入的比例高达24.42%，而全年的净利润也不过206.8亿元。

专注之下，回报也肉眼可见。

据《中国人工智能专利技术分析报告（2022）》显示，百度AI专利申请量为16754件，AI 专利授权量为5705件， AI 专利申请量与授予量连续五年全国第一。

实际上，从全球AI 专利数量排名来看，百度已稳压微软、谷歌一头，这意味着百度AI 在中国乃至全球范围均具有综合优势。

其次，持续夯实算力底座。

技术占优之外，百度也有承接AI 算力的底气。

多年以来，百度一直是“新基建”的主力之一，在算力基础设施上一向未雨绸缪，并规划2030年百度智能云服务器数量超500万台。

如此一来，百度自然没有算力瓶颈的困扰。

更为重要的是，百度在山西阳泉、江苏盐城等地建设智算中心；其中，百度阳泉智算中心是亚洲最大单体智算中心，建设规模为4 EFLOPS（每秒400 亿亿次浮点运算）AI 算力，可满足各行业超大规模AI 计算需求。

再次，打造AI 闭环。

百度是中国唯一一家拥有全栈AI 技术架构的公司：从高端芯片昆仑芯，到飞桨深度学习框架，到文心预训练大模型，再到行业AI 落地，在芯片层、框架层、模型层与应用层都有关键自研技术。

截至2023年3月17日10点，申请文心一言AIP调用服务测试的企业已达7.6 万家，涉及互联网、媒体、金融、汽车、软件等行业，而百度智能云已與5 家企业完成首批签约合作，并与650 家企业启动签约。

让每一家公司离客户更近，成为百度智能云最大的诉求。

中信证券认为：“百度具备‘模型、框架、芯片、应用的全栈布局，上述领域的产业落地有望带动百度云计算业务在AI 领域的持续拓展，持续强化公司智能云业务的竞争力与远期市场空间。”

总而言之，文心一言承载了百度科技改变世界的梦想，是赋能千行百业的新平台，势必成为产业的智能牵引，驱动产业不断降本增效。

毕竟，文心一言的一小步，百度的一大步。

猜你喜欢

文心算力百度

卫星通信在算力网络中的应用研究

算力网络中基于算力标识的算力服务需求匹配

中国电信董事长柯瑞文：算力成为数字经济的主要生产力

基于SiteAI算力终端的交通态势感知系统

Robust adaptive UKF based on SVR for inertial based integrated navigation