文心一言,生逢其时
2023-04-04陈邓新
陈邓新
对标GPT-4,文心一言底气十足
文心一言,终于揭开了神秘面纱。
2023年3月16日14时,百度在北京总部召开新闻发布会,宣布正式邀请测试基于百度新一代大语言模型的生成式AI 产品文心一言。
百度创始人、董事长兼首席执行官李彦宏表示:“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”
时代,变了。
2023年3月15日凌晨,OpenAI正式发布了升级后的GPT-4,具备了图像处理,尽管如此仍有不足之处:在新版本中,AI 依旧存在社会偏见、捏造事实、对抗生成等问题。
而一天之隔,百度的“文心一言”也横空出世。
巧合的背后,则是棋逢对手,标志着AI 正式迈入“iPhone 时刻”,拉开新时代的序幕。
事实上,文心一言虽然对标GPT-4,却大有不同:走了一条“人有我有,人有我优”之路,寻求差异化竞争力,与GPT-4 形成错位竞争。
具体来看,文心一言对人类意图的理解颇深,在现场展示的互动中,准确性、逻辑性与流畅性已逐渐接近人类的水平。
此外,文心一言也有独到之处。
一方面,大模型更懂中文。
中文博大精深,同一个词汇,在不同语境或有不同的意义,这对AI 是一个巨大的挑战,但难不倒文心一言。
毕竟,作为一家中国公司,百度天然占据中文语境的优势,再叠加持之以恒地深耕,从而对中国文化的理解更深:文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及5500亿事实的知识图谱。
一言以蔽之,百度的文心大模型扎根于中国本土,比国外开发的大语言模型更适合中文语境和中国市场。
另外一方面,多模态更丰富。
相比GPT-4,文心一言可以生成视频与方言语音,前者降低了视频制作的门槛,一次创作,触及文本、图片、视频等全域内容生态;后者覆盖不同地区的群体,方便用户流畅地进行智能互动。
百度多模态的实力,可见一斑。
未来,百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。
厚积薄发,才能水到渠成
需要注意的是,Open Al 为美国创业公司,而正式发布对标GPT 产品的,百度是全球大厂的第一个,值得高看一眼。
这并非突击数月就办得到的,而是厚积薄发的结果。
首先,十年投入超千亿元。
2013年起,百度陆续成立了百度美国研究院、百度深度学习研究院、大数据实验室、硅谷人工智能实验室,从此不断加码勇攀AI 技术的高峰。
这十年来,百度在AI 累计投入了超1000亿元,其中核心研发投入占核心收入比例连续多个季度超过了20%。
以2022年为例,百度的研发费用为233亿元,占核心收入的比例高达24.42%,而全年的净利润也不过206.8亿元。
专注之下,回报也肉眼可见。
据《中国人工智能专利技术分析报告(2022)》显示,百度AI专利申请量为16754件,AI 专利授权量为5705件, AI 专利申请量与授予量连续五年全国第一。
实际上,从全球AI 专利数量排名来看,百度已稳压微软、谷歌一头,这意味着百度AI 在中国乃至全球范围均具有综合优势。
其次,持续夯实算力底座。
技术占优之外,百度也有承接AI 算力的底气。
多年以来,百度一直是“新基建”的主力之一,在算力基础设施上一向未雨绸缪,并规划2030年百度智能云服务器数量超500万台。
如此一来,百度自然没有算力瓶颈的困扰。
更为重要的是,百度在山西阳泉、江苏盐城等地建设智算中心;其中,百度阳泉智算中心是亚洲最大单体智算中心,建设规模为4 EFLOPS(每秒400 亿亿次浮点运算)AI 算力,可满足各行业超大规模AI 计算需求。
再次,打造AI 闭环。
百度是中国唯一一家拥有全栈AI 技术架构的公司:从高端芯片昆仑芯,到飞桨深度学习框架,到文心预训练大模型,再到行业AI 落地,在芯片层、框架层、模型层与应用层都有关键自研技术。
截至2023年3月17日10点,申请文心一言AIP调用服务测试的企业已达7.6 万家,涉及互联网、媒体、金融、汽车、软件等行业,而百度智能云已與5 家企业完成首批签约合作,并与650 家企业启动签约。
让每一家公司离客户更近,成为百度智能云最大的诉求。
中信证券认为:“百度具备‘模型、框架、芯片、应用的全栈布局,上述领域的产业落地有望带动百度云计算业务在AI 领域的持续拓展,持续强化公司智能云业务的竞争力与远期市场空间。”
总而言之,文心一言承载了百度科技改变世界的梦想,是赋能千行百业的新平台,势必成为产业的智能牵引,驱动产业不断降本增效。
毕竟,文心一言的一小步,百度的一大步。