百度文心一言价值何在？

2023-06-05刘以秦顾翎羽

财经 2023年6期

刘以秦　顾翎羽

北京百度公司总部。图/法新

2023年3月16日，百度启动生成式对话产品“文心一言”邀请测试。这是国内第一款对标ChatGPT的生成式对话产品。当天，百度创始人李彦宏说，大家对它的期望值是对标ChatGPT，甚至要对标GPT-4，这个门槛还是很高的。

3月16日，百度新闻发布会后，百度港股股价单日跌幅6.4%。3月17日，股价回弹，单日上涨13%。

李彦宏在现场接受《财经》记者的采访时表示，内测中“文心一言”并不完美，之所以现在目前这个节点发布邀请测试，主要两大原因：一是去年开始全球人工智能技术发展从过去的判别式AI（数据库比对）转为生成式AI（生成新内容），百度加快研发脚步，近半年市场验证了这个判断；二是更多的机会出现在了生成式AI这些方面，无论是百度内部产品还是合作伙伴都有强烈需求。

全球最先在生成式对话领域掀起风浪的是微软投资的美国创业公司OpenAI。该公司在去年12月推出的基于GPT-3.5大模型的ChatGPT火爆全球，3月15日OpenAI进一步推出新升级的GPT-4大模型，相比前一代有了不小的提升；3月17日，微软在发布会上宣布，将GPT-4的能力融入Office系列产品。AI大模型的特点是能够在更宽泛、更大规模的数据上进行训练，效率更高，学习能力更强，但耗费资源更大。

ChatGPT火爆后，多家公司宣布也在研发类似产品，百度是目前中国头部科技公司中第一个落地产品的。文心一言基于文心大模型技术。2019年，百度推出文心大模型ERNIE1.0，2022年11月，该模型进化成3.0版本。李彦宏称，文心大模型每天接受数十亿次用户搜索请求，这也为文心一言提供了庞大的数据池。

生成式对话产品并非一个全新形态的产品。它的典型同类产品是对话式AI产品，包括各类语音助手、聊天工具等。第三方数据机构IDC数据显示，2022年，对话式AI市场规模达到54.6亿元，市场渗透率已经饱和。但此前的产品并未引入大模型，新一代产品的出现，将重新激活市场。

文心一言除了能够生成文字内容，还能生成图片、音频和视频内容，由于成本原因，文心一言的视频生成内容暂未对外开放。

无论是ChatGPT和还文心一言，目前都是比较初级的产品，且尚未找到清晰的商业模式，这也是目前行业里最关心的话题。ChatGPT是面向C端用户收费，但依然严重亏损，2022年全年预计亏损5.4亿美元，且用户量越大，亏损越严重。百度目前对文心一言的定位更偏向B端，李彦宏称，文心一言的定位是一个通用的赋能平台，金融、能源、媒体、政务等千行百业，都可以基于这个平台来实现智能化变革，创造商业价值。

李彦宏的判断是，生成式AI代表了一个新的技术范式，是一个每家企业都不可以错过的巨大的机会。AI市场即将迎来爆发性的需求增长，其商业价值的释放将是前所未有的、指数级的。

据百度官方数据，截至3月17日上午10点，申请文心一言API服务测试的企业已达7.6万家。

某中国AI创业公司CEO向《财经》记者评价，中国需要有自己的大模型产品，从算力、数据、人才储备等方面，百度在中国市场优势明显，尽管目前和美国还有差距，但“必须要有勇气走出第一步。”

有差距也有亮点

新闻发布会现场，李彦宏展示了文心一言的5个场景，分别是：文学创作、商业文案创作、数理推算、中文理解、多模态生成。

《财经》记者对比文心一言和GPT-4针对同一问题的回答，发现文心一言对于中文的理解，在某些时候是优于GPT-4的，例如当问题是病句或容易造成歧义的表述时，文心一言能够理解提问者的意思，GPT-4的回答会有所偏离。同时，它们都存在“胡说八道”的情况，不过，新版Bing中的GPT-4会附上内容来源链接，便于用户二次确认。

文心大模型训练使用的数据以中文为主，因此文心一言能够更好理解中文，甚至能生成不同方言的音频。文心一言也支持英文互动，但效果相对较差，其他语种目前还不支持。

此外，文心一言会选择性回答问题，若问题中涉及敏感词，它会说“我无法回答这个问题。”李彦宏提到，整体而言，这类大语言模型还远未到發展完善的阶段，它们有时候会有很惊艳的表现，但不少场景下，细究起来还有明显的问题，进步空间很大。

大模型训练成本高昂，需要有大算力、大数据和大模型，每一次训练任务都耗资巨大。百度拥有全栈式AI能力，从芯片（昆仑芯），到深度学习框架（飞桨），再到预训练大模型（文心），到搜索、智能云、自动驾驶、小度等应用，各个层面都有自研技术。

李彦宏表示，全栈式布局可以大幅提升效率，显著降低成本。另外，芯片、框架、大模型和终端应用场景，可以形成一个高效的反馈闭环，帮助大模型不断优化迭代。

新商业机会

马斯克是OpenAI最早的创始人之一，后期退出。今年2月，他在社交平台上公开批评OpenAI“最初是作为一家开源的非营利性公司而创建的，这也是为什么我把它命名为OpenAI，旨在抗衡谷歌，但现在它已经成一家闭源的营利性公司，并由微软控制……这完全不是我的本意。”

由于OpenAI选择了封闭，只对接微软全系产品，外界将它类比为苹果的iOS操作系统。百度的文心大模型走的是开源模式，类似于谷歌的安卓操作系统。

百度对文心一言的定位是“一个通用的赋能平台”，金融、能源、媒体、政务等行业，都可以基于这个平台来做智能化改造，实现效率提升。

除此之外，按照规划，文心一言也将全面嵌入现有业务中，包括搜索、智能音箱、百度智能云、智能驾驶等。

在搜索场景中，文心一言可以补充、升级搜索体验，类似目前Bing中集成了GPT-4的体验。搜索引擎能以此形成新的流量入口，获得新的数据。在智能驾驶场景中，可以与百度阿波罗自动驾驶舱、车路协调做融合，提升无人驾驶的可靠性。

李彦宏提到，大模型时代将产生三大产业机会：

2023年3月16日，李彦宏在“文心—言”发布会上。图／法新

第一类是新型云计算公司。之前企业选择云厂商更多看算力、存储等基础云服务。未来，框架、模型的质量，以及模型、框架、芯片、应用这四层之间的协同能力，会变得更重要。微软已经将Chat-GPT的能力融入Azure云服务，多位业内人士提到，这将有助于Azure提高市场份额，也是微软投资OpenAI的商业回报之一。

在中国市场，目前百度云的市场份额低于阿里云、华为云和腾讯云。不过，智能云是目前百度增速最快的业务，2022年营收同比增长23%，这一增速也高于另外三家云厂商。文心一言的出现，或许能够帮助百度云拿下更多市场份额。

第二类是通过调用大模型能力，为行业提供解决方案的公司。目前文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型，在各行各业都可能创造机会。

第三类是基于大模型底座开发应用的公司，即应用服务提供商。李彦宏说，“今天，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，他们可能就是未来的新巨头。”

中国AI大模型进展

基于大模型的生成式AI已经成为新一轮市场热点。数据服务商Dealroom报告显示，全球生成式AI企业估值已达480亿美元，在过去2年里翻了6倍。

中国投资人和创业者们也已经入局。前美团联合创始人王慧文成立AI公司“光年之外”，多家知名投资机构立即跟进，天使轮估值已经达到2亿美元。一家在几年前就开始做大模型的AI创业公司，一度无人问津，近期该公司创始人告诉《财经》记者，几乎每天都有不少投资机构来询问是否接受融资。

目前，中国初创公司中，能够做出真正有影响力产品的还很少。多位投资人表示，短期内能够看到实际应用效果的，可能是抖音、快手这类视频平台。目前，字节跳动和快手均有布局AI大模型和生产式AI。

其他头部科技公司中，腾讯、阿里巴巴、华为也在行动。2022年4月，腾讯对外披露“混元”大模型，协同了腾讯预训练研发力量，覆盖NLP（自然语言处理）大模型、CV（机器视觉）大模型、多模态大模型及多哥领域任务模型。

2022年9月，阿里巴巴在世界人工智能大会上，发布“通义”大模型系列，并宣布相关核心模型向全球开发者开源。华为云团队于2021年4月发布“盘古”大模型，2022年11月，在华为全联接大会2022中国站上，华为云发布盘古大模型的新技术能力，扩展盘古大模型的服务范围，发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项新服務。

ChatGPT火了之后，中国不少公司都在尝试研发类似产品。但这件事成本极高。OpenAI每年的研发费用高达几十亿美元，GPT-3.5语言大模型包含1750亿个参数，微软为ChatGPT构建了超过1万枚英伟达AlOOGPU芯片的AI计算集群。GPT-4的参数值在此基础上又大幅提高。谷歌3月6日推出的多模态大模型PalM-E，参数值达到了5620亿。

一位长期关注AI的投资人告诉《财经》记者，中国的创业公司从0去做类似产品，非常不划算，也很难追赶进度，应该将重心放在行业应用上。

另一位投资人提到，由于监管因素，文心一言为代表的国产替代产品未来才是主流。

文心一言的出现，或许能够帮助中国公司更好地理清思路。李彦宏称，对于大部分创业者和企业来说，新的机会在于基于通用大语言模型，抢先开发重要的应用服务。“就像移动互联网时代，最成功的商业产品不见得是安卓和iOS，而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。”