大模型创业，学不起OpenAI

2023-12-06刘以秦郑可书

财经 2023年24期

刘以秦　郑可书

美国大模型领域明星创业公司Open AI公司11月6日召开了首次开发者大会，这次大会上的发布让全球产业界看到了美国高科技公司“火星级创业速度”。其中发布的GPTs应用商店标志着这家明星公司把大模型从技术推向了商业化——这一步至关重要。此时，中国大模型创业公司仍处于“军备竞赛”阶段。

中国创业公司在大模型领域跟进速度其实相对较快。目前已经出现三家明星创业公司，分别是百川智能、Minimax、智谱AI。这三家明星创业公司呈现一个共同特点：融资密集、金额巨大。

最新的动态是，百川智能在筹备新一轮融资，本次融资前估值16亿美元，计划融资2亿-3亿美元，已经基本确定约1.5亿美元的投资意向，投资方是中东背景。另外还有一家人民币机构也有投资意向，还在讨论阶段。

百川智能成立于今年3月，本轮融资前已经完成一轮3亿美元的融资，融前估值10亿美元，融后估值13亿美元。投资方包括阿里巴巴、腾讯、小米、愉悦资本、深创投等。

目前，大模型创业领域第一梯队的公司只有三家。10月20日，智谱宣布今年共完成25亿元融资，投资方包括中关村自主创新基金、美团、蚂蚁金服、阿里巴巴、腾讯、小米、金山、顺为、红杉、高瓴等多家机构。接近智谱的投资人告诉《财经》记者，智谱上一轮融资估值约120亿元，还在做新一轮融资。

Minimax估值约20亿美元，已经完成三轮融资，投资方包括腾讯、高瓴、米哈游、云启资本、IDG资本等。早期王慧文创办的光年之外也被投资人认为属于第一梯队，还在团队组建阶段估值就达到15亿美元，被美团收购后，光年之外已经退出独立竞争。

此外，相关投资人告诉《财经》记者，目前估值仅次于前三家的大模型创业公司月之暗面也在交割新一轮融资，估值约8亿美元，美团龙珠领投。李开复创办的零一万物已经完成融资，由阿里云领投。

OpenAI发布ChatGPT不到一年时间，中国大模型创业融资再次创造历史。中国人工智能领域上一次这么热闹是2017年-2018年。那两年间，成立于2014年的商汤科技完成了六轮融资，当时估值达到60亿美元。当时商汤科技、旷视科技、依图科技、云从科技被称为“AI四小龙”，均拿到多轮融资。

2021年后，四家公司陆续开始上市计划，只有商汤和云从成功上市，不過股价表现均不佳。商汤目前市值472亿港元，较最高点缩水85%。云从最新市值136亿元，较最高点缩水70%。两家公司均回到2018年以前的估值水平。这四家公司仍处于亏损状态，从两家已上市公司的财报来看，营收增速也明显放缓甚至大幅下滑，商汤2023年上半年营收同比增长1.3%，云从同比减少58%。

对于投资人来说，“AI四小龙”并不是拿得出手的成绩。多位关注AI领域的投资人告诉《财经》记者，2020年之后，一级市场对于AI投资一度陷入冰点，直到这次大模型热潮开启。

当一个方向成为风口，投资人涌入，创业公司估值飙升后，资本市场对于营收、利润、规模、增长的要求也会倍增。而AI领域过去营收几乎都来自企业用户和政府用户，难以做到高增长。资本催肥加上后续增长乏力，如果这个矛盾不解决，历史将会重演。

资本不撒胡椒面了

钱越集中在钱多的创业公司，这些公司越有可能跑出来，撒出去的投资越有可能得到回报

今年投资人密集关注AI大模型有两重原因。

除了OpenAI的带动，不少投资机构集中在2021年募资，2022年一级市场融资爆冷，很多投资人手里有钱但一直不敢出手，尤其是AI领域，甚至有头部投资机构在2022年已经撤掉AI小组转向制造业。与此同时，机构募到的资金必须在一定期限内投出去。

一位投资人提到，今年上半年，以OpenAI为代表的美国公司发布新产品的速度太快了，连续迭代了三个版本，且每次都有明显提升，用户数激增。中国投资人甚至一开始都没反应过来，90%的投资人不懂技术，主要就是跟热点，当市场形成共识的时候再投进去，OpenAI创造了这个条件。

新风口来临，加上头部机构手里有钱，共同促成了今年大模型融资热潮。

不过，除了头部公司融资火热，其他创业公司的融资情况并不算好。第三方数据机构企名片数据显示，除头部三家外，今年国内共有26家大模型初创公司拿到融资，基本是种子轮或天使轮。今年截至目前共有超过130家公司发布大模型相关产品。

第三方数据机构企名片数据显示，2023年截至目前，中国AI领域共融资214亿元，头部三家创业公司的融资额占比超过30%。

投资人的共识是，大模型的成本高昂，创业公司需要大量资金来“大力出奇迹”，目前各家都还在堆算力、跑训练阶段，有钱就是核心竞争力。头部机构会盯着头部公司连续投，二三线机构会跟着头部机构来跟投，且大部分投资人并不清楚各家大模型公司的真正技术水平，只能“抱团”投资。因此，能融到钱的公司会持续拿到钱；创始团队背景不够好或是错过融资窗口的创业公司，很快就会退出竞争。

头部三家创业公司中，智谱成立时间最早，成立于2019年。在今年之前，智谱曾经历了融资冰点期。智谱CEO（首席执行官）张鹏告诉《财经》记者，他们一度融资困难，投资人会反复问他“什么时候盈利”。到了今年，这个问题还是会问，但答案已经不重要，更重要的问题是“你们什么时候能做出中国的ChatGPT”。

表：2023年融资额最高的五家AI创业公司

资料来源：企名片。制表：颜斌

另一位AI初创公司创始人也在多年前就开始投入研发大模型。他回忆，ChatGPT发布的几年前，他拿着生成式AI产品出去做报告，没人相信他，都认为AI生成内容是天方夜谭。

ChatGPT出现前，他被投资人问了无数次，“你的商业模式是什么？”他很困惑，他认为AI公司在早期应该考虑的是技术能力，而技术的突破需要钱，技术成熟后，才能有确定的商业模式。

投资人说，“你先把东西做出来，我就给钱。”创业者说，“你不给我钱，我怎么做出来”？这仿佛一个“鸡生蛋还是蛋生鸡”的难题。

另一位AI创业公司创始人此前见投资人时说要做大模型。投资人说他狂妄自大，不可能做得出来，反复询问他算力有多少，训练了多久，“好像我是一个骗子”。这家创业公司成立于2021年，今年大模型热潮后，不少投资人排着队要见他，不再觉得他是“骗子”了。

多位AI创业者都提到，此前面对投资人时的一个共同问题是，“美国人都没做出来，我凭什么相信你能做出来”。ChatGPT出现前，投资人不关注大模型领域，也因此会找理由拒绝这些创业公司。今年整体融资情况比过去几年好了很多。

这些问题共同造成了现在融资集中在头部三家创业公司的现状。多位投资人告诉《财经》记者，大模型领域是典型的暴力美学模式，大算力是造就大选手的基础门槛，撒胡椒面模式没办法聚焦资源，钱越集中在钱多的创业公司，这些公司越有可能跑出来，撒出去的投资越有可能得到回报。

资本和创业者的矛盾

“没有人会拿出10亿美元让我烧，只能一边做营收，一边研发技术”

大模型概念的火热带动了融资。密集融资后，无论是大模型创业公司，还是科技大厂，都要找到大模型落地应用的商业模式。

一位大厂AI产品负责人提到，目前中国公司大模型的商业化基本走两条路：一是“跟随”OpenAI的路径；二是延续过去AI的商业路径。

OpenAI的发展路径是：前期不考虑商业化，等技术相对成熟后，先推出免费的C端产品，通过各类营销手段短期内获得大量用户，占领市场，教育用户。同时，用户每一次交互，都能提供新的数据并帮助大模型训练一次。

今年下半年，OpenAI商业化进程加速，先是推出C端付费版，随后推出企业用户定制版。在这个过程中，不断降低免费版的运行成本，优化付费版的能力来提升付费率。

多位投资人的共同观点是，这个打法相当于降维打击，在中国很难复现。

Minimax的发展路径最接近OpenAI，也是這一轮大模型创业中最早成为独角兽的公司。一位Minimax的投资人告诉《财经》记者，当时在没有推广的情况下三个月时间积累了500万用户，成绩还不错。

但这种发展势头很快遇到阻碍。今年3月，Minimax的AI交互产品Glow因涉嫌违规被苹果应用商店下架。前述投资人称是因为竞争对手多次举报，同时还发动网络攻击。Minimax决策层开始担心国内的竞争环境，逐步转向海外市场发展。

11月1日，中国科技公司百度推出文心一言付费版，这在中国大模型领域走出了第一步。一位百度人士告诉《财经》记者，百度对于付费率的考核对标OpenAI，“目前还可以”。OpenAI的C端付费率约4%。

多位业内人士提到，大模型的C端付费模式在中国相对困难。主要原因是大众对于AI能帮助自己做什么，还不太有明确的想法，在C端起量需要有普遍性，也就是满足大部分人的基本需求，而“生成内容”并不是大部分人的需求。OpenAI能在上线初期就获得1亿用户，除了技术能力，包括马斯克在内的早期创始团队的影响力也很重要。“中国的创业者普遍缺少这种号召力。”一位头部投资机构合伙人评价。

C端的产品逻辑是，在前期通过各种方式获取大量用户，再根据用户行为做个性化，同时规模化效应出现。中国公司常见的获取用户手段是推广加补贴，这很难复制在大模型应用上。

事实上，OpenAI也遇到了C端付费乏力的情况，今年5月至8月，ChatGPT访问量持续下滑。方正证券研究显示，ChatGPT如果不下降精度，月度付费率超过12%才能实现盈亏平衡。

图：2016年至今，中国人工智能领域融资情况

资料来源：企名片

在中国，一个普遍的预期是，大模型更广阔的应用市场在B端。今年，多家科技公司都推出垂直大模型，试图用大模型来解决过去行业里难以解决的问题。一位大厂技术负责人提到，垂直大模型可以根据客户需求调整参数量，节约成本，更利于商业化。

垂直大模型的核心竞争力在于比基础大模型更懂行业，而非“更小的模型”。这意味着垂直大模型比基础大模型的门槛更高。如果将基础大模型比作一个有通识的人，垂直大模型就是行业专家。需要的数据总量或许会相对较少，但数据的“含金量”要求更高，需要对大数据做“蒸馏”“提纯”，这又是另一个难题。

那么这又出现了一个新问题——上一轮AI浪潮已经证明，AI初创公司服务B端客户是一条艰难的路。

前述AI公司创始人提到，AI领域的客户大多是B端，每个客户都需要定制化适配，也意味着他需要全力以赴才能服务好客户，牺牲掉核心技术研发上的投入。“我可以赚钱，我今年赚到钱了，明年怎么办？后年怎么办？”

上一轮AI创业潮中走出的创业公司商汤的一位投资人告诉《财经》记者，这是上一轮AI投资热潮中的老问题。多轮融资后，要做商业化，收入持续增长，然后上市，创业公司被“收入”一直推着走，以商汤为代表的公司们就只能去做一个又一个的项目，不断让收入数字变大，来支撑估值，这个过程“一定会影响技术突破能力”。

投资人清楚知道问题所在，但他们认为自己没得选。有投资人说，投资不是做慈善，“我只需要你尽快上市，完成退出”。还有投资人说，“你可以说我没有梦想，我自己当然也想投那些创造未来的公司。但投资是一份工作，我要跟LP有交代，我没法告诉LP我们一起等十年，整个基金周期就只有十年。”

去年，智谱花了6000多万元买了1000张英伟达A100（AI训练芯片）。现在看来这可能是决定智谱发展的关键一步。张鹏说，当时内部也很担心，因为疫情期间公司收入并不算好，花这笔钱是一次“没有退路的决定”。

他认为这是中国AI公司不得不面临的境地，“没有人会拿出10亿美元让我烧，只能一边做营收，一边研发技术”。

AI大模型融资第一阶段已经接近尾声。多位投资人提到，中国市场上能够投得起大模型公司的机构大约有15家，均已入场，后续还想融资，就要讲清楚商业化路径，而现在很多初创公司还讲不清楚。

百川、智谱和Minimax从起步阶段起，就走在不同的道路上。智谱一直以来拿的都是人民币机构的投资，未来会主要往To B和To G的方向发展。百川被投资人看好的特点在于，以创始人王小川为核心的搜狗团队，有做过超级产品的经验，未来也希望能基于大模型做出C端的超级产品，“现在起步阶段也会做To B，已经有一些客户了。”前述投资人提到。

在投资人看来，Minimax相对有些模糊，是否要彻底转向海外还是未知数，而海外市场竞争更激烈。

中国大模型创业公司还有一个现实挑战：将面临国内大厂的正面竞争。截至目前，百度、阿里巴巴、腾讯、字节跳动、美团、京东等几乎所有大厂都在重金投入大模型。

能不能绕开大厂？

单从技术来看，无论是大厂、成立几年的创业公司或是刚刚成立的新公司，还没有出现明显的“代差”，还在“大力出奇迹”阶段

《财经》获悉，美团、字节、腾讯内部均有多个团队在研发大模型。美团认为大模型是决定美团能否活到下一个十年的关键。腾讯的张小龙团队也在投入大模型，张小龙在C端产品方面，比王小川更有经验。

阿里、腾讯、字节、美团都对外投资了大模型创业公司，且不止一家。这一方面体现出大厂们对于大模型的未来都十分看重，同时也说明目前大家对于大模型的未来方向还不是十分确定，只能多方押注。

2018年时，中国13家AI独角兽中，有9家都拿了大厂的投资。阿里投了4家，腾讯投了2家。大厂投资往往不单纯追求投资回报，更多的是看重对自身能力的提升。

当时创业公司会面临两重风险：一是拿了其中一家大厂的钱，就很难再拿其他大厂的，融资通道变窄；二是很有可能变成大厂的技术部门，影响独立性。

这个情况目前看来有所改善。投资限制没有了，智谱和百川都拿到了多个大厂的投资。一位接近百川的投资人告诉《财经》记者，融资时这些因素都考虑过，三家大厂每家只出资了几千万美元，都没有绝对的话语权。

不过，这也意味着，即使有投资关系，业务上的竞争不会有影响。

大厂的竞争优势在于有丰富的业务场景，可以更快将大模型产品落地应用，即便没有外部客户，也可以在自己的业务上验证、优化。例如字节已经在视频制作方面应用了大模型技术。百度将大模型技术应用于百度文库，让文库从资料检索工具变成内容创意工具。

大厂资金实力和人才储备资源也更强。字节跳动2022年净利润超过200亿美元，腾讯是1882亿元。百度2022年净利润206亿元，百度称过去十年研发投入超过1000亿元。

但也有人持不同观点。多位投资人和大厂人士提到，大厂虽然有钱，但花钱的时候限制也更多，“所有业务都要花钱，大模型团队也只能想办法争取”。且今天不少大厂还有降本增效的压力，还要考虑财报。按照目前头部创业公司的融资规模来看，资金并不是短板。

创业公司的优势则是足够聚焦，决策更快更灵活。多位业内人士提到，单从技术布局来看，无论是大厂、成立几年的创业公司或是刚刚成立的新公司，还没有出现明显的“代差”，还在“大力出奇迹”阶段。

大厂对于创业公司的碾压往往来自后期商业模式的碾压。这可能出现两种情况：

一是某些或某个创业公司在新技术商业模式上出现了划时代的突破性进展，创造了大模型时代的流量新入口，如果这样，技术周期将形成商业洗牌，新一代大厂呼之欲出；

另一种情况是和之前绝大多数创业公司一样，绕开大厂，在某个细分领域形成竞争力，成为生态的一个环节和分子。这种情况下，目前的商业生态不会被颠覆。

中国投资人和创业者，自然期待第一种情况发生。

在美国，包括谷歌、亚马逊、Meta在内的大厂也都在強势进入大模型领域，且方向大多是大模型的底座，包括基础大模型、算力服务、开源大模型等。而美国的创业公司们，则很明显出现了差异化竞争的趋势。

大模型领域可以分成三层，底层是基础大模型，最上层是各类应用，还有大量的中间环节，包括数据处理、模型训练、工程能力、工具开发等。美国新兴的大模型创业公司大多集中在中间层和应用层，避开了基础层。

例如，AI数据开发平台Databricks，今年6月13亿美元收购开源大模型企业平台MosaicML后，主攻帮助企业做大模型训练方向，该公司宣称，已经有1500家企业在其平台上训练大模型。Databricks最新估值430亿美元。

数据标注公司Scale AI在大模型风口出现后，迅速转型开发出适合大模型数据标注的软件工具，该公司预计今年业务量将增长一倍。该公司最新估值73亿美元。

在应用层，有包括聊天机器人公司Anthropic（最新估值200亿美元）和Character.ai（最新估值50亿美元）。推出AI绘图工具的Midjourney估值100亿美元，年收入已经达到2亿美元，整个公司仅有40名员工。

现实情况是，中国的大模型创业公司们还没能走出差异化竞争之路。此前，OpenAI前科学家肯尼斯·斯坦利告诉《财经》记者，“成为下一个OpenAI不是一条明智的路，OpenAI之所以出色，就因为它是独一无二的，应该去思考有什么完全不同的新东西。”

有投资人提到，五年前，“AI四小龙”的融资能力源于当时人脸识别技术在中国有特殊的应用场景，但没能给行业来带质变，类似的产品和服务，传统巨头海康威视和大华股份都能做到。大模型在这一点上确定性更高，在过去的一些AI应用场景中，大模型可以更好地解决更多样化的问题，成本降低效率提升，且能创造新的需求。

今年10月，OpenAI宣称2023年度收入将达到13亿美元，去年营收仅2800万美元。今年4月，OpenAI估值290亿美元，最新的消息是，OpenAI正在与投资者就现有股票出售进行谈判，如果交易达成，OpenAI估值将达到800亿到900亿美元。

到明年，中国的大模型创业公司们恐怕又要面临那个老问题，“营收多少？增速多少？什么时候盈利？”

当竞争大于创新

科技创业公司最大的魅力来自大公司不具备的“创新力”，拿什么来保护它，是个真问题

今年，投资人们问的最多的一个问题就是，“中国为什么没有OpenAI？”

11月4日，信息社会50人论坛杭州特别会议上，阿里商学院执行院长章剑林表示，中国为什么没有OpenAI，类似问题反复出现过，例如中国为什么没有Palantir？Palantir2020年上市时，收入3.5亿美元，市值达到700亿美元，很多人曾经认为这就是泡沫，但目前市值依然稳定。

包括OpenAI在内的这些创业公司，都是长在美国科技创新森林里一棵树上的两片叶子。“今天我们所有人都在关注那两片叶子，都快被烤煳了，但我们更应该思考的是，那棵树是什么样子？森林是什么样子，土壤是什么样子？”

多位从业人员都提到，中国的AI创新创业环境不够好，包括投资人更在意收入而非技术实力；恶意竞争频发；缺乏相对单纯的科研土壤；公司变大后架构复杂，团队难以专注等。

落到具体的AI大模型研发上，常被提及的理由还包括：数据质量不够，多位业内人士将一些主流平台上的中文数据称为“垃圾语料”；买不到GPU或算力成本太高，一些科研部门甚至连跑算力的电费都交不起。此外，因为大模型的产品形态是生成内容，还涉及内容审查。

创业者李志飞感受到中美创投环境的不同。中国投资人对于商业化的要求更加急迫，而在美国，大家也会关心商业化，“但总会有一批人说，你不用考虑这个问题”。

他认为两国环境差异的根源，就在于竞争。“中国竞争太激烈了，因为中国创业者的供应是美国的几倍，但中国的客单价、市场空间只有美国的几分之一。”

自2012年创立出门问问，李志飞已经在AI领域创业十年。五年前，智能音箱的“百箱大战”，出门问问也有参与，李志飞第一次切身体会到了中国竞争的残酷。

現在他的想法也逐渐改变。今年，他跟硅谷一位华人投资者聊天，聊了一个多小时，对方最后问他：“李志飞，你怎么了？”这时，他才突然意识到，硅谷人都在讨论创新，而自己聊的所有内容都是“竞争”，和各种各样的“坑”。

另一位AI公司创始人的观点，也能为理解过去几年的中国技术探索进程提供一个视角。他说，在研发一项新技术时，合理的流程应该是：在探索阶段申请国家相关资金支持；有一定成果后，寻找风险投资或产业基金；技术相对成熟、商业化扩展阶段，大基金进入；然后计划上市。但很多中国基金厌恶风险，不愿在公司创业初期作投入；国家级基金评选中，最后能拿到钱的往往是“四平八稳”的项目。“用你已经做出来的东西去申请基金，拿到钱再去做未来的东西”，几乎成为通行惯例。

过去几年，几乎所有的大型科技互联网公司都设立了AI部门，部门人数甚至超过大部分创业公司。AI算法不仅被应用于巨头们的业务中，且代表了公司的未来潜力。早些年巨头们有钱，四处挖人。但过去两年，互联网行业追求降本增效，而AI部门是成本中心，无法直接带来收入。

一位大厂AI负责人告诉《财经》记者，当公司发展到一定阶段以后，用户增长、营收、盈利的增速就是会下降的，必须接受这个现实。此时，公司对AI部门的要求是能够直接帮助到业务，而非技术创新。

“当增长变慢，中国公司对中长期技术的耐心不够。”这位AI负责人在几年前就被调去管理业务团队，这不是他想做的事但也没办法，公司认为这样更能创造价值。直到今年初，ChatGPT火爆，他才有理由说服老板，回到AI部门。他很难预测未来是否又会重演一次，降本增效、裁剪AI业务。

2014年左右，世界顶级AI会议上，参会的多是美国人、日本人和欧洲人；今天，变成了美国人、美国华人和中国人。中国的AI产业如果放在世界范围来看，已经是领先水平。中国不会有OpenAI，会有更适合中国市场和环境的新AI创业公司们出现。