国产AI大模型，卷到“零元购”

2024-07-07徐乃帅

看世界 2024年12期

关键词：价格战模型

徐乃帅

当前，国产AI大模型的竞争，似乎已进入了白热化阶段。

2023年，继文心一言、天工AI、通义千问等最早推出的大模型引领潮流之后，各大互联网科技公司、科研团队迅速跟进。截至今年5月，国内已完成备案的人工智能大模型总数达到了136个，已发布的大模型更是达到了300多个。

在这一年多时间里，国产大模型产品你追我赶，在技术层面形成了激烈的竞争态势。而正当大多数人还在横向对比各个大模型的孰优孰劣时，“百模大战”的画风却陡然一变，转向了“价格战”。

如此景象，不禁让人产生了疑问：现在的国产AI大模型领域，已先进到可以跨越技术积累阶段，直接进入商业竞争阶段了？

“价格战”体现同质化？

5月6日，幻方量化宣布，旗下深度求索（DeepSeek）开源第二代MoE模型DeepSeek-V2，定价为每百万tokens输入1元、输出2元，价格为GPT-4-Turbo的近百分之一，并且登录就送500万tokens，由此打响了大模型价格战的第一枪。

5月11日，智谱AI调整了旗下入门级大模型GLM-3-Turbo的价格，从0.005元/千tokens降低到0.001元/千tokens，新注册用户获赠从500万tokens提升至2500万tokens。而GLM-3 Turbo Batch批处理API还将进一步便宜50%—为0.0005元/千tokens，也就是1元200万tokens。

这一“优惠”力度，已基本向DeepSeek看齐。

8块钱可以买到约1600万个汉字，相当于25本《三国演义》的字数。

豆包大模型页面

到了5月15日，字节跳动成为第一个抛出“重磅炸弹”的互联网大厂，将“价格战”带入高潮。在火山引擎原动力发布会上，豆包大模型“全家桶”正式发布，豆包主力模型的推理输入定价仅为0.0008元/千tokens，这意味着8块钱可以买到约1600万个汉字，相当于25本《三国演义》的字数。

这种状况下，多次被当作比价“靶子”的阿里和百度，不得不作出回应。5月21日上午，阿里云官方宣布，通义千问9款主力AI大模型全面降价，其中，Qwen-Long API输入价格由0.02元/千tokens降至0.0005元/千tokens，降幅达到97%。同日下午，百度在毫无预兆的情况下，宣布文心大模型两大主力模型全面免费，立即生效。

有意思的是，此前，面对来势汹汹的字节跳动，百度曾回应过“使用大模型不应只看价格，更要看综合效果”，如今却也加入了这场“内卷”，并且一举达到了“掀桌子”的效果。

紧接着，5月22日，科大讯飞宣布，讯飞星火Lite API永久免费开放，讯飞星火Pro/Max API价格降低至0.21元/万tokens。而后，就连腾讯也加入了降价阵营，将混元-lite模型的价格调整为全面免费。

如此景象，自然唤醒了人们对互联网价格战的记忆。

彼时，网购平台、外卖、打车、共享单车……几乎每一个新的竞争赛道都经历了激烈价格战的洗礼。但在技术主导的人工智能领域，却不禁让人有几分疑虑，国产AI大模型的发展，真的已经足够成熟了吗？企业是否会陷入“亏钱换增长”的恶性循环？

此前，DeepSeek发布时，幻方员工表示，之所以可以给出如此低的定价，重要原因是通过模型结构创新，大幅度降低了运算成本，其利润依然可以超过50%。

另一方面，硬件和计算资源的提升，也是成本降低的关键因素。字节跳动火山引擎的总裁谭待也在一次谈话中表示，降价源于技术自信，未来还有很多手段持续降低成本。

关于眼下这场“价格战”，谭待直言：“现在还不是谈竞争的时候。”

在许多业内人士看来，这场“价格战”是大模型同质化的表现，但另一方面，也在为加速AI应用的爆发做铺垫。更低的成本，让更多的企业和开发者能够负担得起这项技术，也有更多的试错空间，将有效推动AI应用的创新和广泛普及。

落地场景仍待更多探索

没有人会否认，生成式人工智能（AIGC）将会陪伴人类走向未来，但现阶段大多数人还很难想象，它究竟会以何种形式去作用于我们这个世界。

2022年11月30日，OpenAI发布了ChatGPT，其用户在短期内迎来了爆炸式的增长，仅在5天内就收获了100万用户，但是直到现在，寻找商业化的场景仍然是OpenAI所面临的难题—其中最直观的原因是，像ChatGPT这样中心化的聊天对话产品，很难成为大众的高频刚需。

蚂蚁集团副总裁、金融大模型负责人王晓航在一次接受采访时表示，大模型要融入千行百业，让产业在“AI化”中收获价值，才能成为广泛的刚需，“每个行业都在等待自己的AI超级应用”。他预计，未来一年，一定会出现现象级的生成式AI应用。

当前，国内许多大模型产品已经对落地场景进行了一定探索，打造属于自己的特色。

情感陪伴类AI大模型星野App宣传图

3月18日，初创企业月之暗面宣布，其产品Kimi智能助手在大模型长上下文窗口技术上取得新的突破，目前可支持200万字超长无损上下文。

去年，由AI写作的小说获科幻奖的事件曾引发热议，但当时受限于AI记忆文本长度的限制，生成小说时还是采用了从“提纲”到“段落”，逐段提示生成文本的形式，进行了数十次操作。

如今，拥有200万字记忆的大模型，也就意味着AI可以一次性阅读理解和生成超长文本，用AI写小说有了真正的可能性。

此外，“情感陪伴”也是颇具潜力的赛道。目前该领域的产品有星野App、冒泡鸭等，通过定制不同人设、性格的AI智能体，主要面向年轻的“重度”用户，满足玩家的个性化互动需求。

今年4月23日，商汤科技正式推出“日日新SenseNova 5.0”大模型体系，与海通证券联合发布业内首个面向金融行业的多模态全栈式大模型。

据悉，该大模型叠加了金融行业相关知识、法规条例及搜索引擎，能够准确理解行业相关问题，为内部员工提供即时、高质量的问答服务，提升工作效率。

相较于刚需感性思维的文娱领域，未来教育、医疗、金融等专业性较强的领域，AI大模型更有可能占据重要的地位。

5月29日，商汤科技还面向粤语区用户推出了“商量语言大模型粤语版”。该版本对粤文化和粤语有着深入的理解，可以听懂粤语中的各种俗语、俚语，并能通过语音交互功能实现无障碍交流，融入粤语用户的日常生活。

站在企业的角度上，打造个性化的垂直领域产品，是实现商业化变现的有效途径。但仍需注意的是，通用大模型技术才是AIGC领域的核心竞争力—一个显而易见的事实是，一个基于ChatGPT-4开发的产品，马上就会被基于ChatGPT-5开发的产品淘汰。

AIGC大潮将进入收敛期

今年2月，在中国数字经济发展和治理学术年会（2024）上，清华大学苏世民书院院长薛澜表示，在AI大模型方面，单从量上讲，中国进步很大，但实际上有不少模型是在国外开源模型的基础上，进行套壳和拼装做出来的，缺乏原创性。

据了解，目前大多数国产模型都是基于LLaMA训练的。LLaMA是一个基于Transformer架构的大语言模型，而Transformer架构本身，就存在计算复杂度高、算力需求大、算法效率低等问题。

相较之下，幻方的DeepSeek是基于性能表现更优异的开源模型MoE训练出来的，这也是上述幻方打响价格战第一枪的底气。

国产大模型的另一个困境在于，语料数据的质量偏低。中文的数据量很大，但数据清洗是一项耗时耗力的工程，当前国内尚未构建起成熟的数据市场，定制化服务收费较高，往往只有少数大厂商才能负担得起。

此外，数十种国产芯片体系/生态不同，目前还做不到高效适配大模型训练。这个问题得不到解决，国产大模型就有因为芯片被“卡脖子”的风险。

像ChatGPT这样中心化的聊天对话产品，很难成为大众的高频刚需。

尽管受制于各种因素，国产大模型仍然取得了一些值得一提的成就。

近期，在业界公认最好的第三方盲测竞技场LMSYS中，零一万物旗下的Yi-Large大模型跃升为总榜第七；在中文类别中，Yi-Large和GPT-4o并列全球第一。相比排在前面的公司，零一万物的团队规模、参数规模、GPU算力都要更“小”。

稍早一些时间，另一位重磅选手商汤科技使用MoE架构、参数高达6000亿的产品“日日新SenseNova 5.0”，在中文大模型测评基准SuperCLUE中，成为首个超越GPT-4 Turbo的国产大模型；在OpenCompass的基准表现中，客观评测超过GPT-4 Turbo，主观评测已超过GPT-4o，并位列第一。

据介绍，在过去一年时间里，商汤科技花了大量时间完成语料质量的优化，搭建了完善的数据清洗链条，并重点关注了具有高信息密度、逻辑性强的语料，从而实现了性能提升；在知识层面上，采用了超10TB的token，保证了模型对客观知识和世界的初级认知。

据业内人士分析，不久后，生成式人工智能可能会进入收敛期，大浪淘沙过后，国内只会剩下10到20个大模型。而此次降价潮，一方面是互联网企业惯性的“圈地运动”，更多是一次面向全社会的“开放测试”，增加的访问量将有助于企业找到产品的不足，进一步提升模型性能，探索商业落地的方向。

短期的风光，难以决定长期的胜负。国产大模型的竞争，才刚刚开始。

责任编辑吴阳煜 wyy@nfcmag.com