APP下载

国产AI大模型,卷到“零元购”

2024-07-07徐乃帅

看世界 2024年12期
关键词:价格战模型

徐乃帅

当前,国产AI大模型的竞争,似乎已进入了白热化阶段。

2023年,继文心一言、天工AI、通义千问等最早推出的大模型引领潮流之后,各大互联网科技公司、科研团队迅速跟进。截至今年5月,国内已完成备案的人工智能大模型总数达到了136个,已发布的大模型更是达到了300多个。

在这一年多时间里,国产大模型产品你追我赶,在技术层面形成了激烈的竞争态势。而正当大多数人还在横向对比各个大模型的孰优孰劣时,“百模大战”的画风却陡然一变,转向了“价格战”。

如此景象,不禁让人产生了疑问:现在的国产AI大模型领域,已先进到可以跨越技术积累阶段,直接进入商业竞争阶段了?

“价格战”体现同质化?

5月6日,幻方量化宣布,旗下深度求索(DeepSeek)开源第二代MoE模型DeepSeek-V2,定价为每百万tokens输入1元、输出2元,价格为GPT-4-Turbo的近百分之一,并且登录就送500万tokens,由此打响了大模型价格战的第一枪。

5月11日,智谱AI调整了旗下入门级大模型GLM-3-Turbo的价格,从0.005元/千tokens降低到0.001元/千tokens,新注册用户获赠从500万tokens提升至2500万tokens。而GLM-3 Turbo Batch批处理API还将进一步便宜50%—为0.0005元/千tokens,也就是1元200万tokens。

这一“优惠”力度,已基本向DeepSeek看齐。

8块钱可以买到约1600万个汉字,相当于25本《三国演义》的字数。

豆包大模型页面

到了5月15日,字节跳动成为第一个抛出“重磅炸弹”的互联网大厂,将“价格战”带入高潮。在火山引擎原动力发布会上,豆包大模型“全家桶”正式发布,豆包主力模型的推理输入定价仅为0.0008元/千tokens,这意味着8块钱可以买到约1600万个汉字,相当于25本《三国演义》的字数。

这种状况下,多次被当作比价“靶子”的阿里和百度,不得不作出回应。5月21日上午,阿里云官方宣布,通义千问9款主力AI大模型全面降价,其中,Qwen-Long API输入价格由0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。同日下午,百度在毫无预兆的情况下,宣布文心大模型两大主力模型全面免费,立即生效。

有意思的是,此前,面对来势汹汹的字节跳动,百度曾回应过“使用大模型不应只看价格,更要看综合效果”,如今却也加入了这场“内卷”,并且一举达到了“掀桌子”的效果。

紧接着,5月22日,科大讯飞宣布,讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API价格降低至0.21元/万tokens。而后,就连腾讯也加入了降价阵营,将混元-lite模型的价格调整为全面免费。

如此景象,自然唤醒了人们对互联网价格战的记忆。

彼时,网购平台、外卖、打车、共享单车……几乎每一个新的竞争赛道都经历了激烈价格战的洗礼。但在技术主导的人工智能领域,却不禁让人有几分疑虑,国产AI大模型的发展,真的已经足够成熟了吗?企业是否会陷入“亏钱换增长”的恶性循环?

此前,DeepSeek发布时,幻方员工表示,之所以可以给出如此低的定价,重要原因是通过模型结构创新,大幅度降低了运算成本,其利润依然可以超过50%。

另一方面,硬件和计算资源的提升,也是成本降低的关键因素。字节跳动火山引擎的总裁谭待也在一次谈话中表示,降价源于技术自信,未来还有很多手段持续降低成本。

关于眼下这场“价格战”,谭待直言:“现在还不是谈竞争的时候。”

在许多业内人士看来,这场“价格战”是大模型同质化的表现,但另一方面,也在为加速AI应用的爆发做铺垫。更低的成本,让更多的企业和开发者能够负担得起这项技术,也有更多的试错空间,将有效推动AI应用的创新和广泛普及。

落地场景仍待更多探索

没有人会否认,生成式人工智能(AIGC)将会陪伴人类走向未来,但现阶段大多数人还很难想象,它究竟会以何种形式去作用于我们这个世界。

2022年11月30日,OpenAI发布了ChatGPT,其用户在短期内迎来了爆炸式的增长,仅在5天内就收获了100万用户,但是直到现在,寻找商业化的场景仍然是OpenAI所面临的难题—其中最直观的原因是,像ChatGPT这样中心化的聊天对话产品,很难成为大众的高频刚需。

蚂蚁集团副总裁、金融大模型负责人王晓航在一次接受采访时表示,大模型要融入千行百业,让产业在“AI化”中收获价值,才能成为广泛的刚需,“每个行业都在等待自己的AI超级应用”。他预计,未来一年,一定会出现现象级的生成式AI应用。

当前,国内许多大模型产品已经对落地场景进行了一定探索,打造属于自己的特色。

情感陪伴类AI大模型星野App宣传图

3月18日,初创企业月之暗面宣布,其产品Kimi智能助手在大模型长上下文窗口技术上取得新的突破,目前可支持200万字超长无损上下文。

去年,由AI写作的小说获科幻奖的事件曾引发热议,但当时受限于AI记忆文本长度的限制,生成小说时还是采用了从“提纲”到“段落”,逐段提示生成文本的形式,进行了数十次操作。

如今,拥有200万字记忆的大模型,也就意味着AI可以一次性阅读理解和生成超长文本,用AI写小说有了真正的可能性。

此外,“情感陪伴”也是颇具潜力的赛道。目前该领域的产品有星野App、冒泡鸭等,通过定制不同人设、性格的AI智能体,主要面向年轻的“重度”用户,满足玩家的个性化互动需求。

今年4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,与海通证券联合发布业内首个面向金融行业的多模态全栈式大模型。

据悉,该大模型叠加了金融行业相关知识、法规条例及搜索引擎,能够准确理解行业相关问题,为内部员工提供即时、高质量的问答服务,提升工作效率。

相较于刚需感性思维的文娱领域,未来教育、医疗、金融等专业性较强的领域,AI大模型更有可能占据重要的地位。

5月29日,商汤科技还面向粤语区用户推出了“商量语言大模型粤语版”。该版本对粤文化和粤语有着深入的理解,可以听懂粤语中的各种俗语、俚语,并能通过语音交互功能实现无障碍交流,融入粤语用户的日常生活。

站在企业的角度上,打造个性化的垂直领域产品,是实现商业化变现的有效途径。但仍需注意的是,通用大模型技术才是AIGC领域的核心竞争力—一个显而易见的事实是,一个基于ChatGPT-4开发的产品,马上就会被基于ChatGPT-5开发的产品淘汰。

AIGC大潮将进入收敛期

今年2月,在中国数字经济发展和治理学术年会(2024)上,清华大学苏世民书院院长薛澜表示,在AI大模型方面,单从量上讲,中国进步很大,但实际上有不少模型是在国外开源模型的基础上,进行套壳和拼装做出来的,缺乏原创性。

据了解,目前大多数国产模型都是基于LLaMA训练的。LLaMA是一个基于Transformer架构的大语言模型,而Transformer架构本身,就存在计算复杂度高、算力需求大、算法效率低等问题。

相较之下,幻方的DeepSeek是基于性能表现更优异的开源模型MoE训练出来的,这也是上述幻方打响价格战第一枪的底气。

国产大模型的另一个困境在于,语料数据的质量偏低。中文的数据量很大,但数据清洗是一项耗时耗力的工程,当前国内尚未构建起成熟的数据市场,定制化服务收费较高,往往只有少数大厂商才能负担得起。

此外,数十种国产芯片体系/生态不同,目前还做不到高效适配大模型训练。这个问题得不到解决,国产大模型就有因为芯片被“卡脖子”的风险。

像ChatGPT这样中心化的聊天对话产品,很难成为大众的高频刚需。

尽管受制于各种因素,国产大模型仍然取得了一些值得一提的成就。

近期,在业界公认最好的第三方盲测竞技场LMSYS中,零一万物旗下的Yi-Large大模型跃升为总榜第七;在中文类别中,Yi-Large和GPT-4o并列全球第一。相比排在前面的公司,零一万物的团队规模、参数规模、GPU算力都要更“小”。

稍早一些时间,另一位重磅选手商汤科技使用MoE架构、参数高达6000亿的产品“日日新SenseNova 5.0”,在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o,并位列第一。

据介绍,在过去一年时间里,商汤科技花了大量时间完成语料质量的优化,搭建了完善的数据清洗链条,并重点关注了具有高信息密度、逻辑性强的语料,从而实现了性能提升;在知识层面上,采用了超10TB的token,保证了模型对客观知识和世界的初级认知。

据业内人士分析,不久后,生成式人工智能可能会进入收敛期,大浪淘沙过后,国内只会剩下10到20个大模型。而此次降价潮,一方面是互联网企业惯性的“圈地运动”,更多是一次面向全社会的“开放测试”,增加的访问量将有助于企业找到产品的不足,进一步提升模型性能,探索商业落地的方向。

短期的风光,难以决定长期的胜负。国产大模型的竞争,才刚刚开始。

责任编辑吴阳煜 wyy@nfcmag.com

猜你喜欢

价格战模型
一半模型
p150Glued在帕金森病模型中的表达及分布
Cartoons
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
价格战是一定的! 2020年虾苗需求量预计减少10%~20%,苗价下调是趋势
不打价格战也能赢得漂亮! 2020年虾苗企业要打的是价值战
沉着应对价格战 创新引领行业良性发展
3D打印中的模型分割与打包
从手机价格战所看到的