腾讯的大模型故事　为什么要从产业开始？

2023-11-26张天伦

新财富 2023年10期

关键词：模型

张天伦

面对大模型这样一个被马化腾视为几百年不遇、类似发明电的工业革命一样的机遇，腾讯终于公布了其在这一领域的全面布局。

一方面，腾讯通过混元大模型、腾讯云MaaS，将大模型能力应用于内部产品及To B业务之中。另一方面，腾讯在企业服务、人工智能领域的投资已累计超过280起，其中包括估值达到12.5亿美元的大模型初创企业MiniMax。

种种迹象表明，腾讯的大模型故事将着重从B端市场展开。

从6月18日在国内率先推出行业大模型解决方案腾讯云MaaS（Modelas-a-Service，模型即服务），到9月7日将混元大模型放到其在产业互联网领域最具影响力的“全球数字生态大会”上发布，腾讯对产业互联网的重视，可见一斑。某种意义上说，已在C端拥有数个覆盖10亿级用户的腾讯，未来能否再造一个腾讯，系于B端。

事实上，在人们的新鲜劲过后，年初爆火的ChatGPT自今年6月起便陷入了流量瓶颈。根据SimilarWeb的监测数据，其用户数量从5月最高的19亿人下滑至7月的15亿人。这也让大模型在C端直接以产品形式落地的商业前景蒙上阴影。

相比较下，数字化转型需求更为明确的产业客户，对大模型出色的语言理解、内容生成等能力，有着更强的付费意愿。因此，在To C或To B的路线选择上，腾讯从商业模式的角度出发，选择率先从后者发力。

在腾讯云副总裁吴运声眼中，产业场景是大模型的最佳练兵场，而大模型也可以为腾讯To B业务的商业模式拓展提供新的思考。“当前，企业客户在应用大模型时，会面临计算资源少、数据质量差、投入成本高、专业经验少等现实问题的挑战。拆解客户所遇到的问题，也会为我们带来很多业务契机。”

同时，借力大模型，打破腾讯云长期面临的“增收不增利”的局面，或也是另一种期待。

图1：腾讯金融科技及企业服务业务收入

数据来源：Wind，新财富整理

自2018年进军产业互联网以来，腾讯面向B端客户的金融科技与企业服务业务收入在不断增长，2019-2022 年从1013.55 亿元增至1770.64亿元，占营收的比例从26.9%提升至31.9%（图1），但一份券商研究报告显示，2020至2022年，腾讯云的毛利率均为负值。

以至于在主打“ 降本增效”的2022 年，腾讯云与智慧产业事业群（CSIG）明确各业务要全面提升利润率更高的自研产品比例，并将业绩考核重点转为业务的利润水平。

“我们始终认为，大模型需要基于产业场景，与企业数据融合，才能释放出最大的价值。”腾讯集团高级执行副总裁、CSIG负责人汤道生称。

那么，当混元大模型正式亮相，腾讯云MaaS能力完成升级迭代，腾讯To B业务的发展又将产生什么样的变化？

商业链路：从技术底座到智能应用

“腾讯会议基于混元大模型打造的AI小助手，已经能够通过简单的自然语言指令，完成会议信息提取、内容分析等复杂任务，会后还能生成智能总结纪要。”在2023腾讯全球数字生态大会上，腾讯集团副总裁蒋杰分享的案例显示，拥有超3亿用户数的腾讯会议，已开始应用大模型的能力。

大模型本身并非一个新的事物。在吴运声看来，大模型的本质是深度学习，而腾讯早在十几年前便已开始对深度学习进行布局。只是当2017年谷歌提出神经网络模型Transformer，驱动深度学习模型参数从过去的以千为单位，发展至如今超过千亿级别的大模型，并在2022年底爆发时，才闯入了人们的视野。

拆解腾讯在大模型领域的布局，可分为三大模块。第一块是腾讯云过去研发、积累的算力、算法、数据等基础设施及AI工具，这是大模型训练的前提条件。

“ 在ChatGPT爆火后，CSIG内部甚至没有专门针对行业大模型的立项。各个团队最大的变化是在日常沟通时增加了很多与大模型相关的深入探讨，包括与现有产品的结合，以及未来商业路径的选择。”吴运声称。

第二块，基于各类基础设施及工具，腾讯全链路自研出了基础大模型“混元”。所谓基础模型，是在大量无标签数据集上训练的AI神经网络，可处理从翻译文本到分析医学影像等各种工作。

第三块，是以混元大模型为基础模型所衍生的各类应用及服务。典型如面向企业客户的“腾讯云MaaS服务”，即是将混元大模型与腾讯云过去积累的行业解决方案、企业级应用结合后的一类业务模式。而腾讯会议上的“AI小助手”则是混元大模型与腾讯企业级应用的融合案例。

腾讯围绕大模型所构建的新的商业模式，也大抵延着以上三大模块而展开。例如，腾讯在利用HCC高性能计算集群、星脉高性能计算网络、向量数据库等基础设施训练混元大模型时，也同样可将这些基础设施提供给在软、硬件设施上有短板，但同样有大模型训练需求的客户。

据腾讯集团副总裁、政企业务总裁李强透露，近期MiniMax、百川智能旗下的大模型都使用了腾讯的算力。MiniMax是由前商汤科技副总裁、通用智能技术负责人闫俊杰成立的大模型初创公司。

而在算力层面，腾讯云先是2023年4 月发布的新一代HCC高性能计算集群，即是专为大模型训练所设计，能够提供高性能、高带宽、低延迟的智算能力支撐。而后是在7 月，基于每日处理千亿次检索的向量引擎（OLAMA），推出向量数据库（Tencent Cloud VectorDB），使数据接入AI的效率较传统方案提升10倍。“当你想在大模型中找到一张带‘猫的图片，腾讯云向量数据库能在100毫秒内，从10亿张向量化的图片中，返回查询结果。”汤道生表示。

此外，在工具层面，腾讯混元大模型在训练数据时采用的，同样是自研的训练框架AngelPTM。这一框架使腾讯混元大模型的训练速度相比业界主流框架提升1倍，推理速度比业界主流框架提升1.3倍。

腾讯在大模型领域的布局，包括腾讯云积累的基础设施、AI工具，以及基础大模型“混元”和其衍生的应用及服务。

一方面，AngelPTM源源不断提供引擎动力；另一方面，腾讯云TI平台的工具链也包括TI-ONE训练平台、TI-Matrix应用平台等，可为客户提供大模型训练、精调工具链，以快速生成更有针对性的专属大模型，满足企业个性化需求。

据汤道生介绍，作为基础大模型的“混元”，如今拥有超千亿参数规模，预训练语料超2万亿tokens（可被认为是词语的片段），具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。

而基于混元大模型所构建的行业大模型精选商店“腾讯云MaaS服务”，即是将腾讯云在基础设施、行业解决方案、企业级应用等领域的积累升级打包所形成的一站式服务。

“在腾讯云行业大模型精选商店中，我们不仅提供混元大模型，还上架了20多种行业最新、最流行的开源通用大模型，以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。企业可以根据需要，选择合适的模型，然后借助腾讯云智能的TI平台，导入企业专有数据，做进一步的训练与精调，快速生成更有针对性的专属大模型，满足企业个性化需求。同时，我们也将大模型与腾讯的行业解决方案、企业级应用结合，在生产、营销、售后服务、办公等多个环节，实现能力提升，达至降本增效。”汤道生称。

可以看到，基于混元大模型，以及腾讯过去在人工智能领域的积累，已经针对B端客户对大模型的各类需求设计出了一条极长的商业链路。

在拆解腾讯大模型商业路径的同时，吴运声反复强调，推出“腾讯云MaaS服务”的初衷，是从多个角度解决B端客户需求。除降本增效外，其需求还包括赋能传统产业跨界融合、实现创新升级等。

吴运声在腾讯集团内部身兼多职，除了担任腾讯云副总裁外，他还是腾讯云智能负责人以及优图实验室负责人，其工作重心之一便是强化AI技术与腾讯云的底层融合。

例如由其负责的优图实验室成立于2012年，如今已通过计算机视觉算法的迭代，实现对人脸识别、图像识别、视频特效等功能的持续优化，其应用落地场景从最初的QQ空间的“面孔墙”、微众银行的“人脸远程开户”，到如今，已深入教育、金融、工业等领域，构建了超过50个行业应用。而在2021年成立的腾讯云智能品牌，则将腾讯分散于优图等实验室的AI能力进一步深度融合，目的是形成一条完整的AI产业落地链条。

据吴运声透露，如今腾讯云团队从对接企业大模型需求，至行业大模型方案的最终落地，通常可分为四个步骤。

第一步是了解客户需求。例如，有客户想做基于语音识别的大模型，那么，腾讯云便需要了解客户拥有的语音文件的数量、规模，以及语音中的专业化术语等，这一环节考验的是团队对行业及企业的理解。

第二步是结合客户需求、预算，以及所掌握的训练数据量等，推荐基底模型。“通常，我们会推荐3-5 个基底模型做实验，最终选择一个最为合适的。”吴运声称。

第三步是基于基底模型进行数据训练，其中涉及TI机器学习平台、HCC高性能计算集群等基础设施的应用。

第四步，当模型正式上线，腾讯云还会负责数据存储、算力资源部署等运维工作，以及后期大模型的优化及迭代。

如今，CSIG内部涉及人工智能研究的产品团队，几乎将一半的重心放在了大模型方向。汤道生称，目前CSIG已和1.1 万家生态伙伴展开合作，推出覆盖100多个产业场景的行业解决方案，服务了60多万家制造企业。未来，在大模型加持下，腾讯云所创造的商业价值能否成为腾讯继移动社交、网络游戏之外的第三大增长极，值得关注。

应用场景：无声胜有声

尽管不少人期待腾讯能基于大模型，推出一款如微信般的重量级产品，但目前，腾讯却是将大模型能力更多地应用于腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部产品及To B业务之中。有腾讯内部员工对新财富表示，未来大模型的能力将会无处不在，但人们若非十分用心，甚至可能都感受不到。

除騰讯会议外，大模型“润物细无声”的特性还出现在诸多腾讯内部的产品之中。典型如已接入包括广汽在内的15家车企、超300万台汽车的腾讯云车载助手，过去曾存在上下文理解准确率低、复杂场景下语义理解问题不理想等问题，如今，行业大模型的应用，正提升其理解车主复杂意图的能力及应答能力，最终用户感受到的，是更自然的人机对话、更合理的行程规划，甚至是通用知识问答能力。

与此同时，行业大模型对于企业“降本增效”的作用也在逐步显现。腾讯云分享了一个服务税务部门的案例?过去，当传统智能客服遇到不在知识库的问题时，常常无法答复或答非所问，最终依旧需要税务部门铺设人力去完成服务。此外，政策法规、办事指南持续迭代，需不断投入人力梳理。问题拦截率、覆盖率低，急需扩展客服的问答边界等问题，导致智能客服让人感觉不智能。

而2023 年后，基于MaaS能力，腾讯云打造的专属政务大模型，从知识采集到知识运营均实现了智能化升级，业务咨询的解答率大幅提升。尽管这极大提升了税务部门的服务效率，节约了人力成本，但不常跑税务部门的人，并不容易察觉这一变化。

据透露，腾讯云MaaS能力已在腾讯企点客服、腾讯企点分析、数智人、车载助手、AI绘画、文案创作等超50个产品中进行了模型可用性、易用性等方面验证。

除了服务企业，混元大模型亦落地于面向C端群体的腾讯广告系统升级，提升了系统在广告内容理解、行业特征挖掘、文案创意生成等方面的能力，在为腾讯广告带来大幅GMV提升的同时，也初步验证了大模型在C端场景的商业化潜力。2023 年上半年，腾讯的网络广告业务同比增长25.5%，较2022年同期增收93亿元。

发力大模型投资

图2：2018 年至今騰讯在各领域的投资笔数

数据来源：执中数据，新财富整理

对于大模型这样一个被马化腾视为几百年不遇的、类似发明电的工业革命一样的机遇，腾讯在投资层面也在加紧布局。

执中数据显示，2023年以来，腾讯分别在4月、6月投资了深言科技、MiniMax两家大模型创业企业。

深言科技创始人兼CEO岂凡超，是清华大学计算机科学与技术系2017级博士毕业生，主要研究方向为自然语言处理（NLP），曾在EMNLP等顶会发表论文30 多篇。据公开资料，深言科技团队孵化自清华大学自然语言处理实验室和北京智源人工智能研究院，由欧洲科学院院士、清华大学计算机系教授孙茂松领衔，并出任首席科学家。

在2023 年举行的第三届“清华大学国强研究院杯”双创大赛的路演环节中，岂凡超称，深言科技的大规模预训练模型在续写、改写、扩写、摘要4类文本生成任务和6个数据集上，均超过现有其他中文模型，达到了当前最好的中文文本生成效果。这次大赛，深言科技的“基于超大模型的新一代语言理解与生成平台”项目斩获技术创新赛初创组一等奖。

在获得腾讯投资后，深言科技估值为1亿美元。据执中数据，与腾讯共同投资的机构还包括红杉中国、好未来、英诺天使基金等，其他轮次的知名投资方包括水木清华校友基金、奇绩创坛等。

相较深言科技，MiniMax的来头更大。在腾讯投资之前，MiniMax已完成两轮融资，投资方包括米哈游、IDG资本、高瓴创投、云启资本、明势资本等。而在腾讯投资之后，MiniMax的估值已高达12亿美元。

根据公开资料，MiniMax直接从底层的基础模型做起，自研了三个基础模型，其法定代表人、技术合伙人杨斌曾在今年初表示，MiniMax可能是国内第一家同时拥有三个模态大模型能力的创业公司。值得一提的是，在大模型对战平台SuperCLUE发布的中文大语言模型排行榜上，MiniMax的模型在国内企业中排在第7名。

除投资大模型初创企业之外，近年间腾讯对B端生态的加速布局，或为其在大模型领域的突破积累了更多的筹码。根据执中数据，自2018年腾讯入局产业互联网以来，其在企业服务领域的投资事件已达到178起，仅次于文化娱乐领域的221起，且对人工智能的投资也达到38起（图2）。

可以想见，在腾讯云MaaS服务的加持下，腾讯的To B战事才刚刚开始。