丁磊的大模型试验田，单季营收15亿

2024-02-07

世纪人物 2024年2期

“国内好的大模型应用目前还是太少了，2023年大家都使劲做大模型，反倒在应用方面没有大的突破。”这是网易有道CEO周枫投身大模型一年后最大的感受。

在他看来，2024年大模型应用即将迎来爆发，“咱们中国创业者在移动互联网时代可是最会做应用的”。2023年，周枫去美国转了一圈，他发现那边的创业活力非常强，大家都在各个层级上创新，他意识到国内需要再次加速，尤其在应用层。过去一年，不同于百川智能创始人王小川、智谱CEO张鹏等清华大学校友研发超大规模大模型，周枫带领团队研发出“子曰”教育大模型之后，就快速投入到大模型原生应用的开发中，业务被逼着进入一种快速迭代的状态，周枫参与业务会议的频率从月会变成了周会，他形容当时的团队状态是“应用团队和模型团队互相逼”。

截至目前，基于“子曰”教育大模型，有道已推出10多款学习类AI原生应用和功能，成为国内开发AI原生应用最多的大模型企业之一。而基于大模型对原有业务的重构，有道的业绩变化也真实地体现在公司的经营数据中。

根据有道2023年第三季度的财报，网易有道该季净收入15.4亿元，毛利率上升至55.9%，达到近两年新高；季度经营亏损同比收窄73.7%，总运营费用也同比下降，经营效率进一步提升。

在具體产品和业务上，受益于大模型的助力，AI Box的升级以及AI写作功能的推出，带动有道词典及有道翻译第三季度会员费同比增长160%以上，在线营销服务净收入较2022年同期增长113.5%。

“搭载了子曰大模型的产品，比同期发布的未搭载大模型应用的产品，在用户使用频率上要高出50%以上。”周枫说。从2006年网易有道成立，周枫相继做了有道搜索、有道词典、有道云笔记、有道精品课、有道词典笔等业务，业务范围覆盖K12教育、成人教育、素质教育、智能硬件等领域，这让大模型的应用落地有了众多的场景。

虽然有道并非大模型企业中规模最大的一家，但周枫采取的“小快灵”AI应用开发路线，很显然已率先在商业模式上奏效。当外界在追问大模型到底给企业带来哪些增量时，有道已经在各业务的用户反馈中得到了答案。

“做企业最重要的是挑什么仗去打。”周枫说道，“如果你告诉团队去打根本不可能赢的仗，那不是害大家吗？”

时间回到2022年11月底，ChatGPT发布之后，周枫试用后感到非常震撼。他跟算法团队来来回回地用，测试它的能力底线，在公司内部评测模型不同能力的细节。为了了解更多技术细节，周枫把从GPT-2开始的所有语言模型相关的论文全部读了一遍。

2023年1月，有道内部召开年度战略会，这是公司每年的传统，周枫把总监以上的团队集中在一起连续开三天会。不同于往年，2023年周枫让有道首席科学家段亦涛讲了一个多小时GPT相关的技术，让大家做了充分的讨论。

最终的结论是，大模型是一个革命性的技术，如果有道不迅速入局，革新和颠覆自己，就连起家的词典和翻译业务就也别干了。当时，周枫和团队一直在思考，ChatGPT、大模型跟有道到底有没有关系？有道到底要做什么？有没有合作方可以调用？

“我们从第一天开始就决定要做一批应用，而不是说我要训个模型出来，然后看怎么办？我不是这个想法，只是当时找了一圈都没有可调用的大模型，只能自己训练。我觉得你把大模型弄出来，却搞不明白用来干什么的话，自己做大模型的意义就不大了。”周枫告诉《中国企业家》。

其实，当时美国可汗学院等教育公司已经开始尝试接入GPT-3.5，做一些教育服务尝试，但国内还没有能力综合又非常成熟的可以接入的模型，周枫必须得自己做。

很快，周枫就和团队达成两个共识：第一，有道团队一定要自己做大模型，如果自己不做是很难完全摸清楚门道的，公司的动作就会变得很慢，做什么都落在别人后面，成为一个跟随者；第二，做开源大模型肯定打不过专门做超大规模大模型的公司，必须把重心转移到应用上。

作为资深技术从业者，周枫过去20年见证了好几轮技术变革浪潮，历史经验告诉他，每一次大的浪潮里，机会不仅仅在于基础技术。就像互联网发展之初，做服务器和路由器的公司最赚钱，但大家很快就发现互联网的精髓不在路由器，而是在互联网应用上。

他认为，如果中国的创业者眼睛全盯着要去做大模型，就会像移动互联网时代那样，整天盯着怎么做手机而忽视了微信、淘宝、抖音等应用的机会。

截至目前，有道大模型团队超过100人，且大多数都是从原来的团队转过来，他们中很多都有人工智能领域的相关研发经验。

除了人才外，有道在AI方面也有深厚的积累。早在2008年，有道成为国内第一家提供统计机器翻译模型的公司；2017年，有道从机器翻译引擎升级成神经网络翻译引擎，随后又升级到现在主流的Transformer技术。因此，在做大模型的时候，有道团队过往很多积累都可以用上。

但即便有技术积累和人才优势，周枫给团队设定的边界是：坚决不会做1000亿参数以上的模型。

在周枫看来，大模型目前可分为三个层级——1000亿参数以上的超大模型、100亿参数～1000亿参数的中间模型和100亿参数以下的小模型。

每个层级都定位不同的实用场景，其中超大模型提供最佳质量，具备较强数理推理能力；中间的模型具备知识的能力，且因为成本较低，但效果不错，可以广泛应用；而小模型则是放到设备里，具备语言能力和情绪能力。“我们基本上相对早期的时候就琢磨明白这件事儿了，超大规模的模型应该留给专门以大模型为全部工作的公司去做，一方面太贵了，另一方面市场也不需要重复建设。”周枫说。在他看来，有道作为教育科技企业，核心的差异应该来自于中间和底下两个模型。而这其中，要求开发者对不同层级的模型能力有深刻的理解，且能将产品需求和能力模型匹配。

在结合过往业务寻找落地场景应用的过程中，周枫确立了两个原则：第一，解决用户在教育场景的需要；第二，能快速变现，有足够的商业空间。而虚拟人口语教练Hi Echo、AI家庭教师小P老师等应用和功能，都是他认为既能满足用户学习需求，又能实现商业化变现。

2019年10月，有道在美股上市时，周枫就曾拿用AI技术批改作文这一场景举例。“但当时的确效果一般。”周枫告诉记者。2023年，借助AI大模型，有道再次推出AI作文指导，目前已经批改了几十万篇作文。周枫发现用户需求没变，但当需求能被很好地解决的时候，产品使用量或者活跃度就会快速上升，满意度也明显提升。

2023年一年，周枫深刻地意识到，其实教育从来都不缺用户需求，缺的都是办法。除了AI作文批改被使用频次变高之外，他发现有道硬件词典笔中，以前用户都是扫一个词，而现在则是扫一行句子，而有道的业务正是在这些细微的变化中被重构。

在周枫看来，教育科技是个巨大的市场，很多刚性需求下的细分场景都是巨大的业务盘。而大模型提供一个很大的机会，让用户以相对廉价的方式能买到不错的教育服务。

2022年全国教育经费执行情况统计公告显示：2022年全国教育经费总投入为61329.14亿元，首次超过6万亿元，比上年增长5.97%。

除了直接面向C端用户外，2023年有道与杭州拱墅区智慧教育达成了合作，有道团队直接把应用内置到智慧教育系统中，这里的学生每天在学校就可以练15分钟口语。

研发和推广大模型应用这一年，周枫也总结了一些经验：第一，即便大模型已经在媒体上变成一个热词，但其实大部分中国人还没有用过大模型产品，所以当开发者产品做得非常精致，完成度非常高时，用户的接受度也非常高。第二，英语口语类产品，虚拟人非常有用。在此之前，有道曾开发出一版无虚拟人的口语教练产品，但发现效果一般，最终有道决定联合网易游戏团队在产品中加入虚拟人形象。第三，交互式的追问，以及基于语音和聊天的学习产品形态，用户非常需要，他们天然就喜欢这样的产品形式。

除了是一名教育科技创业者外，周枫还是两个孩子的父亲。在ChatGPT和大模型火了之后，他现在逢家长就问，你孩子学编程没有，学计算机没有？

在周枫看来，如果小学二三四年级的学生，逐渐开始能接受计算机时，真的应该去体验一下编程。“过去50年，社会所有行业中间给人类社会发展带来最大震撼的，基本就是信息产业，它不断带来惊喜，每10年都有一个巨大变化。”周枫表示。

与此同时，他也开始培养孩子的创造力和提问的软能力，他认为在未来这对每个孩子来说都是越来越重要的。他也正逐渐将这样的育儿观念带入到有道的产品中，比如坚决杜绝孩子们用AI工具作为抄作业的手段，保护孩子自主学习的精神。在周枫看来，大模型是个长达10年的事儿，就像移动互联网是10年的事兒一样。“虽然2007年就已经出现iPhone，但直到2016年才出现抖音。”周枫强调。

他认为，2024年大模型相关领域将会有三大机会点：第一，超大模型肯定会成为一个国内大模型厂商争夺的焦点；第二，国内将会涌现一大批大模型原生应用；第三，端侧将会得到广泛应用。

（来源：《中国企业家》）

责任编辑/李雪曼