张鹏:让机器像人一样思考
2024-07-13沙敏
沙敏
张鹏说,通用人工智能之路未来可期,当然社会上有种种对人工智能前途的质疑的说法,与其说停下来争论,还不如踏踏实实地为实现目标前行。
2024年3月,在福布斯公布的2023年中国51家新晋独角兽企业名单中,智谱AI名列前茅。这意味着在国内的人工智能赛道,智谱华章已经迈入头部企业行列。经过2023年的学习与探索,今年已经迈入人工智能的元年。4月29日,在人工智能也如繁花开放的春天,在中关村搜狐网络大厦,智谱华章CEO张鹏,接受了记者专访。
张鹏介绍,智谱最新的GLM—4已经能在MMLU、LAMBADA等国际测评集中达到GPT—4约95%能力水平。博学多才、沉稳干练的张鹏,向记者讲述了智谱的创业发展历程。
仰望星空,脚踏实地
张鹏说:“智谱AI将坚持技术升级和市场驱动。大模型Scaling Law还远未看到天花板。”
在2024中关村论坛年会上,智谱华章作为合作伙伴,将年会升级成科技办会,并以智谱清言产品智能体能力,为参会者全面实时提供会议服务,这只是智谱AI成果中的一项。
谈起2019年智谱AI的创业,张鹏说,在创业之前我们就已经从技术层面上思考明白这件事情,然后就考虑如何孵化与成立公司。
智谱AI是国内最早一批大模型研究单位之一。当时可供选择的有两条路,一条路是用国外现成开源的模型。另一条路,是充满挑战的自主研发之路。张鹏带领的GLM团队,发扬顽强拼搏精神,日夜作战,克服资金短缺、算力不足等困难,用很短的时间就完成GLM对话模型。2023年8月底,智谱AI正式上线首款生成式AI助手智谱清言。在发布第一代千亿基座模型时就同步开源,至今已有20多款模型开源,尤其对话模型ChatGLM—6B在国际开源社区GitHub上的星标数累计超过5万,这个星标数超过LLaMA,国内排名第一。
智谱AI的发展,得到海淀区的支持。2022年底,海淀区在东升大厦,提供三个月免租的办公场地。随着研究的深入,科学家团队提出了GLM算法框架,研究不同预训练参数规模带来的变化。这些研究工作为公司大模型技术发展奠定了良好的人才、数据及技术基础。
智谱AI在千亿基座模型、对话模型、代码模型、多模态模型等方面布局完整,并在国内率先发布。最新发布的第四代大模型GLM4全面对标GPT4,在多语言、多模态、数值计算、智能体等方面通过国际公认数据集评测,达到了逼近GPT4的水平。在中文、写作和数学推理等方面甚至超越GPT4。
商业挑战,服务领先
张鹏回忆道,早在2021年,智谱AI就提出Model as a Service(MaaS)模型即服务的市场理念,智谱最先面临的是技术的挑战。MaaS开放平台的用户,不仅包括大模型爱好者、个人开发者和程序员,还包括企业。智谱清言app面向C端用户,以个人消费者为主。
谈到智谱AI专门为中关村论坛定制,首次为年会提供会议助手的智能服务。打开智谱清言app,询问2024年中关村年会的相关问题,如提问与大模型相关的主题活动,时间,地点等问题时,会议助手马上一一显示出来,如提问某个教授参与的活动时,智能助手也会展示相关的活动。其实,智谱清言app中的智能体会议助手,已经在许多场景进行过实验,它也是基于大模型做到了像人一样思考,能够听懂提问人的意图,并回答相关的问题。
张鹏谈到,当今人工智能技术包括三个元素:数据、算法、计算能力,中国的人工智能在国际上的地位,和GDP排名是相符合的。从应用规模、综合实力上看,总体排在第二的位置,我们得承认,与国外有一定差距。但国内人工智能行业企业非常多,竞争也很激烈。智谱AI得益于涉足这一行业比较早。
张鹏说,人工智能产业是生态信息产业链。智谱AI作为大模型生态圈的基础层,需要打通上下游,实现协作共赢。智谱AI,将搜狐大厦的七层建成孵化空间,无偿提供资金、办公场地给相关公司,发挥企业的孵化器作用,帮助企业尽快成长,孵化成功的企业,反过来会促进公司的发展。公司既需要上游提供AI芯片、视觉传感器服务等;同时也服务于应用层的各行各业,其中就有医疗、金融、汽车、互联网、法律和心理咨询的公司。
在七层建成孵化空间进驻的公司,已经有许多企业孵化成功。
2024年,人工智能持续火爆,宛若春季的繁花,姹紫嫣红,悄然盛开在各行各业。人工智能是新质生产力的引擎,大语言模型仍然将是主要的增长点,大语言模型进入百家争鸣的时代,各大科技公司竞相研发的核心技术,也进入群雄逐鹿的时间节点。2024年1月,智谱AI推出新一代基座大模型GLM—4,随着GLM—4一起推出的还有智谱清言智能体功能,即使没有编程能力的人也能够通过自然语言发挥大模型的强大能力。除了私有化部署外,超过2000家生态合作伙伴,1000家规模化应用和200家深度共创客户活跃在智谱开放平台上,而推出不到半年,智谱清言智能体已经突破了30万个。并同时上线智谱清言GLMs个性化智能定制功能,实现聊天对话,只需输入问题指令,即能够创建属于自己的GLM对话智能体。
通用智能,大展宏图
张鹏谈到公司定位,是一家致力打造新一代认知智能大模型,赋能千行百业加速迈向通用人工智能时代的AI公司。通用人工智能又称强人工智能,通用人工智能像人一样,能举一反三、触类旁通。比如,它能接收不同类别、有一定规模的数据,包括文字、影像、语音,然后把它们融合在一起。
人工智能大模型的出现,为通用人工智能的实现打开了新的想象空间。这些大模型往往运用一套算法、一套模型结构、一个训练思路,来提升人工智能的分析处理能力,而不是直接去解决一个个具体的问题。
张鹏说,通用人工智能的大模型训练是从语言开始的,所以语言和图像能力会更强。对于机器来说,语言信息密度更高,更容易学习。机器人会写诗,会唱歌,但从事家务的机器人就难一些,因为它需要有多模态的处理能力,更多的数据和复杂的训练方法。
要让机器人做家务,首先是大脑要健全,容量要足够大,脑细胞足够多,并且能够读懂信号,指挥手和脚。第二是视觉、听觉,语言感官能力,多角度地感知世界,多方面能力要打通,才有可能实现机器人从事复杂的家务劳动。通用人工智能也在不断进步与发展。
比如,过去只能进行录音转写的人工智能应用,现在则可以根据要点进行提炼总结。尽管经过大模型训练的人工智能仍然“不懂”所做事情的意义,但已经可以输出接近人类理解的结果,并具备生成新事物的“创造力”。
谈到智谱AI的未来,张鹏说,通用人工智能之路未来可期,当然社会上有种种对人工智能前途的质疑的说法,与其说停下来争论,还不如踏踏实实地为实现目标前行。
张鹏表示,智谱AI始终坚定踏实地做好每一件事。智谱AI乐于承担社会责任,用户对公司有很好的评价,对于市场引进起到了推动作用,有一定的社会影响力。智谱AI支持上下游包括芯片和应用公司,支持人工智能的研究与应用。智谱AI与CCF中国计算机学会、中国中文信息学会社会媒体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。自成立以来,两只基金为来自全国30余所高校参与的41个研究项目累计提供了超1000万元现金和算力资源的科研支持。在开源社区,智谱AI设立了大模型开源基金,计划累计用1000张GPU、1000万人民币和1000亿tokens来支持人工智能开源社区建设。成绩只属于过去,未来的智谱AI,会更加努力,用更多的成果回报社会。