APP下载

阿里GPT测评:“AI 摩尔定律”时代真的来了?

2023-04-24张毅

电脑报 2023年15期
关键词:天猫阿里作文

张毅

半导体领域的摩尔定律正在失效,AI世界的“摩尔定律”才刚开始。不久前,OpenAI CEO 、“ChatGPT之父”Sam Altman 发文指出,全球AI 运算量每隔18 个月就会提升一倍。从科技公司对GPT 你追我赶的态势看,“AI 摩尔定律”,也许正在成为全球大模型竞争的节拍器。

继OpenAI、微软、谷歌之后,中国公司也正加速公布各自的大模型研发进展。上周,阿里云官宣其大模型“通义千问”启动企业邀测,达摩院多年磨一剑的AI 研发工作初现真身。《电脑报》参与了“通义千问”的定向邀测,短短几天内,感受到了中国大模型“以日为进”的成长速度。

阿里云大模型“通义千问”亮相

从OpenAI 的ChatGPT 到百度的文心一言,同AI 对话成功挑起人类的好奇心,而就在人们为“哪家AI 更聪明”争论不休时,阿里云突然宣布“通义千问”开始企业邀测。

“通义千问,一个专门响应人类指令的大模型。我是效率助手,也是点子生成机,我服务于人类,致力于让生活更美好。”——这是“通义千问”官方主页上对自己的介绍(如图1),单从字面上理解,“通义千问”更像是一个问答平台或对话工具,但登录进入其交互界面后,“通义千问”对自己的“工作范畴”其实是有引导性解释的。

在“通义千问”页面最下方的“百宝袋”通道,展示了9 种应用,这些应用被分为3 类:效率类、生活类和娱乐类(如图2)。

在娱乐类应用中,有“彩虹屁专家”“写情书”“为你写诗”3个功能,比如“彩虹屁专家”,当你想夸别人,却不知道怎么夸的时候,就能让通义千问帮吹一些彩虹屁。

显然,从这9 種应用定位可以看出,“通义千问”并非单纯用于对话娱乐,更有生产力工具属性,而在我们输入“通义千问自身定位是?”提问时,它是这么回答的(如图3)。

以“日”为单位成长的AI

“最初第一批拿到测试资格时蛮兴奋的,第一时间就尝试同‘通义千问进行对话,但对话结果却有些失望,除‘牛头不对马嘴外,更给出了不少错误答案。可当我们带着失望心情在第二天输入同样问题时,‘通义千问竟给出了近乎完美的正确答案,这种‘低开高走的测试真的很刺激,‘通义千问真是以肉眼可见的速度在成长!”

2023年4月8日,《电脑报》记者根据热点新闻事件向“通义千问”提出“能否制作一段有关石墨烯的视频脚本?”要求时,它写出来的视频脚本非常生涩,甚至像说明文多过视频脚本(如图4)。

然而,仅仅过了一天时间,当记者在4月9日向“通义千问”再次提出“能否制作一段有关石墨烯的视频脚本?”时,“通义千问”非常准确地理解了记者需求,且创作出可行性较高的视频脚本,从旁白对话到画面设计,都给予了详细的内容和建议(如图5)。

每天都在变强的“通义千问”成功吊起我们好奇心,同当下主流免费的ChatGPT(GPT3.5)和文心一言相比,“通义千问”能力究竟如何呢?

一场“谁更聪明”的对局

2023年4月9日, 我们分别从逻辑思维及语言组织能力(教育心理分析)、语言文字创作能力(小学生作文)及非线性思维能力(数学组合题目)三个方面进行了横向测试。当下各家AI 更新太快,本次结论仅做测试当日参考。

逻辑思维及语言组织能力:如何处理同叛逆期初中生的亲子关系?

ChatGPT(GPT3.5) 在该测试场景下的表现堪称完美,整体逻辑非常有条理,将同孩子关系的处理方式方法进行了罗列,具有较强的说服性(如图6)。

文心一言回答显然简单了许多,这样的回答想要说服一个叛逆期的初中生,显然不太具有可执行性(如图7)。

通义千问的逻辑性已经和ChatGPT 不相上下,其给出的解决办法具有比较明显的条理性(如图8)。

点评:无论是ChatGPT 还是通义千问,都已具备初步逻辑思维能力,完全可以应对日常交互,并针对用户需求给出符合逻辑的解决方案。

语言文字创作能力:帮我写一篇赞美秋天的作文

天的作文在文字描述细节上,ChatGPT(GPT3.5)抓住了秋天的特点,但在文章结构和具体事物的表述上显得有些僵硬,对于这样一个相对简单的入门级作文,ChatGPT(GPT3.5) 的表现让人有些失望(如图9)。

文心一言将果实作为赞美秋天的核心来展开,很好地领悟了中文作文“主次分明”的技巧。只是在对秋天整体的把控上稍欠火候(如图10)。

通义千问的作文能力多少让人有些惊喜,总分总的结构拿捏得十分到位,开篇明义的同时,通过树木、树叶、果园三个事物在秋天的表现,完成了秋天具象化描写,很好地表达了对秋天景色的赞美和喜爱之情(如图11)。

点评:从作品看,三款AI 在语言文字创作能力上均有不错的表现,尤其是通义千问对作文的打造显得非常“老练”, 稍加修改就能成为一篇传阅的优秀范文,整体作文的逻辑性上稳压ChatGPT 一筹!

非线性思维能力:老师打算将10张相同的积分卡分给甲、乙和菲菲,甲想得到至少 4张,菲菲想得到至少3张,乙则表示无所谓,给不给他都行,若老师打算满足每个人的要求,共有多少种分法呢?

答案错误, 显然,ChatGPT(GPT3.5)这一次在一本正经的胡说八道(如图12)。

答案错误,虽然文心一言简短的回答看上去挺有自信,可答案依旧错了(如图13)。

通义千问这一次很老实,开小差而没有给出答案(如图14)。

点评:相对于编程、鸡兔同笼、流水行船、牛吃草等线性思维的数学学科题目,排列组合这类非线性思维模式题目能考验AI 自主思考能力。显然,从这道题目的测试情况看,三家AI 均败下阵来,不过非线性学科问题本身就是AI 测试的难点,很期待未来AI 在该领域的表现。

阿里系应用全面接入通义千问

“所有软件都值得接入大模型升级改造”,阿里云智能CTO周靖人在北京云峰会现场宣布:“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型!”据电脑报记者在现场传回的消息,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能(如图15)。

根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI 功能, 全面激发创意和办公生产力。通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI,开启全新工作方式。在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公。在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点。最惊艳的是,钉钉展示了拍照生成小程序场景,上传一张功能草图,不用写一行代码,可立刻生成订餐轻应用。

而接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。它支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容。比如,用户可以在跑步时要求天猫精灵“合成1 小时歌單,50% 穿插摇滚风格的歌曲”,也可以和天猫精灵聊文化谈人生。新天猫精灵不仅能回答小朋友的各种刁钻问题,还可以一起创作“宇宙大爆炸”的新故事(如图16)。

科技巨头的大模型之战

通义千问并非凭空出现,而是阿里厚积薄发的结果。

阿里达摩院深耕 NLP领域,在大模型技术路径上具备多年前瞻技术积累,阿里达摩院于2019年启动大模型研发,在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面,为中文大模型的发展做出一系列探索工作(如图17)。

动辄超千亿参数的大模型研发,不是单一的算法问题,也不是简单的堆算力的过程,这是包括了底层算力、网络、存储、数据清洗与治理、AI 框架、AI 算法、人类调优等多个方面的系统性工程问题。

目前头部科技企业均采取“模型+工具平台+ 生态”三层共建模式,有助于业务的良性循环,也更容易借助长期积累形成竞争壁垒,而国内大模型厂商主要为百度、阿里两家。

根据周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

以统一底座为基础,达摩院构建了层次化的模型体系,其中,通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律、金融、娱乐等行业(如图18)。

而如此庞大的构想底气源自阿里系庞大的算力。根据行业权威研究机构Gartner2021年全球云计算IaaS市场份额数据显示,阿里云排名全球第三,市场份额为9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为25.53%。

在AI算力方面,2022年阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,为科研、公共服务和企业机构提供强大的智能计算服务,通过先进的技术架构,飞天智算平台实现了90% 的千卡并行计算效率,可将算力资源利用率提高3 倍以上,AI训练效率提升11倍,推理效率提升6 倍。

阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,让计算成为公共服务是阿里云始终不变的追求,未来核心要做好两件事情:第一,让算力更普惠,推动自研技术和规模化经营的正循环,持续释放技术红利;第二,让AI 更普及,让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型(如图19)。

而除了开放自研的通义千问大模型外,阿里云也在积极建设开源的AI 社区生态。去年11 月,阿里云正式提出“Model as aService”理念,并推出国内首个AI 模型社区“魔搭”,开发者可以在“魔搭”上下载各类开源AI 模型,并直接调用阿里云的算力和一站式的AI 大模型训练及推理平台。发布不到半年,“魔搭”社区总用户量已超100万,模型总下载量超1600万次,成为国内规模最大的AI模型社区。

依托于坚实的云计算底座,AI正像水一样浸润到千行百业,帮助更多企业从数字化走向智能化,更多应用涌现出更智能的新功能和新体验。

对于这样的变革, 你期待吗?

通义千问将全面接入阿里系应用

通义千问接入天猫精灵

猜你喜欢

天猫阿里作文
云上阿里
辰辰带你游阿里
从天猫的“新零售”变革中看商业的“新四化”
雀氏联姻天猫母婴共赢奥斯卡
天猫“北伐”
阿里战略
阿里是个好榜样
神威大药房天猫旗舰店正式上线