小冰的应许之地
2021-07-29曹彦君
曹彦君
在很多人的脑海里,说起小冰,第一印象是微软研发的人工智能语音助手,以18岁美少女的虚拟形象示于人前。
小冰也会长大。如今,这一人工智能框架已经进入第八代,并逐渐拥有了诗人、歌手、主持人、画家和设计师等多重身份。基于小冰框架的交互总量,约占全球人工智能交互总量的60%。
2020年7月,微软宣布进行业务分拆,将小冰业务分拆为独立公司运营,原微软全球执行副总裁沈向洋、原微软(亚洲)互聯网工程院常务副院长李笛分别担任小冰公司的董事长、CEO。
从微软小冰到小冰的角色转变,过去将近一年。李笛表示,这个近300人的团队在组织架构层面并没有发生太大变化,分拆的动作主要是为了加速小冰在本地的发展,后续会有更多商业和模式上的创新。
相比国内其他人工智能企业,这个团队在商业化方面保持着较为谨慎的主观态度,直到小冰框架推出第七代,才开始搭建商业化团队。2020年11月,成立7年后,公司完成数亿元的Pre-A轮融资。
“重学术”,是小冰团队的一个明显特质。李笛认为,小冰是一个重要的“学术课题”,更广泛的市场应用恰好为人工智能研究提供了绝佳的实验室。“像是有一个巨大的真实的盘子,可以直接用来做学术,如果你的算法很棒,那你会得到特别好的效果。”
在他看来,当下的中国在基础科学研究方面所面临的困境,和二战后的美国非常类似:缺乏体系化建设,需要更多的社会认知、顶层设计和资金投入。
“与其说它作为一个重要因素,引领了 20 世纪美国科学的高速发展,不如说它的意义远超出美国的范围—— 在高速发展的世俗世界中, 它为科学划出了应许之地。”李笛在《科学:无尽的前沿》一书的序章中如此写道。
无论是仍处于人工智能萌芽阶段的小冰公司,还是中国的基础科学领域,都在呼唤这样的应许之地。“不同的产品都属于一个大时代。腾讯的微信赶上了人人交互的变革,微软赶上的时代是人机交互的改革,它的未来还有很久。”李笛在接受《21CBR》记者采访时表示。
全局优化
以前在微软的时候,小冰就非常独立,从创立初期开始,所有决策都是小冰自己来做。
交互是人类社会最基本的形式,每天的交互量数以千亿次, 人的社交行为、商业行为、信息的交换,都是交互。
小冰的独特理念在于,我们认为人工智能交互是一个开放域,不是为了完成特定的任务,而是为了面向交互全程;目标是全局优化,而不是优化每一个局部。
最开始形成这一理念是在2013年,团队准备做微软的人工智能助理,我们去找了一些人类助理来设计想法,并设定了一个场景:一个老板跟助理说:“我今天中午要订一份汉堡,因为开会时间太忙。”
我最初的设想是,人工智能助理的关键能力,在于迅速完成任务:马上去订汉堡,不说废话,在一轮交互之内完成任务,并且提前预判第二天也需要汉堡,直接动用老板的钱包进行预订。
但是人类助理跟我说:“不是,我大概率会拒绝帮他订汉堡,因为健康是比订汉堡更重要、更底层的任务。”所以我想,这是更高层面的智能,我们的产品在除了完成当下具体的任务之外,还有一些更长期的目标。
人类助理告诉我,也不是如此,他和老板之间是工作伙伴,他不能被当成只会完成任务的语音控制接收工具,还要在一定程度上跟老板达到对等关系。
所以我们最后的观点是,人工智能助理要关注对话的全局,关注对话是不是慢慢收敛了、是不是没有新的信息进入了,而不只是回答问题、完成任务。
行业内以前都不是这么看的,但是Facebook、谷歌都先后开始按照这个理念去做人工智能。今天,无论国内还是全世界,人工智能都处在早期萌芽状态。各大做人工智能研究的公司,在理念上还处于相互学习的阶段。
在人工智能领域,我个人对于商业化持比较克制的态度。
小冰目前切入的市场是金融、体育、汽车、内容产业等,这些领域的规模化效应往往不是to C的。在to C领域,你如果掌握了一个并发很高的人工智能系统,在进行商业化的时候,比较容易出问题,任何一个企业都很难做到上下一心。
不过我们认为,to B都是临时的,人工智能技术的应用最终会向to C转化。例如,我们现在给企业提供金融服务,跟人不产生交互,但这项服务最终会提供给个人。
这个过程需要一步步实现,我们现在的判断是,在未来5-10年内,to B方向仍然会是人工智能应用的主角。
走向纵深
小冰选择切入以上这些领域,有多重考虑。
一方面是因为数据方面的配套设施,比如金融领域,随着金融决策的产生,数据往往已经进行了很好的结构化,有了推进人工智能的基础;另一方面,这些都是“专家领域”,专业化程度高,不容易出问题。
金融领域,小冰做的是金融文本摘要生成平台。2017年开始,小冰与万得资讯、每日经济新闻合作,提供由人工智能技术生成的上市公告文本摘要、中英双语金融资讯。
汽车领域,我们和很多汽车厂商合作,但不用“小冰”这个名称,而是让用户去定制一些拟人化的东西,做高度去中心化的 AI。
体育领域,小冰进入的是难度系数最高的竞技体育。在2022年冬奥会上,小冰将提供自由式滑雪空中技巧视觉评分系统。国际级裁判不可能一直在现场,但运动员在备战、训练的过程中,要始终确保每一次训练得到的反馈都跟最终比赛一样。
人工智能的目的不是要取代人类,也不是打败它之前的科技,而是帮助人类做更了不起的事情,协助人们进一步释放创造力。
由人工智能来做金融摘要,那么金融信息服务提供商的人就可以去做摘要的指导工作,在职能上来说,这是更有意义、更重要的事情。
体育领域同理。人工智能的优势——高并发、稳定、长时间持续存在,使AI裁判符合测试赛的需求,国际级的赛事,依然会交给专业的人工裁判去做。
我认为,造成人工岗位流失这样的影响,跟人工智能技术本身没有太大关系,这往往跟企业选择的商业模式有关。企业选择使用机械工厂、引入流水线,吞噬岗位是很常见的,没有人工智能技术,这件事情也一直都在发生。
企业选择我们的人工智能技术,从技术上来讲,可以选择替代人工岗位。但也可以用人工智能系统,让整体生产效能更好。
在科技领域,中国有一个很明确、很独特的区别,就是市场的纵深程度特别好。
从一线城市到六线城市,市场容量非常大,但凡有一个技术小革新的基础,在巨大的人口背景下很容易成功。背后的原因,一个是人口的基数庞大,另一个是改革开放以来,配套的基础设施比较完善。
商业是一个生态系统,如果把一个公司的商业模式看作一种生物,生物多样性越好,这个生态系统越不容易崩塌。
在中国,不同类型的商业模式都能获得很好的纵深,即使某一种模式出了问题,也有办法进行过渡。抓住时机,就可以做得很好。
回归基础
这些年中国出现了各种各样的商业模式创新,而真正的问题,是很难去做周期比较长的、基础性质的技术创新。
这和二战后的美国很像:企业机构承担了主要的研发力量,政府不知道该如何运用资金。因此,《创新与竞争法案》的发布对美国社会非常重要,而我们也有几个方面可以参考:
第一,要为基础研究正名,不能污名化,也不能神化。我们往往很容易去观察到直接推动我们生活、工作改进的技术,却很难观察到前端的技术研究。
以电动车为例,随着电池技术的提升,车的续航能力从400公里上升到700公里,这是大众能直接观察到的,因此他们会认可电池公司的贡献。但电池技术的完善是基于一些基础的物理学理论,人们观察不到这一层因果关系。这需要针对社会大众的大量宣传,告诉大家,基础研究和社会生活之间存在强因果关系。
第二,要让人才在不同的地方都留得住,也就是说,不应该让科学家认为,成功只有一种界定,只有财富积累这一种方式。大部分人可能追求的是一夜暴富,相比基础研究,财富积累只是一个短期的过程。
一个经过了良好教育的工程师,是去做基础的操作系统,还是去做应用?我们经常看到一家公司上市,创造了很多个千万、亿万富翁。如果做操作系统,不太容易实现这一点。当更多的科学家前往这些地方,科研机构就会流失人才。
成功的规则不应该只有一条,这需要通过整个社会的顶层设计来实现,要在客观上让科学家们能够沉下心去做基础研究。
第三,要确保政府层面的資金运用。资本是逐利的,企业需要高速发展,要看资金运用的效率,当市场的纵深程度很高,我们很难说服自己和资本市场去做一些基础层面的事情。当你赶上一个高速发展的时代,会尤其害怕你的发展速度落后于时代。
我们以前觉得,当一个公司慢慢有钱了,就应该可以深入做基础研究了,但其实不是这样,公司越有钱,越需要考虑收入环节的前置,在财务报表上越缺乏抗风险能力。
中国以前在基础科学研究领域也有重大成果——比如,当年全国人民勒紧裤腰带搞“两弹一星”,能让国家几十年的和平维系于此。但这些都是单点的技术突破,那时候没有足够的国力把基础研究体系化,如今就可以。
很多科学、科技上的进步,单靠个人的英雄主义是不够的,必须是一个团队,甚至是一个有上下游的团队,一起去奋斗的结果。
操作系统、芯片的研发,要靠一个团队拧成一股劲儿往前走;人工智能领域也是如此,微软、小冰的华人团队还是很有心气的。