人工智能先行者
2015-11-07刘磊采访刘磊洪鹄张卓陈睿雅编辑洪鹄
文|刘磊 采访|刘磊 洪鹄 张卓 陈睿雅 编辑|洪鹄
人工智能先行者
文|刘磊 采访|刘磊 洪鹄 张卓 陈睿雅 编辑|洪鹄
作为工业界顶尖的人工智能研究者,王海峰的兴趣不在想象未来,而在脚踏实地地探索通往未来的路。
他和他的团队通过互联网产品影响着数亿网民的日常生活,他们正在改变世界。
铁臂阿童木
对人工智能最初的兴趣,发生在王海峰先生小学的时候:他迷上了中央电视台播放的日本动画片《铁臂阿童木》。天马博士因为一场车祸痛失爱子,为了缓解伤痛,博士按照儿子生前的模样制造了一个机器人—阿童木。这个拥有10万匹马力和7种武器的小家伙本领超常,它一边同各种恶势力作斗争,一边坚持在人类和机器之间搭建友好桥梁。
“我那时候不知道这是科幻故事,还以为是真的。”王海峰回忆,他穿一件浆洗得有点旧的蓝色衬衫,眼睛很大,这让他在平静的时候也表现出一种颇为愉悦的放松感。那年他9岁,对未来的设想是—每个人都会很快拥有一个“可以上天入地的”、属于自己的阿童木。
很多年以后,当王海峰成为人工智能研究者,加入制造“阿童木”的队伍时,人们仍然在为“阿童木”是否会出现、到底什么时候出现而争论不休。王海峰经常遇到对此好奇的人,他们往往会用一种跨越式的方式来提问:“有一天机器人会比人类更强大甚至毁灭人类吗?”
这个问题的有趣之处在于它引发的分裂。未来学家、科幻迷、对科技一知半解的文艺爱好者们提前感受到了恐惧,他们为机器将具有自由意志的假设所困扰,甚至斯蒂芬·霍金这样非计算机领域的大科学家也在关心:弗兰肯斯坦会出现吗?人类会不会创造出失控于自身的邪恶智能?但当我们用这类问题(“库兹韦尔认为30年后的2045年,人工智能可能超越人类智能,你怎么看?”)去询问任何一位人工智能研究者,得到的都是他们好脾气的、却令人扫兴的回答。“这太乐观了”、“这是未来学”(言下之意不是科学)、“你知道吗,飞机刚造出来时人们叫它人工鸟,但现在我们不需要担心它会下蛋”。王海峰的答案温和一些。“我会说这个还是很遥远的,”但他立即又补充了一个熟练的比喻,“现在谈论机器人是否会反噬人类,就像今天开始考虑如何在火星上打地基建房子一样多余。”
王海峰所从事的人工智能研究是这个时代最时髦的谈资之一。人工智能是计算机科学的一个分支,它企图了解人类智能的实质,并开发出一种能以与人类智能相似方式做出反应的机器智能。1956年夏季,以麦卡赛、明斯基、香农为首的几个年轻科学家在一场探讨机器模拟智能的聚会上第一次提出“人工智能”的概念,被视为这一学科的正式诞生。几个研究组很快在美国建立起来了,同年一个叫逻辑理论家的程序问世,它能证明罗素《数学原理》中的38个定理。1962年,名为Checkers的西洋跳棋程序先是打败了它的发明者,继而打败了美国一位州跳棋冠军—Checkers具有学习能力,能在下棋的过程中自动积累经验,这迈出了机器智能模拟人类学习过程中惊人的一步,“人工智能”这个名词从这一年开始轰动世界。
但人工智能在接下来几十年的发展并不如预期。Checkers无法再打败更高一级的跳棋冠军,而在其他领域,比如一度被人们寄予巨大期待、认为可以短期实现的机器翻译,可行性也受到严重质疑,发展一度停滞不前。到了1970年代,世界范围内的人工智能研究已走向低落,那种“强人工智能”概念,即香农他们最初想要实现的有真正推理能力、解决能力,甚至有知觉有自我意识的机器不再被看好,甚至被认为是浮夸的。
狂想曲回到了最初的7个音符之上。令人工智能重新回复生机的驱动力由实验室里的冲动转变为工业界的实际需求。而专家系统的出现则实现了人工智能从理论研究到实际应用、从思维规律的探索走向专门知识的巨大转折。在今天的世界,主流的人工智能意味着它所包含的那些细分领域:自然语言处理、机器翻译、语音技术、计算机视觉、机器学习(现在很热的深度学习是机器学习的分支)等。有意思的是,这些领域一方面互相交叉一方面又彼此分裂—所以研究自然语言处理的王海峰会告诉我们,在一些底层的算法上他们会用到譬如机器学习的模型,但同时他也有可能和我们一样听不懂一场关于计算机视觉的前沿报告。
“度秘”来了
当然,大部分好奇于人工智能的人并不会真的对计算机程序里那些复杂枯燥的0、1代码感兴趣。他们谈论人工智能,更多的是在谈论《她》中拥有迷人声线的萨曼莎以及《超能陆战队》中“萌萌的”大白。
王海峰现在是百度这家中国互联网巨头的技术副总裁。浪漫地想象未来,那是科幻迷们的事儿,他要做的是脚踏实地地探索通往未来的路—通过人工智能,帮助更多的人解决他们此刻或不远的将来需要解决的问题。
这位人工智能科学家显然对谈论自己的产品有更大的热情。2015年9月8日的百度世界大会上发布的新产品“度秘”就来自王海峰团队。实体化的“度秘”是一个叫小度的机器人,由一条机器手臂推送到李彦宏面前。当这个白色玩偶般的家伙完成了李彦宏“订两杯中份拿铁”的指令时,台下掌声一片。
人物:如果能回到过去改变历史,你最想改变的是什么?
王海峰:中国历史上曾经非常发达,但是那个发达以后,那个积累的社会财富很遗憾的是没有用来去发展科学技术。如果比如说我回到唐朝或者回到什么朝代,我能影响这件事的话我会希望那些社会财富更多是(用来)发展科学技术。
2011年苹果推出Siri,语音助手从此进入大众视野。随后微软小冰、Google Now也纷纷问世。在互联网自媒体人罗超看来,“由于智能手机天然具备听和说的硬件基础,再加上移动互联网带来的语音场景,人们都认为语音助手是时候爆发了”。
但大部分语音助手仍然只是“玩具”。“人们许多时候都在调戏Siri,它的笨拙甚至会激怒用户恶语相向—不信去看下东北司机怒骂车载语音助手的视频。语音助手是刚需,但大家都没有完善的解决方案。”罗超认为。
相对于各类语音助手,“度秘”起码有两个新的尝试。王海峰告诉《人物》,一方面“度秘”可以相对流畅地完成多轮对话,即基于上下文理解用户意图—这一点的背后自然是强大的技术支撑。从功能上说,Google Now主要做信息推送,Cortana是用户手机中的日常事务助理,Facebook M正在小范围测试预订餐厅服务,而主打服务的Magic包括国内的“神猪”其实是通过人工处理用户的语音指令—唯有“度秘”试图以自动化为主的方式连接人与服务。
面向用户的“度秘”如今是手机百度里的一个功能,王海峰告诉《人物》,独立应用也将很快上线—百度的目标是让这个功能最终嵌进整个移动互联网。李彦宏也用手机演示了使用“度秘”的过程:他对着麦克风说话,“度秘”先后帮他预约了一家可以带狗的餐厅,买了三张电影票,找到一家可以看僧帽猴的动物园。
作为中国互联网用户长时间以来最习惯的搜索入口,“度秘”的发布,意味着百度将“连接人与服务”作为它新的追求之一。王海峰说,今天的人们差不多忘了我们还曾生活在一个没有搜索引擎的世界,“3w网址靠手打进地址栏,有人甚至会把网址抄在小本子上”。未来我们回想起今天的手机也会和此时回想没有搜索引擎的史前世界心情一样:一个人居然会装80个应用,3种打车、4种买电影票、6个负责吃饭团购。
这显然是一种赘余。王海峰认为,人们的生活需要简化,我们宝贵的时间不应该浪费在“寻找、比较、下单、支付”这些事务性的环节上,“而‘度秘’将会是你的服务引擎”,“不但能帮你找到服务,还能完成它,最终一杯咖啡或两张电影票直接送到你手中”。2015年上半年,李彦宏提出了百度要做连接3600行的平台。可以理解为“度秘”和这句话有相同的抱负。
在正式上线之前,“度秘”曾经有过各种各样的命名,王海峰说,最终确定叫“度秘”是希望它能提供一种“聪明、贴心、定制化的服务”。“好比我告诉我的秘书,明天我要去上海出差了,我只说这么一句,因为他知道我一直以来的喜好,就会帮我订我喜欢的酒店、习惯的航班,查好天气,提醒衣着。‘度秘’最终要提供的就是这样一种个性化的服务,它是有学习能力的,你的使用习惯就是它的学习材料。它会因为你不断的使用而越来越聪明,越来越了解你。”
科学偶像
8月底王海峰回了一趟哈尔滨老家,和小学同学聚了一场。大家聊起读书时候的事儿。同学们都说,小时候个个都说要成为科学家,现在只有你真的成了科学家。
王海峰嘿嘿一笑。保持不变对他来说从来不是难事—无论是习惯还是目标。他从小学起每天如铁律般6点起床,至今如此。“他基本都是第一个到公司的人,每天7点多就来了。”王海峰的百度同事、自然语言处理部总监吴甜告诉《人物》,以至于保洁阿姨都不得不每天首先打扫他的办公室。
王海峰出生于一个知识分子家庭,学核物理的父亲毕业于清华。他的成长适逢改革开放后70年代末和80年代,重启科学、信奉科学成为时代精神,以至于王海峰“头脑中最高大的形象全是科学家”。牛顿、爱迪生到陈景润、华罗庚,他们的照片挂在中国所有教学楼的走廊里,配以“天才就是1%的灵感加上99%的汗水”这样耳熟能详的名言。每天走过这条走廊的王海峰是一个成绩好、朴素、正派的小男生,对苹果树和发明电灯的故事倒背如流,幻想着自己有一天也可以成为“他们那样的人”,发明出“对全世界有用的东西”。
王海峰就读的哈尔滨三中是黑龙江省最好的中学。1984年,邓小平在上海亲昵地摸了一个正在操作电脑的13岁中学生的头,宣布计算机的普及要从娃娃抓起。这让王海峰和他精英中学的同学们成了他这代人中罕有的、在1980年代中期就开始接触电脑的年轻人。那是1986年,他高一,学校有一个机房,班上50个同学每人一台电脑,但所有的电脑都是没有硬盘的。“每次课上,写几段程序,复杂一些的数字运算或者小游戏,运行一下,成功了就很开心。”最大的遗憾是下课关机后,“写的程序全部消失”,下堂课想用的话,就要重新敲。
王海峰回忆接触计算机时最初的魅力:“(原来)计算机是这样的,不是那种小计算器。我们可以写一些程序,写一些思想进去,而不是说(只是)算一个数。那个其实印象是很深的。”当时,王海峰的愿望极其简单,他希望自己写的程序不要下课关机就全没了。
1989年他如愿进入哈尔滨工业大学计算机系。其时市场经济大潮正在到来,国际交流越来越多,而“大家学外语又学得很辛苦”,王海峰想到,机器翻译会是一个“很多人需要”的研究方向。
事实上1950年代后期,美国和苏联出于冷战需要,一度对机器翻译大量投入。然而到了1966年,一次英译俄再译回英文的机器翻译闹了笑话—“心有余而力不足”译回后变成了“酒是好的肉是坏的”,机器翻译的“不够智能”引发了公众的巨大失望,而美国科学院公布的一份名为《语言与机器》的报告也否定了机器翻译的可行性,该领域从此一落千丈,之后很长一段时间里发展缓慢。
王海峰从大学四年级进入机器翻译领域,“一做就是18年”。2010年他离开东芝加入百度,次年6月30日,他主持下的百度翻译上线,运行一周后,一切稳定。互联网上的大数据大大提升了机器翻译的准确率,而百度作为入口自带大量用户的使用和反馈则可以使其进一步完善。王海峰带团队去吃了顿庆功宴,席间他忍不住感叹,“过去一周所获得的用户,所服务的用户,比过去18年的总和还多”。
本科毕业20周年聚会时,王海峰发现,他是全系100多人里唯一一个从事本专业研究工作的人。其他的同学要么转了行,要么换了研究方向。只有他,读本科时在研究自然语言处理,如今自然语言处理仍然是他主要的工作领域。
“我做这个领域能取得一些成果也许就是因为我比别人坚持得更久。”王海峰说。他的业务助理赵世奇则告诉我们,他从王海峰身上同时看到了坚持和顺势而为带来的结果。好比一个人行船,无论风向如何他都没有停下来的意思,但当顺风到来时,他本能地加大马力,终于抵达了他从出发时就预定好的目的地。
人物:你认为你或者你的团队能给未来带来怎样的变化?
王海峰:人工智能本身未来会涉及到人们生活的方方面面,就像刚才我讲起互联网+、讲起3600行。整个人工智能的技术我们会把它应用在互联网的很多产品,比如说我们现在百度在做的度秘啊、搜索啊这样的产品,而这些产品本身会影响人们生活的方方面面,每一个人都可能会用到这些产品。所以人工智能通过这些产品其实是会影响每个人的生活,改变每一个人的生活。
人物:你觉得30年后你所在的领域会发生怎样重大的变化?
王海峰:那个时候肯定会机器变得越来越聪明,但是我倒不认为到那时候机器会取代人了,而是机器会更好地帮助人,跟人协同,机器更擅长的事情机器都帮人完成了,人可以干他更喜欢干的事情。
务实与影响力
王海峰解释自己的经历时常以“我有一个很朴素的想法”开头。“我一直说,希望我做的东西能给最多人用。”今年的世界人工智能大会主席、香港科技大学计算机系教授杨强很欣赏王海峰这一点:“他是很早就看出来,就是说要创新,不能仅仅写文章,一定要做出一个真实的系统。”
这也使得王海峰成为为数不多的同时在工业界和学术界有影响力的人工智能研究者。2013年,王海峰成为国际计算语言学协会(ACL)的第一位华人主席,同时也是ACL 50多年历史上仅有的两位来自工业界的主席。研究机器学习的南京大学教授周志华向《人物》评价王海峰:“一位温和的学者,同时也是一位有前瞻力的高效的管理者,很善于在工业界领导技术团队取得突破。”
王海峰的职业生涯起点是微软中国研究院。那是1999年,李开复和张亚勤作为研究院创始人,来到中国到处寻找“最聪明的人”。李开复当时问王海峰,你学了这么多年的自然语言,最想做什么?王海峰的答案是“希望我做的东西让最多的人用”。“那你来微软就对了,我们有windows、office这么多的产品,遍及全球。”李开复说。
在微软干了15年,去年刚刚来到百度担任总裁的张亚勤对王海峰印象深刻。“他很安静,但又很有主意。”有的研究员会比较急,“急于证明自己的聪明,急着发论文什么的”,但王海峰很淡定,“十分十分扎实。”
2010年,王海峰从东芝离职加盟百度,他说后者吸引他的地方在于它所拥有的巨大平台——海量的数据以及更多的用户。“更多的原材料,可以让我的算法发挥到极限。同样一个算法,原来我只用一台机器,现在我用几百几千甚至上万台机器在跑,跑更多的数据,得到的结果是完全不一样的。”他在讲述这些的时候语调平静却掩不住当时面临极大诱惑的兴奋感。
王海峰每一个人生节点的选择都充分理性,遵循的也是一贯的逻辑。这让他讲的故事多少有些过于平实—不像人们对一名人工智能专家期待的那样酷。但如果我们换一种方式称呼这些人工智能领域的从业者:工程师、程序员甚至“码农”,也许就能理解落差因何产生。
王海峰追求影响力,但他从不愿让自己出面,“有用”的产品是他的武器。世易时移,改变世界的主角已经从浪漫的革命家、深邃的知识分子变成了务实低调的程序员们—这也许是这个时代最为显著的变化之一。
离开微软后他在香港曾有过一段短暂的创业经历,结束后他面临去海外还是留在香港的选择。那是2002年,互联网当然还没有像今天一样全方位冒着热气,但王海峰预感到了“一种趋势”—“真正有活力的、发展更快的(地方),是大陆”。
中国大陆越来越确证了他当初的判断。如今,全球十大互联网公司只剩中美对峙,而中国占据了四席(阿里、腾讯、百度、京东)。O2O在中国的火热更是远超美国——得益于中国的人口密度和城市结构。是这些令“连接人与服务”的“度秘”可以率先在中国诞生。
“我们以前是跟在美国后面的,我们做什么东西也都没什么自信,基本就是模仿、山寨。但现在不同了,中国社会发展衍生出的很多需要,在美国完全找不到范本。我们早已开始自己创造,并且做得很好。”张亚勤说,“接下来我们就要——其实我们已经开始输出了。”
“中国社会比美国发展变化更快,变化会带来很多不同的东西,这个不同的东西就会导致需要的互联网技术不同。因为这些(技术)美国并不需要,(因此)百度就会做得比美国更领先。”王海峰说。如果说整个中国是世界上最具活力的地方之一,那么他每天方圆10公里的活动区域又是其中的中心:他家住北京中关村一带,公司所在的西二旗是互联网公司聚集地,他每天所见的都是正在改变世界的年轻程序员们。王海峰感到自己身处时代的浪潮中心。他喜欢这种感觉—尽管在这家平均年龄只有26岁的互联网公司里,44岁的他已经成了一个“老人”了。
奥迪说
奥迪A6L:他是全球顶级的人工智能科学家,他的兴趣不在想象未来,而在脚踏实地地探讨通往未来的路。