人机大战
2016-03-18陈赛
陈赛
李世石在第四局中战胜AlphaGo的消息传来时,我已经回到北京,据现场的朋友说,现场气氛达到了几天来的最高潮。所有人都在欢呼,记者、观战的棋手、连谷歌的工程师们都在欢呼。一个多么富有戏剧性的故事。
在首尔观战的那几天,我住在仁寺洞的一个小旅馆里。每天早晨,我都照常坐在旅馆的咖啡馆里翻看当天的报纸。首尔的早春还带着冬日的寒意料峭,阳光淡淡地照进来。每份报纸的头条毫无例外都是李世石黯然认输的面孔。
每一天,前台的韩国大叔都照例为我端来早餐,笑眯眯地问道:“您觉得今天谁会赢?”
大叔是一位业余四段棋手。他从小跟着爷爷学下棋,和许多韩国人一样,他相信围棋是应该敬畏的,因为“其中隐含着我们所不知道的幽玄世界的真理”。人机大战的首战赛,他特地请了假,兴冲冲的跑到比赛现场——首尔最奢侈的四季酒店。他被挡在赛场之外,巴巴地等了三个半小时,没想到等来这样的结局。
虽然我一再告诉他,我并不真正懂围棋,但他还是努力地向我解释当天棋局的走向,以及李世石为什么会输:“你知道,前半场人和机器都犯错了,后半场机器没有再犯错,但我们李世石君……”
说着说着,竟然有点哽咽。
“但是,这就是人间啊!”他长叹一声说,“我们生而为人,生命有限,能力有限,只能带着这样的限制过下去,不是吗?”
离开韩国前,我给那位大叔留下了我的媒体证。他现在也许也在现场跟着众人一起欢呼吧。过去几天,AlphaGo以一种猝不及防的方式向世人展示了人工智能钢铁般的力量和意志,这场人机世纪对决的故事似乎要告诉我们,技术革新已经远远超过了生物进化的速度,一旦人类被征服,就再也不可能迎头赶上。但今天李世石以一场美妙而珍贵的胜局告诉我们,机器并非没有缺陷,AlphaGo每秒可以评估成千上万种可能的走法,而李世石仅仅凭借一个人的思考和天赋与之进行如此激烈的对抗,最终在第四场比赛中突破了AlphaGo的极限,这本身就证明了人类无与伦比的适应性、灵活性和创造力。
事实上,按照谷歌DeepMind的联合创始人德米斯·哈萨比斯赛前的说法,这也是创造AlphaGo出来的初衷:让机器学会像人类一样学习。
到目前为止,人类仍然是这个星球上最擅长学习的物种——李世石可以在四盘棋局里不断调整策略,并成功找到AlphaGo的弱点,而AlphaGo在此期间却没有办法做任何调整,因为机器学习需要庞大的数据和漫长的训练时间,单局棋的经验对它来说毫无意义。很多人以为AlphaGo能从与李世石的对决中学到很多东西,其实几盘棋根本无法对AlphaGo产生作用,它至少需要上千个棋局的数据和一个多月的时间,才能训练出新的版本出来。
在赛前的全球记者招待会上,曾经有人问德米斯·哈萨比斯:通过这次决战,希望向世人传递什么样的信息?
他回答说:“第一是向世人展示学习算法可以多么强大和灵活;第二则是展示人类的智慧,毕竟AlphaGo是一群非常聪明的科学家创造出来的。”
当时,没有多少人在意他的这段貌似外交辞令的回答。但直到赛事发展到后来,人们才意识到,李世石的确不是与一个聪明的机器作战,而是与机器背后几十位天才的工程师作战,这些工程师不仅利用了机器完美的计算能力,还以这种计算能力“量化”了围棋累积了几千年的人类智慧。
不知道是否出于客气,还是本能嗅到了其中的危险意味,听完哈萨比斯对于AlphaGo的介绍之后,李世石第一次收回了自己之前许下5∶0完胜的豪言。“如果这个机器真的有‘直觉,也许我的胜利不会是压倒性的。”这已经是这位一向以狂傲著称的棋手最谦逊的一种姿态了。
在这场历史性的人机对决中,世人的目光都集中在李世石和AlphaGo身上——一个是当世最伟大的围棋手,一个是全世界最好的人工智能专家花了两年时间开发出来的强大的自学习系统,以至于我们很容易就忽略了也许德米斯·哈萨比斯才是这个故事背后真正的主角。
德米斯·哈萨比斯,39岁,英国人,看上去瘦瘦小小,戴一副黑框眼镜,貌不惊人,履历却相当惊人——4岁学国际象棋,5岁参加全国比赛,13岁拿到国际象棋大师的头衔,16岁考入剑桥大学攻读计算机专业,17岁开发价值数百万美元的电子游戏《主题公园》,然后他决定在伦敦大学攻读神经学博士学位,专攻记忆与想象力,35岁创办人工智能公司DeepMind,去年被谷歌以4亿美元收购……此外,他还保持着5次获得智力奥林匹克运动会(Mind Sports Olympiad)精英赛Pentamind冠军的世界纪录。
和李世石站在一起,你立刻能发现两人相似的气场,同样的绝顶聪明,同样的恃才傲物。
哈萨比斯也曾经是国际象棋神童,4岁学棋,11岁就已经到达巅峰状态,却突然急流勇退。因为他觉得以国际象棋为职业,将所有的才华和智慧都倾注在一个游戏里面,只为了打败另外一个人,似乎是一种过于自我放纵的行为。“我想,也许国际象棋只是我的大脑所能做的事情的一个症状,而不是全部。”他这样说道。
他对自己的人生有更大的计划和野心——他想要攻克人类的“智力”难题。他想创造一种“通用人工智能”(General AI)——一套能够像生物系统一样学习的灵活、自适应的算法,仅使用原始数据就能从头开始掌握任何任务。在他看来,这是通往人工智能的唯一道路。
在人工智能领域,已经很久没有人提出要制造“人类意义上的智能”了。
“当我们坐下来建造Waston的时候有没有模拟人类的认知?”IBM的Waston开发小组的负责人戴夫·费鲁奇(Dave Ferrucci)曾经说过,“绝对没有。我们只是试图制造一台可以赢得‘危险边缘的机器。”(“危险边缘”是美国的一档电视智力竞赛节目,类似中国央视的“开心辞典”)
但哈萨比斯在建造AlphaGo的时候,是计划它能够应用于解决现实世界的问题,比如气候模型或者疾病分析。“癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。那么,我们如何才能从如此庞大的数据量中筛选出正确的见解呢?而一种通用人工智能思维的方式则是自动将非结构化信息转换为可使用知识的过程。我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。”当然,现实世界远比棋盘更复杂,现实世界没有绝对的输赢,现实世界的行为常常会导致意想不到的结果。
但这是一个像“阿波罗登月计划”一样野心勃勃的宏图大志,AlphaGo只是小小的第一步。说到随机应变、深谋远虑,还有什么比围棋更美妙的试验场呢?
20年前,哈萨比斯在剑桥大学读书的时候第一次接触到围棋,立刻就被这种游戏极致的简单与复杂给迷住了。当时卡斯帕罗夫与“深蓝”正战得如火如荼,他对他的好朋友、也是后来AlphaGo最重要的设计者之一大卫·西尔弗(David Silver)说:“如果将来我们也能为围棋设计这么一个程序那该多好。不过,为了破解围棋,我们需要一种不光会计算的人工智能,因为围棋太复杂,根本不可能总结出一套规则可以教给机器。它得会学习,甚至能一定程度模仿人类的直觉。”
简单地来说,今天的AlphaGo与当年的“深蓝”之间最大的区别就在于,“深蓝”是“教”出来的——IBM的程序员们从国际象棋大师那里获得信息、提炼出特定的规则和领悟,再通过预编程灌输给机器,而AlphaGo是自己“学”出来的——DeepMind的程序员为它灌输的是学习如何学习的能力,随后它通过自己不断的训练和研究学会围棋。人类学围棋,也是如此。
在电影《模仿游戏》中,人工智能之父阿兰·图灵以少年时代的同性恋人为原型设计了他的机器。事实上,图灵当年的想法的确是设计一个“像孩子一样思考”的机器,而不是成年人,因为他认为人类智能的秘密是学习的能力。
20年后的今天,在AlphaGo赢得对李世石的第一局比赛后,哈萨比斯在自己的Twitter上这样写道:“我们已经登陆月球。”