“人工智能之神”打造围棋世纪大战
2016-03-22
作为AlphaGo之父,围棋1段业余选手,哈萨比斯并没有与他亲自创造的AlphaGo对弈过,
“因为它实在太强大了。AlphaGo的学习能力很强,我完全不是它的对手。”
4岁,对国际象棋表现出浓厚的兴趣。
8岁,喜欢上编程,并编写了自己的计算机游戏。
13岁,获得国际象棋大师称号。
17岁,开发出首款引入人工智能元素的电子游戏《主题公园》并大获成功。
20岁,获得剑桥大学和伦敦大学学院的计算机科学和认知神经科学双学位。不久后,创建游戏公司Elixir,并完成关于大脑海马体和情景记忆的前沿性学术研究。
2011年,创立人工智能公司DeepMind。说到这儿,你或许可以猜出他是谁。他叫德米斯·哈萨比斯(Demis Hassabis),3月9日,由他主导研发的人工智能项目——AlphaGo,向韩国围棋九段选手李世石发起挑战。全球有一亿人通过网络围观了这场挑战人类智力的世纪“人机大战”。
挑战九段高手
“这是一场新鲜而陌生的比赛,是全新的挑战。我很难保证5比0全胜,毕竟我的对手从来不会失误。”比赛前一天的发布会上,李世石一改此前的自信满满,但依旧认为“目前人类还是比人工智能强”。
去年10月,AlphaGo就5:0战胜了欧洲围棋冠军樊麾。这一消息公开后,世界顶级杂志《自然》评论说:“面对谷歌围棋AI(人工智能),人类最后的智力骄傲崩塌了?”
人工智能早在20年前和10年前打败了国际象棋和象棋的顶尖职业棋手,但在围棋领域,一直被认为还只是业余水准。与国际象棋不同,仅靠暴力计算无法让计算机成为围棋高手。围棋的走法更为复杂,对弈过程中的判断分支十分巨大:其每回合的可能性可达250种,一盘棋可以长达150回,共有3的361次方种局面。要知道我们目前可观测到的宇宙,其原子数量是10的80次方。同时,围棋对战略和推理的要求更具有挑战性,也因此,围棋被看成是人工智能研究人员的试金石。
之前,输给AlphaGo的樊麾曾过了一段饱受责难的生活,甚至被人斥为“职业棋手的耻辱”。这一次,他希望李世石能为他“平反”。
李世石作为韩国围棋九段选手,也是近10年来获得世界第一头衔最多的棋手。截至目前,他共获得14个个人赛世界冠军,仅次于获得18个冠军的李昌镐,遥遥领先其他国家的棋手。此次“人机大战”是历史上第一次电脑挑战职业九段棋手。
事实上,哈萨比斯也是围棋爱好者。早在剑桥读书时,他曾在一个高水平围棋社团里学习围棋,并很快沉迷其中。但因为忙于编程,他没有足够时间去练习,围棋技艺仅停留在业余1段水平。他还教会了游戏公司的合伙人下围棋。彼时,正值IBM的超级电脑“深蓝”战胜世界象棋冠军卡斯帕罗夫。从那时起,他就在想有一天能为围棋写一个程序,并能战胜人类围棋大师。
家中的那只“黑天鹅”
哈萨比斯还是位国际象棋大师。年少时,他曾用国际象棋比赛赢得的奖金先后买过两台电脑ZX Spectrum 48K和Commodore Amgia。Commodore是与苹果公司同时期的个人电脑公司,曾经创造过一系列奇迹。1994年,该公司停止生产并宣布破产。他甚至将后一台设备拆开并学会了编程。
当然,不要以为光拆一台电脑就能学会编程。这背后同样需要付出超出常人的努力。哈萨比斯在青少年时期,曾花了整整一个夏天的时间,在布伦特十字站的一个报刊铺浏览那些他买不起的计算机杂志。“我是一个经常自我反省的小孩,总会想方设法把事情解决。”
出生于1976年的哈萨比斯,今年刚刚40岁。父亲有着希腊和塞浦路斯血统,母亲则是新加坡华裔。个子不高的哈萨比斯遗传了一副亚裔的面孔,架着一副方框眼镜,发际线略有后移。走在大街上,估计没有什么回头率。
不过,相貌平平的哈萨比斯可是这个星球上最聪明的人之一。他的父母都是教师,曾开过玩具店。他是家里三名孩子中的老大,妹妹是一名作曲家和钢琴演奏家,弟弟则专注于创造性写作,科技并不是家中的主旋律。
“我的父母是技术恐惧者,他们并不怎么喜欢计算机。他们就像是波西米亚人。我的弟弟和妹妹都走了文艺路线,他们没有人关注数学或科学。”他开玩笑地表示,“很明显,我就是家中的那只黑天鹅。我也不知道,我的这种个性从何而来。”
国际象棋活动组织者斯图尔特·鲁本(Stewart Reuben)在哈萨比斯9岁时就认识了他。“他当时是个小不点儿,总是非常讨人喜欢。”在鲁本看来,哈萨比斯作为一名企业家所表现出的稳重,得益于国际象棋界在智力方面的民主风气,以及长期处于成人圈子的影响。
哈萨比斯很小就开始争强好胜,最初表现在国际象棋上。很快,他又爱上电脑、人工智能和游戏,“通过它们,我可以创造出比按部就班的日常生活更令人兴奋的东西。”
21岁,哈萨比斯进入剑桥大学,之后,他又获得伦敦大学的认知神经科学博士学位。就在他就读博士期间,他梦想有一天创造出“人工智能科学家”——一个比人类科学家还要聪明的“机器人”。这一梦想使他在2011年中止博士后研究,创办DeepMind公司。三年后,他将公司以4亿英镑的价格卖给谷歌,但他的梦想还在继续。
人类智力的骄傲崩塌了?
哈萨比斯将验证“梦想”的机会交给了李世石。作为AlphaGo之父,他并没有与AlphaGo对弈过,“因为它实在太强大了。AlphaGo的学习能力很强,我完全不是它的对手。”
传统的会下棋的机器人是根据“一步棋子带来的所有可能性”来布局,导出所有可能的结果,再往前推当前这一步该怎么走。因此,“深蓝”能击败国际象棋大师卡斯帕罗夫,却无法在幼儿园游戏中胜过三岁小孩。
而AlphaGo的强大之处在于,它并非一个机械的编码程序,而是拥有“监督预判机制”,每走一步,都会考虑这种走法是不是更有前途,这是一种类似“想象力”的能力。这种思维模式,几乎和人类的直觉类似,使得AlphaGo前所未有地更像人类。
北京时间3月9日中午12点,“人机大战”首战正式开始。
围棋猜先的礼仪是,围棋界地位高或者年龄长者先抓若干白子,低段者猜对手抓的棋子数目是单数还是双数,确定先后手。面对不到2岁的AlphaGo,33岁“高龄”的李世石显然是上手。结果AlphaGo猜错,李世石选择黑棋希望能借先行主导布局。
李世石在右上角选择了激烈的作战。背着全球一亿人的期待,他或许有些紧张。一直观看实战进程的棋手常昊九段表示,不看对局者的话,还以为黑棋是AlphaGo,着法显得生硬,其后更是撑得极满。
不过,AlphaGo也下得很生硬,在棋盘上紧贴着黑棋弈出一根“棍子”,效率低下。李世石趁机在中腹围出大空后,棋局形势逆转。观战的职业棋手们一致认为,只要处理好右下的孤子,黑棋赢定了。
结果,李世石在右下角的“作战”失去了水准,本就优势有限,一下就露出败局。而AlphaGo根本不犯一点错误,着着精准。最后,李世石投子认输。
在经历了樊麾战败的短暂震惊后,围棋界的职业高手们渐渐回归理性,一致认为AlphaGo的实力仍停留在业余高手阶段,尚不具备与职业高手对抗的能力。“神猪”罗洗河九段甚至放言:可以让AlphaGo四个子。
《自然》杂志的评论言犹在耳,几个月后,AlphaGo的实力又推进了一大步,这一次,人类智力的骄傲真要崩塌了吗?
李嘉诚曾是背后股东
李世石输了第一局,但并不能说明AlphaGo的实力已经超过李。常昊说:“李世石的败因主要是心理有些失衡,开局选择激战不太自然,之后又在右下角出现莫名其妙的失误,随便怎么下也比实战结果强。”
结果,3月10日,李世石输了第二局。
3月12日,李世石又在大家紧张的期待中输掉第三局。AlphaGo以3:0的战绩提前锁定这场“世纪人机大战”的胜利。一度受挫的李世石坚持完成五局比赛,终于在13日的第四局取得首胜。
在AlphaGo取得第一场胜利时,哈萨比斯在推特上发了条推文:“赢了!!!!登月成功,为团队感到骄傲!!”整整六个感叹号,足以说明他激动的心情。哈萨比斯领导的人工智能团队到底有哪些特别之处?
一直以来,DeepMind都是AI届的强大势力。浏览他们的网站,你会看到他们的目标是“solve intelligence”,口气不可谓不大。团队成员更是个个身怀绝技。不仅是程序员,更是人类计算机科学领域的尖端研究员。他们之中还有人一边当着国际象棋大师,一边当着写代码的“攻城狮”……
公司联合创始人穆斯塔法·苏莱曼表示,DeepMind将在20年内开创出真正具有“意识”的人工智能形式,“这是我们对改变世界、让世界变得更好所做的努力。”
被谷歌收购以前,DeepMind的投资方包括皮特·泰尔的Founders Fund、香港亿万富豪李嘉诚的维港投资、一家与特斯拉首席执行官马斯克有关的信托基金,还有少年发明家尼克·达洛伊西奥的母亲。
谷歌收购DeepMind时,该公司的员工仅有50多人。目前,该公司聘请了来自全球45个国家的近200人,并占据伦敦Kings Cross一栋大楼的全部六层。“我在伦敦出生并长大,我非常喜欢这座城市,”哈萨比斯在接受《卫报》采访时表示,“我坚持留在这里:我感觉伦敦没有任何理由无法容纳一家世界级的人工智能研究机构。”
DeepMind办公楼的所有房间都以人类历史上的“天才”命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。哈萨比斯是不是某人的粉丝?“当然。”他回答,“我曾读过几遍《弗兰肯斯坦》,将这些东西记在心里很重要。”
大楼的一楼有一家咖啡厅,一个红砖风格、带冰箱的会客室,桌上足球游戏机,以及在任何世界级大公司都可以看到的懒人沙发。楼顶则是一个露天平台,可以看到漂亮的伦敦风景。全世界最聪明的人才都争相来到这里工作,尽管许多互联网巨头正在人工智能领域大举挖人,DeepMind的员工离职率仍为0。当然,其原因并非每周五晚上员工都可以在楼顶举办聚会,小酌几杯。
“我们有能力吸引最优秀的科学家。我们可以招来波兰物理奥赛的冠军,可以吸引法国顶级数学博士。我们提出的概念比获得的研究者更多。与此同时,想要加入的优秀人才也超出了容纳能力。唯一的限制在于,我们能容纳多少人,同时又不影响企业文化。”
“比任何人想象的都要好一个数量级”
当然,DeepMind的文化不仅仅是懒人沙发、免费小吃以及屋顶酒会。哈萨比斯表示,谷歌的收购并未影响他的研究路线。
一直以来,哈萨比斯很重视“创造性和直觉”。尽管他接受的是正规科学教育,但他并不认为自己是“标准意义的科学家”。他认同下围棋更多地是一种艺术,更多地需要依靠棋手的“直觉”而不是科学。正因如此,在被问到某一手为何这样下时,职业棋手的答案通常是:感觉这样是对的。
AlphaGo是哈萨比斯职业生涯中取得的最令人兴奋的成就。他并不认为人工智能会让人类生活变得危险。相反,他觉得人工智能很神奇。“这比任何人的想象都要好一个数量级。”他断言,“但对我们来说最重要的一方面在于,这不是一个基于预设规则的专家系统。AlphaGo能利用机器学习技术,通过自我教学去掌握围棋。最终,我们希望将这种技术应用至现实世界最重要的问题,例如气候建模以及对复杂疾病的分析。因此最令人兴奋的是,我们可以开始想象,这一技术下一步能解决什么问题。”
“人机大战”的胜利给哈萨比斯带来人生中另一个“冠军”。实际上,他保持着一项世界纪录,即5次世界智力运动会冠军。
这些桂冠和谷歌收购DeepMind带来的巨额财富并没有改变哈萨比斯的生活,他也没有改变自己的生活方式,每天晚上仍会搭乘地铁回家,与家人共进晚餐。他的妻子是一名意大利分子生物学家,专注于阿兹海默症的研究。他们的两个孩子分别为7岁和9岁。哈萨比斯常常与他们一同游戏和读书,或是帮助他们完成家庭作业。“以他们各自的方式来看,他们都很聪明,但他们似乎是两个极端,分别擅长科学和创造性活动。”
与其他孩子的父亲一样,哈萨比斯会抱孩子们上床入睡。而到夜里11点,许多人都准备入睡时,哈萨比斯会开始他所谓的“第二天”。与美国同事之间的电话会议总是会持续到1点。在这之后将是他的思考时间,这些思考常常持续至凌晨3点或4点。哈萨比斯表示:“这段时间里,我会进行自己的思考,包括我们的研究、我们的下一挑战,或是写一份算法设计文档。”
AlphaGo的下一个挑战,会是什么呢?
资料来源:新浪科技,《超级英雄哈萨比斯:人工智能挑战李世石幕后故事》;新华网,《AlphaGo创始人哈萨比斯:下个对手希望是中国柯洁》等