阿尔法狗之父,低调的天才
2016-04-05杨扬
杨扬
在赢得“事关人类命运”的一战后,哈萨比斯说:“我们只爬上了人工智能梯子的第一级”
2016年3月,哈萨比斯说在韩国
3月15日,在全世界媒体的聚光灯下,机器人阿尔法狗(即AlphaGo)的创造者戴密斯?哈萨比斯,与韩国围棋九段李世石微笑握手,留下人类历史上颇具意义的一个瞬间。
过去20年间,计算机已战胜过中国象棋和国际象棋的顶尖高手,围棋被视为人类最后的智力自留地。从计算量上来说,围棋的难度平均是国际象棋的1亿倍。
当阿尔法狗以4:1赢得这场“事关人类命运”的一战,全世界的情绪都被搅动了起来:有人为人工智能的飞速进步欢欣鼓舞,也有人担忧未来地球将被机器人控制。而这一切背后的那个人——哈萨比斯,仍然低调地沉溺于他自己的世界。他说: “看到人工智能这个深奥难懂的事情成为人人都关注的话题,这很有趣。”
阿尔法狗如何做到像人一样“聪明”
对这场比赛,哈萨比斯超级期待,他甚至在正式比赛开始前,和谷歌前CEO埃里克?施密特分别坐在阿尔法狗和李世石的座位上下了一局。
3月9日,在首尔四季酒店,大战终于开幕。第一局中,阿尔法狗一度不断吃亏,直到150手深入李世石的领地,宣告了棋局的胜利。对此,李世石十分意外。哈萨比斯也为阿尔法狗的侵略性和大胆感到意外。“李世石以好战闻名,比赛一开始,他就在整个棋盘上求战,但是没有一处是真的;而阿尔法狗也戏耍了李世石。传统的围棋程序在局域计算中并不差,但是在需要通盘视野的时候会很无力。”
每天赛况一出,哈萨比斯都会在推特上发表感想。他一边为自己的团队感到骄傲,一边为顽强的李世石喝彩。当李世石在第四局中赢了阿尔法狗之后,他发文说:“祝贺!今天他的表现太精彩了,把阿尔法狗逼入死地。”当第五局结束之后,哈萨比斯评论说:“世界上最不可置信的游戏结束了,这必将进入历史!”
阿尔法狗是如何做到像人一样“聪明”的?首先,它的核心系统是,机器学习与神经系统科学这两个领域结合起来开发的学习算法;其次,它在谷歌强大的云计算系统中,通过大量数据分析学习了3000多万步的职业棋手棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更好的棋路。这让它有了类似人脑的功能:庞大数据库;自我学习,找到更好的解决方法;局面判断准确率接近80%。
从资深游戏迷到远离游戏
走出聚光灯的哈萨比斯,是个再普通不过的上班族。每晚他从伦敦国王十字车站搭地铁回家,那是位于海格特、背靠山顶公园的一处房子。小小的玻璃门廊、粗糙质感的白墙,门前的街道很幽静。无论多忙,他都会与家人共进晚餐,他的妻子是一名来自意大利的分子生物学家,两个儿子一个7岁,一个9岁。晚饭后,他陪着儿子玩耍、读书,哄他们上床睡觉。
这里离哈萨比斯儿时的住处也不远,在那里有很多美好的回忆。他从小就天赋异禀:4岁迷上国际象棋,两周后就赢了爸爸;6岁获得伦敦8岁以下锦标赛冠军;9岁成为英国11岁以下国家象棋队队长;13岁取得了“国际象棋大师”头衔。
1984年,8岁的哈萨比斯用自己赢得的奖金买了台计算机,“这种机器是我们脑力的延伸。通过它们,我可以创造出比按部就班的日常生活更令人兴奋的东西。”哈萨比斯开始自学编程,因为没什么零用钱,有一个夏天,他一直流连在报刊亭,翻阅买不起的计算机类杂志。
哈萨比斯的父亲是希腊裔塞浦路斯人,母亲则是华裔新加坡人,两人都是教师,而且都是“现代技术恐惧者”。但对于这个整日沉迷于游戏的孩子,他们一点也不担心,还兴致勃勃地听他分享心得。
高中毕业后,哈萨比斯就被视频游戏公司“牛蛙”的老板看中,去做游戏开发。1994年,他开发的《主题公园》——最早包含人工智能元素的游戏之一,一发布就销售了数百万份。但到了1997年,他开发的《共和:革命》《邪恶天才》市场表现却很一般。这让哈萨比斯开始反思,“90年代,游戏很有趣,也有创新性。但到了新世纪,游戏注重图像和内容,想通过游戏这扇‘后门去展开人工智能研究已经非常困难,这违背了我做游戏的初衷。”
从此,哈萨比斯这个资深游戏迷远离了游戏,甚至对现在大型多人游戏感觉失望。“我从来都无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,游戏质量就能提升到新水平。”
21世纪的“阿波罗工程”
雄心勃勃的哈萨比斯想创造一个通用人工智能系统。在他看来,从智能语音助手Siri到人脸识别系统,这些预设好程序的软件只能掌握某项特定技能,属于弱人工智能。而通用人工智能系统与以往技术最大区别在于自学能力,它可以从零学起,掌握任何技能,“就好像和人类做得一样”,他称之为21世纪的“阿波罗工程”。
2005年,哈萨比斯重返校园,到伦敦大学攻读认知神经科学博士学位。“在游戏行业,我做了能做的所有一切,在成立‘深度思维之前我需要收集好必要的信息,这就是神经科学——我希望从大脑解决问题的方式中获得灵感。”他选择研究海马体,海马体是人脑中主要负责记忆和学习的部位,短期记忆都储存其中。
2016年3月,阿尔法狗与李世石对弈
哈萨比斯说,当时自己“对大脑的唯一了解就是它是个壳”。仅仅两年后,他就开创性地发现海马体和情景记忆间的联系。他证明了因为海马体受伤而患上健忘症的人,在畅想未来的时候也有障碍,因此提出:大脑中与过去的记忆有关的部分,在规划未来的时候也同样至关重要。这项研究结果被《科学》杂志列入“年度十大突破”。
2010年,哈萨比斯与发小穆斯塔法?苏莱曼、人工智能专家谢恩?莱格一起创办了“深度思维”公司。公司一创立就引起了许多大佬注意,包括特斯拉创始人伊隆?马斯克,2012年他投资了650万美元。除了通用人工智能这个大方向,“深度思维”到底在干什么,大家都不清楚。
2013年12月,“深度思维”的第一次公开亮相震惊了众人。在美国加州和内华达州交界的太浩湖畔,“深度思维”向公众展示了一款软件。这款软件并没有被编入“如何玩游戏”的指令,但通过控制键盘,观察显示器分数,经过反复试错之后,成为了一个专业级游戏高手。这证明软件可以通过神经模拟网络处理数据,像人脑一样“本能地”学习。加州大学伯克利分校人工智能专家斯图尔特?罗素感叹道:“人们根本没有想到当今的技术能达到这种水平。” 谷歌CEO拉里?佩奇也不吝赞美,这是“我多年以来见过的最惊人技术之一”。
谷歌花4亿英镑买下“深度思维”
一向对于人工智能嗅觉灵敏的谷歌,看到“深度思维”这匹黑马如何能不动心?2014年1月,谷歌完成了在欧洲最大的一笔收购,以4亿英镑(1英镑约合9.3元人民币)将“深度思维”纳入麾下,尽管当时后者尚未实现商业盈利。之后,谷歌应哈萨比斯的要求设立了道德监察委员会,制定一系列限制条款,以确保人工智能技术不会被滥用。被收购后,哈萨比斯说:“这是20年精心计划的结果。我教育经历中的每一步,我为团队雇佣的每一个人,都是为了这一天的到来。”这听起来有点像一场漫长对弈中走出的一招妙棋。
在哈萨比斯的坚持下,“深度思维”依旧留在了伦敦,而不是搬到加州山景城的谷歌总部或者其他地方。“我在北伦敦出生并长大,我非常喜欢这座城市。” 他依旧是个超级工作狂。每天,他都要工作到夜里11点多;当午夜时分到来时,他开始了所谓的“第二天”,与美国的同事进行电话会议,一直到1点多;这之后才是他自己的思考时间,通常会持续到凌晨三四点。
“深度思维”原来有50名员工,现在有来自全球45个国家的近200人,占据了伦敦国王十字车站附近一栋6层大楼。每间办公室都以天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。一楼有咖啡厅和会客室,桌上足球游戏机、懒人沙发等更是一应俱全。楼顶还有露台,可以观赏伦敦风景,每周五晚的楼顶聚会已成惯例。公司还有跑步协会、足球队、棋类协会。虽然互联网行业人员流动很大,对手公司也试图来挖墙脚,但“深度思维”从创建起离职率一直为零。看来,哈萨比斯把自己对人脑的理解,不但用到了开发人工智能上,也完美地用到了企业管理上。
继人工智能开发、企业发展之后,哈萨比斯还要回答第三个问题:人工智能的安全性。在阿尔法狗战胜李世石后,人们尤为关注这个问题。“人工智能距离人脑的水平仍有几十年的差距,我们才爬上了梯子的第一级。技术本身是中立的,但会受到设计者价值观的影响,因此我们要非常谨慎地思考价值观问题。”在哈萨比斯看来,说到底,这还是人类自身的问题。