阿尔法狗之父，低调的天才

2016-04-05杨扬

环球人物 2016年8期

关键词：比斯李世石阿尔法

杨扬

在赢得“事关人类命运”的一战后，哈萨比斯说：“我们只爬上了人工智能梯子的第一级”

2016年3月，哈萨比斯说在韩国

3月15日，在全世界媒体的聚光灯下，机器人阿尔法狗（即AlphaGo）的创造者戴密斯？哈萨比斯，与韩国围棋九段李世石微笑握手，留下人类历史上颇具意义的一个瞬间。

过去20年间，计算机已战胜过中国象棋和国际象棋的顶尖高手，围棋被视为人类最后的智力自留地。从计算量上来说，围棋的难度平均是国际象棋的1亿倍。

当阿尔法狗以4：1赢得这场“事关人类命运”的一战，全世界的情绪都被搅动了起来：有人为人工智能的飞速进步欢欣鼓舞，也有人担忧未来地球将被机器人控制。而这一切背后的那个人——哈萨比斯，仍然低调地沉溺于他自己的世界。他说： “看到人工智能这个深奥难懂的事情成为人人都关注的话题，这很有趣。”

阿尔法狗如何做到像人一样“聪明”

对这场比赛，哈萨比斯超级期待，他甚至在正式比赛开始前，和谷歌前CEO埃里克？施密特分别坐在阿尔法狗和李世石的座位上下了一局。

3月9日，在首尔四季酒店，大战终于开幕。第一局中，阿尔法狗一度不断吃亏，直到150手深入李世石的领地，宣告了棋局的胜利。对此，李世石十分意外。哈萨比斯也为阿尔法狗的侵略性和大胆感到意外。“李世石以好战闻名，比赛一开始，他就在整个棋盘上求战，但是没有一处是真的;而阿尔法狗也戏耍了李世石。传统的围棋程序在局域计算中并不差，但是在需要通盘视野的时候会很无力。”

每天赛况一出，哈萨比斯都会在推特上发表感想。他一边为自己的团队感到骄傲，一边为顽强的李世石喝彩。当李世石在第四局中赢了阿尔法狗之后，他发文说：“祝贺！今天他的表现太精彩了，把阿尔法狗逼入死地。”当第五局结束之后，哈萨比斯评论说：“世界上最不可置信的游戏结束了，这必将进入历史！”

阿尔法狗是如何做到像人一样“聪明”的？首先，它的核心系统是，机器学习与神经系统科学这两个领域结合起来开发的学习算法;其次，它在谷歌强大的云计算系统中，通过大量数据分析学习了3000多万步的职业棋手棋谱，再通过增强学习的方法自我博弈，寻找比基础棋谱更好的棋路。这让它有了类似人脑的功能：庞大数据库;自我学习，找到更好的解决方法;局面判断准确率接近80%。

从资深游戏迷到远离游戏

走出聚光灯的哈萨比斯，是个再普通不过的上班族。每晚他从伦敦国王十字车站搭地铁回家，那是位于海格特、背靠山顶公园的一处房子。小小的玻璃门廊、粗糙质感的白墙，门前的街道很幽静。无论多忙，他都会与家人共进晚餐，他的妻子是一名来自意大利的分子生物学家，两个儿子一个7岁，一个9岁。晚饭后，他陪着儿子玩耍、读书，哄他们上床睡觉。

这里离哈萨比斯儿时的住处也不远，在那里有很多美好的回忆。他从小就天赋异禀：4岁迷上国际象棋，两周后就赢了爸爸;6岁获得伦敦8岁以下锦标赛冠军;9岁成为英国11岁以下国家象棋队队长;13岁取得了“国际象棋大师”头衔。

1984年，8岁的哈萨比斯用自己赢得的奖金买了台计算机，“这种机器是我们脑力的延伸。通过它们，我可以创造出比按部就班的日常生活更令人兴奋的东西。”哈萨比斯开始自学编程，因为没什么零用钱，有一个夏天，他一直流连在报刊亭，翻阅买不起的计算机类杂志。

哈萨比斯的父亲是希腊裔塞浦路斯人，母亲则是华裔新加坡人，两人都是教师，而且都是“现代技术恐惧者”。但对于这个整日沉迷于游戏的孩子，他们一点也不担心，还兴致勃勃地听他分享心得。

高中毕业后，哈萨比斯就被视频游戏公司“牛蛙”的老板看中，去做游戏开发。1994年，他开发的《主题公园》——最早包含人工智能元素的游戏之一，一发布就销售了数百万份。但到了1997年，他开发的《共和：革命》《邪恶天才》市场表现却很一般。这让哈萨比斯开始反思，“90年代，游戏很有趣，也有创新性。但到了新世纪，游戏注重图像和内容，想通过游戏这扇‘后门去展开人工智能研究已经非常困难，这违背了我做游戏的初衷。”

从此，哈萨比斯这个资深游戏迷远离了游戏，甚至对现在大型多人游戏感觉失望。“我从来都无法真正融入游戏，因为虚拟人物看起来傻傻的。他们没有记忆，不会改变，也与环境无关。如果有学习型人工智能，游戏质量就能提升到新水平。”

21世纪的“阿波罗工程”

雄心勃勃的哈萨比斯想创造一个通用人工智能系统。在他看来，从智能语音助手Siri到人脸识别系统，这些预设好程序的软件只能掌握某项特定技能，属于弱人工智能。而通用人工智能系统与以往技术最大区别在于自学能力，它可以从零学起，掌握任何技能，“就好像和人类做得一样”，他称之为21世纪的“阿波罗工程”。

2005年，哈萨比斯重返校园，到伦敦大学攻读认知神经科学博士学位。“在游戏行业，我做了能做的所有一切，在成立‘深度思维之前我需要收集好必要的信息，这就是神经科学——我希望从大脑解决问题的方式中获得灵感。”他选择研究海马体，海马体是人脑中主要负责记忆和学习的部位，短期记忆都储存其中。

2016年3月，阿尔法狗与李世石对弈

哈萨比斯说，当时自己“对大脑的唯一了解就是它是个壳”。仅仅两年后，他就开创性地发现海马体和情景记忆间的联系。他证明了因为海马体受伤而患上健忘症的人，在畅想未来的时候也有障碍，因此提出：大脑中与过去的记忆有关的部分，在规划未来的时候也同样至关重要。这项研究结果被《科学》杂志列入“年度十大突破”。

2010年，哈萨比斯与发小穆斯塔法？苏莱曼、人工智能专家谢恩？莱格一起创办了“深度思维”公司。公司一创立就引起了许多大佬注意，包括特斯拉创始人伊隆？马斯克，2012年他投资了650万美元。除了通用人工智能这个大方向，“深度思维”到底在干什么，大家都不清楚。

2013年12月，“深度思维”的第一次公开亮相震惊了众人。在美国加州和内华达州交界的太浩湖畔，“深度思维”向公众展示了一款软件。这款软件并没有被编入“如何玩游戏”的指令，但通过控制键盘，观察显示器分数，经过反复试错之后，成为了一个专业级游戏高手。这证明软件可以通过神经模拟网络处理数据，像人脑一样“本能地”学习。加州大学伯克利分校人工智能专家斯图尔特？罗素感叹道：“人们根本没有想到当今的技术能达到这种水平。” 谷歌CEO拉里？佩奇也不吝赞美，这是“我多年以来见过的最惊人技术之一”。

谷歌花4亿英镑买下“深度思维”

一向对于人工智能嗅觉灵敏的谷歌，看到“深度思维”这匹黑马如何能不动心？2014年1月，谷歌完成了在欧洲最大的一笔收购，以4亿英镑（1英镑约合9.3元人民币）将“深度思维”纳入麾下，尽管当时后者尚未实现商业盈利。之后，谷歌应哈萨比斯的要求设立了道德监察委员会，制定一系列限制条款，以确保人工智能技术不会被滥用。被收购后，哈萨比斯说：“这是20年精心计划的结果。我教育经历中的每一步，我为团队雇佣的每一个人，都是为了这一天的到来。”这听起来有点像一场漫长对弈中走出的一招妙棋。

在哈萨比斯的坚持下，“深度思维”依旧留在了伦敦，而不是搬到加州山景城的谷歌总部或者其他地方。“我在北伦敦出生并长大，我非常喜欢这座城市。” 他依旧是个超级工作狂。每天，他都要工作到夜里11点多;当午夜时分到来时，他开始了所谓的“第二天”，与美国的同事进行电话会议，一直到1点多;这之后才是他自己的思考时间，通常会持续到凌晨三四点。

“深度思维”原来有50名员工，现在有来自全球45个国家的近200人，占据了伦敦国王十字车站附近一栋6层大楼。每间办公室都以天才来命名：特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。一楼有咖啡厅和会客室，桌上足球游戏机、懒人沙发等更是一应俱全。楼顶还有露台，可以观赏伦敦风景，每周五晚的楼顶聚会已成惯例。公司还有跑步协会、足球队、棋类协会。虽然互联网行业人员流动很大，对手公司也试图来挖墙脚，但“深度思维”从创建起离职率一直为零。看来，哈萨比斯把自己对人脑的理解，不但用到了开发人工智能上，也完美地用到了企业管理上。

继人工智能开发、企业发展之后，哈萨比斯还要回答第三个问题：人工智能的安全性。在阿尔法狗战胜李世石后，人们尤为关注这个问题。“人工智能距离人脑的水平仍有几十年的差距，我们才爬上了梯子的第一级。技术本身是中立的，但会受到设计者价值观的影响，因此我们要非常谨慎地思考价值观问题。”在哈萨比斯看来，说到底，这还是人类自身的问题。