戴密斯·哈萨比斯:引领人工智能的“超级大师”
2016-05-13张锐
张锐
从剑桥到麻省再到哈佛,一路求学展现出的是戴密斯·哈萨比斯超人的禀赋;从电子游戏到计算机编程再到认知神经科学,破解未知彰显出的是戴密斯·哈萨比斯惊人的特质;从英国到美国再到韩国,跨洋穿越辐射出的是戴密斯·哈萨比斯过人的能量。头顶着“国际象棋神童”的光环,荣膺着“天才程序员”的美誉,拥戴着“认知神经学家”的尊称,39岁的戴密斯·哈萨比斯正携带令人憧憬的智能工程朝着未来世界注入强大的变革与改造基因,创造着人类所痴迷与渴求的科技福音。
星球上最聪明的人之一
父亲是希腊与塞浦路斯混血,母亲则是新加坡和中国混血,四国混血血统的家族生物背景似乎让哈萨比斯未出生前就获得了与人不同的天资。不过,在哈萨比斯看来,自己却是父母眼中的“另类”与“黑天鹅”。因为,与成为钢琴家的妹妹和成为作家的弟弟相比,作为家中的长子,哈萨比斯并没有像父母那样走上人文科学之路,而是对自然科学表现出了独特的钟爱与兴趣。
4岁时的一天,哈萨比斯发现父亲和舅舅在玩国际象棋,便马上对此产生了兴趣。出人意料,两周后,哈萨比斯竟然赢了父亲,而且自称棋路高手的舅舅也心悦诚服的落败。次年,哈萨比斯参加英国国内比赛,一举夺魁;再过了一年,哈萨比斯捧回了伦敦8岁以下锦标赛的冠军奖杯;9岁时,哈萨比斯成为英国11岁以下国家象棋队队长;13岁时,哈萨比斯获得了国际象棋大师头衔。当然,频繁穿梭于各大赛场和激烈角逐之余,哈萨比斯也在时常思考着两大问题:人类大脑是如何掌握如此复杂的任务?计算机是不是也能如此?
穷究答案的哈萨比斯并没有继续沿着象棋这条路走下去,而是很快将兴趣转移到了计算机上。没有向父母伸手,哈萨比斯用自己在国际象棋大赛中获得的奖金买来了两部频谱电脑,并对其进行反复的拆装;与此同时,哈萨比斯花了一个夏天的时间呆在图书馆里翻阅计算机杂志,并最终学会了编程。也正是在这个时候,人工智能初步闯入哈萨比斯的视线。不过,作为当时自己最得意的成果,哈萨比斯编写了一个黑白棋游戏的程序,而且战胜了弟弟。当然,可能哈萨比斯本人也没有想到,就在埋头编程的同时,自己却不知不觉地爱上了电子游戏。
提前两年完成高中学业的哈萨比斯被剑桥大学录取,而且像许多同年人一样在整个大学期间也没有割断对电脑游戏的爱好。所不同的是,哈萨比斯除了是一个痴迷的玩家外,还是一个游戏开发高手。在一场为游戏《太空侵略者》设计续集的比赛中,哈萨比斯获得第二名,且被一家视频游戏公司相中,也正是在这家企业的支持下,哈萨比斯设计和开发出了名为《主题公园》的游戏产品。据可靠资料表明,这是一款带有沉浸式特征的模拟现实游戏,也是最早包含人工智能元素的游戏之一。而得益于这款游戏数百万份的销量,哈萨比斯也获得了足以完成学业的全部资金,同时也愈发坚定了他的信念:人工智能将会有惊人发展。
对于哈萨比斯来讲,在读剑桥大学就读的4年期间所得到的业余收获其实并不只有游戏开发这一项。当时剑桥有一个高水平围棋社团,哈萨比斯学习围棋知识就从那里开始,只是因为忙于电脑编程与游戏开发而没有足够的时间去练习,围棋技艺也就一直停留在业余一段水平。不过,这并不妨碍他对围棋的喜爱。尤其在当时目睹了超级计算机“深蓝”与国际象棋大师卡斯帕罗夫的世纪对弈后,哈萨比斯就产生了一个有朝一日为围棋编写一个程序的冲动。
20岁从剑桥大学计算机科学系毕业时,哈萨比斯就创立了自己的电脑游戏公司“仙丹工作室”。不过,在坚持了七年之后,哈萨比斯强烈的感觉到自己走商界这条途径并不能破解有关人类大脑与计算机的许多谜团,同时公司开发的游戏也没有取得预料中的那种成功。为了寻找灵感,27岁时哈萨比斯选择了回归学术领域,在伦敦大学学院攻读认知神经科学博士学位。
攻博期间哈萨比斯研究的方向是海马体。海马体是人脑的一个区域,对方向感、记忆调取和未来事件的想象至关重要。经过研究,哈萨比斯发现,五名因脑损伤而遭受失忆症折磨的病人,他们的海马体会努力地设想未来的事情。紧接着,哈萨比斯发表了有关海马体的12篇研究论文,而且相关成果被《科学》杂志纳入“年度突破”的研究目录之中。互联网之父、英国计算机学家蒂姆·伯纳斯·李紧随其后发文评价称,哈萨比斯是这个星球上最聪明的人类之一。
获得伦敦大学神经科学博士学位之后,哈萨比斯先后进入麻省理工大学和哈佛大学分别开展“机器学习”与“深度学习”等博士后课题的研究,而为了检验自己的系列前期研究成果,在走出博士后流动站的当年哈萨比斯就回到伦敦创立了名为DeepMind(深度思维)的科技智能公司,并且成功开发出了深度学习的程序。为了让这项技术得到更广泛的应用,哈萨比斯选最终选择了围棋,目的就是望通过利用深度学习的计算机程序战胜人类围棋大师。
鱼和熊掌往往不能兼得。对DeepMind持续经营与管理了三年后,哈萨比斯愈来愈感到分身乏术。由于绝大部分精力需要投放到企业融资上,相应地实际用来做研究的时间还不到十分之一;更为重要的是,当时DeepMind并没有公开发布过任何产品,而且成立次年就发生了200万英镑的亏损。再三权衡之下,哈萨比斯作出了转让公司的决定,并很快迎来了脸谱、谷歌等科技大佬抛来的橄榄枝。不过,哈萨比斯最终选择了谷歌,原因是在哈萨比斯看来,拉里·佩奇“一直把谷歌看作一家人工智能公司”。公开资料显示,2014年收购DeepMind时,谷歌拿出了4亿英镑的真金白银,为其有史以来在欧洲最大的一笔收购,而哈萨比斯也从这笔买卖中净赚了8000万英镑。
战胜人类的“AlphaGo”
即便是将DeepMind纳入麾下,拉里·佩奇也不敢慢待至今拥有5次世界智力运动会冠军记录的哈萨比斯。除了让哈萨比斯继续担任DeepMind的首席执行官外,谷歌不仅丝毫没有改变DeepMind的人工智能开发方向,而且在资金和团队上给予了强大的支持与辅助。18个月之后,哈萨比斯构想中的结合人脑神经元与大数据的人工智能项目“AlphaGo” (阿尔法围棋)横空出世,而且哈萨比斯将2016年的首战目标锁定在了韩国著名围棋棋手李世石的身上。
公开资料显示,现年33岁的李世石从12岁时开始入段后,仅用了2年时间就跳至5段,并在夺得韩国LG杯冠军的次年直接升为六段,又仅仅用了一年,李世石先后夺得韩国最大棋战KT杯亚军和第16届富士通杯冠军,并分别因此晋升为七段和直接升为九段,此后多年,李世石一直蝉联韩国围棋大奖——最优秀棋手大奖(MVP)。另外,作为世界世界顶级的围棋棋手,李世石的战型棋风历来以“稳,准,狠”著称,并善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手。不过,按照哈萨比斯的说法,AlphaGo看中就是像李世石在围棋顶尖水平已盘踞十年甚至更久的年轻选手。
作为人机大战历史上第一次电脑挑战职业九段棋手,应当说哈萨比斯对AlphaGo最终取胜的结果并无十足的把握。在接受媒体采访时,哈萨比斯将输赢的概率确定为50:50,甚至他也公开表示过,人工智能超越人类棋手需要五年时间。然而,今年3月上旬的一周大战之后,全球无数个围棋爱好者却屏住呼吸最终迎来了令人瞠目的时刻:AlphaGo以以4比1战胜了李世石。而在第一时间得到这个消息后,哈萨比斯就在推特上发出了近似狂热的呐喊:““赢了!登月成功!”。
的确,曾经年少轻狂藐视一众前辈的李世石在赛前根本就没有想到自己会如此惨败,但在比赛中场休息时,李世石就坦言面对Alpha Go“从未如此紧张过”,而在赛后,李世石更是坦白与AlphaGo对弈之后,体力被大量透支,体重曾一度下降了7公斤。甚至李世石承认,如果再次和AlphaGo对弈,自己最多可能获得两场胜利,而这还是建立在AlphaGo博弈水平没有提高的假设基础之上的。
不知道了AlphaGo是否还会与李世石再度过招,但哈萨比斯是不会让它停下进攻的脚步的,并公开表示接下来会去中国、日本寻找高手切磋棋艺,其中最可能接受邀请的就是中国浙江丽水的天才棋手柯洁。据悉,在AlphaGo对阵李世石的不久之前,柯洁在第二届梦百合杯世界围棋公开赛中以3:2险胜李世石,获得个人职业生涯第三座世界冠军奖杯。而作为人工智能围棋的AlphaGo在战胜李世石后,排名升至世界第二,仅次于柯洁。基于此,人们预测,双雄鏖战已近在咫尺。
实际上,在与李世石对弈之前,Alpha GO已与法国“疯石”、日本“zen”等当今最优秀围棋程序进行过500盘博弈,结果Alpha GO只输了一盘,对弈胜率高达99.8%。不仅如此,去年10月Alpha GO还以5:0的战绩绝杀欧洲围棋冠军、前中国职业棋手樊麾,创造了电脑首次战胜围棋职业棋手的历史,Alpha GO也从此声名鹊起。据悉,在完败Alpha GO之后,樊麾也加入了哈萨比斯的团队,主要任务就是为Alpha GO项目提供咨询。
接下来在与人类更加顶级的围棋棋手博弈中Alpha GO能否继续旗开得胜?结果尽管充满悬念,但有几个已经存在的事实却是人们不得不关注的。从Alpha GO战胜樊麾到斗败李世石,中间仅仅相隔了不到半年时间,其棋艺的进步可谓神速。另外,自项目启动以来,程序员已在Alpha GO程序中录入了多达3000万步职业棋手的棋谱,让它自己博弈,研习棋谱,最终结果是将预测对手下一步棋落子的准确率提升到57%。不仅如此,战胜樊麾以来,工程师们还将Alpha GO的硬件从1202个CPU增加到1920个CPU。同时,击败李世石之后,哈萨比斯对外宣布,Alpha GO将不参考人类棋谱,完全自我演化三个月。至于三个月后机器会自我升级到什么水准,结果也不难想象。显然,无论是硬件装备,还是软件配备,Alpha GO已经今非昔比,人类所面对的一定不是一个简单的对手。
当然,目睹了Alpha GO出色棋艺与精彩战绩之后,人类也在更长的战线上展开自己的联想:Alpha GO能否战胜中国四川的麻将美国德州的扑克?而且人们相信这两个项目将是棋类之外电脑与人脑能够一比高下的更高层次领域。比较而言,围棋是一种透明的策略游戏,对弈双方不隐藏、不欺骗、不作弊,彼此较量的是公开透明的智力,但是麻将与德扑的透明性则差了许多,甚至其中充满了人类的欺骗、设局、隐瞒的技巧。对此,很多人认为,在麻将与德扑面前,人工智能将毫无优势可言。但是,我们不得不承认的是,像Alpha GO这样的人工智能,已经具备了从已有信息中捕捉概率并做出抉择的完全能力,譬如麻将,人工智能就能从已经打出的牌九中分析出可能的胡局,同样,针对德扑里的种种心理战,人工智能也能从以往的数据中判断出牌的可能性。在专家看来,无论透明还是不透明游戏,只要是有确定的规则和边界,在与人类博弈的过程中,人工智能最终胜出的可能性非常之大。
从“深蓝”到“阿尔法狗”
20年前,国际象棋棋王卡斯帕罗夫接到了由IBM设计的名为“深蓝”的电脑呈送的战书,原本信心满满的卡斯帕罗夫最终不得不接受残酷的结果:“深蓝”2胜1负3平胜出。输棋之后的卡斯帕罗夫认为“深蓝”表现出的智能和创造性不可思议,必有人类棋手在背后操刀,并主动发出再战的请求,但被IBM拒绝,同时IBM也拆卸了“深蓝”,致使卡斯帕罗夫至今复仇无望。
然而,“深蓝”的出现的确是人工智能历史上的一个标志性事件。10之后,超级计算机浪潮天梭以一敌五,战胜5位中国象棋特级大师;5年之前,“深蓝”同门师弟“沃森”在美国老牌智力问答节目《危险边缘》中战胜两位人类冠军。深蓝的一系列成功,既让人类必须正视人工智能的强大潜力,也让人们将眼光从国际象棋身上转向了围棋这一被视为最高也是最难的棋谱与棋局对弈之上。
一般人都知道,“深蓝”实际上就是是一台超级计算机,它装有480颗特别制造的象棋芯片,下棋程序以C语言写成,运行AIX操作系统,其计算能力在世界超级电脑中排名第259位。在与卡斯帕罗夫对弈时,“深蓝”可以预判12步棋,而前者可以预判10步,二者势均力敌。看得出,“深蓝”战胜卡斯帕罗夫依靠的就是略强于对手的“暴力”计算速度,即凭借强大的计算能力穷举所有路数来选择最佳策略。也正是如此,不少人认为“深蓝”算不上“聪明”的电脑,它可以击败卡斯帕罗夫,但却无法在幼儿园游戏中胜过三岁小孩。至于面对围棋,“深蓝”更是力不从心。
棋盘游戏在西方被视为人类顶级智力的试金石,而在中国具有2500多年历史的围棋更是被不少人视为抵挡电脑进攻的最后阵地。上下纵观横览,19×19的围棋棋盘共有361个点,理论上可能产生的局数为3的361次方种,这个数字大概是10的170次方,比已观测到的宇宙中原子数量还多;相比较而言,国际象棋则只有10的46次方。更为重要的是,正如哈萨比斯所言,在围棋博弈中,人的直观感受和洞察力可以发挥决定性作用,其中存在的变数较国际象棋复杂得多。因此,如果说在国际象棋方面电脑可以通过快速计算战胜人类,但同样的方法面对围棋却很难奏效。也正是如此,哈萨比斯与他的“阿尔法狗”最终将围棋作为了征服目标。
不错,从先前的“深蓝”到今天的智能语音助手Siri,再到人脸识别系统,都可以看作是人类在人工智能领域探索的成果,但在哈萨比斯眼中,这些只是预设好程序的软件和只能掌握某项特定技能的东西都只属于“弱人工智能”,而DeepMind所开发出的则是“通用人工智能”。所谓“通用”,就是模拟人脑神经系统创造出真正的“通用型学习机”,也就是具有自我学习、自我进化、自我提升能力以及自我解决一切问题的计算机系统,而且哈萨比斯相信“通用型学习机”正在向着人类越走越近。
去年2月,全球顶级科学期刊《自然》杂志刊登了哈萨比斯研究团队一篇论文,称“具备自学能力的人工智能软件”在电子游戏中的表现已达到人类水准。据悉,这款名为“深度Q网络”的程序可让计算机实现更接近人类的独立学习和推理能力,是世界上首个成功实现点对点通用学习的系统。研究人员让这个程序通过在玩中自学来挑战49款不同的经典电子游戏。结果显示,新程序取得了与人类职业游戏测试员相当的成绩,在多半游戏中得分与测试员非常接近。几个月后,《自然》杂志再次发表了来自DeepMind的第二篇研究论文,而这一次则是“阿尔法狗”的面世。
显然,“阿尔法狗”不仅可以通过自我学习去掌握围棋技术,而且还能通过深度学习自我发现新的战略,其中深度学习所模拟的就是人类大脑的神经网络。据此,“阿尔法狗”除了内置了3000多万步的职业棋手棋谱以供其自我博弈外,相比于人类在一年里只能下1000盘棋,“阿尔法狗”可以在一天就下几百万盘,而且只要不断电就会永不停息。也正是如此,无论是“阿尔法狗”的强大的数据处理能力,还是新增学习与增强训练能力,都可以到达人类远远达不到的境界。
进一步分析,“阿尔法狗”实际是通过两个深度神经网络和“蒙特卡洛树”搜索算法三者的组合来完成下棋并战胜人类的。两个神经网络是指“策略网络”和“价值网络”,其中“策略网络”主要用来生成落子,直接略过那些明显不该走的棋步;“价值网络”是用来评估整体局势,然后给出一个“胜率”;接着,相关数值就会反馈到“蒙特卡洛树”搜索算法中,推演出“胜率”最高的走法。“蒙特卡洛树”搜索算法决定了策略网络仅会在“胜率”较高的地方继续推演,这样就可以抛弃某些路线,不用一条道算到黑。
有人这样形象地解释“蒙特卡洛树”搜索算法:假如篮子里有1000个苹果,让你每次闭着眼睛找一个最大的,可以不限制挑选次数。于是,你可以闭着眼随机拿了一个,然后再随机拿一个与第一个比,留下大的,再随机拿一个,与前次留下的比较,又可以留下大的。循环往复这样,拿的次数越多,挑出最大苹果的可能性也就越大,但除非你把1000个苹果都挑一遍,否则你无法肯定最终挑出来的就是最大的一个。可见,“蒙特卡洛树”搜索算法的最大特点不是计算速度,而是算法优化,它不仅有效降低了搜索空间,而且抛弃了穷举法中对大量计算资源的消耗,并最终成就高胜率。
天使还是魔鬼?
没有人怀疑哈萨比斯及其旗下的“阿尔法狗”代表着的是一股无法抗拒的科技进步力量,但正如《自然》所发表的评说那样,在人类文明里,机器会扮演越来越重要的作用,代表这样的力量,人应该更多思考自己的意义。的确,虽然目前“阿尔法狗”只是作为一个深度学习程序存在于计算机中,但我们相信未来绝对不会只有一只“阿尔法狗”。人工智能在给人类创造福音的同时,所引起的担忧与恐慌也会如影随行。
著名科学家斯蒂芬·霍金预言,成功开创人工智能将是“人类史上最伟大的一件事,但不幸的是,这也可能是最后一件大事”;无独有偶,特斯拉公司创始人埃伦·马斯克则将人工智能技术的发展比作是“召唤恶魔”。 也就在去年,霍金与马斯克以及比尔·盖茨等数百名顶尖精英联名签署发表了一封公开信,表示人工智能对人类生存的威胁更甚于核子武器。科学家与企业家们担忧的是,包括通用人工智能被武器化,以及人工智能的发展达到“技术奇点”,从而带来的“智能爆炸”。在这种情况下,机器将可以迅速自我优化,其智能程度将超过人脑,从而脱离人类控制;甚至人工智能被用于军事装备的普及,如大量用来战争和杀敌,其带给人类的必然是灾难。
然而,在哈萨比斯看来,许多科学家之所以对人工智能存在偏见,就是因为他们对此并不太了解。据悉,哈萨比斯曾与霍金长谈了四小时,自此之后,霍金就再也没有公开发布过“关于人工智能的煽动性言论”。 另外,哈萨比斯认为,人工智能并没有人们想象的那样进步神速,虽然自上世纪八十年代始人工神经网络的算法基础就已经基本构建好,但由于处理器的运算能力上不去,人工神经网络的威力也不能得到完全发挥,导致从“深蓝”到“AlphaGo”整整花了20年时间。而即便是“AlphaGo”成功展示了计算系统运算能力的进步,但距离人脑水平的通用智能仍有几十年的差距,即人工智能还处于“爬上了梯子的第一级和只能玩游戏”的水平。
因此,按照哈萨比斯的观点,人工智能不仅不会让人类生活变得危险,相反能够帮助人类取得更大的进步。由于类似于“阿尔法狗”的人工智能软件在面对任何问题时完成自学,哈萨比斯认为,这有助于解决一些全世界最棘手的问题,甚至未来“超智能机器”会跟人类专家协同工作,攻克有关癌症、气候变化、能源、基因组学等方面的种种难题。据悉,作为一项创造性举动,哈萨比斯目前正同英国政府合作,利用人工智能提高英国全国医疗服务体系的效率。
当然,哈萨比斯也承认人工智能所可能导致的法律和伦理风险,但同时强调在如何降低通用人工智能可能的危害方面,DeepMind的研究处于领先。一方面,虽然DeepMind不受政府审查,但却以相当透明的方式运作,包括公司主动公开代码,并且一些研究成果定期在英国《自然》杂志上公布。另一方面,在与谷歌签订并购协议时,双方就明确承诺禁止将人工智能技术用于军事或情报;与此同时,哈萨比斯和他的同事们多次推动召开业内国际会议,发起倡议将智能技术用于善举、杜绝潜在危险。另外,DeepMind已经成立了内部的道德委员会和顾问委员会,这些委员会的成员来自多个科学和哲学领域,他们将监督通用人工智能技术未来的应用。
正如飞机并不是飞鸟,潜水艇并非游鱼一样,“阿尔法狗”也并非简单的“肉身拷贝”,而是另一种独立发展出来的心智,而当这种心智产生改变甚至颠覆世界的力量时,作为星球今日主人的人类不可能无动于衷,甚至产生些许的惊恐与慌张也属完全正常。不过,经历了互联网冲击与改变的人类真的没必要对人工智能作出过度悲观地解读,相反应当看到其必然带来的积极影响力。就像互联网构建起了人与人之间的全新沟通方式一样,人工智能则创造了人与物之间的崭新交流渠道,对于社会经济而言,人工智能将使得经济成长的传统路径得到进一步的改写,商业经济的成本得到更宽幅地削减,新经济的因子得到更快速地激活,整个社会的财富价值得以更顺畅地叠加。
我们还想特别指出,即便是人工智能真的发展到威胁人类的那一天,人类也依然还是掌控着保护自己的钥匙,那就是切断电源,让“阿尔法狗”们失去生物能力。不过,在我们拔掉了插头的同时,实际上就拔掉了人类文明的引擎,进而关闭了通向光明未来的通道,这种结果显然不是人类所愿意看到的。因此,控制与切断未来人工智能电源,与其让人类面对道德伦理风险,还不如像哈萨比斯所说的那样:人类必须制定有价值的目标与规则,并在此基础上切实地执行与坚守。