一场没有悬念的人机大战与一个悬念重重的未来
2017-06-02陈赛
陈赛
这场人机大战真正的悬念也许在于AlphaGo的未来。它还可以走多远?它还可以变得多强大?如果一个科技公司能在两三年的时间内把一个机器训练成围棋大师,是否也可以把更多的机器训练成一个律师、一个医生、一个程序员,甚至一个作家、一个艺术家?对于人类而言,这到底是福是祸?
一场没有悬念的人机大战
这是一场没有悬念的比赛。至少,谁输谁赢,根本没有任何悬念。全世界都知道柯洁会输。毕竟,我们都领教过AlphaGo的进化速度:
2015年10月,第一代AlphaGo以5∶0第一次击败欧洲冠军樊麾;
2016年3月,第二代AlphaGo以4∶1击败李世石,过去10年里最伟大的人类围棋手。
从樊麾到李世石,对人类可能是一辈子都无法跨越的鸿沟,而AlphaGo只花了5个月时间。
AlphaGo进化史
第一代,是击败樊麾的AlphaGo Fan。与Zen/Crazy Stone等之前的围棋软件相比,棋力要高出4子。
第二代,是击败李世石的AlphaGo Lee。与上一代相比,棋力高出3子。
第三代,是柯洁如今的对手,也是年初60连胜的:AlphaGo Master。相比于击败李世石的版本,棋力又再次提升3子。
在李世石之后,AlphaGo又经历了一轮新的进化:
DeepMind修补了当时与李世石决战时系统暴露的漏洞。整个系统架构经过了重新设计,神经网络从原来的12层增加到40层,而且,不再借助人类棋谱,而是完全通过机器的自我对弈来训练——通过这种自我对弈产生高质量的数据,这意味着它正在按照它的创造者德米斯·哈萨比斯最初制定的目标演化——一个能够自主学习、自我适应的智能体。
经过一年的算法结构优化,从李世石版的50个TPU(谷歌专门为机器学习而设计的处理器)并行式运算,变成由4个TPU组成“单机版”,运算量降低了90%。AlphaGo的训练时间不再以月计算,而是以周计算。
AlphaGo Lee
运行于谷歌云,耗用50个TPU进行计算
每次搜索计算后续50步,计算速度为10000个位置/秒
2016年在首尔击败李世石
AlphaGo Master
运行于谷歌云,但只用一个TPU机器
自学成才,AlphaGo自我对弈提高棋力
拥有更强大的策略/价值网络
5月23日,中国棋手柯洁(左)对战AlphaGo首局比赛在浙江乌镇举行 ,AlphaGo执白1/4子获胜
从某种角度来说,我们已经见识了新版的AlphaGo有多强大——2017新年,AlphaGo再次以“Master”的网名在各大围棋对弈网站连胜60场,击败了当世几乎所有的顶尖高手。
柯洁与AlphaGo的第一局赛后,DeepMind的首席科学家大卫·席尔瓦(David Silver)透露AlphaGo Master可以让李世石版本的AlphaGo 3个子,立刻引来全场哗然。午餐的时候,我刚好坐在一桌棋手边上,所有人都在谈论3子,全是一副下巴掉下来的表情。
这个差距有多大呢?
用柯洁的话说,“简单地解释一下就是,一人一手轮流下的围棋,对手连续让你下三步……又像武林高手对决让你先捅三刀一样……”
后来,大卫·席尔瓦特意向所有媒体写信做了更正:“新版本的AlphaGo,已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色。也因此,新版本的AlphaGo可以让旧的版本3子。但当AlphaGo与从未对弈过的人类棋手对局时,这样的优势就不复存在了,尤其是柯洁这样的围棋大师,他可能帮助我们发现AlphagGo未曾展露的新弱点。这样的衡量标准是无法比较的。”
尽管如此,我们还是疑惑,为什么还有必要再进行一次人机大战?
是谷歌重回中国市场的一次外交尝试,还是相信DeepMind的官方解释,“这是因为尽管已经连战连捷,AlphaGo仍然有继续探索的空间。我们仍然想在围棋领域继续追问:我们离最优解还有多远?怎样才是完美棋局?人类3000年的对弈没有找到最佳下法,AlphaGo可以与人类棋手共同探寻这些奥秘”。
去年的那场人机大战,AlphaGo对战李世石,用李世石自己的话说,第一局震惊,第二局无语,第三局深感无力,第四局力挽狂澜、赢回一局,到第五局再度落败时,深深叹息人类创造力的局限性。
这次柯洁与AlphaGo Master的比赛,到本文发稿之前为止,已经输了两场。但去年那种悲情的气氛已经消失了,取而代之的,是对于一种异类智能的好奇、敬畏,甚至拜服。
在比赛现场,不少九段棋手追着DeepMind的工程师,想要观摩AlphaGo的后台数据——AlphaGo每走一步对双方的胜负概率都有预估。他们急于知道,机器到底是怎么评价人类的表现的。
不止一位九段棋手表示,很愿意被讓2子,甚至3子,与AlphaGo Master对弈,以了解对方的真实水平。
每一个顶尖棋手都在苦心钻研年初AlphaGo Master扫荡棋坛后留下的60张棋谱。作为棋手,他们不得不承认,AlphaGo对围棋是有它自己的“理解”的,而且这种理解的强大与精妙之处,远远超出了人类的想象。
“很多棋,我们理解不了,我们理解不了的时候就说我喜欢这样,我个性如此……”在第一局赛事后的间歇,著名的九段棋手江铸久这样告诉我,“比如,如果不是AlphaGo,我们不会理解吴清源有多好。AlphaGo的招式是从16万张人类棋谱里选出来的,选出来很多是吴清源的招式。”
他再次谈起AlphaGo与李世石的第二局比赛中的第37手。“有人认为不够好,有人表示看不懂,当时我一看,就觉得热泪盈眶,我想,莫非是吴老师回来了?”
“只有吴清源才会这么下棋。”
AlphaGo可以走多远?
从某种角度来说,是历史选定了这些围棋手,作为第一批与“机器智能”正面交锋的人类,领悟这种智能的强大与奇妙,诡谲与怪异,并被迫重新评估自身的角色、信仰、目标、身份。
作为一名观战者,这次人机大战对我最大的触动之一,就是这些顶级的棋手对于AlphaGo没有丝毫轻慢之心。连曾经那么年少轻狂的柯洁,也在第二局战败之后这样感慨:“在AlphaGo没出现之前,我可能对棋的了解有50%。AlphaGo出现之后,我对人生看法都有巨大改变,未来不是我等凡夫俗子可以预测的。如果对围棋规则了解就算知道1%,我可能只能算是知道2%。”
是的,未来不是我们这些凡夫俗子所能预测。这场人机大战真正的悬念也许在于AlphaGo的未来。它还可以走多远?它还可以变得多强大?如果一个科技公司能在两三年的时间内把一个机器训练成围棋大师,是否也可以把更多的机器训练成一个律师、一个医生、一个程序员,甚至一个作家、一个艺术家?对于人类而言,这到底是福是祸?
事实上,AlphaGo的脚步并不止于围棋。哈萨比斯曾经说过,他创办DeepMind真正的目的是攻克人类的“智力”难题。他认为,学习和通用(general)是人类智力最根本的特征。他想发明一种“通用人工智能”(General AI)——不是自上而下,一点点教机器规则,让它从规则中理解语言、识别人脸;而是自下而上,让机器像人类一样,从观察、经验中学习,像人类一样根据环境的变化做出灵活的决策,像人类一样举一反三,执行各种不同的任务。
机器学习真的能实现这样的智能吗?
2015年,美国麻省理工学院一次关于人工智能的研讨会上,有人问乔姆斯基怎么看机器学习,他的反应是嗤之以鼻,认为不过是数据预测,一场华丽的天气预报而已。即使神经网络的翻译获得了某种完美的功能性,它仍然无法揭示语言的本质。机器也许能比人类医生更好地检测肿瘤,但机器永远不会告诉你是什么引发了肿瘤。
但谷歌一向是典型的工程师思维。对他们来说,人工智能更重要的不是关于理解心智的本质,而是关于制造工具、解决现实的问题。
事实上,根据谷歌在“人工智能的未来”论坛上(与此次人机大战同期举行)发布的数据,他们的机器学习模型诊断眼疾的准确率,甚至高于一些通过美国认证委员会认证的眼科医生。这些模型还能比放射科医生更快地在医学影像中找到肿瘤,甚至根据病理报告的文本做出诊断。
在这次论坛上,哈萨比斯还透露,AlphaGo的算法已经被应用于谷歌数据中心的节电项目,并成功节能40%。至于它的未来,可以在材料、医疗、智能手机和教育等各种领域。
“癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。那么,我们如何才能从如此庞大的数据量中筛选出正确的见解呢?而一种通用人工智能思维的方式则是自动将非结构化信息转换为可使用知识的过程。我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。”
“神经网络和深度学习的爆发是我此生所经历过的最大变革。”前来参加人机大战的谷歌董事长埃里克·施密特(Eric Schmidt)在赛后的一次对谈中这样表示。
“在谷歌内部,人工智能不只是研发人员的事情,而是贯穿整个公司的战略和技术。无论硬件领域、产品组、服务组等,都在AI的连接下交叉配合,比如谷歌翻译、谷歌照片、谷歌医疗、无人车等产品和项目,背后都有人工智能贯穿其间。”
与去年一样,在激烈的比赛间隙,杰夫·迪恩(Jeff Dean),谷歌工程师的精神领袖,也是谷歌大脑的负责人于百忙之中介绍了谷歌大脑在过去一年的技术进展。从项目上看与去年韩国首尔所见似乎没有什么大的区别,但技术进展的加速度却令人震惊。以图片识别为例,2011年,机器的图像识别错误率为26%,到2016年已经降低到了3%,比人类的识别错误率(5%)还要低。
在媒体上引发最大轰动的,是在过去9个月的时间里,谷歌彻底拆除了原先的翻译系统,引入神经网络,大幅提高了翻译的准确率,其中一些语言的准确率甚至提高了85%。随之发布的多语言互译系统,将两种语言的翻译学习“迁移”到更多的语种,比如通过中英互译的学习,就能直接把模型算法迁移到中日、日英等多语种互译方面。如杰夫·迪恩所说,机器“学习如何学习”,将是谷歌未来最重要的研究方向。
旧翻译系统:基于短语的翻译,先把句子分成一个个短语和单词,然后独立翻译,最后对翻译出来的独立短语解释进行逻辑整理,变成句子
新翻译系统:神经机器翻译,将整个句子视作翻译单元,对句子中的每一部分进行带有逻辑的关联翻译,翻译每一个字或单词时都包含着整句话的逻辑
关于人工智能,我们应该警惕的危机
当我们想象人工智能未来的时候,总是想著库兹韦尔那些关于“奇点”的古怪预言,比如不久的将来,我们会制造出比我们更聪明的机器,它们再造出比它们自己更聪明的机器,如此这般,整个世界朝着我们无法预计的巨型超智能的方向狂奔;再比如,我们很快就能将人的思维载入计算机中,在计算机的电路里获得超强的智力,甚至永生。2014年的反乌托邦电影《超验骇客》中就有一个情节受此启发,其中有个类似库兹韦尔的科学家,他的思维被人载入网络,给人类带来了毁灭性的后果。
去年,尤瓦尔·赫拉利来中国宣传他的《人类简史》时,我有机会采访到他。他谈到当今世界最重要的变化,就在于“权力和权威正在从人类转移到人工智能、到算法等,而人类却毫无知觉”。
是的,今天的人工智能与人类智能还有着本质的差异——它不具备情感、不具备欲望,所以,它不会有统治世界、奴役人类的兴趣与野心。但无人驾驶汽车不需要任何欲望或情感就能代替司机,因为按照现实世界经济系统的设定,司机的工作就是把人/物从a送到b,廉价、迅速即可。如果在这方面机器做得更出色,经济系统就会更倾向于机器,而不是有欲望、有情感的人,于是人就变成了多余。
关于人工智能,我们应该警惕的危机,不是“奇点”,不是超级智能,不是人机大战,而是当下这些因为具备了越来越强的学习能力而变得越来越聪明的平凡機器。
当然,从机器学习到机器理解,人工智能还有很远的路要走,就像一位人类学家告诉我的,“相信奇点,就像重新相信上帝一样”。但是,作为人类,我们对于这些“聪明”的机器的信任已经超过了自己,而近乎相信上帝了。
本来,上帝死后,人是一切世界意义和权威的来源,而人的感情、人的感觉、人的自由选择是所有问题最终的答案。但现在,我们正不假思索地将控制权让渡到那些距离真正的“思考”“理解”还很遥远的机器手中,甚至将整个文明置入自动化的快车道。最吊诡的是,在整个权力/权威的交接过程中,每一步都显得如此的理所当然,令人无可拒绝。
今天,再没有人用自己的头脑来做加减运算,因为计算器要快速准确得多。我们信任百度地图,远远胜过自己的方向感。学习一门新的语言听起来是一件性价比越来越低的事情,因为谷歌的翻译越来越强大了。
我们依赖机器告诉我们,哪些信息更重要、更有用、更值得关注;我们依赖机器告诉我们,应该看什么电影、读什么书、听什么歌,甚至选择什么样的伴侣;更深入一点,当面对一个生死攸关的医疗选择时,你觉得你会相信自己、相信医生,还是相信机器?当年安吉丽娜·朱莉切除两侧乳房,不是因为她自己的身体出现问题,也不是出于医生的诊断,而是机器告诉她,她所携带的一种突变基因,意味着她有7%的可能性将来会患上乳腺癌。所以,很有可能,在我们此后一生当中,关于我们的身体,那些性命攸关的医学决定,都将不再取决于你自己的感觉,甚至医生的意见,而是会由计算机、电子算法和巨大的数据库来决定。
“工作,本来应该由人来完成的,现在越来越多地由机器来完成。决定,本来应该由人凭借感觉与理性做出的,现在越来越多地由算法来做出。而且,每一步都让你觉得无法拒绝。”赫拉利说,“在此过程中,人渐渐变得无用、多余。这是为什么你知道世界正在发生非常严重的变化。”