人机对弈珍珑棋局 人工智能扑面而来
2016-05-14王彦彬
王彦彬
举世瞩目的围棋人机世纪大战——谷歌人工智能系统“阿尔法围棋”(AlphaGo)对决韩国高手李世石(五番赛第一回合),于北京时间3月9日12时在韩国首尔准时拉开帷幕。
继2015年10月份AlphaGo在没有任何让子的情况下以5∶0完胜欧洲冠军职业围棋二段樊麾之后,AlphaGo向李世石发起了挑战。
面对拥有众多国际冠军头衔的九段高手李世石,AlphaGo已经连下两城,取得2∶0的领先。
三万个“深蓝”
其实人工智能征服人类的智力骄傲是个漫长的征程。
1997年,IBM的“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地。这让重达1270公斤、拥有32个微处理器、每秒可以计算2亿步、计算能力达到11.38GFLOPS的“深蓝”声名显赫,轰动世界。
但在长期以来围棋AI一度举步维艰,顶级AI甚至不能打败稍强的业余选手。但是现在一台笔记本的计算能力就已经远远超越了“深蓝”,成功战胜了围棋世界冠军李世石。
人工智能正在指数级快速增长。据了解,AlphaGo计算能力是当年IBM计算机“深蓝”的3万倍。
揭秘AlphaGo
谷歌于2014年收购了英国人工智能公司DeepMind。今年早些时候,DeepMind的团队发表论文,介绍了AlphaGo击败职业棋手、欧洲围棋冠军樊麾的情况。
AlphaGo的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到“黑”;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。
不必过于惊慌
AlphaGo战胜李世石,人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
就像十多年前的“深蓝”战胜国际象棋世界冠军一样,今天,AlphaGo战胜李世石也必将引发超出围棋自身领域之外的讨论。人工智能还将在其他层面上继续碾压人类吗?传统认为人工智能不可能完成的任务是否也都将被逐一打破?人类最后是会进入人工智能的乌托邦还是被人工智能淘汰呢?
没人知道答案。但有一点毫无疑问:面对人工智能不用过度惊慌。人工智能一定会进入我们的生活,并且将极大地改善我们的生活,我们不可能躲开。