APP下载

改变围棋的七天

2016-04-05海舢

南方人物周刊 2016年8期
关键词:胜率棋手人机

海舢

对33岁的韩国棋手李世乭而言,过去二十多年的围棋职业生涯中积累的人气和关注度,恐怕都没有3月9日到15日一周的时间高——如果将视线扩展至全球范围,这一周内,全世界有过亿的人关注了这场人机大战——一方是过去10年人类围棋的最强者李世乭,一方是谷歌开发的围棋AI(人工智能)翘楚AlphaGo。

这场五局制的比赛最终以李世乭1比4落败而告终,事实上,前三盘AlphaGo即直落三局宣告了比赛胜利,只是根据双方事前商议,必须下完五局。

真正的明星是AlphaGo。它的表现让职业围棋选手大跌眼镜,赛前围棋圈内普遍对李世乭获胜抱有信心,其中多数人都坚信李将以5比0的比分零封AlphaGo。

“AlphaGo是个实用主义者”

围棋起源于中国,是一项充满魅力的智力游戏,规则简单,棋子之间没有等级关系,平和之下的战争,静默之下的杀机,精确与模糊,虚无缥缈与锱铢必较,普遍认为,这是一项充满着东方智慧的游戏,非常倚重直觉与模糊思维。“中国人经常讲条条大路通罗马,西方人考虑哪条最近,你别跟我讲条条通罗马。”在原中国棋院院长王汝南看来,围棋有很多模糊的东西,很多是凭一种直觉,确实是东方文化的产物,“西方人干什么都有个定性定量的思想,一定要找到最好的一手。”

1997年,IBM的人工智能深蓝就曾打败国际象棋世界冠军卡斯帕罗夫,在大多数用来考察人类智慧的游戏中,如国际象棋、拼字游戏、奥赛罗棋等,机器都能毫不费力地击败人类。唯独围棋,能让人类保持最后一点骄傲。

这是因为围棋比国际象棋要复杂得多,即使是最强大的超级计算机,也缺乏在合理的时间内分析出每种走法可能的结果的能力。国内电脑围棋顶级高手“本手”的设计者、北京邮电大学的刘知青教授曾说,“相比而言,象棋的复杂度是1048,而围棋的19路盘比象棋复杂10122倍。这是个什么概念呢?围棋相对于象棋比整个太阳系相对于单个原子核更复杂!”

更重要的是,围棋在对弈过程中,有厚薄、味道、形状等各种概念,换句话说,高手常常要依靠直觉来判断这些很难量化的东西。而直觉这类模糊判断一直是人工智能发展的难点。

正是由于这个原因,近二三十年,人工智能在多个智力游戏领域一项一项地将人类选手拉下马,却始终无法在围棋项目上攻克人类。1990年代,曾有日本棋手宣称计算机要在围棋上战胜人类,至少要用一百年。事实上,多年来,哪怕面对业余高手,围棋人工智能都难求一胜。

但谷歌下属的DeepMind公司开发的这款围棋人工智能AlphaGo,进展之大出人意料,其思考更接近人类, 真正实现了从“计算”到“智能”的超越。

严格地说,颠覆性的测试结果至去年10月才出现,生于中国的欧洲围棋冠军樊麾职业二段,在5局较量中被AlphaGo零封,只不过,当时还是这款围棋人工智能的内部测试。

各国职业选手都高度关注这场人机大战,中国的常昊九段也不例外。“AlphaGo的平衡感非常好,曾经以为不易量化的判断是其弱点,但实际上并非如此,它的大局观非常好。”

棋圣聂卫平九段赛前曾预测李世乭5比0胜,但第一局的结果就让他非常震惊。几局下来,他对AlphaGo的评价是,“布局有职业六七段水平,而中盘有十三段的水平。”

棋评、文字与棋力俱佳的李喆六段称,“对于我而言,这一场人机之战给我最大的震撼来自于棋谱。AlphaGo下出了许多完全在人类棋手经验之外的着法,这些着法在目前尚不能得到人类棋手统一的理解。”

“但是,我隐隐读到了这些着法背后壮美的天地,这壮美天地当然不是AlphaGo所创造,而是有四千多年历史的围棋本身所自有的丰富与辽阔。AlphaGo并不是解开了围棋之谜,它离穷尽围棋还有非常远的距离,它只是向我们展开了这样一个新世界。我们需要用多久才能理解?或许一年、五年、十年……但我相信,人类一定能够用理性的方式去不断地理解这些数据给出的信息,AlphaGo的出现恰恰证明了人类理性的重要价值。”

“AlphaGo是个实用主义者,”柯洁九段说。这位19岁的中国棋手目前排名世界第一,在与李世乭的10次正式比赛中8胜2负。李喆进一步说明,AlphaGo追求的不是最优的下法,而是追求在它看来胜率最高的下法。AlphaGo的算法运用了神经网络加蒙特卡洛算法,蒙特卡洛算法给出搜索之后的胜率评估,然后智能会根据这个胜率来选择落子点。这就是它在对局中有一些在职业棋手甚至业余棋手看来明显失误的着法的原因。在它看来,或许这根本不是失误。

留住尊严

AlphaGo前三局零封李世乭后,顶尖高手们对其棋力的判断已经普遍达成一致:超越了所有的人类。大家都绝望地认为,一盘比一盘强的AlphaGo将不会再给李世乭机会。“大家只是感情上希望这位勇敢的胜负师赢下一盘,留住一点自己的尊严。”知乎围棋达人高飞龙说。

李世乭没有让人们失望。没有胜负包袱的他为荣誉而战,终于迎来了“人机大战”的首次胜利。与前几局相比,李世乭此局更多次陷入了长时间思考,导致耗时过多。在比赛进行到两个半小时后,他仅剩下17分钟,比AlphaGo剩余时间足足少了一个小时。但随后,他祭出白78“挖”妙手,一场“逆袭”之战也由此开始。AlphaGo被李世乭的“神之一手”下得陷入混乱,走出了黑93一步常理上的废棋,导致棋盘右侧一大片黑子“全死”。此后,AlphaGo判断局面对自己不利,每步耗时明显增长,更首次被李世乭拖入读秒。最终,李世乭冷静收官锁定胜局。

最后一局,李世乭虽然也告败,但在行棋内容上并非完败,而是让AlphaGo也暴露出诸多问题手。这两局,可谓打破AI神话的两局,AlphaGo有弱点,并非无懈可击。

综观这五局棋,常昊九段认为李世乭并没有发挥出自己的优势,而且这位33岁的韩国棋手也过了自己的黄金时期。这次全球瞩目的人机大战,给了他巨大压力。但无论如何,李世乭都让人尊重,这次对局对职业棋手乃至人类认识AI围棋具有重要意义。放在几百年的时间段来看,这次人机对弈都是具有里程碑意义的重大事件。

“李世乭面对AlphaGo,并未因5个月之前的棋谱而有丝毫轻视,他做了非常充分的准备。他抛开人类的偏见和自负,试图理解AlphaGo运算的机理,并找出其中可能存在的弱点。”李喆说,在比赛伊始,他就对AlphaGo可能存在的弱点进行了直指要害的攻击,并且在失败后迅速调整,继而展开了第二次、第三次针对性攻击。正是他的策略针对性,使人们更好地理解了AlphaGo的强度和特点,以及不同于人类的决策模式。他在第二局中就已经找到了足以在中盘接近甚至抗衡AlphaGo的布局策略,使人类第一次见识到AlphaGo梦幻般的后半盘。”

在俞斌九段看来,如果AlphaGo改进成一个可以装在笔记本电脑中的软件的话,对围棋的学习、培训、职业化的路径都会有巨大影响,因为提高围棋水平的最重要手段就是同高手多下棋。

今后,围棋AI说不定可以加入人类职业比赛的体系中来,或者自已建立一个比赛体系,这些都很有想象空间。

常昊一方面表达了某种担忧——即人类顶尖高手负于计算机后人们对这项智力运动的“祛魅”。另一方面,他又说,围棋不仅是胜负的游戏,围棋也是一种文化、一种修为。这五盘棋对围棋的推广普及非常有帮助,特别是在欧美地区的传播,人们在领教科技魅力的同时,也领会了围棋的魅力。

猜你喜欢

胜率棋手人机
人机“翻译员”
一种生成残局数据库的倒推算法
从内到外,看懂无人机
基于预期收益策略与UCT的德州扑克算法
2019年下半年男子棋手等级分
“人机大战”人类智慧遭遇强敌
未来深空探测中的人机联合探测
2014—2015年中国女子篮球职业联赛单节得失分与比赛结果相关性分析
90后棋手走在路上
CBA球队主客场胜率及得失分与比赛结果排名的相关性研究