一场胜者退役的棋局
2017-06-12姚胤米
姚胤米
当发现自己曾经的意识、认知、抉择都是错误的时候,一如既往错下去,还是给自己重新开始的机会。
步步紧逼
他的右手握成一个空拳,紧紧堵住自己的嘴巴,两根眉毛皱得马上就要连在一起,他揉揉眉头,一绺一绺地把头发揪起来,左手边的蓝色计时器上就这样走掉了两分钟。
柯洁一向下棋很快,小时候,父亲柯国凡希望他深思熟虑后再落子,曾经吓唬他:“再下这么快,我就用牙签戳你的手。”但AlphaGo比他更快,对局中,这位當今世界排名第一的棋手多次陷入长时间思考。终于,他把头从臂弯里抬起,抓起棋罐里的一颗白子。
AlphaGo紧追一子,仅用了三十几秒。
5月底的浙江乌镇,早晨常常飘着小雨,细密的雨丝中,19岁的围棋世界冠军柯洁出现在世界互联网大会的会展中心—这是他与AlphaGo对弈的“战场”。200多家媒体记者守候在此,每个比赛日,柯洁通过安检的照片都会成为“围棋峰会媒体群”里议论的焦点。
距离上一次围棋获得如此的举国关注,已经过去了近30年,那还是1980年代中日围棋擂台赛的时候。因为这次比赛,新中国成立以来的棋圣、天元、名人、新人王,从聂卫平时代到现代最年轻的世界冠军,大多到场,相聚于此。长达四五个小时的对弈横跨午饭时间,在餐厅里,记者们一边用餐,一边开着VPN,观看比赛直播,棋手们则在餐桌旁聊着上午的棋局。
5月27日,柯洁与AlphaGo的最后一场对局,此前他已经连输两场。“希望柯洁今天能够坚持到午饭后。”一位棋手说。柯洁做到了,但那天下午1点08分,他情绪失控了,突然起身离席,一个人走到摄像机拍不到的布景板后,小声啜泣起来,声音越来越大。
十几分钟过后,柯洁重新回到棋盘旁边,他抹了抹眼角,紧紧抿住嘴, 继续下了20分钟,最终拿起两枚棋子放到了棋盘的一角—投子认输了。
赛后发布会上,柯洁起身鞠躬,声音哽咽,不住叹气,神态间已经不是一年前那个“管你是阿法狗还是阿法猫”的狷狂少年了。“虽然很不甘心,但坐在对面的我最终只剩下绝望。”比赛结束后的第三天,柯洁在某问答平台上感慨:“科技真的太伟大了。”
面对面与一个无论如何也打不过的对手强行较量的痛苦,世界上恐怕只有李世石最能理解。
2016年3月,AlphaGo第一次在世界面前公开亮相,于韩国首尔挑战韩国知名棋士、世界冠军李世石九段。那是一场五番棋比赛,赞助方开出的奖金是100万美元,很多中国棋手听说后都觉得“李世石发财了”,因为在当时,围棋界普遍认为,人工智能想要攻克围棋,至少还需要10到20年。
“当时的人工智能没有突破围棋最大的一个瓶颈,围棋没有一个直观的目标。像国际象棋你就是对着那个老将过去了,围棋它是一个很虚的,最讲究的一个词叫中庸。如果就是说我拿到了50.01%,你拿49.99%,没关系,我只要赢你那么一点点就可以。它本身的变化之多,是别的项目没法比拟的。”国家围棋队领队华学明告诉《人物》记者。
早在2015年10月,AlphaGo就曾与欧洲围棋冠军樊麾对弈,那场比赛樊麾以0︰5输了,棋手们普遍认为樊麾没下好,甚至可能故意稍微下得比较松,没有引起足够的警惕。这样的错误李世石不可能犯。
可出乎所有人的意外,李世石以1︰4输了比赛。第一局比赛结果刚刚出来,中国棋院办公室的电话就被打爆了,“就好像是要百米赛跑一样,一会儿来接这个座机,一会儿就跑到训练室去看训练室的那个棋。”华学明回忆说,“我想全世界都会记住这么一天,对围棋是个颠覆性的。”
震惊之余,棋手们期待与AlphaGo的正面较量,或许李世石的发挥并非完美,机器本身也存在计算漏洞。
“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?”彼时,年仅18岁的世界冠军柯洁在微博上喊话,“AlphaGo赢得了李世石,但赢不了我。”
2016年12月30日,第二代AlphaGo以“Master”为名出现在中国的两大在线围棋对弈网站野狐网、弈城围棋上,以60盘30秒一步的快棋,连续击败了包括聂卫平、柯洁、朴延桓、井山裕太等在内的世界顶尖棋手。1月3日,对阵落败后柯洁突发急性肠胃炎,人生第一次住院了。在接受《人物》记者采访时,柯洁的父亲柯国凡说,当时感觉到儿子压力的确有点大,“开始很想有机会赢,后来发现觉得这个机会那么渺茫,很难找到弱点。”
棋手周睿羊第59场出战。那时他们已经意识到对手不可能是人类—每步棋都在5秒之内落子,人不可能做到这一点。周睿羊向《人物》记者描述与AlphaGo对弈时的感受:“它没有绝对的风格,它其实就是均衡嘛,它的每一步棋可能是下在全局效率最高的地方,它的每一个子都会发挥它的作用,这就是它厉害的地方……就是有一些你认为是坏棋的地方,它偏偏就这么下了,而且就是这种招法就随随便便地好像就把你赢了。”周睿羊说,越高水平的棋手越能体会到它有多强。
棋手古力在微博上用了一个类比形容Master带来的震撼:“多年后的某一天,当你发现自己曾经的意识、认知、抉择都是错误的时候,你会一如既往地错下去,还是否定自己,给自己重新开始的机会呢?致最好的时代or最坏的时代!”
自从AlphaGo战胜李世石后,柯洁就闭门研究了大半年的围棋软件,这次,他准备了一个星期的“最后一招”,因为生病没有机会用上,他做好了之后与AlphaGo单挑的准备,“我将尽我所有的智慧终极一战。”他在微博上这样说。华学明有些担忧。1月11日,和柯洁父母一块吃饭时,她嘱咐了一句,“你可别让柯洁走火入魔了。”但那时,这位曾经战胜过日本老牌超一流的女棋手,也对人类的胜利抱有一丝希望,AlphaGo虽然赢了60盘快棋,但“我们慢棋不见得下不过”。
坚守
5月23日,柯洁与AlphaGo三番棋比赛的第一天。
正式比赛前半个小时,刚刚出席完开幕式的柯洁一个人待在二层的专属休息室里。华学明有点担心他,特地去探望。门打开时,她看到柯洁靠在椅子上闭目养神,看起来精神不太好。作为领队,华学明知道过去一段时间里,柯洁经常一个人研究棋谱,“再怎么的在大眾面前,他是一个谜或者他是一个巨星一样的,但是实际上来说他还是一个小孩。”
她宽慰柯洁,有人希望你输,有人希望你赢,任何的关注,其实跟你本身都没有关系,顺其自然,自己做好就行。柯洁听了没有说什么。
自从4月10日中国棋院与谷歌联合宣布这次围棋峰会议程后,网络舆论对柯洁充满质疑:明知道这场比赛会输,为什么还要参加。这也成为备赛期间,最让柯洁心绪不宁的压力。5月22日,柯洁接受新浪体育的赛前最后一次视频专访,他这样解释自己的赴战理由:“大部分人觉得我下这个棋没有意义,但是我是一名棋手,我就应该有奋斗拼搏的精神,所以我觉得我不能怂。”
这位曾经因直爽敢言而出名的年轻棋手也早就对比赛的结果有了一定的预期,“我自己也知道我这次会非常艰难,但我不希望我承认自己会输,我觉得能让我服它的方法就是在棋盘上狠狠地摁倒我,我觉得只要这样,我希望我自己就算抛开胜负,也要下出精彩的棋局,给它一点压力吧。”
柯洁是有备而来的。
第一局,开局第七手(即第七次落子),柯洁采用了AlphaGo的特色着法—在棋盘左上角点了一个“三三”。这是AlphaGo非常喜欢用的招数。在19×19的围棋棋盘上,“三三”处于整个棋盘相对角落的位置,在传统观念里,点“三三”以后,容易让对方形成厚势,对自己造成威胁。这一步被视为不适合在棋局初期使用的着法,却是AlphaGo开局的标志性下法。如今,柯洁“以彼之道,还之彼身”进行反攻。
即便使用了这样具备“针对性”的打法,整场比赛还是有些不温不火,用华学明的话说,“根本就没见血”。最终,柯洁以1/4子负于AlphaGo—这是在中国围棋规则下双方之间最小的差距,但在聂卫平看来,“这是AlphaGo一再退让的结果”,这位被誉为“棋圣”的中国围棋界老前辈觉得,“这非常恐怖。柯洁也尽了努力,但实在下不过人家。”
毕竟,与人类缓慢进步的速率相比,过去一年,AlphaGo的进步堪称飞速。据DeepMind团队介绍,新版本的AlphaGo除了与欧洲围棋总冠军樊麾二段对弈之外,还进行了大量的自我对弈训练,训练数目达到千万级。
千万级,这是任何一个人类棋手穷尽一生都难以企及的数字。获得过3次世界冠军的常昊九段说:“吴清源大师一生也只下了8万盘棋,我大概正式比赛有1000盘。”柯洁更少,正式比赛只有大概300多盘。
DeepMind首席技术官大卫·席尔瓦在比赛第二天的公开演讲中提及,新版的AlphaGo和去年与李世石对弈的版本相比,可以让其3个子。这意味着,“假如用一个数字来比喻的话,如果100是满分的话,3个子,就等于是我跟你考试之后,我让了你差不多快70分了。”曾与古力同属“国少三剑客”的棋手胡耀宇八段向《人物》记者解释。但他也和许多棋手一样,认为新版AlphaGo还做不到让人类棋手3个子。
巨大差距让柯洁的认知更加清醒:“我觉得人类的姿态肯定是要放低的,它真的是太厉害了。它很多棋的思想是,它对目的敏感度远超于人。以前那个版本还很像人类下的棋,现在的版本就很仙。”5月22日,他在赛前最后一次视频采访中这样说。
或许正是因为这份确切的差距,正式比赛前的最后一个深夜,柯洁在微博上宣布,不出意外的话,这将是他与AlphaGo的最后三盘棋。
“人工智能发展速度太快了,它每一个版本的进步都是巨大的。我相信以后它会更加完美,越来越强,而人和它的差距仅靠自身努力是不能够弥补的。”第一场赛后新闻发布会上,柯洁向媒体解释为什么要做出这样的决定。在他看来,如果此时不能打赢AlphaGo的话,“未来和AI对弈赢的概率无限接近于零,这个太痛苦了。”巧合的是,另一位曾经的“人机大战”主角也在3月份的一次采访中说:“以后再也不会和人工智能下棋。”
李世石和柯洁,这两个被AlphaGo公开挑战的职业棋手都被外界视为守护人类在围棋上“最后的希望”,这让两次人机大战都不可避免地带有一定的“末日英雄”色彩。
可DeepMind创始人兼CEO戴密斯·哈萨比斯却从来就没有把人工智能放在人类的对立面,在他看来,AlphaGo的开发者们是和棋手一起探索围棋的未知世界,“就像是从前人们用哈勃望远镜探索宇宙”,这位被誉为“世界上最聪明的人”之一的科技神童说。
第一局比赛结束后,尽管输了棋,但是柯洁看上去心情不差。赛后,他和朋友连笑一起去钓鱼、射箭、摘枇杷,还特地带了一些枇杷回酒店,“给爸爸吃,老爸喜欢吃。”他的状态看上去很轻松。
“阿老师”
与一年前AlphaGo给围棋界带来的冲击相比,职业棋手已经接受了人工智能的到来。曾经被戏称的“阿尔法狗”有了属于他的尊称,“阿老师”。研究“阿老师”的棋谱成为棋手们日常训练的重要一环,“他们现在每天比较感兴趣的就是,一会儿就说研究一下,这招,这是AlphaGo,就哄堂大笑。”华学明说。
使用人工智能的招数已经成为当下棋手间普遍流行的打法。回溯围棋发展历史,棋界一直处于一种“缓慢进化”的节奏中。即便是围棋大师吴清源、“石佛”李昌镐这些曾经引领过时代的棋手对于棋界的影响也远不如AlphaGo来得广泛、彻底和猛烈。
周睿羊算是率先把“阿老师”的招数应用到实际比赛中的人。在“阿老师”的启示下,这个25岁的年轻棋手觉得自己的思路更开阔了,“很多棋不能光是盯在一个小的地方,要往更大的地方看,从全局考虑。”这让他在之后的数次比赛中屡屡得手,被棋界调侃为“Alpha羊”。“除了柯洁,就他最难对付了,实在是太强了。”曾经的中国围棋领军人物古力这样评价。
28岁的棋手陈耀烨九段在本次乌镇围棋峰会上,参加了对阵AlphaGo的团体赛。他告诉《人物》记者,棋手们研究AlphaGo的棋谱,更多是研究它前半盘的着法,“主要是它的棋谱到后半盘的时候,基本上都胜负已分了,不像前半盘,确实它的很多着法给我们带来了一些新的、应该是革命性的想象力吧。”
这种“革命性的想象力”指的是AlphaGo下棋的自由度。诸如开局点三三、高拆拆四、局部的大飞守角直接撞上去……类似下法在人类之前的比赛中比较少见,但在AlphaGo的操作下,这些罕见的招数在全局中发挥出了极大效率,从这一层面而言,AlphaGo告诉棋手,“没有什么棋是不能下的。”
不同于AlphaGo基于全局的胜负概率判断而落子,人类棋手在尝试使用“阿老师”的招数时,必须在自己的理解和风格上进行判断。这就是反复被棋手提及的“下围棋的直觉”,也是在他们看来,人类棋手对弈时体现的“人性温度”。
柯洁在5月22日的长微博《最后的对决》中评价自己的机器对手:“可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言……它的热情—也只不过是运转速度过快导致CPU发热罢了。”
正式比赛时,帮助AlphaGo落子的“人肉机械臂”—DeepMind工程师黄士杰博士也将这种“机器的冰冷感”发挥到极致,6个多小时的对弈中,坐在柯洁对面的黄博士几乎全程面无表情,甚至可以不喝水、不上廁所。曾经坐在黄博士对面的李世石甚至在第一次人机大战后的一个月,还梦到黄博士面无表情地坐在自己对面,因而惊醒。
5月25日,柯洁对AlphaGo的第二局,前100手,DeepMind的后台数据一度显示两人之间的胜负差率相差无几。
一旁的研究室里,其他棋手和聂卫平、王汝南、华以刚等老前辈同步摆棋研究,下到最紧张的时候,在开着冷气的房间里,周睿羊把外套都脱了。午饭时间,聂卫平等老棋手没有一个舍得下楼吃饭,都紧紧地盯着棋盘。
尽管第二局比赛柯洁还是输了,但这是人类第一次如此接近AlphaGo的水平。虽然AlphaGo本身只是一个由数万行代码构成的程序,可开发出它的工程师却是与柯洁、李世石等棋手一样的血肉人类。持续关注着后台的工程师们面对这一数据内心振奋,AlphaGo之父戴密斯·哈萨比斯迫不及待地发了条推特:“太难以置信了!”某种程度上可以理解为,这是寄托在AlphaGo身上的“人性”。
一别两宽
柯洁曾经的教练、从事在线围棋创业的王煜辉七段认为,AlphaGo的出现让更多的人关注到围棋,过去一年,报名学习围棋的小学员里,至少有70%-80%是因为家长看了AlphaGo的新闻。
与老一辈不同,如今年轻一代的棋手在训练时,更加注重技术性和计算力。一方面,大量的网上训练增加了训练强度,强化了棋手的胜负观。同时,赛制的变化也需要他们依靠快速计算获取时间上的优势。“年轻的一代,更多的,我跟你讲,有点AlphaGo的意思。”年逾70的中国围棋协会主席王汝南对《人物》记者说。
缩短比赛用时已是棋界的普遍趋势。过去,一场比赛可以下四五天,有一次电视台想要转播,结果不能确定比赛时间。为了适应现代节奏,让比赛更激烈、具有可观性,现在一局棋每人一般在3小时左右结束,而且每局比赛之间的间隔也缩短了。“他就不能像以前日本那样,宽松的时间,又有休息的时间,那他可以慢慢地去琢磨这个棋应该怎么下。”胡耀宇说。“大家到后面呢就偏向计算,然后看谁算的快,时间上就占(优势)。因为到后来没有时间,你计算不过来啊,所以那一定要加强速度,强调计算的速度,强调你的这个速度要快,这样你的体力也能节省下来。”
这看上去的确与追求胜利为结果的“阿老师”颇为相似,只不过AlphaGo下棋追求取胜概率的最大化,不拘一格,人类则受限于计算力,不敢轻敌,必须全力拼杀。
在胡耀宇看来,现在的棋手不仅需要学习AlphaGo的着法,还要将这些着法与人类历史对局中的着法融会贯通地学。“更多的不是拼计算力了,那有可能是理解力了,那这个时候,大家对文化的需求就更大了。不然的话,你没有一定的文化,没有一定的积累的话,你这个着法相对来说,吸收就会比别人慢。”
“其实还得感谢人工智能的出现。因为原来的年轻棋手的话,他唯一追求的也是一种取胜,有很多的条条框框,他最后的一级就是说我的胜负只要在那个,死活题啊在什么地方,一招致胜就可以了。”华学明说,“就像那时候大家有的人会说,哎呀,聂老说大局观怎么怎么样,其实大局观对于围棋是很重要的,但是大家不会在意这些东西,只要觉得我最后算过你就可以了。但是AlphaGo围棋给大家带来了另外一个思路,大家就觉得应该去开阔眼界,而不是像现在这么局限性,这是有好处的。”
5月27日,柯洁与AlphaGo最后一场比赛结束后,DeepMind官方宣布AlphaGo从此不再与人类进行公开对弈。“年仅3岁”的AlphaGo,被中国棋院授予九段棋手认证的“人工智能棋手”正式“退隐江湖”,在它身后,留下50张自我对弈的慢棋棋谱作为礼物,供人类研究。
剧情的发展让人联想起1996年,计算机“深蓝”战胜当时世界棋王卡斯帕罗夫后的“隐退”,科技的进步搅动了古老游戏后远去,留下了一个神秘的背影。
在紧随乌镇围棋峰会到来的第22届LG杯世界棋王战32强战上,柯洁首局中盘战胜韩国名将元晟溱九段。比赛结束后,他发了条微博:“现在才发觉……原来和人类下棋,是可以这么的轻松、自在、快乐……下围棋真好。”
那个人类的围棋“大魔王”回来了。
(实习生单琦、翟锦对本文亦有贡献)