披着“小号”上线的棋神
2017-04-22朱信明
朱信明
Master“审视”着棋盘的361个交叉点,迅速计算其中的可能性,试图在变化万千的对弈中,寻找最佳落点。
与此同时,还在度假的黄士杰博士坐在台湾的家里,按照Master计算出的结果,移动鼠标,将棋子落入棋局。在网络的另一端,面对电脑屏幕的中日韩三国棋手们,一次又一次陷入困局。
作为替AlphaGo落子的“人肉臂”,黄士杰见证了人类太多的失败:最初,爱好围棋的同事们被击溃;欧洲冠军樊麾在内部测试中认输;在2016年3月的人机大战中,世界冠军李世石落败。而现在,他要做的是挑战一群顶尖棋手,与他搭档的则是再次进化了的AlphaGo。
穿“马甲”的AlphaGo
2016年12月29日,大二学生乔智健白天一直忙于应付期末考试,直到晚上才有空上网看会儿棋。
夜里11点,上海外国语大学的宿舍楼熄灯了。乔智健打开折叠台灯,白光洒在课桌和他的身前,将自己和漆黑的寝室分隔开来。笔记本电脑的屏幕上突然跳出对弈邀请,身份信息显示为韩国职业选手Magister。一天后它又改名为Master。上线后,它一直在寻找职业棋手对弈。
这个陌生账号已经拿到六连胜,作为职业四段棋手,乔智健觉得对方还有点水平,他接受了对弈邀请。虽然从没有看过这家伙下过的棋,但他感觉赢这个新面孔的机会很大,于是把自己账号里的4亿多虚拟币都押出来,赌自己胜。
这一局乔智健下得很平稳,起初双方形势还算接近,可没过多久执白棋的他明显感觉到形势不妙。左侧白棋的生存空间被黑棋压缩到极小范围,下快棋让他没有太多思考时间,一手紧接着一手落子,他渐渐意识到自己已经输了太多,没机会了。
输了棋,乔智健赶紧翻出对手前几局的棋谱,“基本就是人工智能,”他解释说,“我们一般对顶尖棋手都比较了解,突然出现一个特别厉害的,又不知道是谁,看他的棋谱基本就能猜出来。”
事实上,AlphaGo披着“小号”上线的第一天,职业棋手尽数落败的消息就在围棋圈内传开了。人们猜测着这个账号的身份,是人还是机器?围棋对战平台弈城网编辑曲江在聊天室里看到,网友已经开始说那就是AlphaGo了。因为不知底细,29日当天,有些接到邀请的棋手拒绝了对弈机会。乔智健就认识其中的两位,得知真相时,他俩“感觉损失了几个亿”。
后知后觉的乔智健完成了他职业生涯里首次和人工智能的对弈。“我把能押的都押上了,完全就是在送。”虽然输光了全部“财产”,但之后知道Master就是AlphaGo时,他觉得“学费”交得值。
与多数人一样,乔智健也是在人机大战时才开始了解人工智能的。比赛的那几天,他一边上课一边偷偷地在手机上看直播。当时他觉得AlphaGo下得不好,结果4比1获胜;在自己输掉的这局中,他也觉得AlphaGo并不是每手棋都下在完美的位置,但就是能赢。“我只分析出一部分的原因,想要全部理解还需要花很多时间。”
其实,和AlphaGo下棋的机会早就有,只是当时很少有人注意到这个无名小卒。从2014年上半年开始,AlphaGo就已经在围棋对战平台弈城网上下棋了。
曲江向记者介绍,当时它化名“Deepmind”,大部分时间都在和业余棋手对弈,互有输赢地下了一年多,从注册时填写的业余5段棋力升到业余9段,并且在2015年年底第一次击败网站上的职业棋手。直到2016年3月的人机大战结束后,Deepmind公司创始人戴密斯·哈萨比斯才承认这是AlphaGo的小号。这时,他已经在弈城网下了近500局棋。
2016年12月16日晚8点,弈城网的合作方韓国Tygem公司收到黄士杰的电子邮件,“我们计划让AlphaGo在Tygem进行测试,希望能够为AlphaGo设立一个国籍为韩国的ID——Master。”
“那肯定受伤”
第一批职业棋手在1月2日这天战败后,有人坐不住了。韩国等级分排名第一的朴廷桓、中国名人战冠军连笑、世界等级分第一的柯洁等国内外顶尖棋手都主动应战,在之后的两天各路棋手连战连败,三天输了30局。
不再只是围棋界,整个人类世界都一下子打起精神来。分析这个账号棋路的帖子、网友猜测账号身份的段子弥漫整个网络,对于职业棋手们来说,感情则复杂了许多。
围棋是一项争胜负的游戏,棋手们被称作“胜负师”。但对于人工智能而言,它根本就无所谓尊严。一场围棋对弈里的选择没有“最佳、次佳和欠妥”的区别,它的选择只有一个——基于当前状况下计算得出的最优解。
围棋是单纯的计算游戏,与情感无关。
败于AlphaGo的樊麾这样形容对手:“……就是一个虚无,但却完全能把握住你的性格。”
在和电脑争胜负的过程中,人类棋手们曾占优势。虽然十多年前的围棋软件还算不上人工智能,但当乔智健还是个6岁棋童时,就已经在虐电脑了。台湾首位世界冠军周俊勋从2008年开始参加一些对战人工智能的测试,起初可以让电脑7个子,隔年再参加测试时,让子就会输棋。电脑棋力飞涨,棋手开始反过来被虐。对于“胜负师”们来说,这是个严重的问题。
乔智健来杭州参加比赛,住在天元大厦的棋手们只要碰到一起,基本上都要聊这个在弈城网连赢30局,又跑到野狐网继续赢棋的人工智能。
这家伙除了元旦当日休息,6天里平均每天赢10局,节奏稳得很,棋力也强太多。曲江发现,棋手们都兴奋起来了。“他们从小学棋,对棋的探索是一种本能,或者说是人生目标。”不少人都提出要和Master过招,但等候的队伍在网上排得老长。围棋国手古力一直在网上盯着看,国家队的群里,对棋局的感想随时都在更新着。
60局棋看下来,棋手们觉得有点蒙,如果说人机大战,李世石用一场胜利为人类保留了希望,那这次的连续失败算是彻底让棋手们放弃了在快棋上战胜AlphaGo的念头。
在围棋界,棋手根据棋盘上黑白双方的对抗情况,对比赛结果做出预判,如果一方在比赛中局提前放弃,对手即取得“中盘胜”,意思就是棋局进行不下去了,提前认输。这意味着对弈双方的实力差距较大,Master的“战绩”里,大多以中盘胜作为结局。
世界排名第一的职业九段棋手柯洁发微博说:“多么希望网上的快棋人类能赢一盘。”情况就好像AlphaGo挑战李世石的翻版,盼望能有一胜成为大家仅存的愿望。
已经拿下8个世界冠军的古力在接受采访时感慨:想要理解AlphaGo还比较难,可能刚理解了一招,它就换了一招,结果又看不懂了,短时间内似乎难以跟上它的步伐。“它的想法和我们好像不在一个维度上。”古力还在网上悬赏10万元奖励赢棋的人类棋手,但这笔钱根本就没机会送出去。
“感觉职业尊严有点受伤吗?”
古力回答:“那肯定受伤。”
1月3日晚的最后一役,Master对阵柯洁,古力称之为 “最后防线”。此时,距离柯洁放出“就算AlphaGo战胜李世石,但他赢不了我”的狠话,已经过去近10个月的时间。
但他还是输了。
搅 局
2016年12月29日到2017年1月4日,整个围棋界好像经历了一场大地震。现在看来,这是迟早会发生的事情。
围棋对弈网站野狐网总经理耿进告诉记者:人机大战后,野狐网根据谷歌的要求,提供了数千万张棋谱,职业九段棋手的棋谱只是其中的一部分。
2016年11月18日,黄士杰在脸书上说:“最近我的一个心得是,人的进步最多是用跑的,电脑的进步却是用飞的。”有网友留言询问,是不是已经准备好和世界第一的柯洁正式比赛了?最终呈现给人们的就是这场“地震”——这只是AlphaGo开小号上网测试棋力,而非正式比赛。但对手可不止柯洁这么一个世界冠军。
离开弈城网后,AlphaGo转战至与腾讯合作的野狐网。黄士杰、古力和耿进建了一个微信群,三个人在里面商量对弈人选,然后由古力和耿进负责出面邀请。主要的范围圈定在等级分排在前面的棋手,这些人不是世界冠军就是国家冠军。安排好比赛顺序后,棋手们上线等待黄士杰发送对弈邀请,只能下快棋,30秒一手。
之前耿进曾向黄士杰建议,给他一个自动下棋的协议,好减轻他的工作量。因为担心安全问题,黄士杰坚持手动操作,替AlphaGo一步步地落子。台湾和内地之间的网络,在晚上7点半到9点半这一时间段非常拥堵,为了保证网络顺畅,野狐还找腾讯云派了将近30个人提供技术保障。
一切准备妥当,AlphaGo继续在野狐网上进行剩下的三十场棋。
在人类棋手面前,AlphaGo好像拥有某种神秘力量一般,几乎都是下着下着,棋手的棋就没希望了。“无论柯洁还是韩国的朴廷桓,好像都是下一会儿就不太行了。”古力说。他发现现在的AlphaGo布局新颖,而且中盘以后的招法,很多都跟人类棋手的价值判断不太一样。
聂卫平听说网上有这么一个“兴风作浪”的人工智能后,特意让人把棋谱调出来分析,发现这家伙完全不按套路来。和朴廷桓对弈时,AlphaGo执黑棋在棋局初始阶段就沿着边路连下数子,都说“七子沿边活亦输”,因为占不到太多地盘,这样的下法聂卫平实在难以认同。可人家就这么下了,也这么赢了。和芈昱廷对弈,AlphaGo“下错”了大雪崩定式,这个围棋定式除了50多年前,由吴清源将外拐改成内拐,就几乎再没变化。聂卫平说:“就像一位不懂复杂定式的业余棋手一样,这个时候竟然选择扳了一手!将定式也改变了。”
人们再次想起日本著名围棋棋士藤泽秀行的那句话:“棋道一百,我只知七。”AlphaGo的再次出山,搅动了整个围棋界。
“Now,I am the master.”
持續7天的对弈彻底火了,外国媒体Science New在脸书发布新闻时,写下了“AlphaGo:“Now,I am the master.”。
这句话出自科幻电影《星球大战》。达斯·维达认为自己的能力已经超过师父欧比旺,他说:“我离开你时还只是个学徒,现在,我是大师了。”
具备自我学习能力的AlphaGo确实已经是实至名归的大师了。当完成50局对弈后,能请到的高手已经差不多都下过了,有的甚至下过好几局。
耿进问黄士杰:“可不可以请聂老下一盘?”
“这是我们的荣幸!”黄士杰回答。
通过聂卫平的儿子,耿进联系到这位中国棋圣。此时,眼看着高手纷纷落败,连世界第一的柯洁都力不能胜,网友们开始呼唤“棋圣”出山。
聂卫平几乎不下网棋,但他痛快地答应接受对弈邀请。为了保证对局顺利进行,他被接到野狐网的办公室。
“您坐哪儿?”
聂卫平指了指办公室角落里的一张大办公桌,“我坐这儿”。那是耿进的位置。他给聂卫平递上水点上烟,连接好笔记本电脑,把其他人都关在办公室外面。就他和聂卫平两个人待在屋子里,等着AlphaGo的邀请。
之前耿进和黄士杰商量,30秒一手太快了,聂卫平年龄在这儿,“可不可以调长一点,调到40秒”。
黄博士回答:“应该的。”然后将时限调成60秒一手。
聂卫平执白棋。他左臂支在桌面,右手移动鼠标,还是保持着老习惯,在下棋的过程中,嘟囔几句日语。他布局不错,将局面打散,降低黑棋的效率。然而在第58手,他下错了棋。如果这枚白子落在旁边的交叉点上,仅仅这么一步之遥的距离,就可以让棋盘右上角的白棋都活下来,相对的,在外围的黑棋却尚未形成优势。
AlphaGo抓住这个机会,第59手,黑子落在聂卫平本打算落子的位置。右上角的白棋“怎么下都做不活了”。这一处失误,让聂卫平失去二十几目的地盘。之后,AlphaGo再没给“棋圣”一点机会。
2017年1月4日的下午,一代“棋圣”聂卫平结束与目前最强的人工智能的战斗。黄士杰用繁体字打出“謝謝聶老師”。人们都知道,这不只是一个人类在向棋圣致敬。
爆破天堂之门
在影片《星球大战》中,当达斯·维达说出自己已经是大师时,他的师父回答:“只是个邪恶大师。”
人工智能对未来人类的影响,现在谁都看不清。去年古力在参加AlphaGo的自我对弈测试后,说:“我一直担忧,当它们有足够的自我意识时,人类会被统治、灭亡。愿一切都是杞人忧天,珍惜当下。”
2017年1月5日,AlphaGo带着60连胜下线了。“大师走了”,古力感觉,野狐网上的高手们好像有点厌战,不太想下棋。
悲观的情绪确实有一些,比如以后应该怎么教孩子们下棋?臺湾棋王周俊勋的童年,是从翻阅一本本棋谱开始的。要去死记硬背前人总结的经验,反复打谱,训练固定招式。他和父亲下棋,每输一局都要罚跑步。棋手们大多是在类似的氛围中逐渐磨练棋艺,胜负几乎是最重要的事情。周俊勋觉得“输棋就好像死掉一样”。
周俊勋在台湾的海丰道场教小棋手们下棋,小朋友们倒是没有太多负担,一副看热闹不嫌事大的样子。“从AlphaGo赢棋的那一刻起,小朋友就一直崇拜它。这次更强大了,在30秒的时间内,接近围棋之神的状况了。”
高晓松在微博发表评论说:“为所有的大国手伤心,路已经走完了。多少代大师上下求索,求道求术,全被破解。未来一个8岁少年只要一部手机就可以战胜九段,荣誉信仰灰飞烟灭。”
60连胜后,耿进和黄士杰私下聊过一次。“AlphaGo是不是有点接近围棋之神了?”
黄士杰回答:越研究越发现,我们对围棋的理解,包括对围棋的认知,能优化改进的地方还非常多,“围棋太神秘了”。
人类制造了AlphaGo,它将这个千年历史的游戏又推到新的高度,用科技的力量,破开天堂之门。
“我们发现天堂里面空无一人,这是一件很诱人、很让人兴奋的事情。”耿进说。
柯洁输给AlphaGo以后,其实还安排了再战一局。因为突发疾病,他住进了医院。柯洁说他还有一个准备了一个星期的招式没用上,希望以后有机会。2016年1月6日晚,他在野狐网和一个名叫“绝艺”的人工智能下了一局。
虽然这款人工智能棋力不如AlphaGo,但从和柯洁的对弈历史看,双方互有胜负。
那一局,柯洁赢了。
〔本刊责任编辑 吴 俊〕
〔原载《看天下》2017年第2期〕