AlphaGo背后的男人:我们的目标是探索宇宙
2017-07-29王心馨虞涵棋
王心馨+虞涵棋
“人机大战”的硝烟终于尘埃落定,这场人类和AI的对抗再次牵动了世界的神经。
“我会抱必胜心态、必死信念。我一定要击败AlphaGo!”赛前,对于与围棋人工智能程序AlphaGo的对弈,目前世界排名第一的中国围棋职业九段棋手柯洁曾如此放出豪言。然而,AlphaGo之父却说,“我们发明AlphaGo,并不是为了赢取围棋比赛。”
毫无悬念,AlphaGo又赢了。在过去的一年间,人们已经听到太多人工智能程序战胜人类棋手的消息。在外界普遍不看好柯洁的情况下,比起比赛结果,更多人好奇的是:AlphaGo这次为什么还要来中国“踢馆”?连“当今第一人”柯洁都倒下了,“独孤求败”的AlphaGo是不是可以准备“退役”了?而AlphaGo背后的DeepMind公司在“玩坏”了围棋之后,下一步还打算玩什么?
不久前,在中国乌镇人工智能高峰论坛上,AlphaGo之父、DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)介绍道,AlphaGo的影响已经开始显现,比如在与韩国棋手李世石对决后,围棋的棋盘销量增加了10倍的增量;利用AlphaGo的算法,许多公司也开始深入研究人工智能下棋程序以及各种應用场景的应用。
随后,他重申,下围棋并不是AlphaGo的终极目标,他们的目标是要利用AlphaGo打造通用的、探索宇宙的终极工具。
在哈萨比斯看来,要打造能探索宇宙的终极工具,就需要把AlphaGo改造成通用型学习机器。具体来说,这个机器能做到非程序预设,就能自主学习原始材料,并能在同一系统执行多种任务。要做到这两点非常困难,但AlphaGo正在利用下围棋的方式来向这个目标靠近。
为什么计算机下围棋非常困难?
1997年,国际象棋大师卡斯帕罗夫败给了IBM公司打造的“深蓝”程序,国际象棋被计算机攻克。相比国际象棋每一步棋后能引出三十种可能的走法,围棋棋局的每一步牵出的后续选择有数百种,计算机需要搜索的数量更加庞大。
在哈萨比斯看来,用计算机下围棋的困难主要有四点。首先,围棋是一个靠直觉来赢得比赛的项目,它不像象棋等游戏可以靠计算。其次,围棋中没有等级概念,所有棋子都一样。第三,围棋是筑防游戏,需要盘算未来。第四,围棋中小小的一颗子就可以撼动全局。
基于此,在AlphaGo打败李世石之前,许多人认为人类至少10年才能完成这个目标。但在2016年,DeepMind利用策略网络和价值网络打造AlphaGo,成功撼动了人类在围棋领域的统治力。
AlphaGo之所以有如此“神力”,甚至被柯洁称为“围棋上帝”主要就是依靠这两个网络。首先,AlphaGo用策略网络可以缩小每一步棋走法的选择。接着,每走完一步棋,AlphaGo都能利用价值网络来评估这步棋的胜率值。
AlphaGo已具备直觉和创造力
依靠这两个网络,通过向人类围棋大师学习,以及迭代后的自我学习,哈萨比斯认为当前版本的AlphaGo已经具备直觉和创造力。
比如,2017年初以“Master”马甲出现,对战中日韩顶尖高手取得60连胜时,AlphaGo在与辜梓豪、朴廷桓下棋的过程中,都走出了精彩的一招,显示出了创造力。
“游戏是用来训练算法最有效的做法,但是我觉得我们的最终目标并不是游戏,而是把我们的技术运用到现实生活当中,比如说用到医疗、智能手机以及教育当中。”哈萨比斯说。
据介绍,接下来DeepMind公司有意让AlphaGo与无数其他领域结合,从而得到无数的“组合轰炸”。目前,DeepMind的搜索技术已经运用到谷歌的数据中心,帮助该数据中心节省了15%的电能。
更为重要的是,哈萨比斯期望AlphaGo能成为元解决方案。简单理解就是,让AlphaGo成为人工智能科学家或者人工智能辅助科学家,更好地帮助人们理解人脑的奥秘。
“和所有强大的新技术一样,我们希望AlphaGo能在伦理和责任的约束中造福人类,探索人类大脑的奥秘。”哈萨比斯说。
(本文转自澎湃新闻)