APP下载

浅谈围棋机器博弈

2018-10-30高梦萱

中国科技纵横 2018年19期
关键词:发展

高梦萱

摘 要:本文首先阐述了计算机博弈的概念与历史,讨论了难度最高的围棋机器博弈并比较了不同项目间复杂度;随后从历史发展的角度介绍了围棋机器博弈在各个阶段的发展情况以及取得的成就;之后分析了围棋机器博弈当前面临的问题并给出建议,最后论述了围棋机器博弈未来可能的发展方向。

关键词:机器博弈;围棋;发展

中图分类号:TP18 文献标识码:A 文章编号:1671-2064(2018)19-0247-02

相信很多人都还记得十年前那场人机对战—IBM公司研发的计算机“深蓝”对战国际象棋特级大师卡斯帕罗夫,最终,卡斯帕罗夫以2.5:3.5(1胜2负3平)输给了“深蓝”,震惊了世界,同时也让人们对机器博弈有了更深的认识。

从上世纪五十年代开始,许多著名计算机科学家如阿兰·图灵(Alan Turing),信息论创始人科劳德·香农(Claude E.Shannon),人工智能(Artificial Intelligence,AI)的创始人麦卡锡(John McCarthy)以及冯·诺依曼等都在进行机器博弈相关的研究。计算机博弈也称机器博弈(Computer Games),最早是由从事计算机棋牌竞技研究的科学家们给出了定义,他们认为Computer Games就是让计算机能够像人一样会思考和决策,能够下棋[1]。Computer Games直译为计算机游戏,为了便于和计算机游戏区分,Computer Games中文译为机器博弈,或者计算机博弈。机器博弈属于人工智能领域的一个重要分支,机器博弈的水平在一定程度上也代表了人工智能的发展水平。在机器博弈中,围棋被公认为难度最大,但随着计算机技术的快速发展,人工智能在围棋机器博弈领域也取得了骄人的成绩。2016年3月,由谷歌Deep Mind团队研发的AlphaGo与韩国围棋世界冠军、职业九段棋手李世石进行了比拼,被称为围棋人机大战,最终AlphaGo以4比1的总比分获胜;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜[2]。AlphaGo围棋的胜利打破了人们长久以来认为只有人类擅长下围棋的看法,此前,研究人员普遍认为具备思考能力的人工智能还需要数十年才会出现。本文将对围棋机器博弈的基本概念、发展历史、现状等内容进行详细论述,以期让人们对围棋机器博弈有一个全面、深入的认识。

1 围棋机器博弈概述

围棋机器博弈是机器博弈中的重要组成部分。它之所以被认为是棋类机器博弈中最为复杂的项目,根本原因就在于所研究对象围棋的搜索空间远大于国际象棋等其它棋种。博弈问题中衡量问题的复杂性主要根据状态空间复杂度和博弈树复杂度两项指标,博弈过程的局面称为状态,而博弈问题的状态复杂度是指从初始局面出发,产生的所有合法局面的总和。对于完备信息的博弈系统如围棋、国际象棋等,其搜索还通常基于博弈树搜索算法。博弈树复杂度是指从初始局面开始,其得到理论解所需展开的最小搜索树的所有叶子节点的总和。表1给出了部分棋类博弈问题的复杂度,可以看出,对于局面复杂、形式变幻多样的围棋来说,无论是状态复杂度还是博弈树复杂度都远高于其它棋种,因此,精确计算围棋博弈的状态复杂度几乎是不可能的。围棋博弈的难度主要体现在两方面:一是搜索空间巨大—合法的围棋的变化(10172)大于宇宙中原子数(1080);二是局面判断难—从此前各种研究成果中看来,对于围棋不可能有一个很好的静态局面评估函数[1,3]。围棋机器博弈是一个高复杂度的完备信息博弈问题,求出围棋的均衡策略基本是不可能的,另一方面,正是围棋机器博弈研究的高难度与复杂性吸引着众多人工智能研究的许多科研机构和科学家。

2 围棋机器博弈的发展历程

2.1 第一代圍棋人工智能

历史上第一个完整下完一盘围棋的程序是1968年在美国完成的,由此开启了近20年人们对于围棋AI的探索。一直到1990年,中山大学化学系教授陈志行编写出了名为“手谈”的程序,在问世以后实力快速提升,不断用实力获取回报,甚至于1995至1998年赢得计算机围棋世锦赛七连冠,一度成为九十年代的神话。“手谈”的成功,与其中前所未有的“势力函数”的应用有着密切的关系。“势力”在围棋中代表一个棋子对周围空间的影响,将这种影响量化便得到了作为标准的“势力函数”。同时,这种函数还能够初步解决棋的走向问题,也就是得出了围棋中最高深玄妙的“下法”。这在当时无疑是一次突破,也为后来围棋人工智能的持续发展打下了坚实的基础。同时期的围棋AI还有陈克训的Go Intellect,在1992及1994年两度夺得应氏杯,雷秀瑜的Wulu,David Fotland的MFG也曾问鼎应氏杯,由此,围棋AI进入到繁荣阶段[4,5]。

2.2 第二代围棋人工智能

在此之后,围棋人工智能不断发展,衍生出各种更加完备的算法,例如用评分判定下法对于自己利弊的极小化极大搜索算法以及以概率统计理论为指导用于判断棋局结果的蒙特卡洛算法。这两种算法相较于先前的程序,更加充分地利用了电脑的计算能力,并且能够很好地支持并行计算,提升了工作效率,但同时也存在缺少前后逻辑关联等问题。在诞生于这个时代的围棋人工智能里,最成功的叫做Zen,也被称作天顶围棋。ZEN是由日本的加藤英树教授及其团队开发的,是集成各种算法应用的一次突破。在2011年的欧洲围棋大会上,Zen初露锋芒,在19路盘上让五子击败日本职业棋手林耕三六段。在此之后,Zen能力尽显,于2012年3月被让四子击败了日本围棋高手武宫正树九段,这是围棋AI第一次在让四子的情况下战胜围棋职业选手,也是围棋程序的一次历史性的突破。2016年,Zen的升级版DeepZenGo在第二届日本围棋电王战第二局大胜“不老传说”赵治勋,虽然最终总比分1-2落败,但已经展现出与职业九段抗衡的实力。

2.3 第三代围棋人工智能

在经历过几次胜利之后,围棋AI的发展又陷入了停滞。在这段安静的日子里,飞速成长的AlphaGo已初露锋芒,并在赛场上不断证明自己的实力。AphaGo的非凡之处在于,它采用了一项叫做深度卷积神经网络的核心技术,使得程序有了思维,能够进行主动思考。这种人工神经网络与人脑中的神经网络类似,在面对一个局面时输入信息,就好似大脑思考的过程,这项技术的应用让围棋人工智能的发展走上了又一高峰,2015、2017年AlphaGo相继击败了人类围棋冠军。

2017年10月19日凌晨,谷歌下属公司DeepMind发表研究论文报告了其最新版围棋程序AlphaZero,它能够从空白状态学起,在无任何人类输入的条件下,能够迅速自学,并以100:0的战绩击败了前辈AlphaGo。对于仅拥有四个TPU,零人类经验的AlphaZero来说,在自我训练时间仅为三天的情况下,自我对弈的棋局数量能达到490万盘,并达到非常不错的水平,着实体现了围棋人工智能的大幅进步。在举世闻名的人机大战之后,围棋人工智能再一次刷新了众人的眼界,这样的发展可以说是空前的。

3 讨论

从最初的围棋程序到最新的AlphaZero,可以看到围棋机器博弈的前途无疑是光明的。随着技术的不断进步,机器博弈也从只能对人类的简单需求做出响应,到了拥有类人的“神经网络”,能够运用深度学习算法进行自主学习的“超级程序”。在人工智能持续发展的六十多年中,计算机博弈经历了起步、发展、成熟、飞跃四个阶段,于如今已达到了绝无仅有的空前水平。现阶段的完备信息博弈技术已经比较成熟,非完备信息博弈和隨机类博弈技术还需进一步发展。

4 结语

计算机博弈作为信息时代的代表,依旧是拥有很大的发展前途。相信在正确利用后,它会与其它领域的技术更广泛、更紧密地融合,推动人工智能产业本身迅速发展,从而实现技术快速提升。

参考文献

[1]中国人工智能系列白皮书-机器博弈 [EB/OL].中国人工智能协会,2017.

[2]安波.人工智能与博弈论—从阿尔法围棋谈起[J].中国发展观察,2016,(6):13-13.

[3]严达浚.围棋博弈中的人工智能研究[D].复旦大学,2007.

[4]师军.围棋与人工智能[J].中国体育科技,2005,41(6):135-138.

[5]唐艳.围棋博弈机器学习算法的研究及应用[D].重庆理工大学,2012.

猜你喜欢

发展
迈上十四五发展“新跑道”,打好可持续发展的“未来牌”
产前超声发展及展望
从HDMI2.1与HDCP2.3出发,思考8K能否成为超高清发展的第二阶段
脱贫发展要算“大账”
砥砺奋进 共享发展
改性沥青的应用与发展
身担重任 更谋长远发展
推进医改向纵深发展
谈发展
它会带来并购大发展