APP下载

“人不如狗”的背后

2016-07-15

商界·时尚 2016年5期
关键词:胜率落子李世石

也许你很好奇,为什么“阿尔法狗”和李世石的对战,能够引起那么大的舆论关注。毕竟这并不是人工智能第一次站在人类的对手席上,也不是人类第一次败给自己的杰作。

意料之外的智能

我们从围棋这项运动说起,星盘上共有361个落点,每步落子都会对棋局走势产生不同影响。普林斯顿大学的研究人员计算过不重复的棋局数,最终结果是一个171位的数字。

这意味着这项棋类运动不存在套路,究竟棋子落在哪里能让自己胜率最大,只能凭借棋手的直觉、经验和运气。巧的是,这三样都是人工智能所不擅长的。在AlphaGo出现之前,它们连战胜业余选手都很艰难。所以当这条“狗”五场零封欧洲围棋冠军樊麾、4:1力克李世石之后,有些人开始慌了。

人工智能的进步,已经完全超出了人类的预期,AlphaGo的研发者——DeepMind公司的反应也非常微妙。直到这场人机大战战局尘埃落定,该公司的首席执行官Demis Hassabis才收起了“这只能证明AI在运算速度和判断精度方面潜能无限”的客套说辞,表示已经被自己的作品给震惊到了。

只会算算算?

如果从最简单的层面来分析AlphaGo,它不过是利用了两套智能分析系统,来决定自己的下法。第一个用来评估棋局,会判断双方的优劣势,以及棋盘每个部分的走势,尽可能去读取棋盘上的全部信息,以及对手的动向和意图。另一个则是落子选择器,会通过扫描棋盘,找到数个合理的落子点,最终判断出最佳的一个。

但如果仅仅是运算,那“阿尔法狗”和其他人工智能比起来,不会有质的改变。毕竟处理速度、程序和代码这种东西,都无法拉开决定性的差距。可实际上,在和其他的人工智能对弈时,AlphaGo在500盘中赢了495盘,胜率高达恐怖的99.8%。它的背后藏着什么秘密?只有谷歌能给一个解释。硅谷人曾说过,这台机器人的核心精髓是“深度自学习”,也就是在对战博弈中积累经验。李世石输了之后,韩国棋社跳出来指责AI对手是在赤裸裸地抄袭,可实际上,任何棋手都会去研究对手的下法,AlphaGo只不过是效率更高一些。

在击败李世石的前三盘中,AlphaGo是越战越勇,第二盘甚至频出怪招。研究人员相信,这是它读取了李世石棋谱后,在尝试全新下法的表现。如果这一假设成真,那即便AI现在的学习还停留在“有样学样”的层面上,人类想战胜它们也会变得难上加难。比如你从五步之前就开始设局,如果AI见识过这一招,它当即就能看穿你的心思。

不只是虚拟棋王

AlphaGo的最初设定,并非棋类高手。谷歌在2014年豪掷4亿美元收购了初创公司DeepMind,目的也不是在两年后把100万美元的奖金揽入囊中——这笔钱本来就是谷歌出的。这些硅谷大神立志于将学习类机器人和通用学习算法相结合,构造出能对人类生活产生极大影响的新行业。而击败顶级棋手,不过是这条路上出现的小插曲。

在天才少年柯洁的挑衅下,DeepMind方面的反应非常平淡,他们觉得AlphaGo没有必要再在围棋领域待着了。不久前,公司CEO表示会将AlphaGo整合到医疗、机器人领域。局外人并不知道,这些领域才是它的本职工作。此外,暴雪游戏公司方面还确定了一个消息:AlphaGo会以选手的身份挑战《星际争霸2》。此讯一出,有“星际第一人”之称的韩国选手Flash主动请缨,似是要替同胞复仇。可他也许不知道,在和AlphaGo交锋之前,李世石对它的点评是“只有三段棋手的水平”,并认为自己顶多输一场。结果我们都看到了。

AlphaGo还有很多路要走,但有些事需要其研发者多多注意。它的智商是否有超过人类的可能?又或者说,人类在发掘AI上限的时候,能否在它们脱离自己控制之前及时收手?不要等AI已经可以俯视人类时,我们才终于回想起被AI支配的恐怖,虽然那只是在电影里。

猜你喜欢

胜率落子李世石
一种生成残局数据库的倒推算法
基于预期收益策略与UCT的德州扑克算法
琴(外一首)
银行理财子公司“落子”布局
落子山东,意在全局
2014—2015年中国女子篮球职业联赛单节得失分与比赛结果相关性分析
李世石不代表人类
90后唐丹:人生如棋,落子不悔
CBA球队主客场胜率及得失分与比赛结果排名的相关性研究
李世石“天才”继承人