APP下载

人工智能会叛逃?从下棋开始谈起.......

2019-05-23

求学·文科版 2019年5期
关键词:胜率落子李世石

什么是人工智能?

很多人都以为“人工智能=会思考的机器人”,然而事实并非如此。人工智能的定义其实相当宽泛,从学科定义的角度来说,它是研究、开发用于模拟、扩展人的智能的一门新学科,属于计算机科学的一个分支。

人工智能简史

从“网红”AlphaGo的学习方式看人工智能

“网红”AlphaGo(阿尔法狗)是人工智能中一个成功的典型,赢了韩国棋手李世石,令众人皆知。

一、AlphaGo的获胜秘诀:深度学习

深度学习的前身是神经网络,主要是指研究人员通过程序语言教会电脑模拟人类思考。比如我们初学“1+1=2”的时候,父母教我们通过数手指头的方式来计算;而研究人员教电脑学习的方式则比较简单,输入的是已知信息,其中“1”和“+”就是输入给电脑的,电脑输出的就是结果“2”(电脑上是采用“二进制”进行计算的,感兴趣的同学可查阅更详细的资料)。无论是通过计算、判断还是推理,像这样认知的过程都可以称为“学习”。

二、深度学习=“监督学习”+“评价网络”+其他

1.“监督学习”

打个比方,一个拥有过目不忘的超能力的同学,根本不用学习方法原理和解题技巧,只要记住近乎无限量的题目和答案,考试就能得到高分。同理,AlphaGo不用学习下棋的方法,只要有充足的存储空间就够了。设计人员向其大量输入這个世界上职业棋手的棋谱(也就是说它记住了题目和答案),以预测对手最有可能落子的位置。

用这种学习方式,AlphaGo完全不用去思考“如何才能赢”这件事,只要能够预测对手的落子即可。公开数据显示,目前AlphaGo预测对手落子位置的正确率是67%。

2.“评价网络”

举个例子,在打篮球时,某同学会不断观察对方防线变化,如果能找到防守球员注意力最不集中的地方,就有较大的机会进球。类似地,AlphaGo会预测对手后续落子位置的概率,通过嵌套函数找到最优解。当然,AlphaGo的胜率跟向下预测的步数有关,向下预测的步数越多,计算量就越庞大,同时胜率也越高。

但是AlphaGo的能力显然不止于此,除了预测对手落子后的胜率,它还会模拟自己落子后可能会遇到的情况。就像考生不断地出试卷考自己那样,AlphaGo除了会和对手下棋,还会和自己下棋,以确定自己下一步怎么走胜率最高。在未来,设计人员还会将一个评估体系植入AlphaGo当中,使其能够更加准确地评估所下这一步棋的好坏。

一言以概之,这种机器学习方式不局限于一步的输赢,而是将格局放大,更关注最后结果。

看到这里,同学们应该明白了:其实并不是AlphaGo打败了李世石,而是研究人员用智慧战胜了李世石。除了监督学习和评价网络,人工智能学习的方式还有很多。与人类相比,它们不仅“过目成诵”,而且其拥有的超高的计算速度和准确性也让人类望尘莫及。

作者简介:大宝,人工智能爱好者,算法工作者,目前在一家区块链创业公司工作。

猜你喜欢

胜率落子李世石
一种生成残局数据库的倒推算法
基于预期收益策略与UCT的德州扑克算法
琴(外一首)
银行理财子公司“落子”布局
落子山东,意在全局
2014—2015年中国女子篮球职业联赛单节得失分与比赛结果相关性分析
李世石不代表人类
90后唐丹:人生如棋,落子不悔
CBA球队主客场胜率及得失分与比赛结果排名的相关性研究
李世石“天才”继承人