人工智能破解谜题

2016-08-02

大自然探索 2016年6期

这道谜题是：行刑者下令100个男性囚犯按照身高从高到矮的顺序排成一列（高个子在最前面），并且把一顶红色或蓝色的帽子戴到每个囚犯头上。每个囚犯都能看见自己前面所有囚犯戴的帽子，但看不见自己的帽子或自己后面的囚犯所戴的帽子。行刑者从最后（最矮）那个囚犯开始提问：你戴的帽子是什么颜色？只有答对了，囚犯才能活下来。如果答错，囚犯就会被“安静地处死”。也就是说，其他囚犯能听见这个囚犯说的话，但不可能知道他的回答是否正确。在这场处决的前晚，囚犯们被给予机会讨论一种策略来帮助自己存活。那么，究竟有没有这样一种策略？如果有，它是怎样一种策略？

解答或理解上述谜题，有助于开发智力，启发我们从多角度去思考看似复杂的问题，并找到解决办法。探索自然世界，寻找科学途径，无疑需要独到的思维。事实上，破解诸如此类的谜题，有助于密码理论和信息工程学的进步。据报道，人工智能网络在测试中找到了破解“囚犯帽子谜题”及类似复杂谜题的策略。实施这种策略不仅要求个体具有解决复杂问题的能力，而且要求团队整体保持清醒与合作。科学家指出，包括机器人在内的人工智能有能力破解这样的谜题，这是在协作体系方面的又一个进步。

在测试中，为了解决帽子谜题，每个囚犯都被模拟成一个单独的人工智能因子。它们考虑自己可能看见的帽子颜色，决定告诉他人什么，接着，利用这种集纳信息找出答案。在学习玩视频游戏的过程中，人工智能（机器人）已经各自掌握了应对难题的方法。它们解决这些问题的思路与人类的不同。科学家仍不清楚人工智能提出的解决方案究竟属于什么性质，但这些方案确实行之有效。

据报道，这个被称为“深度分布周期性Q网”的人工神经智能网络，首次证明了自己能解决这类复杂问题。科学家向该网络输入“囚犯与帽子”等两个谜题，但Q网必须掌握交流协作，才能破解谜题。这里先卖个关子，这道谜题的答案并不直白。在“囚犯与帽子谜题”中，找出拯救囚犯的策略需要Q网厘清一系列复杂程序，并且还得依赖于单个因子之间的通信。在这道谜题的测试中，Q网不仅完成了任务，而且超越了科学家所认为的“标准策略”，这证明Q网自身内部就能给出通信协议。

随着测试的成功，科学家认为需要进行更多研究，以了解智能网络给出的解决方案，提升可扩展性，以适应更大的数字集合。在研发可通信合作的人工智能方面，这基本上还是第一步。从长期看，经过提升的延展性能让人工智能解决以前不能解决的难题。未来，这类人工智能将被测试一些涉及“现实世界数据”的疑难情景。有朝一日，成群的机器人将能通过共享信息片段，合作破解难题。

人工智能大胜九段棋手

2016年3月16～25日，由谷歌公司研发的“阿尔法狗”计算机程序与韩国九段围棋手李世石在韩国首都首尔进行了5局比赛，李世石只赢了其中的第4局，其余4局的胜者都是“阿尔法狗”。这次对抗的历史意义，被认为堪比1997年“深蓝”程序（由美国IBM公司研发）战胜国际象棋世界冠军、俄罗斯棋手卡斯帕罗夫。这次比赛后，韩国围棋协会授予“阿尔法狗”最高段位——“荣誉九段”，以表彰“阿尔法狗”以“认真的努力”掌握围棋。

“阿尔法狗”的这场胜利，被认为是人工智能研究领域的一大里程碑。在此之前，围棋的复杂程度被认为超出人工智能所能够掌握的范围。许多专家认为，像“阿尔法狗”这样的计算机程序，至少要等5年、10年甚至更长时间才可能挑战围棋高手。有评论认为，“阿尔法狗”的这场胜利提醒人类：需要为应对未来可能出现的“全能机器人”而做好准备。

李世石赛后为自己输给“阿尔法狗”而道歉。他说自己误判了“阿尔法狗”的能力，并且对此感到“无能为力”。他强调说，他这次的失败只是他自己的失败，而不是人类的失败。他还说，他最终输给机器“无可避免”，但“机器人永远都不可能像人那样明白围棋之美”。作为对这场举世瞩目的大赛的回应，韩国政府2016年3月17日宣布将在未来5年内投资8.63亿美元，用于人工智能研究。