下一步,阿尔法狗比赛玩星际
2016-03-29
本报记者 张旺 马俊
谷歌公司的人工智能程序“阿尔法狗”(Al?phaGo)在围棋领域以压倒性优势获胜后,全球的得州扑克、麻将、电脑游戏等各界高手们纷纷表示不服,并有意在下一轮人机大战中为人类夺回荣誉。近日有报道称,谷歌公司确定下一次比赛的项目锁定为电子竞技,阿尔法狗将与人类高手在即时战略游戏《星际争霸2》中一决高下。阿尔法狗的下一场较量意味着什么?《环球时报》记者28日就此采访了多名中国专家。
玩星际和下围棋有什么不同?
作为典型的即时战略游戏,《星际争霸2》需要玩家在游戏中采集资源建造不同的建筑、军队并进行升级,然后利用各种战术相互厮杀。国防大学信息作战与指挥训练教研部副主任胡晓峰少将告诉《环球时报》记者,在专业领域里,围棋属于“完全信息博弈”,即对战双方的所有情况都公开透明;而《星际争霸2》中存在“战争迷雾”,对手在干什么、收集了多少资源、建造的部队种类和进攻方向等信息在大部分情况下是看不到的。此外相比围棋简单明了的规则,《星际争霸2》更为复杂,包括不同的种族、相生相克的兵种、资源的合理利用等,因此还需要考虑决策的优先等级,阿尔法狗将面临更大的挑战。
彩云天气创始人兼CEO袁行远认为,因为棋盘格子数量有限且规则简单,阿尔法狗下围棋时可以模拟围棋的不同落子,通过最后收益的多少判断最佳下法。但这一套在玩《星际争霸2》时就很难奏效了,因为游戏的变量太多,不太可能在模拟时完全复现整个游戏进行推演,肯定需要进行抽象,比如把坦克、机枪兵等抽象成一些元素,然后在计算机程序里面推演,但这个过程中会有信息丢失,可能会影响评估结果。
阿尔法狗玩星际,强在哪儿?
《星际争霸2》这类即时战略游戏一般自带有电脑对战程序,玩家也可以选择与电脑对战。但这类电脑程序通常是按照预先设定的几种固定套路发展,只要掌握克制它的方法,玩家就可以百战百胜。具备自主学习能力的阿尔法狗显然就没这么容易对付了。
那么对于游戏高手而言,最关键的获胜因素包括哪些呢?通常而言,高手需要具备良好的大局观、清晰的发展思路以及灵活的应对策略。知名《星际争霸2》游戏解说“NeoTv小色”说,由于《星际争霸2》中永远只能看到战局的一部分,玩家可以借机进行战术欺骗。在这点上,人会受骗,电脑也会受骗。
尽管阿尔法狗要实现与人类玩家对决可能并没那么容易,但它也存在诸多先天优势。例如阿尔法狗可在地图上多线进攻,而且还能多线兼顾,但人的注意力有限,只能注意屏幕显示的地方。此外职业玩家的另一个突出特点是能迅速而精准地通过键盘鼠标操控屏幕上的本方单位,他们的APM(每分钟操作指令数)可达到250-300。这种局部的微观操作也是衡量电子竞技水准的重要指标。“NeoTv小色”说,阿尔法狗在这方面完全没有限制,可以做出很多只有理论上才能出现的操作,对人类玩家无疑是不公平的。如果在这方面不进行限制,那就像汽车肯定跑得过博尔特一样,胜负没什么悬念。
不过袁行远认为,即便谷歌通过限制阿尔法狗的APM,将其微操水准下调到与人类相当,但玩家的局面可能也并不乐观。在与李世石的围棋对抗中,阿尔法狗展示出的真正优势在于大局观,反而在局部计算时出现数次失误。因此可能换到《星际争霸2》也会出现类似情况,阿尔法狗的布局战略可能会比人类玩家更好。毕竟相比有着上千年传承的围棋,即时战略游戏出现的时间太短,各种布局存在的漏洞更多。
如果阿尔法狗再度胜利……
比起游戏对抗的胜负,人工智能专家们更关注阿尔法狗带来的一系列革命。中国人工智能领域知名专家王飞跃表示,阿尔法狗取得的成功,为应对优化问题中的计算复杂性提供了一个现实的解决方案。它在民用领域有很多应用,例如可以利用全局信息来处理大城市的交通拥堵问题,以往由于城市交通中涉及的变量太多,这样的做法“想都不敢想”。它还意味着大数据真正成为军事武器,数字化的战例、训练、演习将成为核心战斗力,物联网、云计算、作战计算实验成为军事行动的“新常态”。
身为中国大型兵棋系统总设计师的胡晓峰表示,《星际争霸2》等即时战略游戏中包含有一些兵棋推演的要素,如果阿尔法狗在此方面获得成功,对于利用人工智能掌握战场态势、参与军事决策方面非常有参考意义,甚至可能推动智能化战争取代现在的信息化战争。▲