建设棋牌谱标准 构建计算机博弈竞赛持续发展新生态
2020-09-29王亚杰王晓岩邱虹坤
王亚杰,王晓岩,邱虹坤,李 飞
(沈阳航空航天大学 工程训练中心,沈阳 辽宁 110136)
2016 年,当谷歌公司的阿尔法围棋软件(AlphaGo)与世界围棋冠军李世石上演了“世纪人机大战”之际,人工智能引发了世界范围内的研究与开发热潮。AlphaGo 主要利用深度学习方法训练了两个网络:策略网络和价值网络[1]。2018 年,AlphaGo Zero 又横空出世,它主要使用强化学习算法,将价值网络和策略网络整合为一个架构[2],训练3 天就以100比0 击败了上一版本的AlphaGo。2019 年初,AlphaStar在《星技争霸2》中以10∶1 战胜了职业选手,又取得空前胜利,它主要使用了一种新的多智能学习算法。这些算法促进了人工智能技术的快速发展,在未来,它将得到更多应用,成为无数人工智能产业和服务的基础。
计算机博弈,也称之为机器博弈,就是让计算机学习人的思维模式,像人类一样,能够思维、判断和推理,并做出理性决策,与人类选手或另一台计算机进行的对弈[3-4],如国际象棋、六子棋、德州扑克等。计算机博弈是人工智能领域的重要应用,是研究人类思维和实现机器思维最好的实验载体,是人工智能研究的“果蝇”[5-6]。当人机大战已没有悬念,面对人工智能浪潮汹涌而至,基于机—机对战的计算机博弈大赛就格外引人注目。
1 计算机博弈竞赛在国内的发展
1.1 竞赛基本情况
中国计算机博弈大赛由东北大学徐心和教授团队组织筹备,在组建中国人工智能学会机器博弈专委会(以下简称“专委会”)的基础上,于2006 年在北京举办了首届计算机博弈比赛。计算机博弈虽然在我国起步较晚,但发展非常迅速,表1 为历届博弈比赛的地点与项目名称,图1 为历届比赛的参赛学校数和参赛队数。因竞赛项目具有喜闻乐见、挑战无穷、公平公正等特点,竞赛影响力不断增加,竞赛规模不断扩大。
表1 历届计算机博弈竞赛的基本数据
图1 历年计算机博弈竞赛的参赛队数与学校数统计
1.2 竞赛发展情况
计算机博弈在我国经历了12 年的发展,从表1和图1 中可以看出,竞赛呈现出良好的发展态势。
(1)竞赛项目数不断增加。从最初的1 个项目发展到19 个项目,目前大学生竞赛项目包括五子棋、六子棋、点格棋、苏拉卡尔塔棋、亚马逊棋、幻影围棋、不围棋、爱恩斯坦棋、军棋、海克斯10 种棋类;锦标赛项目包括中国象棋、围棋、十三路围棋、九路围棋、国际跳棋(100)、国际跳棋(64)、二打一扑克牌(斗地主)、桥牌、德州扑克9 种棋牌类,该比赛面向社会所有人员。
(2)参赛队数不断上升。从不足10 所高校到50多所高校参加,每年有240 多支代表队参加全国决赛。如果统计各类选拔赛,每年全国参与学生数累计约5 000 多人,为我国人工智能人才培养提供了有力支撑。
(3)竞赛形式多样化。从完全信息博弈(如中国象棋、六子棋等)发展到不完全信息博弈(如斗地主、幻影围棋等);从个体对抗(如围棋、军棋等)发展到团队协作(如桥牌、二打一扑克牌等)。这种多类型项目的设置有利于调动师生参与的积极性,更有利于学术的深入研究。
(4)竞赛得到多个单位的主办支持。最初的全国锦标赛由中国人工智能学会主办;2011 年,专委会增加了全国大学生计算机博弈竞赛项目,得到了教育部高等学校计算机类专业教学指导委员会的主办支持;2015 年,该比赛被纳入第三届全国智力运动会,又得到国家体育总局棋牌运动管理中心的主办支持,这一过程也体现了计算机博弈越来越受到关注与重视。
(5)竞赛与国际接轨。竞赛中的大部分项目与ICGA 组织的国际计算机博弈奥林匹克比赛项目一致,如围棋、国际跳棋、爱恩斯坦棋等,使参赛者既可以在国内赛场上比拼,也可以走向世界,参加国际比赛。近几年,沈阳航空航天大学、北京理工大学、北京科技大学的学生在国际大赛中均有精彩的表现,为国家争得了荣誉。
(6)竞赛效果显著。通过竞赛较好地提高了学生的实践能力、创新能力、决策能力、合作交流能力和受挫折能力;同时依托竞赛项目,还支撑了许多学生创新创业训练项目申报、软件专利申请、学术论文发表等,也较好地培养了学生的科研素养和钻研精神。多年的竞赛比拼,还产生了一些知名博弈软件,如东北大学的中国象棋“齐天大圣”、北京邮电大学的围棋“本手”、北京工业大学的围棋“深石”、蒋志敏团队的“象棋名手”、重庆理工大学的“骑士”等,它们都在不同时期引领着我国机器博弈技术的发展。
1.3 竞赛存在的不足
(1)“山寨程序”依然存在。所谓“山寨程序”是指程序的主体部分抄袭他人的开源和非开源代码,改头换面后作为自己开发的程序前来参赛。目前个别代表队没有努力提高自身的技术水平,而是想走捷径,使用山寨程序参赛,这种不劳而获的行为导致了竞赛的不公平性,严重挫伤自主研发的积极性,既不利于大学生良好学风和科研作风的培养,也不利于计算机博弈事业的健康发展。
(2)竞赛水平发展较慢。从参赛项目和参赛队数量来看,我国已是计算机博弈的大国,但还不是强国。由于竞赛入门知识偏难和普及性不够等原因,目前参赛的学校数还不多,各高校和研究机构投入的人、财、力资源还不充分,使得高水平的竞赛成果产生缓慢,距世界先进水平还有一定差距。
(3)竞赛没有积累棋牌谱数据。中国机器博弈竞赛开展了12 年,却没有保留下来棋谱牌谱数据,这是一件憾事。在机器博弈技术中,历史积累的棋牌谱数据本质上就是经验和知识,可以直接应用,从而可以减少搜索时间、提高响应速度。分析此事的根本原因在于没有棋牌谱的相应规范或标准,导致没有数据驱动智能,制约了机器博弈水平的快速提升。
2 制定棋牌谱标准,构建博弈竞赛新生态
为了促进我国机器博弈竞赛的规范开展,积累参赛数据,扩大影响力,提高竞赛水平,2017 年11 月专委会研究并开展了“棋牌谱标准设计与打谱软件开发”工作,成立了领导组、专家组和项目开发组,分别负责指导与推进工作、审核与鉴定工作、设计与开发工作。在10 余所高校20 多人的共同努力下,经过6 个月时间,完成了19 种棋牌谱的编制。中国人工智能学会成立了专家组,对此项成果开展了鉴定工作,专家们一致认为:该课题成果填补了国内国际该领域空白,是一项意义重大、影响深远的公益性事业。
2.1 棋牌谱标准的设计要求
在设计棋牌谱标准时,需要达到以下具体要求:
(1)与国际接轨,尽量参照国际国内通用的棋牌谱规范,以方便推广和使用;
(2)棋牌谱格式要注释清楚、科学合理、简单直观,便于理解和应用;
(3)风格尽量统一,对于相同类别(落子、走子、吃子等)的棋种,在棋盘坐标的定义、着法表述、过程记录等方面尽量相近,便于掌握和使用;
(4)明确胜负,记载比赛对手、时间和地点等信息;
(5)所有棋牌谱文件都为文本文件。
图2 和图3 分别是2018 年在合肥开展的国家级比赛中围棋和亚马逊棋的一个对局的棋谱,标题栏处是规范的文件名称。
图2 围棋的棋谱样例
图3 亚马逊棋的棋谱样例
2.2 复盘与打谱软件的设计
在设计复盘与打谱软件时,须达到以下具体要求:
(1)各类棋牌的打谱软件能直接复盘或存取标准的棋牌谱文件;
(2)软件界面美观大方、坐标清晰、有按钮控制、使用简便;
(3)复盘过程可单步复盘,也可自动连续复盘;
(4)打谱过程可以悔棋,也可以手动行棋;
(5)通过操作打谱软件,可以手动制作,保存棋牌谱文件;
(6)打谱软件可判定对弈各方的胜负关系或积分;
(7)打谱软件要配备简单明了的使用说明书;
(8)开发实施单位需向专委会提供软件设计文档,以便后续维护和升级。
图4 和图5 分别为围棋和亚马逊棋对应图2 和图3 棋谱的复盘分析样例图。
图4 围棋的复盘分析软件
2.3 棋牌谱的推行措施
(1)发布《机器博弈棋牌谱白皮书》。依托中国人工智能学会宣传平台,发布棋牌谱标准和复盘分析软件,向机器博弈爱好者充分宣传棋牌谱标准的意义和应用方式。
图5 亚马逊棋的复盘分析软件
(2)强制推广棋牌谱。利用中国大学生计算机博弈大赛暨博弈锦标赛的品牌效应,从2018 年开始,将参赛队提交符合要求的棋牌谱数据作为比赛规则之一。
(3)免费共享棋牌谱库。推行共建共享原则,全国比赛积累的标准棋牌谱库免费向参赛队共享,以利于参赛队提高博弈竞技水平,促进我国博弈技术的快速发展。
(4)解决“山寨程序”问题。保存棋牌谱数据后,有利于验证“山寨程序”问题,保护原创技术产权,从而有利于竞赛的良性发展。
3 推进计算机博弈竞赛的发展
3.1 博弈竞赛契合时代的发展需要
2017 年8 月,国务院发布的《新一代人工智能发展规划》中明确指出:“支持开展人工智能竞赛,鼓励进行形式多样的人工智能科普创作”。2018 年4 月,教育部又印发了《高等学校人工智能创新行动计划》,并提出探索“人工智能+X”的人才培养模式,支持高校师生开展人工智能领域创新创业活动,将人工智能纳入大学计算机基础教学内容。这些政策的推出,使得计算机博弈竞赛具有时代意义。
腾讯发布的《2017 全球人工智能人才白皮书》中提到,中国人工智能人才严重短缺,人才缺口超500万,供求比例仅为1∶10。鉴于此,计算机博弈竞赛既能解决我国计算机博弈技术短板问题,又能弥补我国人工智能创新人才急缺问题。
3.2 5 项驱动要素促进博弈竞赛持续性发展
有5项主要的驱动要素能够促进博弈竞赛持续发展:
(1)应用驱动。棋牌类博弈具有经久不衰的特点,是深受大众喜欢的文化生活的重要组成部分。它不同于一般的消遣游戏,还影响和陶冶着人们的道德观念、行为准则、审美趣味和思维方式等。特别是中国象棋和围棋,它们也是国家在中小学中提倡开设的益智项目。
(2)项目驱动。一方面中国民间棋类项目繁多,除传统项目外(如军棋、飞行棋等),还有一些少数民族类项目(如藏棋等);另一方面国际上也经常推出新的棋牌项目(如爱恩斯坦棋等),所以博弈项目种类和数量均能保证竞赛的持续性发展。
(3)数据驱动。通过标准棋牌谱数据的积累,可以支持大数据智能,利于开展学术层面的深入研究,益于形成以数据推动博弈竞赛发展、以博弈竞赛推动智能人才培育的良性机制。
(4)创新驱动。在“互联网+”和“人工智能+”时代,创新是发展的核心驱动力。基于棋牌类项目的博弈竞赛适于培养大学生的创新能力和创新精神。同时计算机博弈技术是人工智能技术的重要引领者,机器博弈的魅力也是创新的起源。
(5)教育驱动。计算机博弈竞赛符合实践类“金课”的要求[7]。具有①高阶性:知识、能力、素质有机融合在博弈项目中,适于培养学生解决复杂问题的综合能力;②创新性:竞赛内容反映人工智能时代的前沿性问题,学习结果具有探究性;③挑战度:竞赛项目有一定难度,学生需要学习数学、计算机等很多专业知识才能完成,对参赛师生均提出了较高要求。
4 计算机博弈是新时代人才培养的落地项目
4.1 适于培养德智体美劳全面发展的人才
在2018 年的全国教育大会上,习近平总书记提出:“要培养德智体美劳全面发展的社会主义建设者和接班人”。计算机博弈竞赛恰好符合新时代的人才培养要求。一些棋类项目是中华民族优秀的传统文化遗产,包含了悠久的历史和厚重的文化沉淀,下棋过程适合陶冶大学生的情操,培养家国情怀,弘扬核心价值观,所以博弈是非常好的德育项目。一个博弈系统涉及过程建模、状态表示、着法生成、棋局评估、博弈树搜索、开局库与残局库开发、系统测试与参数优化等核心技术,这些技术能够与专业知识紧密结合[8-9],所以博弈是非常适合大学生的智育项目。
计算机博弈像其他体育赛事一样,具有更高、更快、更强的体育精神,参赛队员总是不懈地努力,追求更高的目标,所以博弈也是一项体育项目。棋者,奕也;下棋者,艺也。棋艺带给人们无限的启悟、内涵和审美,同时项目研发需要团队协作精神,所以博弈也是一种创造美感的美育过程。准备竞赛是一件很辛苦的事情,需要投入大量的时间和精力,是一项强度很高的体力、耐力和智力的运动,所以博弈更是一种高级劳动。
4.2 适于作为人工智能课程的实验项目
当前,很多高校纷纷开设人工智能课程,那么用什么案例使课程真正落地呢?由于计算机博弈可以间接地、无损地揭示智能的本质,而且喜闻乐见的棋牌类项目又能迎合大学生喜爱游戏的特点,同时棋牌谱大数据的积累,也为教师开展各类机器学习算法的实验教学提供了数据支持,所以博弈项目非常适合作为人工智能课程的有效实验载体,适于实施寓教于乐、寓学于研、以研促教、以赛促学的新型教育教学方式[10-12]。
5 结语
本文客观地分析了我国计算机博弈竞赛的发展现状和存在的不足。为了更好地促进计算机博弈技术的快速发展,培养更多的人工智能拔尖创新人才,提出了建设棋牌谱标准,开发复盘分析软件,形成以数据驱动竞赛持续性发展的新生态。为了编制更加科学、合理和规范的棋牌谱,制定了棋牌谱标准的设计要求、复盘与打谱软件的设计要求和棋牌谱的推行措施。“人工智能+”时代的特点,进一步促进了博弈竞赛的健康与持续性发展;同时,计算机博弈竞赛也是契合时代需要的人工智能创新人才培养的实践项目。