规训与赏罚：论法律的游戏化

2023-03-15杨子超

华东政法大学学报 2023年4期

杨子超

一、游戏化的原理

（一）游戏化导论

1.游戏化的严肃性

在中文世界，游戏，尤其是电子游戏，仿佛背负着某种原罪。提起游戏，很多人，比如学龄孩童的家长，脑海中第一时间浮现的往往是“辍学”“网瘾”“玩物丧志”“电子鸦片”等负面的词汇，而后这些词汇可能会组装出一位栩栩如生的“三和大神”。〔1〕指聚集于深圳市龙华区三和人才市场的一类呈现颓废生活状态的第二代青年农民工。参见田丰、林凯玄：《岂不怀归：三和青年调查》，海豚出版社2020 年版。若有幸等到人们的直觉褪去，理智回归，游戏从业者们可能会略带欣慰地看到，主流媒体居然愿意把游戏当作一个中性的娱乐消遣手段。若是能再进一步，游戏也许会变身为优化经济结构的第三产业，甚至是为国争光的电竞运动——作为一门生意或职业，已经是大众对于电子游戏能够想象到的最严肃的意义。在这一前提之下，本文竟然要将游戏介绍给高居庙堂的法律，这不能不让人对这一提议的严肃性产生合理的怀疑。但排除这一合理怀疑也称不上困难，因为已经有许多实践为游戏的严肃用途提供了证据。

在每一版Windows 发布之前，微软都必须进行大量的文字校对，这一工作在Windows 7 将要面世前变得愈加繁重起来。而微软在全世界雇用了超过九万名员工，当时最有效率的办法莫过于让这些精通不同语言的人类大脑承担起优化界面语言的工作。后来的结果证明这个想法非常有效，但起初微软走了一些弯路。它尝试了传统的基于赏罚的命令与控制手段，最后才设计出一套以点数和排行榜为基础的游戏化方案——语言质量游戏（Language Quality Game），最终成功使广大员工自愿并热情地投入纠错工作之中。〔2〕See Language Quality Game, https://social.technet.microsoft.com/wiki/contents/articles/9299.language-quality-game.aspx,accessed June 5, 2022.

军队也一直青睐于挖掘游戏在严肃事务中的潜力。除了《美国陆军》这种拟真训练游戏，早在2011 年，美国海军就推出了一款多人互联网在线战争游戏（Massive Multiplayer Online War Game Leveraging the Internet）用以聚合群众的智慧，以求海军在打击索马里海盗的行动中能够以充分的准备应对各种突发状况。这并不是一款有着《命令与征服》〔3〕美国艺电（Electronic Arts）公司制作、发行的一系列经典即时战略游戏。式精美画面和复杂机制的游戏——交互主要是文字性的，最基础并且最核心的游戏机制依然是点数设计，但其最终也达到了预设的目标。〔4〕See Neal Ungerleider, Wannabe SEALs Help U.S.Navy Hunt Pirates In Massively Multiplayer Game, FASTCOMPANY（May 10, 2011）, https://www.fastcompany.com/1752574/wannabe-seals-help-us-navy-hunt-pirates-massively-multiplayer-game; See Spercer Aclcerman, “Navy Crowdsources Pirate Fight To Online Gamers”（May 11, 2011）, https://www.wired.com/2011/05/navy-crowdsourcespirate-fight-to-online-gamers/.

与顶尖跨国公司和顶尖海军一道，以严肃著称的科研人员也将目光投向了游戏。妇孺皆知的《自然》《Nature》在2019 年刊登了一篇分子生物学的论文，其作者列表中赫然写着“Foldit Players”，〔5〕See Brian Koepnick et al., “De novo protein design by citizen scientists”, 570 Nature 390, 390-394 （2019）.而“Foldit”正是一款引导玩家尝试折叠蛋白质的电子游戏。这项工作之所以需要玩家的贡献，是因为了解蛋白质的折叠结构对于攻克其对应的疾病十分关键，然而蛋白质的三维立体结构非常复杂，基于规则的人工智能难以理解和预测，〔6〕截至本文刊发时，基于概率的人工智能已经承担了大量的此类工作，但这从逻辑上并不对本文构成挑战。但人脑正好有着卓越的三维辨识能力。研究者的数量太少，所以数量庞大的电子游戏玩家就派上了用场。实际上，以“Foldit Players”署名的优秀科研论文不止这一篇，“Foldit”也并不是唯一一款成功助力科研的电子游戏。

以上仅仅是诸多游戏化实践中的三例，游戏化真正的应用场景和形式要丰富得多。〔7〕参见［美］简·麦戈尼格尔：《游戏改变世界》，闾佳译，北京联合出版公司2016 年版；See also Ian Bogost, Persuasive Games: The Expressive Power of Videogames, The MIT Press 2007; Thomas M.Connolly, et al., “A Systematic Literature Review of Empirical Evidence on Computer Games and Serious Games”, 59 Computers & Education 661, 661-686（2012）.然而这三个实例的共性对于启发法律的游戏化确实比较典型。它们的核心任务都是通过游戏的形式实现众包（crowdsourcing）工作，而法律的制定和实施作为一项社会治理工程，其追求实现特定立法目标的过程与众包工作十分类似——每个人都得守法，并且守法这件事只能由人来干。〔8〕类似的概念还有同侪生产（peer production），参见胡凌：《超越代码：从赛博空间到物理世界的控制/生产机制》，载《华东政法大学学报》，2018 年第1 期，第8 页。

要达成立法目标，许多法律需要至少是多数人的遵守。为实现其立法目标，游戏化的手段在组织和激励众人进行众包式守法时也应有用武之地。相应地，法律的游戏化也应该能够就此洗脱儿戏化的嫌疑。况且，国家、社会与企业都是人类集体在特定层面上的具体表现，它们在对组织内部的个体进行治理时所遵循的基本逻辑并没有根本性的差异。〔9〕See Ronald Harry Coase, “The Nature of the Firm”, 4 Economica 386, 386-405（1937）；参见［美］曼瑟尔·奥尔森：《集体行动的逻辑》，陈郁、郭宇峰等译，格致出版社2014 年版。所以尽管程度有待探明，本文依然有充分的理由相信，对学校、企业和军队起作用的游戏化机制对于整个社会也同样有效。但需要声明的是，虽然本文主张游戏能够具有某种程度的严肃用途，但为作为一类文化现象的游戏整体正名则大大超出了作者预设的论域，因为本文采纳的是完全实用主义的价值立场。〔10〕话虽如此，对游戏的本体论探讨依然在很大程度上有助于接受和深入理解游戏化这一概念。参见［荷］约翰·赫伊津哈：《游戏的人》，傅存良译，北京大学出版社2014 年版。

2.游戏化法律的可能性

行为经济学的扛鼎之作《助推》在开篇部分讲述过一个令人印象深刻的助推案例：荷兰阿姆斯特丹史基浦机场为了减少男性在小便时产生的飞溅，特意在男厕所的每个小便池内雕刻了一只黑色的苍蝇，结果非常有效地达成了目标。〔11〕参见［美］理查德·塞勒、［美］卡斯·桑斯坦：《助推》，刘宁译，中信出版社2015 年版，第6 页。假设男性小便时产生飞溅的问题变得严重到足以引起全社会的关注进而产生“清洁公厕法”，这一助推方案也依然不失为执行这一法律的良策。

很难想象任何社会在解决这一问题时会像治理超速驾驶一样尝试运用传统的法律规制方式，即基于惩罚的命令与控制。毫无疑问，在减少小便飞溅的问题上采用这种法律规制会产生一系列不可接受的负面效果。即使技术上能够低成本地实施监控，规制型法律的运作也会产生昂贵的组织成本，比如对个人隐私的侵犯、对道德约束的挤出效应〔12〕参见［美］劳伦斯·弗里德曼：《碰撞》，邱遥堃译，侯猛校，中国民主法治出版社2020 年版，第312-317 页。以及执法人员的寻租问题等等。这一简短分析揭示了传统法律规制手段在应对一类数量庞大且分布琐碎的人类行为时所面临的困境。在其衬托之下，行为经济学家提出的助推方案显示出了在处理此类行为时的效益优势。

但在游戏设计师的眼中，助推也并不是终极的完美方案。就拿小便池上雕刻的苍蝇来说，其最大的缺陷在于缺少行为反馈：虽然能够根据实际画面进行想象，如厕者并不确切地知道他是否击中了这只苍蝇，对于他施加于这只苍蝇的即时且细微的影响更是无从知晓。这两种信息十分重要，其缺失在理论上会降低解手者“射击”这只苍蝇的意愿，进而削弱这一措施减少飞溅的效果。

游戏化能够提供近乎完美的解决方案。想象在小便池内安装一个压力传感器，并与小便池上方的显示屏连接。如厕者在小便时对准传感器，屏幕上便会接连显示被击中和冲走的许多苍蝇。实际上，用不着想象，现实世界中已经就这一场景出现过制作更加精良的游戏，其游戏内容远超“射击”苍蝇，这就是日本世嘉（SEGA）公司在2011 年推出的《小便小僧》。〔13〕参见おしっこで遊べるゲーム「トイレッツ」、居酒屋などで好評セガ（12/01/14），https://www.afpbb.com/articles/-/2852812?cx_amp=all&act=all。这款依赖上述装置的游戏具有许多模式，比如一种测量尿量的模式会在屏幕上呈现一个罐子，每次装满了就会有一个卡通人物来迅速替换，而最后的结果会被系统记录下来，加入排行榜。如果玩家觉得打榜的比拼不够刺激，这个游戏甚至提供了一个实时对战的模式。《小便小僧》起初风靡了东京各大公共场所，它也许真的能使安装了游戏的厕所更加清洁，但其最终因为游戏设备成本和使用便利度的问题没能推广开来。不难想象，倘若能够解决硬件问题，这款游戏在实现“清洁公厕法”的立法目标时会比命令与控制模式和助推方案更加得力，而由于“如今的信息革命突破了上帝的‘围栏’”〔14〕马长山：《数字社会的治理逻辑及其法治化展开》，载《法律科学》2020 年第5 期，第4 页。，这一前提在其他的法律实施场景中是有可能实现的。

（二）什么是游戏——游戏化的要素和机制

游戏这一概念包含了由简到繁的几乎无数种生物活动。从仅以身体为道具的“石头剪刀布”“捉迷藏”和“电报机”，到依赖扑克来记录和公示信息的“保皇”“斗地主”和“炸金花”，再到成百上千名策划（设计）、编程和测试人员耗时一年甚至几年才可上市售卖的所谓“3A 大作”，都可以被称为游戏。但从实用主义出发，本文主要寄希望于运用其消费产业已经颇为成熟的电子游戏来实现法律的游戏化，所以下文的“游戏”如无特别说明，均指电子游戏。

电子游戏五花八门，可以从许多维度分类，比如按照玩法可以分为射击游戏、战略游戏、角色扮演游戏和动作冒险游戏等。但透过纷繁的游戏内容可以发现，几乎所有的游戏都包含一些相同的且有限的基础要素。在基础要素之上，游戏进而可以实现一些更为复杂和高级的设计原则和套路。而在这些基础要素以及建基其上的设计原则和套路背后，要么是长期行业实践所总结的经验，要么是严谨的心理学研究所验证的假说。

1.点数（points）

点数是最为基础的游戏要素，典型的游戏化应用是航空公司常旅客计划中积累的里程。一方面，点数本身作为一项游戏机制，可以为玩家的行为提供实时的反馈。另一方面，点数能够为其他游戏机制的设计和实现提供必要的信息。也正是因为要服务于其他游戏机制，点数这一要素在成熟的电子游戏中往往根据需要记录的行为类型不同而被区分为许多类别。相比较早期受限于硬件性能而往往只有一项总点数的红白机游戏，如今的游戏点数使得设计者能够实现多样的游戏乐趣和行为激励。

2.徽章（badges）

建基于归类累积的点数，徽章的主要功能在于给予玩家针对性的奖赏，较为常见的游戏化应用是幼儿园的小红花。借助徽章，奖赏的阶段和类别可以被区分得十分细致。早期游戏中作为阶段性奖赏的徽章机制比较单一，无助于玩家从一个游戏中发掘多种乐趣。因为在一款游戏中，玩家总是能够找到一些对实现游戏主要设计目标无所助益但其本身却十分有趣的游戏行为，比如选择射击头部而非躯干来射杀敌人。若游戏内设单独的点数统计玩家的“爆头”率，并且根据这一点数颁发“神枪手”徽章，则会将“爆头”变成独立于过关和晋级的乐趣激励机制。

3.排行榜（leaderboard）

排行榜能够利用一款游戏中的几乎所有机制——只要有单独的记录，排行榜便可以对不同玩家进行之间的排名，幼儿园的红花榜便是一种游戏化应用。和徽章相似，早期游戏只有总分数的排行榜。而随着游戏点数系统变得越来越细致，排行榜也被应用到了多种类别的游戏机制中，比如可以利用“爆头”率数据，也可以建基于各种徽章的数量或游戏时间等。在这一基础上，制作精良的大型游戏往往会有一套比较复杂的评分算法就玩家的总体表现给出一个综合性的评价分数，用来制作总的排行榜。

（三）游戏为什么好玩

从逻辑上讲，点数、徽章和排行榜只是游戏的基础组件（components），要实现游戏的乐趣，设计者需要运用基础组件拼装不同的游戏机制，最终要通过这些机制满足玩家各种心理需求，获得各种乐趣，或称动力（dynamics）。〔15〕参见［美］凯文·韦巴赫、［美］丹·亨特：《游戏化思维》，周逵、王晓丹译，浙江人民出版社2014 年版，第87-93 页。最早也是最广为人知的游戏机制系统研究者是Thomas W.Malone。他通过调查采用不同机制游戏的受欢迎度和控制同一游戏中的不同机制进行实验，探究并总结出了对玩家行为至关重要的三种机制：挑战（challenge）、幻想（fantasy）和好奇（curiosity）。〔16〕See Thomas W.Malone, “Toward a theory of intrinsically motivating instruction”, 05 Cognitive Science 333, 333-369 （1981）.这三种机制各自有具体的内涵，比如挑战指明确的目标（goal）和不确定的结果。正如论文的标题，Malone 认为挑战、幻想与好奇不仅仅是基础的游戏机制，更是玩家的内在动机（intrinsic motivation）产生机制。几年之后，他和Mark R.Lepper 一道将各自的研究发现整合为一种二元的游戏与内在动机理论，即以自身动机概括的挑战、好奇、幻想和控制以及以人际动机概括的合作、竞争和认可，同时，二人对各类动机的具体内涵也有修正和补充。〔17〕See Thomas W.Malone & Mark R.Lepper, “Making Learning Fun: A Taxonomy of Intrinsic Motivations for Learning”, in R.E.Snow & M.J Farr eds., Aptitude, Learning, and Instruction volume 3: Conative and Aあective Process Analyses, Routledge, 1987, p.229-253.

Malone 和Lepper 对基础游戏机制的总结基本都被后来的研究所承袭，但也许是因为20 世纪80年代计算机的性能限制了游戏的机制创新，21 世纪的游戏研究在这二人的基础上又总结出了许多新的机制。比如Rosemary Garris 等在世纪初曾总结出39 种游戏元素，但随后自己又浓缩成了幻想、规则/目标（rule/goal）、感官刺激、挑战、神秘（mystery）和控制6 种关键元素。〔18〕See Rosemary Garris, Robert Ahlers & James E.Driskell, “Games, Motivation and Learning: A Research and Practice Model”,33 Simulation & Gaming: An Interdisciplinary Journal 441, 441-467（2002）.Wilson 等人在2009 年归类提出了18 种游戏要素，〔19〕See Katherine A.Wilson, et al., “Relationships between Game Attributes and Learning Outcomes: Review and Research Proposals”, 40 Simulation & Gaming: An Interdisciplinary Journal 217, 217-266（2009）.而后Bedwell 等人为了方便实验操控将这18 种要素合并归类为交互语言（action language）、状态评估（assessment）、冲突/挑战（conflict/challenge）、控制、环境（environment）、游戏虚构（game fiction）、人际互动（human interaction）、沉浸度（immersion）、规则/目标9 个类别。〔20〕See Wendy L.Bedwell, et al., “Toward a Taxonomy Linking Game Attributes to Learning: An Empirical Study”, 43 Simulation& Gaming 729, 729-760（2012）.

关于游戏基础机制的研究还有很多，〔21〕参见［美］Jesse Schell：《游戏设计艺术》，刘嘉俊、陈闻等译，电子工业出版社2016 年版。此书是游戏设计业界公认的圣经级读物。但不难看出，这些分类虽然有时重叠，有时错位，甚至有时矛盾，但研究者们对其中一些机制的重要性是有共识的，即它们是挑战、目标、控制、人际关系以及幻想。此外，所有这些机制的实现都要求某种程度的及时反馈。从这个意义上讲，韦巴赫和亨特选择点数、徽章、排行榜作为游戏化设计最基础的组件是相当明智的。〔22〕参见［美］凯文·韦巴赫、［美］丹·亨特：《游戏化思维》，周逵、王晓丹译，浙江人民出版社2014 年版，第77-86 页。任何游戏都必须借助这三个基础组件来实现最优反馈和其他关键机制，才能最终到达目标乐趣。

二、法律的游戏化I：激励

有些法律不需要众包式遵守，比如刑法——大多数人不需要作出任何努力就可以不做“具有一定的社会危害性”〔23〕参见高铭暄、马克昌主编：《刑法学》，北京大学出版社2011 年版，第44 页。的行为。但有些则相反，人们遵守这些法律需要承担某种显性的成本——有时需要学习；有时付出金钱；有时占用时间；有时还要调用注意力。交通法就是这样的法律。道路交通也许是大多数普通人对法律感知最多，甚至是唯一的场所与时刻。〔24〕参见［美］罗伯特·C.埃里克森：《无需法律的秩序》，苏力译，中国政法大学出版社2016 年版，第152-153 页。

交通是每天都在进行的大规模集体行动，一般来说，集体行动若要达成，就必须克服“集体行动的困境”，即“囚徒困境”〔25〕See Garrett Hardin, “The Tragedy of the Commons”, 162 Science 1243, 1243-1248（1968）.、“搭便车”〔26〕参见［美］曼瑟尔·奥尔森：《集体行动的逻辑》，陈郁、郭宇峰等译，格致出版社2014 年版。以及“协调困境”〔27〕See Richard H.McAdams, “The Expressive Power of Adjudication”, 2005 University of Illinois Law Review 1403, 1043-1122（2005）.。一般而言，法律这种社会存在就是为了解决这些合作困境。困境更具体的起因是外部性内化不足以及信息不对称，所以法律就必须运用赏罚和信号来内化外部性和传递信息。这便是交通法做得略有欠缺，但游戏化可以补足的工作。

一个没有拥堵和事故的交通世界基本上是所有社会成员的愿望。如果自动驾驶技术始终不能越过L3 的门槛，而社会还想要实现如此高效率的交通，掌权者就不得不放弃单单依靠技术架构来一劳永逸解决问题，而必须转向其他的规制手段，也就是法律、市场和社会规范。〔28〕See Lawrence Lessig, “The New Chicago School”, 27 Journal of Legal Studies 661, 661-692（1998）；参见戴昕：《犀利还是无力？重读〈代码2.0〉及其法律理论》，载《师大法学》2018 年第1 期，第260-261 页。这四种行为干预思路并不泾渭分明，也不相互排斥，但法律在其中具有比较特殊的地位。因为掌权者若要直接或间接进行行为规制，法律是其主要的手段，姑且称之为“抓手”。

（一）法律的直接激励

许多交通违法的底层逻辑在于囚徒困境所导致的双输纳什均衡，以及搭便车所引发的理性冷漠。比如在交通流量较大时，整体最优的做法是每个司机都尽量减少穿插，由此减少对车流的扰动，进而防止形成“停走波”（stop-and-go waves）〔29〕又称shockwave，是交通流研究中的常用概念，描述的是交通拥堵中逐渐向后扩展和移动的拥堵团（jam cluster）。Yuki Sugiyama 等将停走波的产生视为非平衡多粒子体系的相变问题，并首先用实验验证了形成停走波并不一定需要道路瓶颈，在超出稳定阈限的交通流中，车辆本身的扰动就可以制造停走波。See Yuki Sugiyama et al., “Traきc jams without bottlenecks—experimental evidence for the physical mechanism of the formation of a jam”, 10 New Journal of Physics 033001 （2008）， https://iopscience.iop.org/artic le/10.1088/1367-2630/10/3/033001, accessed June 5, 2022.实验的视频记录可以直观地反映停走波的形成机制，参见https://iopscience.iop.org/article/10.1088/1367-2630/10/3/033001/data，accessed June 5, 2022; See also Max Glaskin, Shockwave traきc jam recreated for first time, New Scientis（Mar.4, 2008）, https://www.newscientist.com/article/dn13402-shockwave-traきc-jam-recreated-for-first-time/.，降低整个车流的效率。但身处繁忙的车流，每个司机的想法都会是利用空隙尽可能地穿插到车队的前部以少吃前方车辆变道所制造的“停走波”，而对于自己制造的“停走波”，则留给身后的司机来消化。这便是车流中的囚徒困境，其唯一的纳什均衡就是每个司机都尽力变道向前挪动，结局就是在不断互相超越的过程中，每个司机的相对位置都没有什么变化，但整个车流的速度却慢了许多。理性冷漠与囚徒困境的形成相关，它指的是所有人都等待别人来监督和惩罚破坏合作的人，这一方面是因为所有人都想搭便车，另一方面是每个人都知道自己的努力微不足道。〔30〕理性冷漠也是公司治理所面临的一个难题。参见张巍：《资本的规则》，中国法制出版社2017 年版，第222 页。交通中的理性冷漠意味着当管理者需要交通个体举报交通违法行为时，这些主体并不会积极地承担成本去举报。

过往的社会科学研究对于如何应对这些典型的博弈困境已有充分的讨论和成熟的理论对策。对于囚徒博弈中的背叛和集体行动中的搭便车，最要紧的是运用奖赏与惩罚内化外部性——无论正与负，让行为者承担或享受其行为的后果。法律奖惩机制的运行符合博弈理论，但实际上并不完美。司机们不再酒驾，不再闯红灯，但如上文所述，他们依然会频繁地违法并线。为什么法律没能控制住变换车道的军备竞赛？原因在于交通执法所依赖的这些技术架构已经过于陈旧，以致执行监控与赏罚的成本过于高昂。交通法对交通行为的规制依赖遍布路网的监控摄像头。这种执法手段在发现和取证酒驾、超速、闯红灯以及不礼让行人等发生在特定道路节点的违法行为时具有相对优势。

然而面对损害整个车流效率的穿插与加塞，这些手段就无法施展。首先，违法并线可能发生在道路的任何位置，若要及时发现，则需要监控全线。最后，若放弃依靠技术手段实施监控转而借助群众的眼睛，则又会遭遇理性冷漠。再次，穿插与加塞处理起来十分棘手，因为有相当部分的并线行为是合理的，或是被迫的。这一状况既增加了甄别成本，又加剧了处罚违法并线的问责压力。

类似于导航软件，利用4G 移动网络和GPS 定位系统，游戏可以对司机的驾驶行为作出即时反馈（奖赏），帮助法律扭转颓势。一款能够与开车相结合的平行实境游戏应该能够显著减少违法并线，本文姑且称之为《驾驶精英》。在这一游戏中，玩家应当能够自定义代表自己的游戏角色外观。〔31〕能够自定义的替身（avatar）是一个重要的游戏机制。See Michael Sailer et al., “How Gamification Motivates: An Experimental Study of the Eあects of Specific Game Design Elements on Psychological Need Satisfaction”, 69 Computers in Human Behavior 371, 371-380（2017）.游戏进行时，角色能够以开车的状态呈现，游戏也会以这个角色为基础和玩家进行多样的互动。《驾驶精英》中可以设置一项挑战，名为“直来直往”，如果司机能够持续保持在同一车道行驶，此项挑战的点数就会以可视的方式一直增长。在这一过程中，设计者可以采用多样的可视化方案来引导司机的行为，比如操纵某种华丽的“热力状态”变换。以这些点数为参照，游戏可以为玩家颁发不同等级的“直来直往”徽章。游戏还可以提供接口，允许玩家自愿在自己的社交媒体账号中展示其获得的徽章，也可以根据徽章获得情况和角色等级给玩家发放代币。玩家可以用这些代币购买游戏中的道具和装饰，比如将游戏人物座驾由大众换成兰博基尼，这些看似简单的机制能为执法带来诸多便利。

第一，游戏能够有效地获取信息。通过这些途径，执法者不必设置大量的监控摄像头和感应装置就可以获取并处理司机的实时行为信息。此外，由于司机玩家的行为都由游戏程序来作出实时反馈，运用法律的规制者便能以极低的边际成本向被规制者传递指令信息，即“微指令”，〔32〕See Anthony J.Casey & Anthony Niblett, “The Death of Rules and Standards”, 92 Indiana Law Journal 1401,1401-1448（2017）.这意味着执法的方向和力度能够根据规制目标和实际情况进行实时调整，使得政令主体在受益于朝令夕改的灵活性的同时，又不至于损伤自身的权威。

第二，游戏能够帮助法律降低甚至消灭施行赏罚的边际物料成本。即使作为二进制代码的点数和徽章不能进一步兑换成为其他利益，它们本身也构成了强有力的奖赏。虽然理性人假设被广泛使用的内涵是人只追求经济利益，但福利经济学已然将效率概念扩张到了主观效用。效用的测度仍然是个障碍，但许多问题其实不需要精确到基数效用。谁也无法否认玩游戏能获得正效用，这种游戏的效用在本文第一章第（三）节已经有过论述。也许这奖赏没有那么强，但可能也足够执法者使用。很多时候，法律只需要程度不高的赏罚便可以覆盖行为者选择“合作”的损失和选择“背叛”的收益。熟练且自信的司机也许只是出于习惯进行穿插，甚至有些本来就只是把恰到好处的并线当作一个获取成就感的游戏——他们只需要一个微弱的理由便可以不去冒这个可能导致剐蹭事故的风险。

最重要的是，这些赏与罚的边际物料成本近乎为零。传统法律能够给予奖赏的场景十分有限——赏金猎人、职业打假人以及股东集团诉讼律师都只局限在较为狭窄的场域。原因在于，“可以用奖励来创设诚实激励。但如果大多数人在大多数时间内都诚实，惩罚不诚实可能就便宜一些”。〔33〕［美］罗伯特·C.埃里克森：《无需法律的秩序》，苏力译，中国政法大学出版社2016 年版，第135 页。所以对于需求数量庞大而单独看起来又不那么重要的行为，比如举报交通违法，法律便只能转而惩罚不法，最多是克制地奖赏守法。有奖发票和有奖举报的低回报率正是这一逻辑的体现。〔34〕参见《深圳交警“随手拍”9 月再发45 万奖金》，来源：http://szjj.sz.gov.cn/gkmlpt/content/5/5587/post_5587579.html#2276，2022年6 月20 日访问；又见《第七季“百日零违法”活动正式启动》，来源：http://jgswj.shandong.gov.cn/art/2022/5/25/art_119330_10297614.html，2022 年6 月1 日访问。奖赏不足的后果便是激励不足，其原因是边际奖赏成本过高，但游戏没有这个问题。增长的点数、发放的徽章、用点数和徽章兑换的代币以及代币购买的“兰博基尼”，归根结底都不过是事先写好并可以零成本无限复制的代码。

第三，游戏能够减轻法律执行的阻力。除了以知情同意回避隐私风险，游戏还能够减轻执法者的问责压力。一来，游戏的奖赏，与真实的经济利益并没有直接的联系。二来，游戏的首要前提是自愿，若有人认为这种游戏中建构的赏罚真的对自己的真实生活产生了不可控的影响，不玩便是。不必担心因为某一部分人的“弃坑”而影响游戏化法律的影响力，法律的游戏化本来就不指望能够规制所有类型的行为者，它只要改变了那些处于违法边际的人便已经完成了使命。

（二）借助社会规范的间接激励

要控制行为数量从而获得某种秩序，法律有时不需要亲自下场。就像举报违法并线的后车司机，人们有时不仅会自发地举报不法，更会代替法律施行奖惩。例如，不难想象，总是有人在泳池中小便，要惩罚此类行为并不容易，但只需要在泳池中加入尿液显色剂并明确提示，便可有效制止。只需揭示事实，社会规范便可自行实施赏罚——违法者会被鄙视、咒骂、排斥或放逐，完全无需担心理性冷漠。

如今，已经有许多学者乐意引用并在一定程度上相信，“法律制定者如果对促成非正式合作的社会条件缺乏眼力，他们就可能造就一个法律更多但秩序更少的世界。”〔35〕［美］罗伯特·C.埃里克森：《无需法律的秩序》，苏力译，中国政法大学出版社2016 年版，第304 页。仔细想来，这句名言不单单在强调秩序无需法律。尽管“法律规则还会影响人们获取为非正式社会控制所必须之信息的难易……计算机时代因此创造了这样的可能性，即非正式控制体系会从法律体系那里收复某些领土”，〔36〕［美］罗伯特·C.埃里克森：《无需法律的秩序》，苏力译，中国政法大学出版社2016 年版，第303 页。但有些时候，法律和社会规范可以抛弃竞争转向合作。〔37〕参见戴昕：《理解社会信用体系建设的整体视角：法治分散、德治集中与规制强化》，载《中外法学》2019 年第6 期，第1469-1491 页。

依然是借助便携式智能终端和移动互联网，游戏化的法律能够以零边际成本为社会规范提供必要的信息。《驾驶精英》不仅应该记录玩家获得了多少点数、赢取了多少徽章以及兑换了什么装饰，更重要的是，最好能允许玩家向自己的朋友、家人和同事等展示这些游戏中的成就，这就需要它自建或利用现有的社交网络。

正如支付宝的内置游戏《蚂蚁森林》中的“能量”积累背后体现了个人的低碳和健康生活，〔38〕其中当然夹带了商业利益的私心，比如线下使用支付宝支付能够获取“能量”。但由于发行这款游戏本来就是阿里巴巴这一商业公司的商业行为，所以《蚂蚁森林》与商业利益这一终极目的的完美契合正说明了游戏化这一手段的威力。《驾驶精英》中的成就也不同于纯粹的电子游戏，这些点数和徽章的背后是长期坚持的不加塞、不穿插以及协助执法。这些高成本的守法和志愿行为在逻辑上可以作为社交信号〔39〕参见［美］埃里克·A.波斯纳：《法律与社会规范》，沈明译，中国政法大学出版社2004 年版，第25-40 页。传递给周遭同侪，表明自己不是乐意逞一时之快的“坏人”。〔40〕好人与坏人概念区分的是人对未来利益的重视程度。参见［美］埃里克·A.波斯纳：《法律与社会规范》，沈明译，中国政法大学出版社2004 年版，第25-40 页。法律游戏中的成就记录能够让玩家以极低的成本向他人传递包含了自己高成本行为的信号，进而增加玩家在线下的合作获利机会，这便是游戏化的法律通过社会规范间接实施的奖赏，这也是非游戏化法律力不能及的。因为成本问题，后者既不掌握相关的信息，也缺少传递信息的途径——犯罪记录算是一种，但其覆盖的范围显然过小。

在法律游戏为社会规范提供信息的过程中，排行榜机制可能会起到催化剂的作用。排行榜能够为社交圈内的人设定平均的行为水平，也能够公示每个玩家在圈子里处于什么位置，这使得玩家在排行榜中的排位能够作为社交信号使用。比如在《驾驶精英》的“礼让行人”得分排行榜上处于末位便不是一件光彩的事情，类似的设计也被应用在了《学习强国》，并收到了良好的激励效果。然而排行榜最为直接的功能是制造竞争，后者在某些情况下有可能演变为囚徒困境式的军备竞赛。例如一些人为了提高《学习强国》或《微信运动》的排名，只是用手机播放课程而并不学习，甚至购买“摇机架”增加步数而并不运动。这些做法同时也揭示出游戏化易产生漏洞（bug）的固有缺陷，需要格外关注。

（三）对协调的激励

为什么很多人会在明知路口没有违法拍照时依然遵守红绿灯？也许是因为无意识的习惯，这确实是一个有竞争力的解释，〔41〕参见［美］劳伦斯·弗里德曼：《碰撞》，邱遥堃译，侯猛校，中国民主法治出版社2020 年版，第299-301 页。但却不容易让人信服，司机们应该都有同感，在路口停车需要承担很重的心理成本——通畅行驶的诱惑力是惊人的，习惯性地停车后，为什么没有在几十秒的时间里反应过来呢？〔42〕流畅行车可能会带来心流体验，红灯停车便是猛然中断了心流，瞬间切换到了无聊的状态，心理成本可想而知。参见［美］米哈里·契克森米哈赖：《心流》，中信出版社2018 年版。另一种解释也许更加接近问题的实质，这就是法律的表达作用（expressive power）。

没有摄像头背书的红绿灯所发挥的就是一种法律的表达作用。在法律经济学文献中，这一守法机制特指独立于惩戒与自身合法性的法律影响力，它能够将合作博弈导向较优解。合作博弈中不存在单一的纳什均衡，也就没有占优策略。所以在这些合作中，人们并不那么关心合作剩余的分配——谁先走不要紧，重要的是避免两个人一起走或一起等。因此，在路口通行的场景中，等或走本身都不是有利或有害社会的行为，人们需要的只是他人行为的确定性。作为法律表达作用机制之一的聚焦点（focal point）能够在一定程度上提供这一确定性，即便它是没长牙齿的便宜话（cheap talk）。

靠哪边行驶是典型的合作博弈，一般由法律规定或变更，比如挪威，〔43〕参见［美］汤姆·范德比尔特：《开车心理学》，邹熙、陈晓斐译，中信出版社2017 年版。但即使没有法律——假设英国政府忽然之间瓦解，人们也很有可能对继续靠左行驶达成共识。共识的关键在于每个行为者都发自内心地相信别人也都怀有同样的想法，促成这一确信的因素是之前的习惯或文化。理论上将这种不依赖外部力量就能使合作博弈中的某一均衡被众人选择的过程称为聚焦，促成这种选择的因素就叫聚焦点。〔44〕See Richard H.McAdams, “Focal Point Theory of Expressive Law”, 86 Virginia Law Review 1649, 1649-1730（2000）.不带摄像头的红绿灯就是聚焦点，即使走/停的成本收益结构和左行/右行有些许不同。司机们普遍有“红灯停”的习惯，同时，他们确信别的司机一般也都有这种习惯，所以当绿灯亮起时，司机们可以放心大胆地驶过路口。同样，当看见红灯亮起，司机一般就会停车，不仅是因为自身的习惯，更是因为他们确信垂直方向上看见绿灯的司机大概率不会停车。

法律游戏也可充当这种聚焦点。“机动车在车道减少的路口、路段，遇有前方机动车停车排队等候或者缓慢行驶的，应当每车道一辆依次交替驶入车道减少后的路口、路段。”〔45〕《道路交通安全法实施条例》第53 条第3 款。但实际上，司机们在遇到此类情况时，总是会出现协调问题。正常行驶的司机和需要并线的司机都不知道对方是准备让行还是抢行，所以两种无效率均衡会频繁出现——要么双方都让行，要么双方都抢行。对此，《驾驶精英》中可以设置一项名为“汽车拉链”〔46〕上海市曾运用传统的交通执法手段在一定范围内的此类路段实现过拉链式的交替通行，但若涉及推广则也会面临本章论述过的传统法律赏罚的障碍。参见《上海高架车辆“拉链式”交替通行被赞》，来源：https://www.thepaper.cn/newsDetail_forward_3463116，2022 年6 月21 日访问。的挑战，对交替让行的司机进行奖赏。如此一来，这一游戏就会成为交替让行均衡的聚焦点。因为游戏的存在正如红绿灯，司机们如果都在玩《驾驶精英》，那么他们就可以预期对方会遵照游戏指示，正如他们预期对方会遵守红绿灯。但问题就出在这个前提——司机为什么会都在玩《驾驶精英》？

聚焦点理论有一个逻辑漏洞：如果博弈者就是不选择聚焦点所聚焦的策略，那么聚焦点也拿他没办法。〔47〕See Richard H.McAdams, “The Expressive Power of Adjudication”, 2005 University of Illinois Law Review 1043, 1043-1122（2005）.那么从这一漏洞反推，博弈者在一定程度上就不能真的确信对手会按照聚焦点的聚焦策略行事。解决这个问题的是信号，也就是上文说过的那个信号。与聚焦点的便宜话相反，信号的关键在于其高成本，即以高昂的成本背书信息的可信度，从而稳定接受者的预期。红绿灯是便宜话，但加上闯红灯拍照设备的红绿灯就是实打实的交通“信号”，它的成本并不在于安装的设备，而在于国家坚决惩罚违法的信用。〔48〕See Richard H.McAdams, “The Expressive Power of Adjudication”, 2005 University of Illinois Law Review 1043, 1043-1122（2005）.司机们一开始也并不是都会遵守红绿灯，但随着闯红灯拍照的普及，红灯停逐渐变成了一种习惯，以至于红绿灯在没有违法拍照的路口也能充当聚焦点。反之，倘若现在拆除所有拍照设备，假以时日，红绿灯便会在一定程度上不再能起到有效的聚焦作用。

所以，《驾驶精英》若要获得司机们的信任，则必须以高成本维持一定的用户数量。但游戏不能效仿国家法那种短时间大范围铺开强制措施的做法，因为游戏的首要元素就是自愿。与其他商业游戏一样，《驾驶精英》可以加强营销力度，同时优化游戏内容以增加用户，形成网络效应。就像社交网络，除了受本身内容的吸引，新玩家还会因为身边人的加入而加入。此外，由于其法律游戏的身份，国家机关也可动用自己的宣传力量推广《驾驶精英》，以国家信用进一步增强其传递的信号。

必须承认，即使火力全开，法律游戏能有效传递信号从而影响行为的人也是有限的——总是会有一部分人不守法。但《驾驶精英》如果能在初期就影响大量的行为，守法人的数量就有可能突破临界点，从而使得守法/违法人数比例发生较大的变化，也就是从仅有较少人守法的均衡转变为仅有较少人违法的均衡。〔49〕See Robert Cooter, “Expressive Law and Economics”, 27 Journal of Legal Studies 585, 585-608（1998）.此时法律游戏化的任务也就完成了。

三、法律的游戏化II：规训

惩罚，在某种条件下，其结果并不会指向最初的目的，有时甚至会使事情向着反方向发展。以色列一家幼儿园的管理者已经切身体验了这一负面效果，他们本想利用罚款降低家长接孩子时的迟到率，结果罚款施行后的迟到率仅有短暂的下降，之后便一直攀升，并且取消罚款后仍然居高不下。〔50〕See Uri Gneezy & Aldo Rustichini, “A Fine Is a Price”, 29 The Journal of Legal Studies 1, 1-17（2000）.惩罚得慎用，那奖赏呢？也得小心。心理学家艾尔菲·科恩搜集了一本书的案例和实验证据，证明了外在奖赏对学生和员工绩效的破坏性影响。〔51〕参见［美］艾尔菲·科恩：《奖励的恶果》，冯杨译，山西人民出版社2016 年版。

尽管很少公开承认，法学家们受行为主义心理学的影响颇为深刻。以斯金纳为代表的行为主义心理学主张像训练动物一样用由外在赏罚构成的“强化”与“惩罚”改变可欲行为与不欲行为的频率，〔52〕参见［美］韦恩·韦登：《心理学导论》，高定国等译，机械工业出版社2016 年版，第182-192 页。这与传统法律对人的激励如出一辙。经济学对法学的全面介入并没有改善这种状况，反而有所加剧——波斯纳甚至提出过著名的财富最大化主张。〔53〕参见［美］理查德·A.波斯纳：《正义/司法的经济学》，苏力译，中国政法大学出版社2002 年版，第四章“财富最大化的伦理的和政治基础”。当然，斯金纳和波斯纳本人不可能认为人和动物没有区别，或者人只追求经济利益，他们如此主张只是为了保证各自理论的简洁性与可证伪性，因为只有行为和财富是可观测和计量的。

然而，行为主义心理学的对立面——认知主义心理学，为保留人性的行为科学研究带来了希望：先是人本主义心理学，而后是方兴未艾的积极心理学。这些认知主义的研究表明，人具有一些与动物性生理需求截然不同的心理需求，这些需求会驱动人的各种行为。从这一普遍性的结论出发，法律便不能仅仅再停留在利用赏罚操纵人的外在动机进而激励行为，而必须正视由特殊心理需求驱动的人类内在动机对行为的影响。

无独有偶，正如本文第二章第三节对游戏化理论的回顾，电子游戏乐趣的科学理论开创者Malone 一开始对游戏的研究就落脚在内在动机之上。Malone 后来的研究兴趣转向了人工智能领域，但与其差不多同时起步的心理学家德西和瑞安对内在动机一般性理论的研究到现在已经成长为积极心理学的重要分支。而他们最终形成的自我决定理论已经成为晚近很多游戏研究的理论框架。

自我决定理论总结并揭示了激发内在动机的三个基本心理需求：自主（autonomy）、胜任（competence）和联结（relatedness）。自主包含两方面的内涵。第一，自主的反面是受控，控制会削弱一个人的自主感，从而破坏内在动机。外部的赏罚便是典型的控制，有关控制影响内在动机的许多实验都是通过操纵赏罚来完成的。第二，自主需要做出有意义的选择，这就要求行为人掌握足够的信息，否则他的选择便只有盲目，没有自主。〔54〕参见［美］爱德华·L.德西、［美］理查德·弗拉斯特：《内在动机》，王正林译，机械工业出版社，第31-44 页。胜任关系着一个人对自身能力的感知。这种感知的关键是及时的反馈，若一项任务给予行为人持续的正面反馈，这些反馈便会增强其胜任感，进而增强其进行这项任务的内在动机。需要注意的是，过于简单的任务并不能增强人的胜任感。〔55〕参见［美］爱德华·L.德西、［美］理查德·弗拉斯特：《内在动机》，王正林译，机械工业出版社，第61-74 页。联结则指的是人际关系，是爱与被爱和关心与被关心的需要。若某种活动使行为者感到能够信赖他人并与其合作，则这项活动就能够满足联结的需求，行为者从事这项活动的内在动机就会提高。〔56〕参见［美］爱德华·L.德西、［美］理查德·弗拉斯特：《内在动机》，王正林译，机械工业出版社，第80-90 页。

游戏能够完美地照顾到上述三种人类心理需求，从而增强内在动机。〔57〕See Richard M.Ryan, C.Scott Rigby & Andrew Przybylski, “The Motivational Pull of Video Games: A Self-Determination Theory Approach”, 30 Motivation and Emotion 344, 344-360 （2006）.首先，游戏要求自愿游玩，游戏中的各种指示也为玩家的选择提供了高自由度和充足的信息。其次，游戏的三大基础组件和挑战机制能够切实增强玩家的胜任感。一方面点数、徽章和排行榜能够为玩家的表现提供及时的反馈；另一方面，游戏挑战的难度变化能够始终匹配玩家的能力。最后，游戏的社交功能以及联机游戏的合作功能能够增强和改善玩家之间的人际联结，增强其联结感。

游戏能够增强玩家玩游戏的内在动机，那么游戏化的法律也应该能增强玩家玩法律游戏从而守法的内在动机。游戏化的法律能够改善行为人对自己守法自主性的感知。法律的制定通常是为了某一种社会公益，但传统的法律赏罚却容易使人忘记这种公益性。《蚂蚁森林》的玩家之所以自觉自愿地收集能量植树，很大程度上是因为他们相信自己在手机上每兑换一棵树，荒漠地区就真的会多出一棵梭梭树，换句话说，收集能量就是玩家凭借充足信息自主做出的有意义的选择。相反，对交通违法行为进行罚款往往不能向违法者传递这么做的意义，后者只是被动地接受罚款，没有信息和机会自主做出选择。但《驾驶精英》可以提供有意义的信息，它可以用图像的方式告诉司机他们每一次看似微不足道的并线对整个交通造成了什么影响，从而为后者选择并线与否提供有意义的信息。

游戏化的法律还能增强守法的胜任感。《驾驶精英》的点数增长状态能够时刻提醒司机他正处于何种守法的状态。每次颁发的徽章能够对司机的遵章驾驶能力作出阶段性的反馈。此外，在总体上评价司机对整个交通状况产生的影响也相当于对司机的公益贡献作出反馈。《驾驶精英》也能够增强玩家与其他人的联结感。排行榜能够让司机与朋友们比试高效率驾驶的技术。个人主页的成就展示还能够增进司机们对彼此的信任。所有这些游戏构件和机制对三种心理需求的满足最终都增强了《驾驶精英》玩家守法驾驶的内在动机，后者又会使玩家增加守法驾驶行为，由此形成正反馈循环。

以上论述表明，游戏化的法律远不仅仅是利用廉价的赏罚控制人的行为。当司机在玩《驾驶精英》时，一方面，他被游戏的简单乐趣所吸引——清脆或激昂的声音与华丽的视觉特效使人流连忘返；但更重要的是另一方面，司机们通过《驾驶精英》的细致反馈理解了交通规则背后的社会公益，并且在引导下自觉自愿地追求这些社会公益。由此，游戏化的法律便由之前单薄的激励升级成为遍及每一个毛孔的规训。只不过，如今的游戏化规训使人沉浸在玩乐的幸福当中，全然去除了福柯笔下的痛苦。〔58〕参见［法］福柯：《规训与惩罚》，刘北成、杨远婴译，生活·读书·新知三联书店2019 年版。

四、结语

在有限的篇幅之内，笔者并不奢望能给出一个游戏化法律的完整设计，一方面，游戏设计的学问虽不比法学深厚，却也称得上是汗牛充栋，因为这一领域集合了心理学、经济学、传播学、美学、文学、历史学、物理学、工程学等诸多学科的知识；另一方面，电子游戏这一事物在中国社会文化中的地位依然十分尴尬，所以本文若能让读者愿意思考一下法律游戏化的可能性，其使命便已达成。话虽如此，笔者还是要重申自己对于法律游戏化的期望：正如全文所论述的那样，法律经济学揭示了法律运作的深层逻辑，正是循着这些逻辑，游戏化有能力在各个方面加强法律的实施效果。许多研究者在大数据时代寻求社会治理手段和效果的升级，游戏化也许就是那条未曾设想的道路。〔59〕参见马长山：《数字法学的理论表达》，载《中国法学》2022 年第3 期，第129-130 页。