关于策略性投票的一个注记*<br/>——对“不利的特权”博弈的延伸探讨

关于策略性投票的一个注记*
——对“不利的特权”博弈的延伸探讨

2018-01-19赵凤仪

中山大学学报(社会科学版) 2018年1期

赵凤仪，丁利

引言

假设甲、乙、丙三人组成一个委员会，需要对三个候选方案X、Y、Z进行投票表决，从中选出一个最佳方案。其各自的偏好顺序为：甲：X>Y>Z；乙： Y>Z>X；丙：Z>X>Y(其中的“>”表示“优于”；如下图:甲、乙、丙三人各自对于候选方案a、b、c的偏好程度从上到下依次递减)。现在，需要解决的一个问题是：对每一对方案的社会偏好的确定，可否按照多数规则来从三个人的偏好中集结出一个对此三个方案的合理的社会偏好排序？

表1

我们可以看到，按照上述偏好顺序，在候选方案X和Y之间，三名投票者中甲和丙皆倾向于选择X，只有乙倾向于选择Y。根据多数规则，候选方案 X以2：1的票数战胜候选方案Y，即社会偏好为X胜过Y；同理，对方案Y和Z，可得社会偏好为Y胜过Z；如果按照通常理性偏好所要求的传递性条件，在X胜过Y，Y胜过Z的情况下，方案X应胜过Z。然而，对候选方案Z和X之间，甲和乙皆倾向于选择Z，只有甲倾向于选择X，得到的结论是方案Z胜过X，从而出现了Z胜过X胜过Y胜过Z的循环，这违背了理性决策理论中合理选择规则所要求的最低条件“非循环性”。运用多数规则集结偏好的过程不能产生一个理性的社会偏好，此即著名的孔多塞悖论。众所周知，孔多塞悖论是1951年阿罗的社会选择不可能性定理的先驱。

孔多塞悖论中对每一对方案之间得到社会偏好时，根据所有人的真实偏好来进行，相当于每个人在投票中真实显示自己的偏好。而在现实世界中，人们会策略性地选择自己的行动，包括扭曲自己的偏好和操控议程(agendas)等手法，以达到策略性操纵(manipulate)结果的目的。

由于策略性投票问题的“普遍存在”，公共决策的投票结果并不一定能完全反映投票者的真实偏好。投票者为追求自身利益的最大化，往往会通过投票交易的方式，收受贿赂，在得到足够回报的前提下投票赞成与已无关紧要甚至有所不利的议案；或者采取互投赞成票的方式，通过投票赞成其反对但不强烈反对的候选对象，以换取他人对自己所偏好的候选对象的支持。接下来我们将主要从虚假显示自己的偏好和对投票议程的策略性操控之层面，结合委员会投票的基本框架，对不利的特权、提名选举、序贯表决等几种场景下的策略性投票问题进行讨论。

一、不利的特权

美国政治学家Farquharson 在1969年的名著《投票理论》中讨论过一个“不利的特权”(disadvantageous privilege)博弈*转引自Hervé Moulin (1985): Fairness and strategy in voting, in H. Peyton Young (ed.): Fair Allocation, American Mathematical Society。。

甲、乙、丙三人组成一个投票委员会(甲、乙、丙三人都足够理性且聪明)，对a、b、c三个方案进行一次性投票表决，他们的偏好如表格1所示。投票采取多数通过规则，得票数最多的方案最终当选。甲、乙、丙三人每人只有一次投票机会，且每次只能选择一个方案。甲、乙、丙三人均秘密写票，即各自写票时对方看不到其所投结果，写好选票后，每个人在选票背面签上自己的名字。而在甲、乙、丙三人中，乙作为委员会的负责人，拥有相应的特权。该特权为：当候选方案a、b、c各得一票打平时，由乙署名的那张票上所写的候选方案最终胜出。

我们假设投票者的偏好和投票规则都是他们之间的共同知识。

博弈论的可容许性(admmissibility)要求，一个理性的人不会选择弱劣策略作为自己的行为。所谓弱劣策略，是说此策略相对于另外一个策略而言，不管对手采取何种策略，他用此策略应对对手的策略所得的支付都不会超过使用另一策略所得，并且至少存在一种情形是严格差于另一策略。如果无论对手采取何种策略，他用此策略所得都严格差于另一策略，则此策略为劣策略。这种一次性投票中，投自己最不喜欢的目标方案的票，只会降低那些更可取的选项被选中的概率，所以一定是弱劣策略。那么，我们可以把上述表格中的最后一行(对甲、乙、丙三个投票者而言各自最不喜欢的方案)剔除，进而可将表格1进一步简化为下表(表格2)：

表2

(甲、乙、丙三人各自对于候选方案a、b、c的偏好程度从上到下依次递减)

我们根据表格2所示的偏好情况，以矩阵的形式写出该投票的策略型表示(如下图)。其中，甲控制每个矩阵中每一行的策略，丙控制每个矩阵中每一列的策略，乙控制左右不同的矩阵。

丙丙甲cacaabbacabbcc bc 乙

倘若甲、乙、丙三人按照自己的真实偏好进行投票，则甲选择方案a，乙选择方案b，丙选择方案c。按照前述投票规则，乙作为投票委员会的负责人，由于其本身拥有特权，则以乙署名的票上所投结果为最终结果，即：b方案最终胜出。而由表格1可知，方案b为丙最不喜欢的方案，因此，作为一名理性的投票者，丙在合理预见自己按照真实偏好选择c反而会导致自己最不喜欢的方案b当选的情况下，其往往会隐藏自己的真实偏好，采取策略性投票。由于对甲来说，比较两行结果可以看出，投b相对于投a是一个弱劣策略，故甲只会选择投a；这样，丙只好放弃对自己而言的最优方案c，退而求其次选择次优方案a，从而使方案a获得两票最终胜出。毕竟对于投票者丙而言，相较于真实表达自身偏好最后却换来自己最不喜欢的结果，其有足够的理由和动力通过策略性投票隐藏自己的真实偏好，从而避免使自身遭受最坏的结果。而根据表格1中所示的偏好顺序可知，方案a恰好是特权者乙最不喜欢的方案，正因如此，这个投票博弈被称为“不利的特权”。

在此，我们需要讨论另外一种可能，即方案c是否有可能获得两票最终胜出。我们首先考虑投票者甲和投票者丙是否有可能结成同盟而共同选择方案c的情况。很显然，由于方案c是甲的严格劣策略，作为一个理性的人，投票者甲不会选择自己最不喜欢的方案。所以通常情况下，只能由投票者丙做出让步，选择自己的次优方案a而最终使得方案a胜出。接下来，我们需要讨论投票者乙和投票者丙是否有可能结成同盟共同选择方案c的情况。我们假设投票者乙和投票者丙之间有一个虚拟对话，即乙对丙说，“我为了避免最坏的情况——方案a当选，我会选择对我而言的次优方案c，对你而言方案c最终胜出自然比方案a胜出要好，对我亦然，我一定会信守诺言”诸如此类的承诺，然而，问题在于，乙对丙的该类承诺具有可信性吗？答案显然是否定的。

很显然，甲选方案a,乙选方案c，丙选方案c的策略组合并不能合理的构成纳什均衡，乙作为理性的投票者，其有足够的动力违背自己的承诺转而投方案b；而丙事先预料到乙会违背承诺转投方案b的情况，其为了避免让自己最不喜欢的方案b当选，只有放弃自己的最优选择方案c转而投方案a，让自己的次优选择方案a胜出，这样便又回到了我们前述结论，从而在结果上导致“不利的特权”。

二、单轮公开选举中投票顺序的重要性：以干部提名为例

我们自然会思考，在何种情形下，特权才能真正成为特权？作为投票委员会中的特权者(如上文中的乙)，究竟以何种方式才能使自己摆脱不利局面？对投票议程(agendas)的策略性操纵是我们接下来要集中探讨的话题。我们首先考察一个干部的提名推选博弈，相应地将上述“不利的特权”所涉之场景进行转换。

投票者甲、乙、丙组成一个投票委员会，从候选人a、b、c中推选一人走向某个重要岗位，三名投票者对于三位候选人的偏好顺序依然如图一所示。

投票采取口头表决的方式，每位投票者只有一次发言机会，且每次发言只能选择a、b、c中的一位候选人，其他人可以听到该投票者的发言内容。结果采取多数通过规则，候选人a、b、c中任意一位候选人得到两张提名票，该候选人即获推选。其中，乙作为投票委员会的负责人享有特权：其不仅可以决定发言的先后顺序，而且当候选人a、b、c各得到一票时，其所支持的候选人即获当选。

此博弈过程的展开型表示比较繁琐，如果画出此过程的博弈树，虽然原理简单却需要较大篇幅，我们可以通过对其时序结构(timing structure)进行本质上相同的简要刻画：

阶段一，乙指定某一位先发言；

阶段二，被指定者发言；

阶段三，根据前者的不同发言，乙相机指定第二位发言者；

阶段四，第二位发言；

阶段五，第三位发言。

接下来，我们将分情况探讨特权者乙如何通过操纵发言者的顺序，寻求有利于自身的投票结果，以使其摆脱“不利的特权”。如前所述，在本质上是一次性的投票中,所有可供选择的策略组合中，一个理性的人不会选择提名自己最不喜欢的候选者，因此我们依然只考察每个人两种提名选择的情形。

首先，我们考察特权者乙让丙第一个发言。按照偏好顺序，丙会选择c或者a。倘若丙选择c，那么接下来乙要考虑的问题是：让甲紧跟丙之后第二个发言还是自己紧跟丙之后第二个发言对其自身更有利。若乙让甲第二个发言，则甲会选择a或者b。无论甲选择什么，乙作为最后一个发言者，出于自身利益最大化的需求，自然会选择b，从而得到c, a, b或者c, b, b的结果组合，即胜出者一定是b。表面上看，这种情况下乙似乎轻而易举即摆脱了“不利的特权”所刻画的不利局面，但细想后便可发现，上述情况是建立在所有投票者均按照自身的真实偏好顺序投票的前提之下的。由前述分析可知：若丙先发言，则无论甲选择a还是b，最终当选的一定是候选人b。结合图一所示的偏好顺序可知，b是丙最不喜欢的候选人，根据逆向递推的原理，丙作为一名理性的投票者，在预见到选择自己最喜欢的候选人c反而会导致自己最不喜欢的b最终当选的情况下，其会放弃自己的最优方案c，退而求其次选择自己的次优方案a。一旦丙作为第一个发言者，在其选择候选人a的情况下，无论接下来乙让甲第二个发言还是自己紧跟丙之后第二个发言，发言的顺序已经无关紧要，因为甲一定会选择a，此时特权者乙无论选什么，最终结果都是a获得两票最终胜出，又会陷入“不利的特权”所示的情况。由此可知，丙、甲、乙或者丙、乙、甲的发言顺序都不能让乙摆脱“不利的特权”所刻画的不利局面，因此，不能让丙第一个发言。

其次，我们考察乙安排自己第一个发言的情形。倘若乙按照自己的真实偏好顺序直接说选择b，那么接下来需要考虑的是让丙第二个发言还是让甲第二个发言的情形。倘若乙让甲第二个发言，甲作为一个理性的投票者，在选择a所得的结果至少不会差于选择b所得结果的情况下，自然会选择a，此时，丙作为最后一个发言者，在推知自己选c一定会导致自身最不喜欢的b胜出的情况下，其会退而求其次选择a，从而使得a以两票最终胜出，这显然又回到了“不利的特权”所示的局面；倘若乙让丙紧跟自己之后第二个发言，丙会选择a(理由同上)，则甲作为最后一个发言者自然会选择a，结果还是a当选，导致“不利的特权”。由此可推知，乙作为理性的投票者，当其预见到自己按照真实偏好选择b同样会使其深陷“不利的特权”之囹圄时，就会退一步选择自己的次优方案c。在乙第一个发言选择候选人c的情况下，接下来甲和丙的发言顺序已无关紧要，因为无论让甲和丙谁第二个发言，丙一定会选择c，甲的选择此时同样可以忽略不计，因为候选人c已经获得了两票而锁定胜局。从图5所示的偏好顺序可以看出，c是乙的次优方案，与乙最不喜欢的a当选相比，“不利的特权”所示的情况得到了一定程度的改善。

接下来要考察的是，乙让甲第一个发言。甲有a和b两种选择。我们先分析甲选择a的情况。此时需要关注的是让丙第二个发言还是乙紧跟甲之后自己第二个发言的问题。倘若乙安排丙第二个发言，丙会选择自己的次优方案a而不是最优方案c(理由如前文所述)，从而使得候选人a获得两票最终胜出。这又回到了“不利的特权”所描述的情况；倘若乙自己紧跟甲之后第二个发言，此时在甲已经选择a的情况下，乙深知倘若自己按照真实的偏好顺序投票而选择b的话，由于b是丙最不喜欢的候选人，丙一定会为了避免自己最不喜欢的人当选而作出让步转而投a，从而再次回到“不利的特权”所刻画的局面。基于此种判断，乙作为第二个发言人会选择对其而言的次优候选人c，从而使得c以两票最终胜出。

正如讨论展开时所进行的假设，甲、乙、丙皆为理性且足够聪明的投票者。对于甲而言，若其能够事先预料到特权者乙可以通过对发言顺序的操纵而第二个发言，则甲为了避免出现自己最不喜欢的候选人c当选的局面，第一个发言时会选择自己的次优方案b而非自己最喜欢的a，从而使得候选人b获得两票最终胜出。这样，特权者乙通过对投票顺序的策略性操纵，如愿以偿地实现了其所期待的最佳结果。

三、序贯表决：以美国国会议程为例

接下来，我们将结合美国国会议案表决的程序，具体分析一下分阶段选举中的策略性投票问题。

众所周知，美国国会在需要就国防、外交、医疗、公共卫生、环境等重要事项投票表决时，通常先由参议院、众议院内所设的专门委员会(如外交委员会、拨款委员会等)就有关事项拟定草案，国会有关部门在草案的基础上拟定修正案。投票表决的议程通常分为两个阶段：首先，由专门委员会进行投票表决；然后，将首轮投票胜出的议案提交到国会，由参议院、众议院进行草案和修正案之间的投票，接着对前一轮胜出的草案或修正案进行最终的投票决定是否通过，如果不通过则保持现状。所以，现状(status quo)永远是备选方案之一。为讨论方便起见，我们在分析问题时不考虑具体的投票表决方式(如唱名表决、点数投票、呼声表决等)。我们将讨论的场域限定在最常用的多数通过规则之下，在此基础上结合前文所提到的甲、乙、丙三人委员会投票的事例，构建如下场景：

假设a、b、c为国会相关部门就重要的社会问题所提出的议案(在此，不考虑具体何者为草案，何者为草案的修正案的问题)，由甲、乙、丙三个集团所组成的委员会就上述三个议案进行投票表决(每个集团内部的行动步调一致)。投票分为两个阶段：在第一轮中，首先就a、b、c三个议案中的任何两个议案进行投票表决(三个议案中没被选中接受第一轮表决的那个议案自动进入第二轮)，得票数最多的议案胜出，获得进入第二轮的资格；在第二轮中，由首轮胜出的议案与直接进入第二轮的议案进行最终的投票表决，得票最多者最终胜出。甲、乙、丙三个集团均秘密写票，即各自写票时对方看不到其所投结果。在每个阶段的投票中，甲、乙、丙三个集团各自只有一次投票机会，且每次只能选择该轮候选议案中的任何一个。其中，乙集团的头目作为投票委员会的负责人，享有如下特权：他可以决定在第一轮中首先由哪两个议案接受投票表决。投票者甲、乙、丙三个集团各自对于候选议案a、b、c的偏好顺序如前述表格1。

这个三阶段博弈的时序结构为：

乙先决定扣住abc中的一个，让其他两个进入第一轮投票；

甲乙丙三个集团对此二方案进行投票，决出一个胜者；

对胜者和余者进行投票，决出最终胜选方案。

此类投票，有一个一般性的结论，即备选方案中的“顶级圈子”(top cycle)中的任何一员，都有机会在特定的议程下成为最终获胜者*参见Jeffrey Banks: Strategic aspects of political systems, in Aumann & Hart (eds.): Handbook of game theory with economic applications, vol. III, 2203-2228, Elsevier Science B. V。，而表格1中的偏好结构使得abc恰恰构成这样一个“顶级圈子”。接下来，我们将分不同情况具体讨论，特权者乙如何通过选择首轮率先接受投票表决的议案，以追求对其自身而言最有利的结果。

倘若乙在第一轮选择让议案a和议案c接受投票表决(即议案b自动进入第二轮)，并且投票者甲、乙、丙三个集团按照各自真实的偏好进行投票，那么按照上述表格1中所示的偏好顺序，甲会选择a，乙会选择c，丙会选择c，即议案c以两票的优势胜出，获得进入第二轮与议案b进行最终较量的资格。在第二轮中，按照甲、乙、丙三个集团的真实偏好顺序，在议案c和议案b之间，甲会选择b，乙会选择b，丙会选择c，即最终由特权者乙最喜欢的b胜出。表面上看，该种情况下似乎特权者乙可以很容易就实现自己所期望的最佳结果。但细想后便可发现，议案b最终当选是丙集团最不希望看到的结果。根据逆向递推的原理，丙作为理性的投票者，当其预见到首轮自己按照真实偏好投票选择c反而会招致最不利的后果时，就会在第一轮改投自己的次优方案a，从而让方案a在第一轮胜出，获得进入第二轮的资格。这样，第二轮在议案a和议案b之间进行投票表决，根据偏好顺序可知，甲和丙都会选择a，只有乙会选择b，从而使得a以两票的优势最终胜出。而方案a恰好是特权者乙最不喜欢的方案。由此可知，对于特权者乙而言，首轮让议案a和议案c进行投票表决的安排只是一厢情愿，结果适得其反。

倘若乙在第一轮让议案b和议案c接受投票表决(即议案a自动进入第二轮)，当甲、乙、丙三个集团按照真实偏好进行投票时，议案b会以两票(因甲、乙会选择b，丙会选择c)的优势胜出，获得进入第二轮的资格。在第二轮对议案b和议案a的表决中，很显然，只有集团乙会选择b，甲和丙都将选择a，最终结果是议案a以两票的优势胜出。方案a是特权者乙最不喜欢的方案。而根据逆向递推的原理，乙作为理性、聪明的投票者，在合理地预见这种不利局面的前提下，在第一轮投票时自然不会诚实地按照真实偏好投票，他会放弃自己的最优选择b，转而投c，使得议案c以两票的优势胜出进入第二轮与议案a进行表决。结合表格1所示的偏好顺序可知，在第二轮议案c与议案a的较量中，议案c将会最终以两票的优势胜出(因乙、丙均会选择c，甲会选择a)。议案c对于特权者乙而言是其次优选择，相较于上述第一种情况议案a当选所引发的“不利的特权”，具有一定程度的改善。

我们最后考察乙在第一轮让议案a和议案b接受投票表决(即议案c自动进入第二轮)的情形。同样的，如果甲、乙、丙按照各自的真实偏好进行投票，则第一轮中，甲和丙都会选择a，乙会选择b，即议案a以两票的优势进入第二轮的投票；在第二轮a与c的投票表决中，按照表格1所示的偏好顺序，乙和丙均会选择c，甲会选择a，从而使得c最终胜出。此时，对于甲而言，在理性地预见到自己首轮选择a反而会获得最坏结果的前提下，自然不应该按照真实的偏好顺序投票，故甲在第一轮会放弃自己的最优选择a，改投方案b，从而使得方案b进入到第二轮的最终决选。于是，第二轮的投票在议案b与议案c之间展开，由表格1所示的偏好顺序可知，议案b将会以两票的优势最终胜出(因甲、乙都会选择b，丙会选择c)。而议案b恰恰为特权者乙最喜欢的议案，因此，让议案a和议案b在首轮即接受投票表决的安排对于乙而言是最佳的策略选择。

结合以上分析我们可以看到，第一轮即让自己最喜欢的议案接受表决的策略选择所得之结果至少不差于首轮让自己最喜欢的议案轮空所得之结果；如策略安排得当，特权者乙甚至可以实现自身目标的最大化。日常生活中很多人参与竞标时，在程序可控的范围内人们通常会选择让自己最喜欢的方案或者说对自身最有利的方案首轮轮空而直接晋级后面的议程，以规避首轮表决失败的风险，殊不知这种做法很有可能适得其反，最终导致对自身不利的后果。正如中国老话“不入虎穴，焉得虎子”，理智分析后的放手一搏反而会有意想不到的收获。当然，具体问题决定了不同的博弈结构和规则，相应的策略也要因地制宜。

结语

作为一种常用的将个体偏好集结为社会偏好的公共决策方式，投票本身即为一个复杂的博弈过程。理性的投票者在追求个人效用的过程中，当发现真实地表达个体偏好无利可图时，自然会采取策略性投票的方式以寻求对自身最有利的结果。这也就要求我们在现实的公共决策中，对投票的各个环节审慎考量，综合分析，制定合适的投票机制并选择最佳策略，使得相应社会博弈的均衡结果尽量接近公共决策的社会目标。

Jeffrey Banks: Strategic aspects of political systems, in Aumann & Hart (eds.): Handbook of game theory with economic applications, vol. III, 2203-2228, Elsevier Science B. V.

Herve Moulin (1985): Fairness and strategy in voting, in H. Peyton Young (ed.): Fair Allocation, 109-42, American Mathematical Society.