双赢的基础
2005-04-29付立
付 立
在现实生活中,竞争性、对抗性的活动比比皆是,如何在这种环境中采取最优的策略击败对手呢?这正是对策论所研究的。对策论又叫博弈论,因为最规范的对抗性活动是下棋——博弈。
这里,“对策”可以理解为对对方策略的反应。在对抗性活动中,各方是具有利害冲突关系的,一方赢,就可能意味着另一方或多方输。对策论研究各方采取策略及效果的规律,提供对付对方策略的最优策略,可以使自己在对抗中处于比较有利的地位。
匈牙利数学家冯·诺依曼是个在对策论研究中作出重大贡献的人。1928年,他提出的极小极大定理是构建对策论大厦的重要基础。
冯·诺依曼分析的是只有两人参加的游戏,游戏中每个人可选择的策略只有有限个,两个人的输赢却是相抵的:一方赢,另一方就输。这种二人有限零和对策,是对策类型中最简单的一种。冯·诺依曼发现,在这样的对策中,虽然两个非常理智的玩家都企图战胜对方,但游戏仍然存在着最佳解。比如说,两个孩子分蛋糕,每个孩子都喜欢要多的,但是一个多了,另一个就少了,这是一个二人双策零和对策,它的解分为两个步骤:一个孩子先把蛋糕切成两半,再由另一个孩子挑选。在每个孩子都认为对方是贪婪的合理假设下,有没有让两个孩子都满意的解,也就是能让两个孩子都不感到吃亏的解呢?有,就是第一个孩子尽可能公正地切蛋糕,让两块蛋糕相差极小,否则,第二个孩子会选大的那块。这就是极小极大定理,后来推广到有更多玩家的情况,即多人有限零和。
对于零和这种对抗性极强的活动来说,只有最佳解,没有双赢解。因为最多只能让双方都不觉得吃亏,却不可能让双方都沾着便宜。战争中的敌对双方即是如此。
好在现实世界中并非只有零和,在现实中,并不一定是你赢我就必然输,它很可能是非零和的。比如说股票市场,炒股的人中有赢也有输,但是钱的总数是随着股票市场资本的增加而变化的,并不是赢输相抵的。
1950年美国数学家小约翰·福布斯·纳什的均衡定理,将极小极大定理推广到了非零和的活动中。他指出,在非零和的对策中,只要参加的人数有限,而且他们可选择的策略也是有限的,那么,就至少存在一个纳什均衡点。而在纳什均衡点上,没有哪个人可以通过选择另外一个可供选择的策略来改善自己目前的地位,因此它正是一个最佳解。
更为重要的是纳什的研究还表明,在许多情况下,最佳解虽然存在却不一定是表面上显而易见的那个。所谓的“囚徒困境”就是一个例子。
“囚徒困境”是说两个共犯一案的人甲和乙被分别关押,他们可以保持沉默(合作),也可以供认事实真相(背叛),这是他们可选择的两个策略。选择不同的策略会有不同的回报,而且这个回报与另一个人的选择有关,具体地说:如果两个人都保持沉默,则因无法定罪,两人都会被释放;如果两个人都坦白了,则他们两人都被判罪;如果其中的一个人坦白了,他将被释放还会受到奖赏,而另一个人则要受到惩罚,被判罪并罚款。
合作还是背叛?表面上看,他们的最佳选择是合作,但在现实中很少出现这种情况,因为每个人都有同样的担心:如果另一个人坦白了怎么办。这种担心导致他们都选择坦白,因为据他们分析,如果坦白的话,结果会有两个:一是对方没说,他将被释放还会受到奖赏;另一个是对方也坦白了,那就与同伙一起坐牢。哪个结果都比“自己保持沉默,对方却坦白了”的结果强。所以实际发生的最佳解往往是两个人相互背叛。现实生活中,各国的贸易保护主义,企业之间的价格大战等,都属于这种情况。
要想体会纳什研究的妙处,必须强化一个意识:对策是相互依赖的。对于每个局中人来说,一个对策的结果取决于所有其他局中人做什么选择。这样一来,在一个依次行动的对抗性活动中,一个局中人的策略原则就是要注意到别人与自己一样都是有头脑的,然后倒退推理、预测未来,也就是通过对“我认为他认为我认为他认为我认为……”的分析,尝试预测各种选择的可能结果,而他的最佳选择正是在这样的预测的基础上作出的。
现在我们考虑这样的情况:如果局中人对对方非常信任会怎样?显而易见,他们的最佳选择是合作,两个人都保持沉默,结果两个人都能自由,达到一种双赢的结局。
由此我们注意到,双赢作为最佳解并不是逻辑的、数学的结果,而是综合了心理、社会诸多因素后的结果。如果人们讲究诚信,相互合作,就会给双方带来利益,取得双赢。否则,单靠对策论是算不出双赢解的。
(李哈鸣摘自《学习时报》)