投球手和击球手的较量
——基于博弈论视角
2021-11-28贺佳圆
贺佳圆
(中国农业大学,北京 100083)
在所有的体育比赛中,棒球无疑是最突出智力竞赛的项目之一。棒球运动是一项以跑、跳、投、打、接等技术动作构成的、在特定技术和战术基础上进行的团队体育运动[1]。它在世界上影响较大,被誉为“竞技与智慧的结合”。棒球运动在美国、日本尤为盛行,被称为“国球”。早期中国棒球主要受美国棒球影响较多,之后逐渐转向日本学习,中国棒球与美国、日本的交流多以技术动作为主,涉及力量训练方面比较少[2]。虽然棒球在中国并不普及,但却是一项体力与智力高度结合的运动:棒球运动不仅能够发展体能素质,还可以促进智力发育,培养集体主义精神,非常适合在当代青年中普遍开展。
在一场棒球赛中,棒球球员分为进攻、防守两方。场上投球手是防守方,击球手是进攻方。进攻方的目的就是通过挥棒打出投球手投出的球从而得分,防守方的目的就是阻止进攻方得分。无论是哪个角色,想要在棒球运动中取得胜利,除了对项目特征有深刻认识、进行力量和技巧训练以外,还要懂得通过博弈论来制定最优策略。
我们知道,如果一件事情的结果只依赖于一个参与者,这叫做决策论。在此基础上,如果结果依赖于多于一个参与者的决策,便为博弈论。在棒球比赛中,比赛的结果不仅取决于投球手的投球技术和策略,也取决于击球手的击球技术和策略,因此棒球比赛的过程也是博弈的过程。
一、投球手和击球手的预判
在棒球比赛中,投球手希望以智取胜击球手。对某个击球手,投球手的最佳策略可能总是投出快球,但对于另一个击球手,投球手可能总是投出弧线球更好。而对于第三个击球手,投球手的最佳策略可能是以某种随机的方式混合地投出快球和弧线球。
击球手可以猜测投球手要么投出快球,要么投出弧线球。如果他预计投球手投出快球,按照投球手实际掷出的是快球或是弧线球,他击球将分别得到0.400或是0.200分;如果他预计是弧线球,按照投球手实际掷出的是快球或是弧线球,他击球将分别得到0.100或是0.300分。在这个例子中,投球手希望使击球手的平均得分最小,而击球手希望自己的平均得分最大,因此投球手和击球手的冲突是完全的,没有参与者在不伤害其他参与者的前提下能够使自己得到改善,投球手和击球手之间注定是一个完全冲突博弈的关系。
可以看出在这种情况下,如果击球手预计是快球,那么投球手应该掷出弧线球。如果击球手预计是弧线球,那么投球手应该掷出快球。正如表1中所示,投球手需要采用两种策略,即快球和弧线球。从击球手的角度看,如果投球手总是投出快球,击球手将转换到总是预计快球的策略,而如果投球手总是投出弧线球,击球手将转换到总是预计弧线球的策略。击球手也需要采用两种策略,这意味着一个参与者总是可以通过单方面改变策略使得自己得到改善,投球手和击球手的较量没有纯策略解,两人都没有占优策略。那么,对击球手和投球手而言,最佳混合策略是什么?
二、击球手的最佳策略
我们首先考虑击球手的决策,他希望选择猜测快球或者弧线球的组合,使击球平均分最大。令x表示击球手猜测是快球的比例,1-x表示猜测是弧线球的比例,我们有EV(投球手投快球)=0.400x+0.100(1-x),EV(投球手投弧线球)=0.200x+0.300(1-x),令它们相等并求解,得到0.400x+0.100(1-x)=0.200x+0.300(1-x),解得x=0.5。因此,击球手应该猜测50%的快球和50%的弧线球。我们可以通过计算投球手采用快球策略或者弧线球策略时对应的击球手的期望值来确定击球平均分:EV(投球手投快球)=0.400x+0.100(1-x)=0.400*0.5+0.100*0.5=0.250。这表明,如果击球手50%的时间猜测快球,无论投球手采用纯快球策略还是纯弧线球策略,他都能得到0.250的分数。令y表示投球手掷出快球的比例,1-y表示投球手掷出弧线球的比例,由于无论投球手掷出快球还是弧线球,结果分数都是0.250,所以我们有击球平均分的期望值:A=0.250y+0.250(1-y)=0.250,因此,无论投球手采用何种策略,只要击球手采用自己的最优策略,他都能得到0.250的分数。
三、投球手的最佳策略
我们再来考虑投球手的决策,他希望选择掷出快球或者弧线球的某种组合,使击球平均分最小。同理,我们给出击球手的策略的期望值,EV(击球手采用快球策略)=0.400y+0.200(1-y),EV(击球 手 采 用弧线 球策略)=0.100y+0.300(1-y),令它们相等并求解,得到0.400y+0.200(1-y)=0.100y+0.300(1-y),解得 y=0.250。因此,投球手应该掷出25%的快球和75%的弧线球,与前面一样,击球平均分0.250,这可以通过计算期望值验证,EV(击 球 手 采用 快 球 策 略)=0.400y+0.200(1-y)=0.400*0.25+0.200*0.75=0.250。无论击球手采用纯快球策略还是纯弧线球策略,击球平均分都是0.250,如果击球手采用混合策略而投球手坚持25%的时间掷出快球,75%时间掷出弧线球,击球平均分的期望值都是A=0.250x+0.250(1-x)=0.250,所以,无论击球手采用何种策略,只要投球手采用自己的最优策略,他都能使击球平均分是0.250,投球手的结果不再依赖于击球手的策略。
四、投球手和击球手最优策略的模型
我们可以将上述博弈过程一般化,得到一个适用于任何简单情形的博弈模型。我们假设击球手预计投球手投出快球,按照投球手实际掷出的是快球或是弧线球,他击球将分别得到a或是b分;如果他预计是弧线球,按照投球手实际掷出的是快球或是弧线球,他击球将分别得到c或是d分。我们按照前文的思路,可以得到EV(投球手投快球)=ax+c(1-x),EV(投球手投弧线球)=bx+d(1-x),令它们相等并求解,得到x=(d-c)/(a-b+d-c),因此,击球手应该猜测(d-c)/(a-b+d-c)的快球和[1-(d-c)/(a-b+d-c)]的弧线球。对于投球手而言,EV(击球手采用快球策略)=ay+b(1-y),EV(击球手采用弧线球策略)=cy+d(1-y),令它们相等并求解,得到y=(d-b)/(a-c+d-b),因此,投球手应该掷出(d-b)/(a-c+d-b)的快球和[1-(d-b)/(a-c+d-b)]的弧线球。这个博弈模型适用于投球手和击球手在知道击球手的预判和投球手实际投出的球所对应的得分时,能够自动形成双方的最优策略。
在这场投球手和击球手的较量中,需要注意的一点是,即使对手并不通过推理得到其最优解,你也需要知道他策略的最优混合方式,以便你能从他的草率行为中占到最大的便宜[3]。
我们注意到保密是很重要的,在前文的例子中,击球手必须猜测投球手以50%的概率混合掷出快球和弧线球,但投球手没有必要弄清楚击球手的击球模式。击球手可能会利用时钟或者随机数发生器来决定什么时候猜测是快球。例如他利用时钟的秒针,每当秒针位于0-30秒时,就猜测是快球。
五、博弈模型在实际棒球比赛中的应用
从前面的分析中,我们看到击球手从他的最优解中得到了有用的信息,即他可以通过一个策略保证他希望得到的结果,无论他面对的投球手采用什么样的策略,这是一种很重要的“保证能够得到的结果”的想法,在日常生活中也有着极为广泛的应用。但是我们也从前面的分析中得出,如果观察到投球手希望最小化击球手的击球平均分,击球手可能会从这个有用的信息中得到启示从而确定投球手的最优策略,如果投球手采用了最优策略,击球手不可能得到比他所能保证的击球平均分更好的分数,在我们上面的举例中就是0.250的平均分。但是如果投球手不采用最优策略,击球手就可以通过改用他的纯快球策略或者纯弧线球策略来增加自己的分数,以从投球手的草率行为中占到最大的便宜。从这个意义上讲,投球手的最优策略代表了击球手的一个临界点,如果投球手不采用最优策略,击球手也可以不采用他的最优混合策略,从而使得自己的击球平均分超过0.250,这是他所能保证得到的分数。最重要的一点在于,投球手并不一定是一个理性的参与者(即自身利益最大、持续地有意图的行动、不对动机妄加猜测、不考虑道德问题、只研究合法问题、盈利函数有多重标准的参与者),因此击球者可以从非理性的投球者身上占到便宜。
在实际中,每个参与者的球技肯定会发生变化。例如,针对某个特定的击球手,如果所有的投球手的最优混合策略是只掷出弧线球,那么这个击球手很可能会改进他击打弧线球的能力,这就会使投球手对应的击球手的最优混合策略发生改变,相应的击球平均分也会发生变化。
每个参与者的策略可能会有拓展,比如与不同的投球手(力量型投球手、技巧型投球手、策略型投球手等)博弈,击球手采用不同策略的得分是不同的。除此之外,投球手还可能投出快球、叉指快速球、弧线球、变速球等,击球手知道这些投球方式,且必须为这些投球方式做好适当准备。当每个参与者的策略增多时,我们可以建立线性规划的模型,找出最优解来得到投球手和击球手的策略。
六、结束语
投球手和击球手的较量是一个有混合策略的完全冲突博弈,棒球赛的魅力就表现在投球手与击球手在较量时发生的智力对策上,这也是吸引我研究这次博弈的原因。在棒球赛中,巧妙运用博弈模型可以使自身的优势放大,得分的可能性增加,为本队获胜提供有利条件。同时,这种博弈的思想和最优策略的计算方法对于其他体育比赛以及经济、生活等方方面面也具有极大地适用性。