基于零和博弈下的罚点球策略分析

2015-12-09吴琴

湖北民族大学学报(自然科学版) 2015年1期

关键词：混合策略点球守门员

吴琴

(湖北民族学院理学院，湖北恩施445000)

对于很多足球名宿，曾经都有一段罚失点球的经历，点球大战造成了不堪回首的往事．罚球队员如何选择自己的射门方向?而守门员又会朝哪个方向扑救?这无疑是一场博弈，罚球队员和守门员的博弈，又是怎样的针锋相对?

1 模型建立

1．1 参数设置及假设

每一个点球涉及两名球员:罚球队员(shooter)和一个守门员(goalkeeper)．理论上来讲，一个专业的射手主罚点球，足球只需0．2 s 就能从罚球点到达球门线，而守门员的最快反应时间为0．2～0．3 s，因此罚球队员和守门员必须同时行动，点球只有两种结果:得分或者不得分，只能一次触球，没有第二次罚球的机会，罚球队员和守门员需要自己做出抉择［1－3］．罚球队员可以选择三种不同射门路径:左路、中路和右路，守门员可以选择扑向左路或者右路封堵足球，原则上守门员可以站在中路不做移动，但除非他看出了罚球队员明显的射门意图，或者故意不作扑救，否则将通常都会扑向一边［4］．

在罚点球的情境里，罚球队员有三种选择—打左边(L)、打右边(R)和打中路(C)．对于一个混合策略而言，上述三种策略出现的概率相同，都为0．33．在一个相对理想的状态下，即罚球队员对守门员的扑救偏好等信息事先并不了解，那么守门员选择左路、中路、右路的概率应该是相同的．但这是否意味着连续三次罚点球，罚球队员会分别选择左路、中路、右路呢?答案是否定的［5］．

现做出如下假设:P(S)表示进球的概率，P(L)/P(R)/P(C)表示射向某一方向的概率，P(M)表示射丢的概率．根据以上假设，有:P(S)+P(M)=1，进一步地，有:

其中P(S|L)表示在已知点球射向左边时的进球概率，P(S|R)、P(S|C)的意思也类似．

最后，为了算出点球射向任何一个方向时的进球概率有公式:

基于相同的模型，可以定义两个不同的概率:一个是球员射点球方向与守门员扑救方向匹配的概率，一个是两者方向不匹配时的概率．显然，就知道守门员扑错方向而导致得分的概率要大于守门员扑对方向而得分的概率，在这里假设射出的点球没有击中门楣或门柱，球也没有飞出门框范围之外．

出于适用性的考虑，假设所有球员踢点球的方向分为两种(自然的方向与非自然的方向)．对于一个右脚球员来说，自然的方向意味着球会自然地射向左路，对左脚球员而言则恰好相反［6］．因此可以将上述问题描述为如下的博弈问题:

1)博弈参与者为两方(罚球队员和守门员);

2)博弈中罚球队员有两种决策行动:踢向自然方向、踢向非自然方向;守门员有两种决策行动:扑向罚球者的自然方向、扑向罚球者的非自然方向;

3)博弈双方的目的都是要获得最后的胜利，即:罚球队员希望破门得分，守门员希望扑出球或者球偏出门框．

参与博弈的双方用N={1，2}表示，1 为罚球队员，2 为守门员．罚球队员可能的决策行动记作a1∈A1={1，2}，分别表示踢向自然方向、踢向非自然方向;守门员可能的决策行动记作a2∈A2={1，2}，分别表示扑向自然方向和扑向非自然方向．

对于双方每一种可能的决策(a1，a2)，用u1(a1，a2)表示对罚球队员产生的结果，即进球概率百分数，称为罚球队员的效用函数．根据文献［7］，u1(a1，a2)可以用矩阵:表示，即u1(i，j)=mij，M称为罚球队员的赢得矩阵或支付矩阵，类似的，守门员的效用函数用u2(a1，a2)表示，显然其赢得矩阵是－M．这种具有完全竞争性质，即一方所得正是对手所失的博弈，一般称为零和博弈．

在博弈中双方都力求通过决策行动使己方的效用函数最大化，用分别表示罚球队员和守门员会选择的决策行动，则必须满足

对于由矩阵M给出的效用函数，容易验证(如通过枚举)不存在纯纳什均衡．对于不存在纯纳什均衡的博弈问题，可以考虑双方随机的采取行动，即双方都对每一种决策行动赋予一定的概率，形成混合策略．设罚球队员采取行动i的概率为pi(i=1，2)，守门员采取的行动j的概率为qj(j=1，2)，记罚球队员和守门员的(混合)策略集分别为:

显然，A1中的每一个行动i也是罚球队员的一个混合策略(采取行动i的概率为1)，称为纯策略(相对于和混合策略而言)．A2也类似．在混合策略下上方的效用函数用期望效用定义，记作:

1．2 模型求解

注意到双方的纯策略是有限的，其纯策略下的效用可以用矩阵描述，且双方效用之和为0，这样的博弈称为二人零和矩阵博弈．对这种特殊类型的博弈，可以采用线性规划求解［7］．

如果罚球队员选择射向自然方向的概率是p，那么，当守门员扑向自然方向时，罚球队员的期望收益为70p+93(1－p);当守门员扑向非自然方向时，罚球队员的期望收益为95p+58(1－p)．罚球队员想使这个期望收益尽可能的大，而同时，守门员却想使这个期望尽可能的小．举例说明，假定罚球队员选择踢向自然方向的概率是50%，当守门员扑向自然方向时，罚球队员的期望收益为70* 50%+93* 50%=81．5．罚球队员意识到，守门员总是在试图最小化他的期望收益．因此，对于任意的p，他有期望获得的最佳收益是上述两个策略所给出的收益中的最小值．可以得出70p+93(1－p)=95p+58(1－p)，求得p=0．583．因此得到如果罚球队员踢向自然方向的概率为58．3%，并且，守门员做出相应的最优反应，那么，罚球队员将获得的期望收益为79．59．那么守门员的情况又如何呢?对于守门员的选择，可以进行相似的分析．假定守门员选择扑向自然方向的概率是q，从而扑向非自然方向的概率为1－q．因此，当罚球队员踢向自然方向时，罚球队员的期望收益是70q+95(1－q);当罚球队员踢向非自然方向时，罚球队员的期望收益是93q+58(1－q)．对于任意的q，守门员将使得罚球队员的收益最小化．这种情况下，罚球队员当然会选择踢向自然方向．同样的，可以得到罚球队员最大收益点，使下面的式子成立:70q+95(1－q)=93q+58(1－q)，求得q=0．617．

现在，已经计算出了博弈双方的均衡策略，罚球队员应该按58．3%的概率踢向自然方向，守门员应该按61．7%的概率扑向自然方向．通过使对方选择两个策略所给出的收益相等来确定概率值，所以这些概率使得无论对方采取什么行动，罚球队员和守门员都能得到相同的收益［8］．

因此，当罚球队员选择p=0．583 时，守门员的扑救方向之间无差别，因此他也可以按任意的概率q扑向自然方向．特别地，守门员按概率0．617 扑向自然方向就更好了．类似的，如果守门员按照0．617 扑向自然方向，那么，罚球队员向两个方向踢就无差异了，或者可以选择这两个策略的任何混合策略．因此，这些选择是一个纳什均衡:给定对方的选择，每一个参与人的选择都是最优的［9］．

2 经验数据分析

罚点球的时候罚球队员和守门员之间确实存在相应的博弈关系，其中也存在一些规律．以2012 年欧洲杯的例子，是否也存在相应的规律．2012 年欧洲杯的1/4 决赛，英格兰vs 意大利的点球大战，罚球队员和守门员的技术动作记录如表1 和表2 所示．

上面已经得到的结论是:罚球队员应该按58．3%的概率踢向自然方向，守门员应该按61．7%的概率扑向自然方向．即:罚球队员和守门员都倾向于踢(扑)向自然方向．

在观察了意大利和英格兰队的9 个点球，其中7 名右脚射门的球员中5 人将球射向了左路，2 人射向了中路，2 名左脚射门的球员分别将球射向了左路和右路，那么，9 名罚球队员中射向自然方向的人数是6 人，3人射向了非自然方向，那么罚球队员在罚点球的时候确实倾向于射向自然方向，考虑到样本数量有限，计算出来的数据有所偏差，也在预计之中．对于守门员来说，英格兰门将乔哈特和意大利门将布冯在9 次扑救中6 次选择了自然方向，这和之前的研究结果(守门员倾向于选择扑向自然方向)相吻合．这个特点尤其体现在乔哈特身上，5 次扑救4 次都是自然方向．而布冯的扑救规律就没那么明显，这也体现出优秀守门员的价值:不会让对方轻易摸到自己的扑救规律．

表1 意大利队球员技术动作统计Tab．1 Statistics of the Italian team players' technical action

3 结论

表2 英格兰队球员技术动作统计Tab．2 Statistics of the England team players' technical action

观察点球大战时的几个关键球，一个是皮尔洛的扳平球，皮尔洛右脚射门，把球射向了非自然方向(中路)，骗过门将轻松得分;一个是迪亚曼蒂的制胜球，迪亚曼蒂左脚射门，也是把球射向了非自然方向(右路)，得分．再看全场唯一被扑住的点球:阿什利科尔左脚射门，射向了自然方向，力道和角度欠佳，被守门员布冯轻松扑获．从这几个关键球可以看出:往往罚球队员射向非自然方向是取得进球的好办法，而罚球队员总是选择自然方向，如果力道和角度不够刁钻，则很有可能被守门员扑出．

在均衡状态下，罚球队员的期望收益为79.59．如果对方做出最优选择，那么，这就是守门员的最优选择．如果守门员没有做出最优的反应，情况又怎样呢?可以得到，当p ＜0．583 时，守门员将扑向自然方向;当p ＞0.583 时，守门员将扑向非自然方向．类似的，当q ＜0．617 时，罚球队员将踢向自然方向;当q ＞0．617时，罚球队员将踢向非自然方向．

因此在足球比赛罚点球中，运动员和教练只要在战术上运用得当，运动员强大的心理素质，教练员和运动员在点球前对对手的技术特点加以认真细致的研究，就能在罚点球的时候发挥较好的水平．

［1］周培勇，吕中凡，猪俣公宏，等．从守门员扑点球动作的时间空间特征看足球运动员点球射门区域选择策略［J］．首都体育学院学报，2013，25(1):67－71．

［2］谢明．对点球射门区域的探讨［J］．成都体育学院学报，2002，28(3):62－64．

［3］张晓刚．足球守门员在防守点球运动情境中眼动特征的研究［J］．中国体育科技，2010，46(1):88－92．

［4］周培勇，猪俣公宏．优秀足球守门员应对点球的认知行动策略［J］．中国体育科技，2010，46(6):39－45．

［5］王祥．世界杯点球决战中技术运用及策略分析［J］．苏州大学学报:自然科学版，2010，26(2):91－94．

［6］ Andrewzxyjy．点球纳什均衡与博奕论［EN/OL］．(2012－10－20)［2014－08－12］，http://soccer．hupu．com/columm/42995．html．

［7］张启金，陈文略．点球进攻的数学模型［J］．黄冈师范学院学报，2002，22(6):15－16，60．

［8］李丹．基于有限次重复博弈的足球点球策略分析［J］．山西青年:下半月，2013(5):147．

［9］李益群，谢亚龙．体育博弈论［M］．北京:北京体育大学出版社，2002:88－89．