用数学预测冠军
2014-04-29苏安德

世界杯是球迷的盛会,亦是赌棍的狂欢节。
对科学家来说,预测是另一回事。从玄幻的量子纠缠到我们更熟知的天气、地震预报,总的来说,研究者是通过某种或多种规律,结合海量数据,获得一些特定模型。这些模型所生成的结果,会在某些条件下触发。这样只要出现类似的条件,某个结果的概率就会浮现。
同样,投行巨擘高盛新推出的《2014世界杯经济学》研究报告也是从大数据中找规律,一帮应用数学的天才用一大把数据和一个玄之又玄的模型对世界杯比赛结果进行了量化分析。
Elo系统排名
工欲善其事,必先利其器。要对世界杯进行量化分析,海量且靠谱的数据是万万不可缺少的,而高盛所需要的就是1960年以来主要国际赛事(非友谊赛)的比赛结果,这样一来,就有了14000多个历史样本,以供数学家们演算调整自己的模型。除此之外,高盛还引用了一个重要参数,那就是Elo系统排名。
说到Elo系统排名,绝大多数人都会觉得有点陌生。这是一个以国家队为单位的国际足球评分系统,跟FIFA排名并不相同,而很显然地,高盛觉得Elo系统排名要更为科学。这主要是因为FIFA排名主要着眼于最近一段时间的比赛情况,而Elo系统则是对1872年至今的完整历史数据进行评估。
那么,什么是Elo系统排名呢?顾名思义,Elo系统排名背后的算法当然就是Elo评分体系,最早由物理学家阿尔帕德·埃洛(Arpad Elo)开发。埃洛出生在风雨飘摇的奥匈帝国,在10岁的时候就跟着父母移民到了美国,他从小热爱国际象棋,又天生对数字有天分有研究,所以自打1939年美国成立了国际象棋协会以后,他就积极热情地参与到协会工作之中。刚好,当时美国国际象棋协会的排名算法引发了一定争议,埃洛便自告奋勇为该协会开发出了一种更科学更合理的排名算法,也就是今天被用于多种体育竞赛和电子游戏中的Elo评分体系。
这个评分体系的核心,是对于单场比赛的评判,它的算法基于几个重要的参数:赛前积分(Ro)、预期结果(We)和比赛结果(W),外加一个常数(K)。其公式为Rn= Ro + K × (W - We)——如果你看过《社交网络》的话,你也许会记得电影里扎克伯格做的Facemash网站,对,那个网站用来评判女生相貌的依据就是Elo算法。
具体到国际足球的Elo系统排名中,每个参数都有确定的数据指标。其中,K代表着不同级别的赛事权重,比如说,世界杯决赛圈比赛权重为60,欧洲杯或者美洲杯这样的洲际锦标赛决赛圈比赛权重为50,世界杯预选赛决赛轮为40,其他锦标赛为30,友谊赛则只有20。至于W,则分为胜平负三类,获胜为1,战平为0.5,而输球当然就只有0了。We比较复杂,需要根据赛前两队积分差来判定,算式为We=1/(10 (-dr/400)+1),其中dr为赛前积分差(还要给主队加100)。也就是说,如果赛前主队积分1110,客队积分1200,两队的We就应该分别是0.514和0.486。
用这个算法对浩瀚的历史数据进行递归演算,最终得出的结果相当合理。世界杯开赛之前,在国际足球的Elo系统里排名第一的是得分2113的巴西,第二位是2086分的西班牙,其后依次是德国、阿根廷、荷兰、英格兰和葡萄牙。高盛的报告指出,Elo系统排名下每支球队的评分,是他们用来打造预测模型的“最有力武器”。
上帝也会掷骰子
有了Elo评分这个“神队友”,高盛就可以开始预测每支球队在世界杯上的表现了。具体要怎么做呢?高盛在报告中明确写道,他们用这些数据来进行了10万次蒙特卡洛演算。

蒙特卡洛是欧洲小国摩纳哥的一个沿海城市,素以富人聚集和博彩业繁华而著名,而所谓蒙特卡洛演算方法其实本来跟该城市毫无关联,不过是借了“赌城”的名头,玩笑般地剖白该方法的实质:上帝也会掷骰子。
是的,蒙特卡洛方法是一种随机模拟方法,其基本思想是对某个随机事件进行模拟演算,最终得到各种概率分布的随机变量,然后用统计方法将模型的数字特征估计出来,从而得到问题的数值解。
不熟悉的人可能会问,如果是纯粹掷骰子的方法,那么双方的胜平负概率不都是均等的吗?这有谁不会的呢,高盛还需要数据干什么?其实非也。因为蒙特卡洛虽说是随机模拟,它也是有不同权重的——比赛双方的实力不同,就好比在掷骰子比总数大小的时候,双方可以投掷的次数不同。
在竞技体育里面遵循蒙特卡洛方法而进行的事件里,NBA乐透抽签大概算是最有名的了。在NBA乐透抽签中,主持抽签的人会拿出编号为1-14的14个球,放入一个容器里,从中随机拿出4个球,而这4个球的组合就决定了状元签的归属。如果不计数字的先后顺序,这种抽签可以有1001种组合,其中1种被规定为“废票”,另外1000种组合被电脑随机分配给14支没有获得季后赛资格的球队。其中,战绩最差的球队能获得250种组合,也就是说,它赢得状元签的几率为25%;战绩最好的球队只有5种组合,中选几率就只有0.5%。
为什么说它随机呢?因为几率终归只是几率,250种组合只不过让你的机会比别人更大,却不能确保状元花落你家。事实上,自从NBA在1990年采用这种方法进行乐透抽签后,以最差战绩抽到状元签的只有4支球队;而2008年公牛抽中状元签的时候,他们事实上只有17种组合,也就是1.7%的中选概率。
于是让我们回到高盛的预测模型来,他们分配权重的依据当然不像NBA就看战绩那么简单。根据报告所言,除了Elo评分之外,高盛还将五个重要变量引入分析:
Q:预测帝能信吗?
A:确实有人能做到成功预测每一场比赛的胜负,甚至精确到比分。并不奇怪。从另一个角度讲,这与一个邮件骗局的思路是相同的。假设某骗子给90万人发邮件,以巴西对克罗地亚开始,任选一种结果(胜平负)随机发给30万人。然后在这场球结果出来后,给收到正确结果的30万人继续发下一场的预测。再正确一场后,给其中10万人继续发。于是,假设最后有10个人收到邮件,发现这个预测帝连续猜对了前面10场球的每一场,(然后相信他能继续正确,就把钱交给他赌一把)……因此,在一个预测帝成功的同时,千万个预测帝倒下了。
1.每支球队在过去10场主要国际赛事中的平均进球数;
2.每支球队在过去5场主要国际赛事中的平均丢球数;
3.每支球队的世界杯抽风指数——这个变量主要是看某支球队是否有在世界杯上发威或者突然哑火的倾向。当然了,要分析倾向,至少得有足够大的样本,所以高盛只选取了巴西、德国、阿根廷、西班牙、荷兰、英格兰、意大利和法国进行该指数研究;
4.每支球队在主场比赛的表现;
5.每支球队在所属大洲比赛时的表现。
有了这些指标,高盛就构造了一个分子模型,然后进行10万次的掷骰子模拟,得到每两支球队交锋时最可能出现的结果,进而得出一个“最合理”的世界杯预测。
巴西夺冠最合理?
10万次模拟之后,高盛的结果出炉——巴西将一路大胜到夺冠。
这其实非常好理解,我们可以挨个对照着高盛引入的6项指标来解析:在世界杯开赛前的Elo排名中,巴西队高居榜首,评分比西班牙高了27分;最近的主要国际赛事里,巴西在去年联合会杯中3比0大胜西班牙,4比2战胜意大利,进球数不少,丢球数不多;巴西队历史上5夺世界杯冠军,世界杯表现往往超出平时,绝不会像英格兰一样每逢大赛就抽风;再者,巴西是主场,根据高盛的计算,主场优势能让巴西每场多进0.4个球;另外,在美洲进行比赛也是大利好,平均每个美洲球队每场能多进0.2个球,而欧洲球队就比较惨了,历史上还没有欧洲球队在美洲举办的世界杯上夺冠的先例。
于是,按照这种预测,本届世界杯上最合理的情况就是,巴西队在小组赛分别以4比1、4比1和5比0大胜克罗地亚、墨西哥和喀麦隆,然后在第二轮3比1干掉荷兰,1/4决赛3比1击败乌拉圭,半决赛2比1淘汰德国,最后在决赛里3比1赢了老冤家阿根廷夺冠。
但是高盛也知道,所谓“合理”在足球运动里是很不靠谱的。因为足球不像篮球动辄打到100分以上,全场比赛0比0结束也是常有的事,而我们也知道,这种低进球的比赛同时就意味着极高的不可预测性——哪怕你全场压着对方打,全场射门比是50比2,射正比是25比1,结果人家门将神勇扑出了你所有的射门,就靠那仅有的一脚射正以1比0赢球,这种故事发生得还不够多么?所以,高盛认为,还是用蒙特卡洛方法计算一下每支队晋级不同阶段的概率是多大更靠谱。
于是又是一轮反复的掷骰子模拟实验,最终高盛得出结论,巴西队有99%的几率小组出线,78.8%的可能性进入八强,71.7%可能进入四强,进入决赛可能性达到60.3%,夺冠概率也高达48.5%!这可是个了不得的数字,要知道,欧洲开赌球盘口的人不过也只认为巴西有25%左右夺冠几率而已。
根据高盛的预测,除了巴西队之外,最可能夺冠的球队分别是阿根廷、德国和西班牙,他们分别有14.1%、11.4%和9.8%的夺冠概率。
值得一提的是,为了尽可能将预测维持在理性分析的范畴内,高盛并未考虑单个球员对比赛造成的影响,比如德国队穆勒一到世界杯就爆发,或者阿根廷的梅西的国家队进球运势不畅,还有裁判倾向等等,这些不可量化的影响因素统统都会被排除在考虑之外。这样当然会让模拟过程更简单容易,不过,其预测效用也就会大打折扣了。
事实上,四年前南非世界杯的时候,高盛就曾经预测过一次,其结果不算太离谱,但也有一些很失准的地方。比如说,他们当时预测巴西队夺冠几率最高,西班牙次之,结果是西班牙夺冠;另外,他们还认为意大利小组出线概率达到84.8%,法国队也能有76.0%的把握出线,但这两支球队分别在所在小组垫底,不得不在小组赛结束后就打道回府。如果用R平方系统来评估他们的预测准确度,你会发现,高盛在2010年的预测R平方值只有0.24,距离完美的1(100%准确度)还有相当遥远的距离。