数理博士横扫英超球场
2020-04-10
利物浦俱乐部旧队徽
王者的低潮
十几年前,利物浦越打越差濒临破产,在2007年和2010年两次被转卖。2010年,靠研发预测大豆市场波动算法走上致富之路的期货交易员John Henry买下了利物浦俱乐部。他决心用自己擅长的数据分析改造这支队伍。
最早用数据打球的奇人是比利·比恩。他用赛伯计量学统计棒球数据,把运动员的表现量化,挑选那些被低估的球员,就和现在玩足球经理游戏差不多。2002年,比恩靠着数据分析让美国职棒的小球队奥克兰运动家队拿下了创纪录的20连胜的奇迹。这个故事后来被拍成了好莱坞电影《点球成金》。
繼棒球之后篮球等竞技体育也开始引入数据分析。不过由于足球的进球数就是篮球的零头,对足球进行数据分析十分困难。切尔西和阿森纳,都曾做过数据分析的尝试,但是两个顶级俱乐部都没有发现数据分析的好处,因此并不十分看重他们各自的科研团队。不少媒体和球员对数据踢球也是相当抵制。前英超中场Craig Burley曾经表示,“期望进球(射门成功概率)就是胡扯。”
实际上外界的看衰似乎有点道理,在Henry接手后的头6个赛季里,利物浦战绩依然不佳。但是Henry仍然相信大豆市场和足球运动一样都由数学规律支配。2012年,他把一个重量级的数据分析师Ian Graham纳入麾下。Graham加入后,利物浦开始逆袭了。
逆袭的利物浦
Ian Graham是剑桥大学高分子物理方面的博士后,但他并不想成为物理学家,而是加入一家给足球队做数据分析的初创公司。
Graham在俱乐部相当强势,他在教练和运动员选秀的过程中有一票否决权。其他俱乐部虽然也有数据分析师,但是在他们决策层的话语权并没有利物浦的这样高。
利物浦的球员纳比·凯塔在2014年接受采访时表示:“有人给利物浦介绍球员的时候,都要先让Graham的模型过一遍,如果Graham的模型说不可以,那么俱乐部就不会签这个人。”不仅是球员,就连利物浦现在的教练尤尔根·克洛普也是Graham用模型跑了一遍才被认可的。
那么,Graham的模型真的挑出了有潜能的球员吗?我们来看看一些事实。
Graham 2012年加入利物浦时的主要任务就是分析巴西球员菲利佩·库蒂尼奥是否有采购的价值。Graham一波分析之后发现,小哥性价比很高,于是库蒂尼奥就被签约了。
过了一段时间,库蒂尼奥升值之后,利物浦又把他卖掉,就和炒股票似的。这一波操作后,利物浦赚到了大笔溢价,终于有钱买下维吉尔·范戴克、阿利森·贝克尔和法比尼奥这些估值偏低的球员。当然,这些队员都是Graham分析之后推荐给俱乐部的。事实证明,这3人加强了利物浦的防守阵容。
通过数据分析,Graham还曾推荐利物浦买下穆罕默德·萨拉赫。最终在2017年6月,利物浦以4100万美金的价格签下了萨拉赫。这个决定相当英明,因为在为利物浦效力期间,萨拉赫打破了当时英超的纪录,进球32个。
除了顶梁柱Graham,俱乐部的体育总监Michael Edwards也是数据分析师出身。利物浦的数理大牛还包括天体物理学家Tim Waskett、哈佛毕业的Will Spearman、世界青年国际象棋锦标赛冠军Dafydd Steele。
Tim Waskett曾为欧足联欧洲联赛做软件开发和统计分析。Will Spearman曾在欧洲核子研究中心(CERN)研究高能物理,原本方向是希格斯玻色子。Dafydd Steele是数学专业曾在能源部门工作。看照片中间这些大哥就是利物浦俱乐部的数据分析师们。
数据分析师Ian Graham
利物浦俱乐部的数据分析师们(红圈)
效果:25场不败
在这些数据分析师的助阵下,Graham更是如虎添翼。利物浦荣获上赛季欧洲冠军杯、国际足联世界俱乐部杯和欧洲超级杯。
当然,赢并不是关键,关键是赢得壕。在本赛季,利物浦领先第二名25分,在过去的25场比赛里一场都没有输,失球数比第二名少11个,控场能力相当惊人。
怎么用数据踢球?
所以问题来了,利物浦的数据分析师到底做了什么,让俱乐部变得这么优秀呢?
具体细节当然是机密,但是可以确定的是利物浦搜集了海量的数据,用来决定哪些球员该在哪场比赛里踢哪个位置,应该用哪种策略更有机会赢。
利物浦也是最早使用从数据科学中诞生的打法——球场控制(pitch control)的俱乐部。
在2019年的英国皇家科学院圣诞讲座上,Waskett介绍,他们会搜集每场球赛中每次球员和足球接触的数据;而在英超的比赛里,他们还能得到额外的追踪数据,因为赛场周围有一圈监控摄像头,它们可以以每秒25帧的速度实时记录球员和球的运动,一场球赛下来就有150万数据点。这就是球场控制的主要数据来源。
Waskett介绍“通过分析射门发生的位置以及成功率,就可以对未来类似的情况进行统计预测。”每个球员都有自己的期望进球,根据这些统计数据,球员就知道自己在什么位置射门更容易进球。
利物浦的球场控制到底长啥样呢?
图中蓝色小圆球是队友,红色是对手,黄色的是目前控球的人。蓝色区域代表有进球可能的区域,所以要把球传给蓝色位置的球员才行。
球场控制的理念已经逐渐被更多俱乐部采用。
下图是在2018年麻省理工斯隆运动分析大会上,巴塞罗那队的数据分析师分享的球场控制图,红色代表有进球价值,绿色代表没有进球价值。
你可能会想,这些数据分析师在分析的时候,会不会和我们普通球迷一样,看运动员的具体表现给建议呢?
令人意外的是,Graham透露他在做分析的時候,完全不看视频,只相信数据分析的结果。他说:“视频会让你有偏误。”因此,他的团队得出的一些建议常常和普通球迷甚至教练看视频时的直觉反应相反。
当然,平时运动员的训练数据也能派上用场。这些球员在训练的时候,就会穿上一个带有GPS的小背包。会记录球员训练时的运动距离、速度、加速度。这些数据被用来分析球员,优化他们的训练,提升他们的表现,然后以更好的价格卖出去。
利物浦足球的口号是“你永远不会独行(Youll Never Walk Alone)。”没想到这句话居然在原本最不可能组成CP的体育特长生和理科尖子生上应验了。
看完利物浦的故事我们明白,数学好玩个球啊!(请自行断句)
(本文经授权转载自“把科学带回家”微信公众号,有删节)
利物浦的球场控制实时分析图
巴塞罗那的球场控制图
数据分析在训练时的应用