大数据和人工智能在足球项目比赛分析中的应用
2020-11-24王星北京体育大学
王星 北京体育大学
比赛表现分析是通过分析影响比赛结果的因素来理解和提升团队运动表现的重要工具[1]。比赛表现分析主要探索不同环境因素和比赛层次状态下运动员和队伍决策行为和比赛表现,具体涉及运动员的技术运用、战术发挥、体能与生理反应、心理状态等相关因素对于特定比赛事件和比赛结果的影响[2,3]。尤其是在团队项目中,技术与战术的使用对决策结果和比赛评估起到决定性的作用[4]。现如今比赛表现分析已经成为职业运动俱乐部、协会、高水平教练团队中的常规工作,而这其中的核心就是数据的收集和处理。越来越多的专业数据软件被应用在各大高水平联赛。通过分析这些数据,可以提供关键的技术指标帮助教练员和运动员提升赛场上的运动表现[5-8]。例如此前就有研究发现助攻、射正球门、触球次数、传球、界外球和高吊球与比赛结果高度相关[9]。但是由于这些数据都是一些观察指标,在收集和分析的过程中会丢失掉大量的细节信息[10]。例如,我们通过射门指标可以知道是哪一脚射门完成了得分,但是无法知道是射门前的哪一脚传球在这次进球中起到关键性的作用。
这些重要且容易被遗漏的信息伴随着人工智能、计算机视觉和传感器技术的快速发展得到最大限度保留。通过可穿戴设备、全场景光学追踪系统收集比赛中运动员的位置信息、体能和生理信息等多维度、动态化的大规模数据[11,12]。基于这些时空数据,运动分析专家在比赛表现分析中引入机器学习、深度学习等人工智能的技术方法来探究高动态、多时空比赛场景下的个人与团队的决策行为和比赛表现。人工智能在比赛表现分析中主要有两项基本功能:识别和预测。对应在足球领域中,就是识别比赛中个人和团队的比赛行为,并基于球场上信息对比赛结果作出预测。
一、足球项目中比赛行为识别
由于足球项目的复杂程度较大,参与的球员人数较多以及不同比赛行为之间的存在细微的差异,导致足球比赛中比赛行为的识别难度较大。且职业球队出于球队隐私的保护,通常不对外界公开追踪数据,普通研究人员很难从事时空数据层面的比赛行为分析[2]。2019年,意大利的体育科学家Pappalardoò和Cinta[13]在《Scientific Data》的期刊论文中共享了在足球分析领域有史以来最大规模的比赛公开数据集;其中包括2018年世界杯、2016年欧洲杯、德甲、法甲、意甲、西甲赛事的1941场和3251294个比赛事件。这类数据集的共享极大促进了各国体育科研人员对于时空数据的研究。
基于这些公开数据集,Morra和Manigrasso[9]提出了一种基于时间间隔逻辑(ITL)从数据位置中高效地提取复杂比赛行为的方法,包括铲球,抢断传球等16项复杂的比赛行为。通过时间间隔逻辑对足球比赛中发生的比赛行为形式化后可以简单地推理比赛进程,例如每一次射门前的传球网络。Richly和Moritz[14]通过将比赛行为的一些时空特征放入神经网络下进行聚类分析,高精度地识别球场上发生的比赛行为。Decroos和Van Haaren[15]采用了一种数据驱动的方法来识别比赛行为,这种方法可以从时空数据的角度发现球队潜在的一些进攻策略,例如无球端的跑动。Knauf[16]等人提出了一种新颖的基于时空内核的方法,通过聚类算法对球员的跑动路径进行聚类。这种算法能够同时观测到多个球员的移动路径,并结合分析,这对于获取球队的战术布置很有帮助。
二、比赛结果的胜率模型
竞技体育比赛中最基本的一个目标就是获得比赛的胜利,而在比赛表现分析中最重要的一项就是对比赛结果的预测。任何两支球队交手前都会有对各自球队取胜的概率预测,基于获胜的概率,对比赛策略进行适当的调整,才能达到帮助球队和球员提升运动表现的目的。由于足球是一项高度复杂的运动,其中22名球员在同一空间中同时互动,双方球队的球权转换也发生的比较突然。随意对足球比赛结果的预测一直是比赛表现分析领域研究的难题。
期望得分是足球比赛分析中一种传统的表现指标,用于表示可能实现进球的得分概率。基于时空数据Fernández 和Bornn[17]提出了一种新的进球概率模型,他们在足球分析中引入篮球的回合概念,依据球队对球权的控制,将比赛切分为单个回合,利用算法得到每回合的期望进球(EPV)来代替原本的期望进球(EG)。Decroos 和Bransen[15,18]在EPV的基础上,提出了一种新颖的数据驱动框架,用于评估比赛中发生的行为动作,包括传球、传中、运球、铲球等。并探究了每种动作发生的环境以及这些动作对后续比赛的长期影响。
三、结论
随着人工智能、计算机视觉和传感器技术,数据分析和人工智能得以在比赛分析领域得到使用,尤其是在商业化程度最高的足球比赛中,全球各大高水平联赛的球队都配备了各自的比赛表现分析团队。基于海量追踪数据,大数据和人工智能技术在足球领域的比赛行为的识别和比赛结果的胜率模型上有着深入的应用。