球类比赛数据可视分析技术的现状与展望
2021-05-29曹安琪巫英才
曹安琪,张 辉,巫英才
随着计算机科学与技术的迅速发展,可视化和可视分析技术作为有效的数据展示和分析手段,越来越多地被应用到球类比赛数据分析领域,它不仅可以为教练员和运动员的训练和比赛提供指导与帮助,还可以提高各种媒体的传播效果,让体育爱好者更加喜欢比赛。例如,美国娱乐与体育电视台(ESPN)等比赛数据网站和其他体育媒体采用一些可视化图表来代替传统的文字比赛信息,可以使体育爱好者更加直观迅速地获取感兴趣的比赛信息,从而提高媒体的传播力。在专业比赛数据分析领域,可视化和可视分析技术可以更加直接有效地展示比赛的时空特征和运动员的技战术特点,吸引了众多专业体育数据分析师的关注。
1 可视化和可视分析技术及其发展
可视化(Visualization)的本意是使物体图像化、图形化,从而能够清晰、直观地呈现。可视化的研究最早可以追溯到18世纪的英国和法国,美国则是现代可视化研究的起源地[1]。1987年美国国家自然科学基金会召开的一个研讨会上,第一次给出了科学数据可视化的定义,标志着“科学计算可视化”学科的诞生。
数据可视化技术主要是指采用图形图像处理、计算机视觉、用户界面等计算机科学与技术,对数据进行编码、展示和表达的技术。数据可视化包括科学计算可视化、信息可视化和知识可视化。科学计算可视化主要指采用计算机图形学等手段对大规模的科学数据进行展示;信息可视化是指对来自不同领域的数据采用图表等可视化元素进行数据编码和展示;知识可视化是指通过视觉表征形式促进知识的传播与创新。图1是一个可视化的参考模型[2],可视化技术主要具有清晰直观等特点,可以使数据分析人员迅速发现数据当中隐藏的规律,进而更加高效地对大规模的数据进行分析。
图1 信息可视化参考模型[2]Figure1 Information Visualization Reference Model[2]
在当前大数据的背景下,可视化和可视分析技术被越来越广泛地应用到不同领域当中,例如,地图、遥感、医学、气象、海洋、航空、金融、通信、商业、新闻和工程技术等,在国际上逐步形成了可视化和可视分析的研究热潮。在竞技体育或职业体育领域,越来越多的职业球队聘用专业的比赛数据分析人员,通过定制的体育比赛可视分析系统,运用交互式方法,观察与分析运动员比赛中的技战术及体能等信息,进而为球队提供有价值的比赛与训练建议。
2 球类比赛数据可视分析的项目特征与内容
近年来,球类比赛数据的可视化和可视分析受到了研究人员的广泛关注,有关球类比赛数据可视化和可视分析的论文数量也在不断增加,涉及足球、篮球、排球、棒球、冰球、乒乓球、网球等项目,不同球类项目的可视化和可视分析聚焦点也有较大的差别。
2.1 球类比赛可视分析的项目特征
足球、篮球、手球、冰球、橄榄球等同场竞技的项目有较多的球员,比赛场地比较大,需要球员之间互相配合,攻防转换频繁且快速,要求球员在比赛场上占据有利位置,并制定相应的战略战术来战胜对手。因此,这些项目的可视化和可视分析关注的是球员位置移动和球运行轨迹的变化,使比赛数据分析人员能够通过比赛中球员位置数据、行为数据和球轨迹数据发现双方的技战术特征,并提出相应的战术对策。
网球和乒乓球等隔网对抗项目的规则相对简单,运动员的比赛战术往往是通过2拍及以上击球的技术、落点、位置、弧线、速度和力量等的变化和组合来完成。因此,隔网对抗项目的可视化和可视分析关注的是运动员每次击球行为的属性(技术、落点、位置、弧线、得失分等)以及击球行为序列变化的时空特征与关联特征。
相比之下,棒球是一项较为特殊的球类运动,它是以棒打球为主要特点,动静结合,成员之间分工明确,责任清晰,又必须主动配合和相互服务。因此棒击球后球的轨迹数据和落点往往是可视化分析的主要内容。
球类比赛是世界上普遍受欢迎的体育项目,许多可视化工作也关注该类项目在社交媒体上的传播和展示,对赛中简单的统计信息进行可视化,以便球迷们能够更好地了解比赛形势以及比赛中球员的表现。
2.2 球类比赛可视分析的主要内容
根据球类项目的比赛特征,其数据可视分析主要关注的是比赛中球和运动员的时空数据及其变化。
2.2.1 球运行轨迹数据可视分析
足、篮球比赛中的传球、运球、射门(或投篮),以及乒乓球、网球比赛的击球落点等常常是数据可视化分析最为关注的内容。传球、投篮、射门等数据通常采用热力图或移动轨迹等可视化方式,击球落点通常采用点标注的形式。例如,Janetzko等[3]的工作展示了足球比赛中球的运行轨迹(图2),其中,用圆点组成的红色线段表示比赛中一段时间内足球的运行轨迹,可以从轨迹中看出运动员传球的线路以及足球运行的速度。通过足球运行轨迹的可视化,分析人员可以观察传球和进球过程,进而分析球队进攻与防守战术的特点。
图2 足球运行轨迹可视化界面[3]Figure2 Visualization of Football Running Track[3]
2.2.2 运动员位置移动数据可视分析
热力图、移动轨迹、移动速度、运动员对球的控制面积或对球的压迫常常是运动员移动时空数据可视分析的内容。例如,Andrienko等[4]提出了足球比赛中运动员对球压迫的可视化方法,图3-A表示多特蒙德队在获得球权之前一段时间内球员对球的压迫,左右两侧的图分别表示比赛上半场和下半场球员对球的压迫。图3-A上方的2张图采用足球场和热力图的可视化形式表示球员对球压迫的空间分布,并采用线段表示一段时间内球的运动轨迹。图3-A下方的2张图采用空间直角坐标系和热力图表示球员对球压迫的分布,同时用相应点的坐标表示球队中每个球员的表现。图3-B是足球运动员跑动轨迹的可视化[5],分析了多特蒙德球队和拜仁慕尼黑球队在2018—2019赛季德甲联赛第11轮中的一场比赛,多特蒙德3:2赢得了比赛。其中,左右两侧的图分别表示多特蒙德球队和拜仁慕尼黑球队在一段时间内(10 s)的球员运动轨迹,并采用颜色区分前5 s和后5 s的轨迹。
图3 运动员位置移动数据的可视化界面[4-6]Figure3 Visual Analysis of Player Tracking Data[4-6]
可视分析系统ForVizor提供了足球比赛阵型数据的可视化探索,如图3-C所示[6]。该系统的特点是展示了2支球队比赛阵型对抗矩阵(B)和比赛阵型流的时空变化(F),同时保留比赛阵型在不同空间区域之间的连续流动过程。该系统还可以深入到显示视图,显示每个球员的详细位置信息(H)。
2.3 球类比赛可视分析系统的开发
球类比赛可视分析系统的开发方式和流程主要包括数据采集和处理、模型建构及可视化等。比赛可视分析系统的数据绝大部分来自比赛视频或收集运动员信息的传感器等。采集的数据类型通常包括轨迹数据(运动员或球在场上的时空轨迹信息)、事件数据(比赛中发生的事件,例如传球、投篮、击球等)、统计数据(比赛中的统计信息,例如传球成功率、击球属性的使用率和获胜率)等。
比赛可视分析系统的模型建构主要是对采集的各种数据进行处理,运用各种分析模型(统计模型、数据挖掘、人工神经网络、马尔可夫链等)对比赛数据进行分析。完成模型建构后,系统通过可视化元素将比赛数据的分析结果清晰、直观地展示出来,并运用直观的交互方式,使人们能够对比赛数据和结果进行分析与探索,为球队提供有价值的比赛方案等。
3 球类比赛数据可视分析系统案例
3.1 足球比赛数据可视分析系统
Perin等[7]针对足球比赛数据开发了可视分析系统SoccerStories,对足球比赛中的行为事件以及球队特征进行了全面的可视化和可视分析。图4展示了SoccerStories的可视化界面,它由5个部分组成:(1)比赛时间线作为比赛概览;(2)比赛中某一阶段的比赛细节,采用球场和传球序列的可视化展示球队在所选比赛阶段采用的战术;(3)比赛中各种统计数据;(4)图标方式对比赛中出现的传球序列进行可视化,提供比赛阶段的概览,可以应用该图标对比赛阶段中的传球序列进行更加清晰直观的比较;(5)提供自动生成的语句对所选比赛阶段进行描述。Soccer-Stories可以对足球比赛中的战术进行清晰直观的分析,并为足球比赛分析人员提供有效的互相交流工具。
图4 SoccerStories的可视化界面[7]Figure4 The System Interface of SoccerSories[7]
足球项目的可视分析工作比较多,除了对比赛数据进行分析以外,还要对联赛的积分和排名进行可视分析。Perin等[8-9]在2014年和2016年分别提出了Átable!和Gap Charts对足球比赛中的积分和排名进行直观有效的可视化。其中,Gap Charts采用类似折线图的可视化设计对2013—2014赛季西班牙甲级联赛各个球队的积分和排名变化进行可视化,人们可以清晰地看出球队整个赛季整体的积分和排名趋势,也可以对感兴趣的球队进行深入观察。
3.2 篮球比赛数据可视分析系统
篮球比赛可视分析代表性的工作主要包括Courtvision、POINTWISE、Counterpoints、BKViz、Game-Flow[10-14],分别对篮球比赛中的投篮分布、预测比分、防守行为、球员表现指标、比赛事件进行了可视化和可视分析。可视分析系统BKViz通过对球员表现指标进行可视化[13],如图5所示。其中(a)用篮球场图形展示运动员的运球轨迹、传球轨迹和投篮轨迹;(b)提供筛选交互操作,可以根据特定条件筛选感兴趣的运动员传球序列;(c)、(d)和(e)针对运动员的投篮数据提供不同的可视化形式。其中(c)采用点表示球员投篮位置,(d)采用辐向热力图表示球员在不同距离上的投篮频率,(e)采用传统的热力图表示球员在不同位置的投篮频率。
图5 BKViz的可视化界面[13]Figure5 The System Interface of BKViz[13]
3.3 冰球比赛数据可视分析系统
SnapShot是冰球比赛数据可视分析较有代表性的工作,提出了新颖的可视化设计辐向热力图,用来对冰球比赛中运动员射门位置的频率进行编码和展示[15]。图6展示了SnapShot中辐向热力图的可视化设计,人们可以通过辐向热力图清晰地看出球员在球门不同距离上的射门频率。基于该设计,SnapShot还提供了完整的可视分析系统,对冰球比赛进行分析。图7展示了SnapShot的可视分析系统界面,主要包含6个部分:①为系统中展示传统热力图和辐向热力图等可视化元素的部分;②为数据分析人员提供比赛筛选等交互操作;③为选择不同可视化方式的下拉菜单;数据分析人员可以通过④提供的交互操作调整①中的可视化细节,例如调整传统热力图中的方块大小;⑤提供不同视图之间的对比;⑥用于导出可视化界面以及比赛数据。Snap-Shot提供的可视分析系统,可以对冰球比赛进行完整的分析。
图6 SnapShot中的辐向热力图[15]Figure6 The Radial Heat Map Design in SnapShot[15]
图7 SnapShot的可视化界面[15]Figure7 The System Interface of SnapShot[15]
3.4 橄榄球比赛数据的可视分析
MatchPad是对橄榄球比赛实时赛况和橄榄球运动员的相位移动进行可视分析的系统,其可视化界面如图8所示[16]。该系统采用时间轴来表示橄榄球的比赛过程,两队的表现分别在时间轴的上侧和下侧采用红色和蓝色进行编码,同时设计定制的图标对比赛中发生的事件进行可视化。时间轴两侧的柱状图分别表示橄榄球在两队中的相位移动情况,其中柱状图的高度编码移动距离,柱状图的宽度编码时间长度。系统在主视图下方设置详细信息面板,对橄榄球比赛双方的详细统计信息进行展示。橄榄球分析人员可以通过MatchPad对比赛情况进行实时的细致分析。
图8 MatchPad的可视化界面[16]Figure8 The System Interface of MatchPad[16]
3.5 网球比赛数据可视分析系统
网球比赛数据可视分析代表性工作主要有Tenni-Vis和CourtTime[17-18]。TenniVis设计了一种新的可视化形式饼盘图,可对网球比赛的每一局进行展示,其设计的可视分析系统可对整场比赛进行分析,如图9所示。该系统共分为4个部分:(a)展示了比赛的基本信息(运动员信息和比分等),并提供交互式的筛选,便于人们对感兴趣的局进行分析;(b)为系统主界面,采用饼盘图对比赛中的局进行展示。每个饼盘图代表比赛中的一局,上方和下方的圆圈分别代表2个运动员在该局的得分,其中实心的圆圈代表效果较好的球(发球得分、制胜球、受迫性失误等),空心的圆圈代表效果较差的球(双误、非受迫性失误等)。饼盘图的主体采用仪表盘的形式展示比赛形势,饼盘图的颜色越深,代表局势对相应的运动员越有利,指针的角度表示选手的最终得分,指针角度越大,表示该局运动员间的分差越大。饼盘图外的方框表示该局为破发局。例如,(b)-(1)表示运动员1轻松赢下了这一局,(b)-(2)表示运动员2艰难地赢下了这一局;(c)为数据分析人员提供了柱状图等统计图表,人们也可以通过(d)提供的比赛视频对该场比赛进行详细分析。
图9 TenniVis的可视化界面[17]Figure9 The System Interface of TenniVis[17]
CourtTime是网球比赛数据可视分析的最新工作,提供了结合空间数据和环境信息的网球比赛数据采集流程,同时设计并实现了对网球比赛中时空数据的分析,如图10所示。CourtTime共包含3个视图:Point Selector、Point Analyzer和Shot Analyzer。其中,Point Selector为人们提供了特征和属性值的选项,可以对比赛中需要分析的回合进行过滤(A、D);Point Analyzer展示了在Point Selector中选择的回合,其中每个回合采用一维的时空图表进行编码(B);Shot Analyzer展示在Point Analyzer中选择的特定回合中重要的击球行为,包括发球、接发球、每个运动员在该回合给出的最后3拍(C、E)。一维的时空图表是该系统中最为重要的可视化元素,该元素将时间和每拍落点的空间信息相结合,将每回合中球的落点以及球员的实际移动轨迹分为2个维度,分别与时间维度相结合,由此得到2个维度的一维时空图表。
图10 CourtTime的可视化界面[18]Figure10 The System Interface of CourtTime[18]
3.6 乒乓球比赛数据可视分析系统
乒乓球比赛数据可视分析代表性的工作是iTTVis数据可视分析系统[19]。iTTVis为乒乓球技战术分析人员提供了全面直观的可视化系统,可以对细粒度的乒乓球比赛数据进行详细分析。图11为iTTVis的系统界面,分为5个视图:Match View、Stroke View、Stat View、Tactic View、History View。其中,Match View用于展现乒乓球比赛的整体局势,采用阶梯图表示每回合中运动员的比分变化(B-1);采用圆圈对比赛中每回合的比赛局势进行编码,其中圆圈的颜色编码该回合获胜的运动员,圆圈的面积编码该回合的长度(B-2);人们可以通过筛选条件获取感兴趣的比赛阶段。Stroke View采用乒乓球桌图形对每回合中球的轨迹进行展示。Stat View采用直观的可视化设计关联矩阵图,分别根据比赛中每拍的击球技术、击球落点、击球位置划分为矩阵,并将相邻拍的矩阵进行关联,将使用频率和得分率在矩阵中进行编码(D)。Tactic View采用定制的图标,对连续3拍的属性进行编码和展示,同时展示对应的使用频率和得分率(E)。History View主要用于对历史操作进行展示(F)。通过iTTVis可视分析系统,乒乓球数据分析人员可以发现运动员在比赛中频繁采用的击球技术和战术,进一步为运动员的训练和比赛提供有价值的见解。
图11 iTTVis的可视化界面[19]Figure11 The System Interface of iTTVis[19]
3.7 棒球比赛数据可视分析系统
比较有代表性的棒球比赛数据可视分析工作有Baseball4D、StatCast Dashboard、Baseball Timeline和HistoryTracker等[20-23],主要对棒球比赛中的运动员和球的轨迹数据进行可视分析。Baseball4D为棒球分析人员提供了展现比赛场景的可视化工具,分析人员可以通过拖动滑动条以及切换不同的可视化形式对棒球比赛进行分析,同时可以查看比赛中的各种统计数据。分析人员也可以采用浮窗的形式对不同的比赛场景进行对比。系统还提供了热力图等多种可视化元素对运动员的轨迹数据进行展示(图12)。
图12 Baseball4D的可视化界面[20]Figure12 The System Interface of Baseball4D[20]
StatCast Dashboard同样也关注棒球比赛中球员轨迹数据的可视分析,图13展示了StatCast Dashboard的可视化界面。该可视分析系统主要包含3个部分,分别为关键词管理(a)、比赛统计数据(b)和比赛场景可视化(c)(d)。人们可以通过关键词管理组件对感兴趣的比赛进行搜索和筛选。比赛统计数据组件主要采用柱状图和散点图等可视化图表,展示比赛中人们选择的统计数据。比赛场景可视化组件提供球员轨迹可视化对单场比赛进行分析,同时提供热力图对多场比赛中球员跑动位置进行直观的可视化。人们也可以在热力图中选取感兴趣的位置进行进一步的分析。StatCast Dashboard为棒球比赛球员轨迹数据提供了完整的交互式可视分析系统,便于人们发现比赛中球员的跑动规律。
图13 StatCast Dashboard的可视化界面[21]Figure13 The System Interface of StatCast Dashboard[21]
利用棒球比赛中轨迹数据的可视化对数据进行交互式采集也引起了研究人员的兴趣。History-Tracker提供了采集棒球轨迹数据的热启动方法,是通过可视化和交互手段采集棒球轨迹数据的数据采集系统,其界面如图14所示。HistoryTracker共包含4个部分:A为人们提供与棒球比赛轨迹数据采集相关的简单问题,在回答问题后,系统将根据问题的结果筛选符合条件的、相似的历史轨迹数据,作为后续轨迹数据采集的参考;B展示所采集比赛的原始视频为人们提供参考;C提供比赛中轨迹数据的可视化,人们可以在轨迹数据的可视化中进行轨迹调整;D展示比赛事件和视频的对应时间轴,人们可以对时间轴进行调整,以进一步筛选轨迹数据。通过系统提供的可视化以及交互手段,可以快速有效地对棒球比赛轨迹数据进行采集。
图14 HistoryTraker的系统界面[23]Figure14 The System Interface of HistoryTracker[23]
4 球类比赛数据可视分析的挑战及前景
4.1 可视分析工作面临的挑战
比赛数据可视分析强烈依赖数据的来源,随着比赛数据采集技术的不断发展,球类比赛的数据也越来越丰富。例如,NBA引入多摄像头动态追踪技术(Sport VU)后,在比赛场馆上方安装了6个移动式超高清摄像头,以每秒25帧的速度捕捉球员的空间坐标,并为每个坐标点加上时间戳和球员ID,能够追踪每个球员的传球、投篮以及在场上所有的动作[24],因此为NBA比赛数据可视分析提供了强大的数据支持。但是,其他绝大多数球类项目并没有达到NBA这样的数据采用水平,甚至连全景比赛视频都很难获取,因此如何获取完整连续的多维数据一直是困扰球类比赛数据可视化发展的一个瓶颈问题。
比赛数据可视分析是科学、设计和艺术与体育专业相结合的一门交叉学科,其核心意义在于清晰地叙述比赛事件(行为)的过程、挖掘数据背后的联系和规则,并进行艺术化表达。这就需要球队的专业分析师和可视化设计师精心策划,抓住各个球类项目制胜的核心环节进行可视分析系统的设计,才能最终帮助教练员、运动员更好地理解数据,作出正确的战术决策,更敏锐地掌握比赛机遇。
4.2 球类比赛数据可视化应用前景及其他项目可视分析
目前,球类比赛数据可视化和可视分析工作主要面向体育爱好者的数据新闻和面向球队(俱乐部)分析师的专业数据。随着体育比赛的影响力不断扩大和体育爱好者的不断增加,数据新闻未来将会有更大量的可视化工作,用于面向大型运动会(如奥运会、亚运会、全运会等)的电视和网络媒体传播。同时,针对球队分析师的专业比赛数据分析,会采集更加细粒度的数据,并应用人工智能等前沿数据分析技术,帮助球队的分析师、教练员和运动员更加深入地了解与发现技战术及体能等多方面的问题,为球队的战略战术决策提供科学支撑。
另外,在综述球类比赛数据可视分析现有成果的同时,发现其他项目的比赛数据可视分析工作非常少见,原因可能是体能主导类项目(田径、游泳、自行车、滑冰等)数据比较单一(成绩或者分段成绩),时空变化具有确定性(比赛规则规定了距离和方向等),且缺少运动员之间的配合与变化;技能主导类表现项目(体操、艺术体操、花样滑冰、花样游泳等)则由于动作专业性极强且变化复杂,运动员的成绩多数是由裁判员评分确定的,要获取详细的比赛过程数据难度较大。如何对体能主导类项目和技能主导类表现项目比赛数据进行可视分析,应该是未来比赛数据可视化和可视分析需要重点关注的方向。