大数据在NBA联赛中的应用研究
2018-11-15赵益鑫
赵益鑫
研究机构 GARTNER认为:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的流量、高增长率和多样化的信息资产,大数据通常用来形容大型的非结构化和半结构化数据。大数据有数据体量巨大、数据多样化、数据处理速度快和价值密度低特点[1]。大数据开启了一次重大的时代转型,它把一切“量化”,利用其优势影响了商业和企业的发展,引起了生活、工作与思维的大变革。大数据时代处理全体数据不再是随机样本,在追求数据精确性的同时,也将数据的混杂性考虑进去,从而得出不一样的结果,数据与数据之间不再变得是因果关系,而是相关关系,大数据已经影响了社会的各行各业,推动了社会的进步和发展[2]。
近几年,大数据越来越得到体育赛事领域的亲睐,它给职业体育赛事带来了革命性的变化,球队通过大数据的分析,能够精确地掌握对手的技战术打法,提高自身训练质量,规避球员伤病,弥补自身的弱点,从而在赛事上击败对手。美国男子篮球职业联盟(以下简称NBA)运用大数据技术建立多样化的数据模型,将赛场产生的海量数据进行分析,为提高球队竞技能力、精确评价球员价值和更好地为球迷服务做出了巨大贡献。大数据的强大分析和预测能力对NBA经营策略,发展方向和比赛方式都产生了较大的影响。本文基于大数据背景,对NBA从传统联盟向数字化联盟转变进行了研究,并分析了大数据对NBA联赛的影响,揭示了NBA运用大数据技术的先进理念和最新成果,从而为我国篮球联赛数据分析和处理工作提供借鉴。
1 NBA从传统联盟向数字化联盟转变
1995—1996赛季,NBA的年收入达到31亿美元,而到了2016—2017赛季,整个联盟年收入已经达到约80亿美元。借助大数据技术优势,NBA联赛已经发生了翻天覆地的变化,现代大数据科技正在重塑着NBA联赛,对NBA联赛的传播渠道,经营策略和比赛风格产生了重大的影响,NBA联赛也在朝着数字化联盟方向发展。
1.1 重塑传播渠道
NBA联赛之所以取得如此成功,电视转播功不可没。NBA前任总裁斯特恩借助电视转播媒体优势,成功地将NBA比赛送到千家万户,积累了大量的客户,NBA联盟商业价值不断攀升,影响力推向世界。在日新月异的现代社会,传统的传播渠道和方式已经无法满足球迷的多元化需求,借助现代科技手段实现NBA联盟的再次飞跃迫在眉睫。在NBA第二位总裁萧华时代,其更加重视互联网传播渠道以及数据科技的运用,工作重心也逐渐转向新媒体。2014年,NBA联盟与ESPN、TNT和ABC等电视转播公司签订9年240亿美元转播合同[3]。与以往斯特恩时代签订的电视转播合同不同,萧华签订的电视转播合同更加数字化,其中包括网络直播、数字商品对外授权等内容。NBA联盟借助现代科技手段,转向互联网传播渠道,这是一次质的改变,迎合了已有客户更加多元化的需求。移动互联网技术的成熟运用保证了网络传播的有效性和便捷性,使更多的球迷通过互联网接触NBA。同时,传播渠道转变为联盟打开新的业绩增长空间,NBA通过互联网推出更多的观赛服务以及娱乐项目,帮助球迷更及时、更近距离地接触球星,各种数据资讯服务也得以推出,联盟获得更多的收入。
1.2 加强与外部合作,改变经营方式
随着联盟的发展和技术手段的升级,经过几十年的发展和积累,NBA联盟数据库中记录的数据种类越来越多,相关数据记录越来越准确,已经建立起庞大的数据库。但是,传统的海量数据虽然丰富,但是数据之间关系复杂,对经营管理的指导意义有限,并且很难直接推送给球迷,海量数据仍然停留在表面上。近年来,NBA联盟与Stats公司合作,引进大数据SportVu球员追踪系统,记录并追踪篮球和球员的运动。这一系统将提供持续的数据流和创新的统计数据,包括速度、距离、球员之间间隔以及控球情况等,从而实现目标性更强的分析。同时,NBA联盟与SAP合作推出HANA平台,一方面将复杂的海量数据重新组织,创新数据呈现方式,增强数据与球迷的交互性,自1947—1948赛季以来的NBA共计超过4 500万亿个数据段全都可以在NBA官网上用一种直观、简便的方式检索得到;另一方面针对基础数据进行分析,构建新指标,以此衡量球员和球队的表现。
1.3 小球比赛风格突出
近些年来,越来越多的NBA球队引进大数据技术,对比赛数据和球员能力进行科学地分析,NBA比赛节奏和攻防转换也随之越来越快,传球、跑位、挡拆、空切非常频繁,比赛风格越来越向“小球”时代发展。小球代表比赛节奏快,攻防转换快,外线投射多,球员的技术越来越全面,回合数越来越多,更具有观赏性。2012—2013赛季,两次夺冠的热火,以及近三年来两次夺冠的勇士都是小球的代表。小球最明显的特征就是三分球出手次数和命中次数越来越多。自1979—1980赛季开始,NBA联赛开始设置三分线,此后,NBA球队使用三分球的频率越来越高,1980—1981赛季,NBA球队三分球出手比重只占2.3%,到了2015—2016赛季,NBA球队三分球出手比重已经提高到28.5%,几乎提升了12倍。进入21世纪,NBA球队各个赛季三分命中数第一球队三分球使用频率也逐年提高,并且提高幅度有明显扩大趋势。
表1 NBA三分球出手及命中情况统计
注:数据来源-NBA官网(2011-2012赛季是NBA缩水赛季,少打了16场比赛)
2 大数据对NBA联赛的影响
NBA联盟现采用SportVU大数据分析系统,该系统由6个联通计算机的摄像头组成,每秒可以抓取25幅图片,它能够追踪赛场上所有球员进行的投篮,传球,触球,掩护和跑动距离等相关篮球技术动作,经过复杂的计算公式,在90s内通过数据形式生成比赛报告。SportVU系统于2005年以色列科学家麦基—塔米尔发明,起初用于导弹追踪和高端光学识别,该技术在以色列足球比赛中追踪赛场球员运动轨迹的成功,为它日后进入NBA球队奠定了基础。
2.1 提高球队赛事竞技水平
近年来,“小球”打法盛行,篮球技战术越来越丰富。NBA球队基于大数据对抢篮板球策略变化和球员技术特点数据分析结果,有效地帮助球队打造科学地场上阵容,做出高效的技战术选择和应用,从而提高竞技水平。
2.1.1 高效抢夺篮板球 在篮球比赛中,篮板球是获得球权的重要手段,是球员个人实力和全队实力的体现,也是比赛胜负的关键。利用大数据分析方法,将球员的篮板球统计数和其所处位置建立模型,更加科学地衡量球员争抢篮板球的能力,并给出不同位置球员不同的争抢策略。南加州大学(USC)的两位教授Rajiv Maheswaran和Yu-Han Chang通过对大数据的分析,印证了抢夺篮板球成功率与球员所处位置紧密相关,并得出结论:在篮球比赛中,投篮地点和拿下前场篮板的几率存在着一个固定的关系:球员每远离篮板一英尺,拿下前场篮板的几率就会降低1%,但到三分线时,几率又突然变大;此外,90%投丢的球都可以在距离篮板11英尺的范围内拿下[4]。
2.1.2 掌握球员技术特点 在球场上,每个球员都有着鲜明的技术特点,利用过往经验和现代数据分析能够更好地掌握球员技术特点,针对不同的球员技术特点,制定相应的防守和进攻策略,在球场上掌握比赛主动权,从而更大概率地赢得比赛。通过大数据的统计和分析,能够得到球员的运球特点、进攻习惯和投篮位置等量化数据,根据球员这些习惯,防守者可以进行针对性的防守。通过大数据分析发现,勒布朗·詹姆斯是一名右手将,他在篮筐左侧时,多数情况下,会选择投篮,当他在篮筐右侧时,更喜欢持球突破上篮。这样的数据统计给防守者一定的启示,当勒布朗·詹姆斯在篮筐左侧运球时,采用贴身防守,他左手突破能力能限,封住投篮角度即可;当勒布朗·詹姆斯在篮筐右侧时,要给他两步,防止他突破上篮,因为他在这个位置投篮的机率不高,只有小概率的进行跳投[5]。
2.2 预防伤病、降低损伤
随着科学技术的进步,大数据对医疗行业发展起着促进作用,健康医疗领域进入“大数据”时代。NBA医疗团队利用大数据提供的医疗数据分析,实现智能化可视化分析,为球员在临床诊断、基因测序、药品研发、治疗方案选型、远程诊断与监控等方面改善健康,预测疾病提供数据依据,帮助医疗团队找到某类疾病更好的治疗方案,为球员减少治疗痛苦并节省诊断成本,同时还能提高治愈率。NBA勇士队球员在训练时,配戴移动传感设备,采用Catapult Sports微型监测器追踪训练时的运动情况,以实时记录球员身体的基本状况。球员身着抗压衣监测膝盖和脚踝的承压情况,并且穿上Athos智能服装收集球员呼吸、肌肉活动信息。所有球员的身体状况都将以数据形式呈现在球队面前,以便更好地监测球员身体状况。医疗团队将每名球员的数据进行汇总分析,在监测数据对球员身体预警的时候,医疗团队会为为教练提供一个医学的建议,球队就会尽快安排轮休,最大程度降低球员伤病风险。
2.3 重新定义选秀价值
在球员选秀方面,大数据技术成为评估球员能力的重要工具。一方面,大数据分析NBA选秀球员在体测训练营里的各项数据,如身高、臂展、垂直起跳高度、力量测试成绩、速度以及球场各处投篮命中率,预测选秀球员的排名;另一方面,通过对球员过去比赛资料、数据的收集,分析球员特点,判断球员未来发展潜力,这会给联盟里的球队提供巨大的帮助。2011年NBA选秀大会之前,现马刺球员莱昂纳德的球探报告显示,他拥有着在一对一和挡拆中的防守迫使有球球员失误的能力,有着出色的抢篮板的能力,但大学时期三分命中率仅有25%( 164投41中),接球投篮命中率为32%。莱昂纳德被马刺选中之后,马刺投篮训练师为其佩戴大数据投篮装备,装备中的芯片与篮网的感应器连在一起,莱昂纳德每次投篮时,装备就会自动显示出其投篮的角度和力度等相关投篮数据,通过电脑将这些数据量化,不断提高莱昂纳德投篮准度。经过3年的训练,2014年,莱昂纳德在季后赛投篮命中率为51.0%,三分命中率为41.9%,力助马刺夺冠[6]。针对球员自身技术弱点,建立球员各项数据模型,大数据重新定义了选秀球员的潜力和未来价值。
2.4 衡量球员价值
传统的数据记录方式就是记录球员的得分、助攻、篮板等数据,看重最后的结果,忽略过程,这显然不能最好地衡量球员作用。为了更好地衡量球员在场上发挥的作用,瑟沃尼和德阿莫尔提出“预期球权得分”(expected possession value,EPV),即在比赛某一次配合或传球过程中,随着比赛时间变化,持球队员的预球权期望得分会得到相应的分数,如果球员的举动增加了EPV,他就为本次进攻做出了贡献,相反则阻碍了本次进攻,通过“预期球权得分增加”(EPV-added, EPVA)指标,就可以衡量一个球员在场上发挥的作用。2013年2月13日,马刺队员莱昂纳德准绝杀骑士,但通过大数据的分析,帕克起到了关键的作用。比赛最后9秒时,帕克持球,此次预期球权得分为0.97分,当面对防守时,预球权分降低到0.86分,在6.3s时,帕克的突破使预期球权达到了1.36分,进入篮下的帕克发现了空位底角的莱昂纳德,后者命中3分球,帕克的预期权分在5.9s时达到了1.75的峰值,鉴于莱昂纳德投篮时,对方队员防守,使帕克的预期权分下降到1.58,但已无关紧要。通过大数据分析,虽然帕克并没有投进反败为胜的一球,但在此次进攻中,帕克的突破和吸引防守以及传球都为最后制胜一球打下基础,这些都是无法用传统数据表达出来的,显然通过大数据的分析,帕克在这次进攻中起到了决定性的作用[6]。
表2 预球权分模型和时间的关系表
2.5 提供球迷服务
如今,随着体育娱乐化的盛行,简单的短视频和文字报道难以满足球迷的要求,NBA利用大数据技术很好地解决了这个问题,为球迷提供前所未有的观赛体验,增强球迷的参与感。2015年,腾讯正式成为NBA中国数字媒体独家官方合作伙伴,腾讯利用大数据技术,为球迷提供“上帝视角”,球迷可以选择不同视角去观看比赛。球迷在观看比赛的同时,通过现场数据采集设备和大数据分析系统,球迷可以直接在直播中看到比赛背后的深度数据。与此同时,大数据为球迷提供可视化数据。NBA在2012年与SAP合作之后,就将自身的数据库彻底升级,并将视频资料也纳入数据库,NBA官网可以同时支持上万人同时搜索,并尽量给予球迷可视化的反馈结果。据统计,在使用SAP的HANA平台之后,NBA.com/stats浏览量超过270亿,访问量增加了66%,停留时间增加了近60%[7]。同时,根据球迷登陆NBA官网所留下的浏览痕迹,利用大数据技术,记录球迷的偏好选择,以及与球迷的互动,大数据系统能够将球迷贴上不同标签,方便将同类球迷放置在一个“社区”,定向推送他们感兴趣的服务和产品,并且可以通过球迷偏好的变化趋势调整市场策略,给球迷最好的消费体验。
2.6 游戏开发
NBA除了将大数据引入比赛之外,还用于游戏开发,《NBA 2K》系列游戏无疑是成功的一款。NBA利用其海量的球员数据库,加之通过大数据分析产生的额外的数据,这为游戏开发奠定了基础。以《NBA 2K》系列游戏为例,大数据分析对游戏本身和未来营销都起到至关重要的作用。一方面,为了使玩家追求最真实的游戏体验,2K系列游戏全部采用NBA真实球员作为模板,基于球员原始的数据,利用大数据分析技术,量化球员在球场上各项基本技术的数据,高度还原现实球员的能力;另一方面,大数据对游戏本身产生的运营和广告数据进行预测和分析,识别客户群体并对其进行分类,最后进行精准营销。
3 NBA大数据成功应用的启示
3.1 拥有优质的体育资源
大数据只是辅助工具,本身无法生成海量的数据,借助优质的体育资源才能发挥更好的效果。NBA联赛自身就是优质的体育资源,它是世界上全球化和影响力最大的职业体育组织之一,每年收入超过40亿美元,用42种语言向212个国家直播赛事,7.5亿个家庭在观看NBA比赛。科学完善的现代化管理制度体系,成熟的商业运作推广扩大其全球影响力,2017年NBA总决赛第五场的最后时刻,比赛的收视率达到了18.8%,这一数据比2015年和2016年的总决赛的第五场高出了13%。因此,NBA大数据之所以成功,是其本身拥有优质的体育资源,且球迷人数众多,赛事组织稳定、运营管理有效,相关经营管理者大都是资深的体育专家。
3.2 高端科学技术和技术型篮球人才的保障
数据科技和互联网技术是体育大数据成功的技术保障,高端的科学技术确保对NBA联赛原始数据和以后产生的各种数据进行采集、处理、存储和管理、分析和挖掘以及展现和应用。人才是科学技术的创造者和使用者,NBA大数据成功恰恰依靠的是既懂篮球知识又懂数据分析的人才。他们利用自身的数学统计学科知识,基于比赛数据,通过大数据技术建立数据分析模型,从而生成了更多的数据类型,即有关运动员指标、球队指标和球指标的进阶数据,他们为篮球领域数据分析做出巨大贡献。约翰·霍林格发明了球员效率值(PER),即衡量球员在比赛场上每分钟的表现。迪恩·奥利弗发明了球员有效投篮命中率、失误率、进攻篮板率、罚球率等数据类型。科克·高登斯贝里对篮球事进行CourtVision分析,记录比赛场上发生的每一次投篮轨迹、投篮趋势以及投篮选择,将数据分析结果通过图像清晰地发达出来,以此来评价运动员的效率和倾向[8]。
3.3 寻求合作,实现共赢
在现代快速发展的时代,合作产生更好地发展,合作才能共赢。为了提高球队成绩,达拉斯小牛队是第一个将大数据引入NBA篮球赛场的NBA球队,随后第二年,球队便杀入了总决赛。随后,联盟如马刺、火箭、凯尔特人、勇士等球队与大数据公司合作,引入SportVU系统,进一步增强球队实力。事实上,大数据产生之初,NBA联盟采取观望的态度,并没有将大数据引进NBA联赛,但允许球队与外部合作引进大数据,直到2009年NBA总决赛,NBA联盟第一次将大数据SportVU系统安装在场馆中,其正式开始了与SportVU合作。NBA联盟借助自身优质体育资源的优势,不断地寻求与外部合作机会,与游戏开发公司共同研发《NBA 2K》系列游戏,与ESPN和TNT传播媒体开展大数据数字业务,同时,积极参与每年举行的麻省理工斯隆体育分析大会,借鉴最新的科学技术成果,将其引入篮球赛场,增强NBA联盟的价值。
4 结 语
大数据时代来临,引发了社会各行业的深刻变革,改变了人们生活和工作方式,为体育赛事解析带来新的角度和思维方式。借助大数据的技术优势,融合本身的优质体育资源,NBA联赛的赛事传播方式、经营管理策略以及比赛风格朝向数字化发展,提高了NBA联盟的商业价值,进一步扩大了全球影响力。球队利用大数据提高了成绩,重新审视传统数据带来的观念误区。同时,NBA联赛借助大数据,在球迷服务和游戏开发方面都取得了良好效果。优质的体育赛事是核心竞争力,大数据赛事技术人才是保障,两者的有机融合,才会发挥出体育大数据的最大作用。