APP下载

大数据在体育领域中的分析及应用①

2016-11-28张梓群

当代体育科技 2016年10期
关键词:球员体育分析

张梓群

(首都体育学院 北京 100191)

大数据在体育领域中的分析及应用①

张梓群

(首都体育学院 北京 100191)

近年来,大数据已经不仅局限在纯粹的IT领域,也日渐渗透于体育科学领域。虽然仍处于起步阶段,但数据挖掘已体现了显著作用,该文旨在探索大数据于体育领域中的应用,并对大数据时代下带给体育科学的挑战展开思考和初步分析,为其在体育领域中进一步发展提供理论参考。

大数据 体育科学 分析 应用

1 大数据的概念阐述及特征

大数据,是指无法在可承受的时间范围内用人脑或工具进行捕捉、管理和处理数据的集合。通过对新系统、新工具、新模型的挖掘,运用分布式计算架构,以收集、处理、分析、归纳、总结数据深层次的规律。新时代下数据资产已经是人们日常中必不可少的经济资产形式,既是创业方向又是投资机会,是国家竞争的前沿和企业创新的源泉。

根据舍恩伯格的归纳,笔者将大数据提炼出3个特征:总体性、关联性和混杂性。大数据是结构化、半结构化与非结构化数据的集合,而非简单抽样数据,它指收集分析与研究对象相关的全部数据。关联性强调分析各变量间的规律,而非小数据看重变量间的因果性,是一种思维上的蜕变。对于大数据的混杂性笔者概括为兼收并蓄,在当下数据纷繁错杂的时代,对精确性的要求不再像小数据时代之高,是鼓励学者探索大方向性的结论,而非沉浸于现象的点滴细节。笔者认为,“大”的意义并不在于数据的海量,而体现在一种大局观,对于分析挖掘数据所要求的洞察力,体现了庞大数据的分析挖掘价值和潜力。特别地,大数据的“数据”不是在谈数据存储,而是研究数据获取与应用,不能只空谈概念而对分析挖掘的工作囫囵吞枣,剖析才是将数据价值最大化的根本手段,是承接大数据的重要载体,二者相辅相成,不可孤立而论。

2 大数据在体育领域的应用

2.1在全民体质健康方面的应用

21世纪起,国家国民体质监测系统逐步建立并完善。体质监测中心官网,囊括了两大数据库,即国民体质数据库和群众体育调查现状数据库,现阶段已积累了海量体质监测数据。传统的简单样本统计方法已经满足不了需求,需利用数据挖掘理论同时紧密联系临床医学理论,深入挖掘数据中蕴藏的健康、疾病状况,以此指导运动健身、养生保健,有效改善生活方式。体质监测主要以三大指标为参考依据:身体形态、身体素质和身体机能。每个指标下有细化的小项,如,背力、台阶试验、选择反应时等项目,所测得数据之间是一种类似于网状的关系,通过系统的综合评定给予建议。体质监测数据的分析常见的有两种:聚类分析挖掘和关联规则分析挖掘。聚类是把相似的对象通过静态分类法分成不同的组别,在每一个组别中对象均有共性特征,是一种归纳行为。关联性挖掘就是在信息载体中查找存在于研究对象集合之间的相关性或因果结构,其结果可细化成3类:(1)验证性规则,即专家的观点得到数据支持性验证的规则;(2)含有新知识的规则,即隐含的、潜在的有价值信息或知识,不容忽视,有深入探索的必要性;(3)不合理的规则,即结果与经验性理论和论断相悖,说明经验性理论需更正或实验数据误差较大需改进。体质监测官网在数据评分和分析下,均有对应的运动处方和专家建议,具体到实施步骤、操作风险,将大数据的价值真正应用到百姓的生活中,对运动健身颇具积极意义。

2.2大数据在体育传媒业的应用

新闻传媒业由于其发展特点,成为第一个真正感受到互联网影响的行业。大数据的来临,无疑又带给体育传媒业颠覆性的冲击。从目前的信息技术发展趋势看,以数字传播为手段的新媒体模式渐入佳境。特别是云端数字化平台的发展,使体育传播告别了单一化的模式束缚,走向社会化和互动化,从固定化迈向了智能移动化的新模式。在大数据背景下,随着信息技术短时间内的迅速变革,涌现出了多元的体育信息平台。人们摆脱了对电视媒体的依赖,电视业对于体育信息的传播平台和通道的垄断被互联网和电信企业打破,出现了可以独立实现报道、制作、传播以及开展服务平台的系统。据统计,伦敦奥运会期间,搜狐、新浪、腾讯三大门户网站日均IP超过300万,日均PV量均突破1 000万大关。CNTV整体覆盖用户近5亿人次,网站日均访问量达3 500万人次,新浪和腾讯微博更是仅访问量就达到了3.1亿次和2.0亿次,以上数据表明,互联网已经成为体育传播的主要途径和交互平台。新媒体和自媒体的普及引领了全新的体育传播模式,同时新平台对包括体育节目在内的网络内容需求激增,对于提高体育传播内容的广度和深度有着积极意义。

2.3大数据在科学选材中的应用

运动选材是体育强国的战略保证,如今体育强国间的训练手段、方法、技战术水平相差越来越小,天赋对于赛绩影响的比重越来越大,运动员硬件的选材环节被无限放大,找到好的苗子,被认为是成功的一半。科学选材是以现代科学的方法手段,依据项目的发展特点和要求,通过综合测评,将适合参与专项运动的人才遴选出来,系统培养并不断地监测其发展的过程。信息化的大背景下,基于大数据分析的运动选材,是对传统静态选材的很好补充。《点球成金》讲述了经理人比利·比恩,如何通过统计学和数学建模的方法挖掘球队人才,使处于美国职业棒球联盟下游的奥克兰运动家棒球队脱胎换骨,成为冠军的有力争夺者。其一系列管理方法手段被世人称为“棒球统计学”,是数据分析在体育应用中完美的诠释。比恩前,教练员以击球率来衡量球员的实力,击球率=安打数/打数,通常打出安打的能力强,击球率就越高,球员能力对应越强。比恩却坚持以自己统计出的上垒率来挑选球员。上垒率=(安打+四坏保送+触身球)/(打数+四坏保送+触身球+高飞牺牲打),更强调球的保送,与球员临场选择有很大关系。长打率=垒打数/打数,整体攻击指数(OPS)=上垒率+长打率,是经验指数,指数超过1就是极为优秀的打者。比恩再由历史数据总结分析,按照每一次安打的概率建模,得出代表胜利贡献的平均获胜概率,由此选材。比恩的成功让体育从业者意识到了经验决策的弊端,意识到数据分析的价值。大数据下的科学选材是教练员强有力的决策保证。是目前评价运动员较为客观的理论依据。

2.4大数据在赛绩提升中的应用

传统竞赛分析以观察、数理统计为主,具有局限性。随着网络技术的兴起,减少人为投入和技战术的细化深化等需求推动了动作采集和运动员评估系统的产生。大数据分析的引入,使教练和运动员有机会从另一个维度深度剖析运动项目,从中获得持之有故的洞察,进而调整策略,由此制定科学合理的训练计划。以美国职业篮球联赛为例,据统计,在聘请数据分析师的球队当中,球队的平均胜率高达59.3%,而没有分析师的球队胜率只有40.7%,数据分析的作用不言而喻。从20世纪80年代至今,球员的表现和各项数据都被量化存储于数据库中,如今可以即时分析出任何一名球员的优势和弱势,对教练在战术安排和训练方面帮助极大。正负值和PER值是衡量一名球员的重要指标。正负值是球员在场时,球队净胜对手的分数,能在一定程度上反应比赛趋势和球员贡献值,可用来长期观察球队里阵容的契合度。PER值是一种复杂的效率计算,被视为最准确的衡量球员价值的评估体系。以12项数据统计全方位包裹球员,包括远投、助攻、进攻和防守效率、联盟进攻防守平均效率和球员犯规代价等。若联盟防守节奏松懈,球员数据暴涨,那么该项数据反而贬值。球员效率指数将球员与联盟环境相结合,衡量一名球员,关注效率指数是较客观的标准。其他运动诸如网球足球也争相效仿,通过数学建模研究如何提高运动员的单位效率。此外NBA还拥有球员投篮热区分布技术,将球员在球场上表现具体呈现,便于针对训练。

3 现状及面临的挑战

大数据工作仍有许多基础性的问题亟需解决。如,结构模型专业性和形式化表述的规范性,对比世界前沿显得相形见绌。数据库中的真实有价值数据偏少,可参考性没有保证。关于大数据的分析解读也有待加强,即如何将数据分析出的关联性应用到具体某一实践活动中,并快速有效地制定管理执行方案。后备人才不足的现状是暴露出另一大问题,该领域需要专业素养极高的管理者和技术人员,前者负责决策制定方案,后者能深度剖析数据内涵。该类人群的严重稀缺性会在很大程度上制约体育科学的发展。我国在数据的共享和流动性上并非长项,相关体育管理机构可酌情加大信息数据公开的程度。同时应重视法律的保护,提取和公开隐私数据需要得到运动员的承认,特别是用于商业开发的数据,运动员需有知情权。在数据公开和保护上如何权衡取舍,是接下来要面临的难题。

4 结语

努力建设并改进体育数据平台,进一步研究开发大众化的挖掘工具,着重探索与其他技术的交叉融和,充分利用云计算和数据交互技术。

各界应该围绕如何采集私人数据、公开数据信息展开深入探讨。同时建立更完善的隐私保护模型,发展以用户为中心的数据交换体系,运用粒度控制技术,完善数据保护机制。

社会需着力培养大数据专业后备人才,以软实力带动硬实力,转变思维,以总体大局观代替随机抽样观,以关联性代替因果关系,理性认识数据混杂性,包容错误数据。坚持完善法律制度体系,加快市场经济体制发展,为大数据下的数据统计和分析工作扫清阻碍。

大数据不仅带给体育科学技术手段的创新,还有思维意识的剧变。星星之火,可以燎原,数据分析初露锋芒,前途无限。随着大数据战略被提上国家战略议程,其同体育科学的紧密结合必将引领我国体育事业发展迈向新高度。

[1]马国全,杨建文,张虎祥,等.大数据在体育科学中的应用及思考[J].河北体育学院学报,2015(2):11-16.

[2]赵国栋,易欢欢,糜万军.大数据时代的历史机遇[M].北京:清华大学出版社,2013.

[3]魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013(2):5-11.

G80-32

A

2095-2813(2016)04(a)-0150-02

10.16655/j.cnki.2095-2813.2016.10.150

①张梓群(1995—),男,汉,北京人,本科,研究方向:体育经济与管理。

猜你喜欢

球员体育分析
隐蔽失效适航要求符合性验证分析
分析:是谁要过节
我不只是球员
回头潮
我们的“体育梦”
体育一家人
体育一家人
体育一家人