运动训练数据驱动决策发展方式的实现基础与实现策略*
2020-11-25杨成波
杨成波
(成都体育学院,四川 成都 610041)
决策是由直觉、经验和逻辑三种方式分别或混合驱动而成。在运动训练过程中,直觉和经验在决策过程中具有重要的作用,而通过逻辑方式做出的决策通常具有更高的确定性和可接受性,数据恰恰是填充逻辑决策过程的基础。数据包括各个层面的定性资料和定量数据,贯穿于运动训练整个过程,它可以协助运动训练从业人员发现运动项目制胜规律与比赛规律、优化运动训练过程与运动训练方法,从而调节运动员竞技状态、提升运动员竞技表现。随着大数据时代的来临,在运动训练领域中数据信息与训练决策之间的关系越来越紧密,正逐渐从“由直觉和经验驱动决策”“以数据为中心的决策”向“数据驱动决策”的发展方式转变。[1]
近年来,随着复杂性科学和大数据技术的兴起,运动训练科学研究认识论与方法论的路径发生了转向,人们认识问题与解决问题时已不再满足于小数据时代探求数据间因果关系的分析模式。基于判断与改进为目的的数据分析在很大程度上释放了数据的意义,数字化、网络化、人工智能设备及各种数据分析方法的应用也为海量数据的收集、存储、数据信息化及数据分析奠定了技术与工具基础。在国际竞技体育领域,基于数据驱动的决策方式在队伍发展战略的制定、比赛战术的调整、体能训练监控等方面日益显现出巨大的作用,正在逐渐打破运动的发展格局。本文试图探求运动训练数据驱动决策发展方式的实现基础及其实现策略,为改变运动训练发展的思维模式及问题解决方式提供思路。
1 数据驱动决策及在运动训练过程中的发展
1.1 数据驱动决策
数据驱动思想指利用受控系统的在线和离线数据,基于数据的预报、评价、调度、监控、诊断、决策和优化等实现系统的各种期望功能。[2]数据驱动决策思想是数据驱动思想的重要组成部分,2013年,福斯特·普罗沃斯特(Foster Provost) 和汤姆·福塞特(Tom Fawcett)在《数据科学与大数据、数据驱动决策的关系》一文中将数据驱动决策定义为“基于对数据的分析,而不是仅仅依靠直觉进行决策的实践”。[3]
在工业和制造业中的质量管理、组织学习和持续改进等方面已通过对不同类型的数据做出迅速反应转向了数据驱动决策的发展方式。在教育领域中,数据驱动决策主要是指收集、分析、报告和使用数据用以学校的改进。[4][5]“基于数据的专业问责和改进”逐渐取代了“基于成绩的绩效问责”,学生成绩数据主要用于确定学生的学习状况和制定与课程、教学直接相关的决策。在美国、英国和澳大利亚等国家和地区制定的校长专业标准中,运用数据支持学校改进被视为一项重要的领导能力。
数据驱动决策具有明显的实践特征,它可以帮助运动训练参与者有效地解决实践问题和改善实践行为。目前,在运动训练领域尚未形成数据驱动决策的概念与成熟的数据使用策略,可通过借鉴教育领域中的数据驱动决策方式加以实现。柳叶青(2013)在研究国外教育领域数据驱动决策研究现状中指出“利用数据改进教育实践是一个典型的结构不良问题,它包括三个基本要素:起始状态、目标状态和解决路径。即利用数据确定初始状态和目标状态,并将数据信息转化为解决问题的行动知识。”[6]而竞技体育的一个重要目的就是通过科学设计、组织有序的竞技运动训练活动,实现运动员竞技能力状态的定向转移,[7]这一过程主要是追求实现运动员竞技能力初始状态向目标状态的转移并寻求科学的解决路径。因而,运动训练领域数据驱动决策发展方式的概念可借鉴教育领域的数据驱动决策概念,即收集、分析、报告和使用运动训练过程中的数据用以促进运动训练发展方式的改进,实质上就是将运动训练过程中的数据元素相互关联,并探索影响运动训练效果各组成因素表现的积极因素和消极因素以实现促进运动训练健康发展的功能。其数据使用策略也相应的包括以数据分析为导向和以决策目标为导向,前者是从已有数据出发,利用数据识别和确定初始状态,探讨数据反映的实践问题。后者是从分析运动训练过程中的目标状态着手,在决策过程中主动寻求数据支持,建立数据与决策的对应关系。
1.2 数据驱动决策在运动训练过程中的发展
进入21世纪,在竞技体育领域,数据与运动员选材、技战术训练安排、身体机能监测与调整、运动竞赛过程控制等联系的愈加紧密,数据分析甚至会影响到队伍的建设及促进运动项目技战术风格的改变。随着大数据技术的出现,现代运动训练的发展方式日益体现出数据驱动决策的特点。
随着互联网和物联网技术的广泛普及,数据和信息的收集日益便捷,通过数据统计分析球员的技战术特点、评价与优化战术方案、进行胜负预测及提取制胜关键指标也已成为各运动项目科技服务的重要内容。如智能羽毛球拍可以记录一场比赛的全部数据,不单包括杀球、搓球等技术指标,还可体现速度——力量曲线。体育的数字化转型也日益明显,从2014年开始,西班牙皇家马德里足球俱乐部开始和微软合作,微软需要为球员、教练、队医、球探等主要成员提供全面的数据服务。球员通过大数据统计,可以更加清楚地知道自身的优势与不足;教练可针对性地对球队做出战术性调整,使得技战术执行更具效率;队医可总结归纳球员的身体状况,对其可能发生的伤病做出预警和应对措施;而球探则能够根据专业的数据统计,发掘更多的希望之星,为球队补充新鲜的血液。英超联赛和一些球队也开始了数字化转型,教练在赛场上通过移动设备实时搜集数据、分析数据,从而在中场休息时更有针对性的对下半场比赛做出布局。在电视转播中,当球员准备罚点球时,电视画面也会出现罚球球员历史主罚点球的相关数据,清楚地标明球员习惯的罚球方式和罚球路线。[8]
在NBA球队中,已广泛应用通过数据统计与分析制定球队发展战略、制定球队战术方案与分析球员表现。如位于硅谷地区的金州勇士队的数据工程师根据历年来NBA比赛的数据分析结果,发现最有效的进攻是眼花缭乱的传球和准确的投篮。在这一思想指导下,队员苦练投球,全队在一个赛季投进1000个三分球。数据分析的作用还可帮助分析和总结优秀选手的动作姿势,纠正选手的动作。如高尔夫和网球选手会在身上安装各种传感器,测定技术动作,然后和优秀选手的动作进行对比,进而纠正自己的动作。[9]
大数据时代,竞技体育所处的外部环境开始逐步呈现复杂化和信息化的特征,传统上具有“保密”特征的训练手段及对制胜规律的把握,开始逐渐被大数据运算产生的“预测”理论所证明。竞技体育的竞争环境和竞争格局也开始趋向科技化、系统化和复杂化。由此,传统训练理论中的选材、训练手段、状态诊断及赛前情报信息收集等都会发生思维方式和方法上的革新。大数据技术将会助力于高水平训练与竞赛领域,运动员的训练和竞赛特征将会通过传感实时传输数据,为教练员的训练决策提供参考。[10]
2 运动训练数据驱动决策发展方式的实现基础
大数据时代的前行时代是小数据时代,其本质仍然是数据。相较于小数据而言,大数据呈现出规模巨大、类型繁多、动态演变、关联复杂、真伪难辨等特性。大数据技术概念弱化了对因果关系的追求,转而关注相关关系,其根本原因在于小而精的数据无法描述因果关系的复杂化。从哲学角度而言,大数据所追求的相关关系必然隐藏着某些因果性。通过对海量数据的分析发现相关关系,进而做出决策并引出某种行为策略,即是对相关关系这一“因”的回应,意即小数据处理的是简单性因果关系,大数据处理的是辩证的新的因果关系。
根据2009年英国e-Science计划首席科学家Tony Hey等编著《第四种范式》一书,人类社会的科学发展范式经历了“实验科学”“理论科学”“计算科学”和“数据密集型科学”四种范式。[11]“数据密集型科学”范式本质上倡导数据驱动,意味着科学发现的主导方式将依赖于数据科学的发展。如生命与健康科学等数据驱动型学科的建立基础即是海量数据和海量数据资源的处理方法,即广义范围的“大数据技术”。[12]因而,与大数据密切相关的“数据密集型科学”范式所倡导的数据驱动,其理论指导和技术支持都无法脱离“大数据技术”这一核心概念及其衍生需求。
2.1 向复杂性科学需求理论指导
大数据时代的兴起是科学整体上作为系统转型演化的历史需要,大数据时代运动训练数据驱动决策发展方式的前提是承认运动训练系统在内在机制、特征及关系间等方面的复杂性。意即与小数据时代的简单性科学相比,数据密集型科学范式所倡导的数据驱动发展方式应用于运动训练,需要承认生命有机体的复杂属性和运动训练实践的特殊性,需要从内部认识复杂运动训练系统与运动训练过程的目的以及认识运动训练系统间的复杂关系。[13]而在21世纪广泛应用于多学科研究领域的复杂性科学,其学科理念、研究方法和认识论基础都对上述条件实现了有效呼应。
复杂性科学提出应该将研究对象当作具有生命活力的整体系统,重视要素间的组合所带来的系统结构和功能的涌现,承认事物发展的不确定性与非线性、承认复杂系统的整体性、自主性、关联性和多样性等特性。复杂性科学所倡导的世界观、认识论和方法论都与大数据技术所倡导“更多、更杂、更好”思维理念相契合。大数据技术所倡导的“更多”,就是倡导数据量的全面。在小数据时代,由于数据收集、存储和处理技术能力的限制,采取的是以抽样数据研究局部,进而由局部推导整体的研究模式。而在大数据时代,随着数字技术、智能技术等的发展,计算机和数据处理工具可以处理海量的数据,因而追求以全体数据取代随机样本,在关注于细节中的价值的基础上,实现了对研究对象整体的刻画,这与复杂性科学强调关注整体性的思维相契合。大数据技术所倡导的“更杂”,就是倡导数据样本的多样性。在小数据时代,强调数据的精确性和对数据的标准化与格式化处理。而在大数据时代,追求分析与处理所有相关数据并挖掘多样数据的整体价值,追求的是“数据的混杂性”,这与复杂性科学强调关注多样性的思维相契合。大数据技术所倡导的“更好”,实质上就是不考虑因果关系,追求数据间的相关性。小数据时代追求的是探索事物间的因果细节,即强调确定性和“为什么”。大数据时代则侧重于从宏观视角探索引起事物发展变化的数据之间的关联关系,强调的是“是什么”和相关性,这与复杂性科学强调事物发展的关联性和非线性理念相契合。[14]
复杂性科学更多的侧重于在哲学和科学等思想、思维和认识层次方面的改变,大数据技术继承了复杂性科学的思维,并将其物质化、技术化和工程化。且由于数据密集型科学范式所倡导的数据驱动决策发展方式是建立在大数据基础之上,数据驱动决策的科学基础也就承接了大数据技术的理论基础,即复杂性科学理论。
2.2 向信息化技术寻求技术支持
以数字化、网络化、智能化为特征的信息技术革命正蓬勃兴起,推动人类认识世界、改造世界的能力空前提升。人类理性的演进逻辑是沿着数据——信息——知识——智慧这一进路不断前进,数字化与智能化直接对应于数据与智慧。数据间的网络化即是信息、信息间的网络化即是知识、知识间的网络化即是智慧。体育信息化的发展也必然沿着从数字化、网络化、智能化这一发展路径前进,其中,数字化为基石,网络化为载体、智能化为灵魂。[15]而运动训练发展数据驱动决策的目的即是将相关数据信息化,并通过网络化实现知识化与智慧化,进而促进运动训练的发展。因而,信息化的相关数字技术、网络技术和智能技术就构成了竞技体育数据驱动决策发展方式的技术基础。
体育的数字化发展是以数字技术为代表的创新成果与体育的广泛结合,其主要推动技术是计算机技术,主要特征是数字技术在指挥、传感、通信、定位等要素中的广泛应用。数字技术是一项与电子计算机相伴相生的科学技术,它是指借助一定的设备将各种信息转化为电子计算机能识别的二进制数字“0”和“1”后进行运算、加工、存储、传送、传播、还原的技术。[16]目前,体育领域中的数字技术促使以“数字虚拟技术”“三维人体运动仿真系统”“我的信息系统”等新技术不断出现,促进了以电子图像表征再现人体机能形态微观世界和身体运动智力特征的实现,使得电子计算机取代机械仪器成为人们参与体育、研究体育的新工具,体育的数字化技术也促进了体育行为和运动过程从单一的肢体层面向以脑完成运动信息加工、支配肢体进行技术练习的运动技术形成过程的转变。体育的网络化发展主要推动技术是网络技术,其主要特征是数字技术与网络技术的有机融合,利用网络将跨越时空的信息进行整合聚集成一体化的训练与指挥系统,实现了线上与线下资源的整体联动,把发展形态推向网络化。体育的智能化发展主要推动技术是智能技术,其主要特征是人机融合、机器学习,是系统基于数据、信息和知识,形成类似于人脑的思维能力。在信息和知识层面,数据都是为决策提供支持作用,而到了人工智能阶段,则是系统模仿人类应用信息和知识进行自主决策。目前,在运动训练领域中通过应用先进的智能传感设备、测量技术,以“分布和离散模式”的网状多维空间信息交互为基础,实现了不同系统间信息的同时传递与交互。[17]
数字技术、网络技术和智能技术推动了运动训练的数字化、网络化和智能化发展,促进运动训练的发展方式实现了从数据到信息的转化并为运动训练发展提供决策支持,并逐步实现了通过网络化将体育信息转化为知识以指导决策,最终将实现从知识到智慧的驱动决策的现代运动训练发展方式。
3 运动训练数据驱动决策发展方式的实现策略
3.1 以问题为导向,为数据赋予特定的背景
数据驱动决策的核心是以数据为中心,而数据的基本解释是科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值,可引证解释为进行各种统计、计算、科学研究或技术设计等所依据的数值。[18]数据是对客观世界的记录,是信息的原材料,为数据赋予特定背景才能成为信息。只有将信息与经验及已有知识相融合才能够从信息中提取出规律,进而上升为知识。在当前大数据语境下,数据和信息经常被替代使用,而大数据方法和技术的发展使得数据的总量不断增加,数据的概念在特定情况下会被引申为“大数据”的概念,使得数据的范畴在一定语境下要大于信息的范畴。[19]数据量的指数式增加,带来了数据分散、格式众多、数据混杂等问题。在运动训练过程中,存在着大量的图像与视频数据。如在NBA比赛中可以实时记录球、球员和裁判的三维定位数据,一场比赛会产生至少70多万个数据点,一场羽毛球比赛需要统计的技术数据指标也多达几十项。通过对一名羽毛球选手纵贯性的历史数据进行分析,既可以判定该选手技术特点的历史性变化,也可以提取出该选手比赛制胜的关键性技术指标,还可用以建立该选手的胜负预测模型或者是制定该选手的未来比赛策略。相较于该选手比赛制胜的关键性技术指标,其它统计所得数据不但不能对教练员训练提供针对性帮助,如果不加方法学上的处理,还可能影响到教练员的决策。因而,面对庞杂的数据,数据使用者必须以问题为导向,为数据赋予特定的背景,消除无意义的噪声数据的影响。
3.2 洞察隐匿性和低质性数据,提取反映对象状态的真实信息
运动训练活动是一种特殊的人类社会实践活动,参与训练实践活动的主客体关系复杂与影响因素众多,整个实践过程呈现复合结构的特性,并没有标准化的操作流程和模式。同时,数据的隐匿性要求数据使用者在提取数据特征的基础上,需要充分关注数据特征背后的物理意义以及特征之间关联性的逻辑机理。运动训练的数据采集多数还需要依赖于人工判别,而不同的数据采集人员判别的标准可能存在差异,造成了数据的质量无法得到保证,进而可能导致数据的低可用率,最终影响到数据的分析结果。但是,运动训练实践过程对数据预测和分析的结果具有低容错率的特点,不能允许在训练过程中反复试错。如教练员需要科技服务人员通过对训练数据的收集与分析监控训练效果,需要通过数据分析检验训练质量进而做出针对性调整,也需要通过数据分析获得竞技对手的技战术特点进而进行针对性训练,这就要求数据采集与分析人员洞察隐匿性和低质性数据,从数据中提取出反映对象真实的状态信息。
3.3 关注数据间的关联性,满足运动训练过程对数据的时限性要求
需关注数据采集者由于主观判断或处理方法不当所带来的片面性与数据的欺骗性。如果数据的采集者在数据分析过程中不能洞察关联数据之间的关系,或者不能结合数据源的实际情况使用数据就很可能被数据所欺骗。如在乒乓球比赛中,单一的发球抢攻的高成功率并不能说明选手发球抢攻技术的有效性。既可能是放弃了技术使用对对手的威胁性,也可能是因受对手限制而使用率低下。同理,选手主动性失误的增加也不能表达出技术的使用效果,既可能是选手球风积极的原因,也可能是受对手高回球质量的限制而追求技术使用质量导致的结果。此外,运动训练的施训对象具有精神和肉体的双重属性,心理现象与生命现象无法被简单还原。其在不断发展过程中受生物、物理和化学等多种因素的影响,在开放自身、与外界进行能量与信息等交换过程中可以不断地进行自我调节与适应。而且,生命始终是处于由微观、中观和宏观等多层级系统组成的非平衡有序动态变化过程之中。[20][21]因而,在运动训练过程中,各种数据与信息的反馈必须满足对时间的敏感性的要求,数据采集、传输与处理效率的低下都会影响到数据的及时性。
3.4 根据数据量级的差异,灵活转换大数据思维和小数据思维
大数据所倡导的数据量更多、样本来源更杂及追求“是什么”的相关关系的理念与复杂性科学所倡导的关注整体性、多样性及事物发展的关联性与非线性理念相契合。数据驱动决策的研究应以复杂性科学为理论基础,强调因系统间的非线性与关联性所产生的系统结构和功能的涌现性。而所谓两个东西相关联,就是他们同时性地出现在不同空间,或异时性地出现在同一空间,这种时空同一性决定了必然有某种隐蔽的原因使它们相伴而行,相关性是其果,因果性是其因。即小数据思维解决的是简单的线性因果关系问题,大数据思维解决的是辩证的因果关系问题。运动训练过程既是促使受训对象竞技能力从初始状态向目标状态转移的过程,又是培养人的过程,既需要知其然,更要知其所以然。以数据为中心研究运动训练过程的复杂系统,既需要研究系统间复杂的相关关系,又需要研究运动训练各子系统关系间复杂性的生成机制,即研究复杂网络局部结构涌现现象形成的内在机理。而采取何种思维方式进行研究决定了研究者对研究范式的选择,这对数据使用者的思维判断能力提出了挑战。同时,因小数据的理论和方法无法反映规模巨大、异质性显著、动态变化的系统特性,面对混杂的大数据也无法将其转化为有用的信息,并且数据量级的大小并没有严格的判定标准。[22]因而,就需要根据数据量的大小灵活转换大数据思维和小数据思维,选择适宜的数据处理方法,并决定是追求因果关系还是相关关系。
4 结语
美国在2012年推出的“大数据研究和发展计划”中提出包括应对大数据环境的基本策略是不断提高“从数据到决策的能力”,实现由数据优势向决策优势的转化。在2016年推出的《联邦大数据研究与开发战略计划》中的主要内容包括支持研发大数据技术和工具,以更好地探索和理解数据和知识的可信度,实现更佳决策,促进突破性发现并采取有信心的行动,在数据驱动型决策中提高透明度。[23][24]从传统的“目标驱动决策”向“数据驱动决策”的重大转型是美国国家战略应对大数据环境的最直接变化之一。虽然当前大数据技术在数据挖掘、智能处理、辅助决策和数据分析与理解的底层支撑技术仍处于发展过程中,数据驱动决策发展方式也面临着诸多挑战,但数据驱动决策的实践范式向“数据+模型+分析”的发展趋势已不可避免。[25]在大数据技术的基础上,应用数据驱动决策将逐步成为各领域新的发展方式。如何使我国运动训练的发展迅速适应大数据技术环境,并有效地抓住大数据环境产生的发展机遇,在世界范围内的竞争中取得领先优势是运动训练参与者的重要课题。而进一步在大数据技术基础上丰富数据驱动决策的理论与方法,找到大数据时代运动训练数据驱动决策发展方式的实现路径是下一步研究需要解决的重要问题之一。