基于数据挖掘的乒乓球技战术多因素组合分析
2015-03-30胡斐
胡 斐
(上海体育学院 经济管理学院,上海 200438)
随着计算机与信息技术的飞速发展,现代科技对优秀乒乓球运动员训练与比赛的影响也日趋明显。人们开始通过各种技术手段,将大量的乒乓球比赛数据化,存放于数据库之中,并尝试运用数据挖掘方法,特别是关联规则对乒乓球技战术进行挖掘分析和深层次开发与利用,以期进一步提高乒乓球项目的训练与比赛水平[1]。
本文拟在经典关联分析的基础上,尝试对乒乓球技战术进行多因素组合数据挖掘,为教练员的科学决策和指导提供支持。
1 研究方法
1.1 经典关联规则挖掘技术
定义1 支持度(support)。设F中有s%的事务包含项目集A∪B,即同时支持项目集A和B,则s%称为关联规则A⇒B的支持度,记为:
定义2 可信度(confidence)。设F中支持项目集A的事务中,有c%的事务同时也支持项目集B,则c%称为关联规则A⇒B的可信度,记为:
在本文的研究中,关联规则就是各种技战术组合规则,支持度是某个关联规则(即某个技战术组合规则)的发生频率,可信度是某个技战术组合出现的情况下,运动员获胜得分的概率。只有满足最小支持度min-sup(发生频率)和最小可信度min-conf(获胜概率)的关联规则(技战术组合规则)才会引起教练员和运动员的兴趣,并在训练、比赛中加以应用。
1.2 技战术观察指标体系
为了能够进行乒乓球技战术多因素组合分析,根据乒乓球比赛的特点,在咨询专家意见的基础上,确立了下列技战术观察指标,包括击球技术(发球、弧圈、快攻、扣杀、挑打、劈长、摆短、挡球、削球、吊球、放高球)、击球落点(正手短球、正手半长球、正手长球、中路短球、中路半长球、中路长球、反手短球、反手半长球、反手长球)以及击球位置(正手位、反手位、侧身位、反侧身位)。
1.3 乒乓球技战术多因素组合数据挖掘方法
文献[5]采用比赛数学模拟竞技诊断理论,即用比赛状态(技术或战术等)的转移概率矩阵概括地描述一场比赛,并在此基础上运用马尔可夫链计算比赛的获胜概率,进行乒乓球比赛分析。还有研究人员着重对乒乓球比赛中应用的技战术包括击球落点、击球技术、击球位置等进行挖掘分析,但基本上是对其中某一单因素进行分析,如前3拍击球落点与得失分之间的关系,或者是前3拍击球技术与得失分之间的关系等[6-7],这会导致教练员在实际应用规则时,还需要将不同技战术因素的挖掘结果进行人工综合分析与判断,因此具有一定的局限性。
本文给出了另外一种思路,即在经典关联规则算法的基础上,采用顺次序和逆次序2种数据挖掘的模式,将多种技战术因素进行组合分析,以便能够给教练员、运动员提供更加明确和直观的信息,因而对训练和比赛指导具有更强的针对性和实用性。
1.3.1 多因素组合数据挖掘模式
根据运动员的打法特点,乒乓球比赛可分为3大类:①2名进攻型选手之间的比赛;②1名进攻型选手与1名削球型选手之间的比赛;③2名削球型选手之间的比赛。根据相关研究表明,2名进攻型选手之间比赛时,前4拍结束的回合约占50%。故本文将2名进攻型选手的比赛分为发球轮和接发球进行关联分析,分别讨论前1~3拍或前2~4拍的击球技术、击球位置、击球落点与得失分之间存在的关联特征,即为顺次序挖掘模式,如图1所示。
当1名进攻型选手与1名削球型选手或2名削球型选手比赛时,1个回合的击球拍数将明显增多,而且发球与接发球的作用也会明显降低,因此采用倒数3拍的击球技术、击球位置、击球落点与得失分之间关联特征的分析方法,即逆次序挖掘模式,如图2所示。
图1 顺次序数据挖掘分析模型
图2 逆次序数据挖掘分析模型
1.3.2 多因素组合数据挖掘算法
设T={t1,t2,…,tw}、Q={q1,q2,…,qu}、S={s1,s2,…,sk}分别为所有击球技术、击球落点、击球位置的集合,R={得分,失分}为得失分结果集合,而V={(t1,q1,s1),(t1,q1,s2),(t1,q1,s3),…,(tw,qu,sk)}为所有击球技术、击球落点、击球位置三要素组合的集合,且V∩R=∅。
设C={C1,C2,…,Cn}为比赛中所有回合的集合,每一回合Ci都具有唯一表示TIDi,且Ci共包括m拍,Ci=(TIDi,(ti1,qi1,si1),(ti2,qi2,si2),…,(tim,qim,sim),ri),其中(tik,qik,sik)为第i回合第k拍的技战术组合,包括击球技术tik、击球落点qik和击球位置sik,ri为得失分结果。
连续3拍技战术组合关联规则的形式如下:〈a,b,c〉⇒y,其中a∈V,b∈V,c∈V且y∈R。
定义3 某技战术组合f∈V在第k拍的支持度计数(support count)定义为:
定义4 技战术组合序列〈a,b,c〉,其中a∈V,b∈V,c∈V在第1拍、第2拍、第3拍的支持度计数(support count)定义为:
定义5 顺次序技战术组合规则项(〈a,b,c〉,y),其中a∈V,b∈V,c∈V且y∈R的支持度计数(support count)定义为:
算法1 顺次序多因素组合数据挖掘算法。
输入:C(总回合数为n),min_sup,min_conf。
输出:所有满足min_sup和min_conf的前3拍技战术组合关联规则。
(1)找出第1拍中的频繁技战术组合集合L1,即
(2)找出第2拍中的频繁技战术组合集合L2,即
(3)找出第3拍中的频繁技战术组合集合L3,即
(4)找出第1拍、第2拍、第3拍中的频繁技战术组合集合M1,即
(5)找出所有的频繁前3拍技战术组合规则项D,即
(6)对∀(〈a,b,c〉,y)∈D,若
则构成满足min_sup和min_conf的关联规则〈a,b,c〉⇒y。
逆次序多因素组合分析算法与算法1类似,可找出所有满足min-sup和min-conf的倒数3拍技战术组合关联规则,出于篇幅考虑在此不详细阐述。
2 多因素数据挖掘实例分析
笔者采集了2007—2010年期间男运动员王皓、吴尚垠、王励勤等16人相互对决的单打比赛及女运动员李佳薇、张怡宁、冯天薇等12人相互对决的单打比赛,总计上百场比赛,分别采用顺次序和逆次序多因素组合分析算法进行挖掘分析,得到了很多有价值的得失分技战术组合,并成功应用于现场比赛的指导中,取得了良好的效果。以下重点讨论新加坡女选手冯天薇、韩国男子选手朱世赫的技战术特征分析结果。
2.1 新加坡女选手冯天薇技战术特征分析
新加坡运动员冯天薇为右手横握球拍、两面反胶进攻型打法,曾获2010年世界锦标赛女子团体冠军,最高世界排名第2位,是中国女队最主要的对手。选取其2010年与中国运动员刘某某的一场比赛,采用顺次序多因素组合挖掘模式进行分析。
冯天薇和刘某某比赛技战术多因素数据挖掘的结果见表1所列。
表1 冯天薇和刘某某比赛技战术多因素数据挖掘结果
以技战术组合规则1为例,该规则的发生频率为9.52%,当刘发球,然后冯中路反手挑打或正手劈长或反手弧圈或反手劈长,最后刘反手弧圈这组前3拍技战术组合出现时,冯的获胜概率为80%。从表1可以看出最主要的技战术模式为:① 刘某某发球至对方中路短球⇒冯天薇挑打、拉或劈长至对方反手⇒刘某某反手弧圈⇒冯天薇得分;② 冯天薇发球中路短球⇒刘某某挑打或劈长至对方反手⇒冯天薇反手弧圈⇒冯天薇得分;③ 冯天薇发球反手短球或半长球⇒刘某某弧圈、挑打或劈长至对方反手⇒冯天薇反手或侧身弧圈⇒刘某某得分。
2.2 韩国男子选手朱世赫技战术特征分析
韩国朱世赫是世界上最优秀的削球运动员,2003年曾获得世界锦标赛亚军,最高排名第8位。选取2010年削球运动员朱世赫与中国运动员张某某的比赛,采用逆次序多因素组合挖掘模式进行分析。
朱世赫和张某某比赛技战术多因素数据挖掘的结果见表2所列。
表2 朱世赫和张某某比赛技战术多因素数据挖掘结果
由表2可以看出,最主要的技战术模式为:①张某某正手或侧身弧圈至对方中路⇒朱世赫中路正手或反手削球至对方中路⇒张某某中路弧圈失分⇒朱世赫得分;② 朱世赫反手削球至对方中路⇒张某某正手弧圈至对方反手⇒朱世赫反手削球或侧身弧圈失分⇒张某某得分;③ 朱世赫中路反手削球至对方中路⇒张某某中路正手弧圈至对方反手⇒朱世赫反手削球失分⇒张某某得分。
3 结束语
关联规则挖掘适合于对乒乓球比赛数据的进一步开发与利用,能够在更深层次上揭示乒乓球运动员比赛的技战术特征,尤其是将击球技术、击球位置和击球落点进行组合,并根据不同比赛类型(2名进攻型选手之间比赛,1名进攻型选手和1名削球型选手比赛或2名削球型选手之间的比赛),分别采用顺次序与逆次序多因素组合分析,能够给予教练员和运动员更加明确的指导,即可以通过比赛数据的挖掘,找出对运动员或对手比赛获胜影响最主要的技战术组合,并有针对性地在训练与比赛中应用,以提高乒乓球运动的科学化训练水平。本文方法已在实际比赛的技战术决策中得到了成功应用。
[1]高洪歌.数据挖掘技术在乒乓球比赛技战术分析中的应用研究[D].北京:北方工业大学,2006.
[2]史忠植.知识发现[M].北京:清华大学出版社,2002:57-61.
[3]Berry M J A,Lonoff G S.数据挖掘:客户关系管理的科学与艺术[M].袁卫,译.北京:中国财政经济出版社,2004:283-309.
[4]Hand D,Mannila H,Smyth P.数据挖掘原理[M].张银奎,廖丽,宋俊,等,译.北京:机械工业出版社,2003:271-284.
[5]张辉,安德烈亚斯.乒乓球比赛的数学模拟竞技诊断[J].上海体育学院学报,2004,28(2):68-72.
[6]虞丽娟,张辉,凌培亮.隔网对抗项目技战术分析的系统研究[J].体育科学,2008,28(10):41-48.
[7]赵养清,虞丽娟,张辉.序列模式挖掘在乒乓球比赛技战术分析中的应用[J].上海体育学院学报,2008,32(2):83-85.