基于核主成分分析的教练评价模型
2014-11-19毕楷明
毕楷明
摘 要:美国大学生体育联盟中有许多知名教练,选取恰当的标准去全面的评价一个教练是很重要的。文章基于主成分分析法和核主成分分析法建立了一个可以评价多种因素的教练评分方式,利用该评分方式能够对教练评价得出更精确的结论。
关键词:主成分分析法 核主成分分析法 教练评分
中图分类号:G647 文献标识码:A 文章编号:1674-098X(2014)09(b)-0253-02
1 基础模型
1.1 基于主成分分析的评价模型
为了能够更加精确地衡量一个教练的执教经历、影响力和战绩,需要建立一套科学有效的评价模型和评价方式。笔者首先通过搜集一名教练所获得的冠军数,参加四强赛的场次数,四强赛的胜率,总胜率,教龄搜索到的谷歌词条数以及总胜场数等项目作为教练评价模型的评价因素[1]。
在建立评价因素的基础上,笔者利用主成分分析的方法来实现评价因素的排序:对每个因素ci按照它们彼此间相关性进行分析,相关性越大说明该因素对于教练评价的影响越大,进而确定系数ai。其中,数据中的因素看作ci。
首先对c1,c2…ci…c7进行标准正交化:
其中
将转化为
,且xi的平均值为0。
再构建有关的协方差矩阵X
X==
=
利用matlab软件求出X矩阵的特征值λ以及对应的特征向量ε,对每一个特征值λ进行升序排列,并将每一个特征向量ε与之对应。考虑贡献率Cr和累计贡献率Cra:
通常取p,使累积贡献率Cra达到85%以上,此时的模型是可靠的[2],针对于所列数据的情况可知当p取3时累积贡献率Cra超过85%。于是主成分为总胜率,四强比赛场数以及胜场数,得出每个教练利用主成分分析的排名。
1.2 核主成分分析评价模型
再考虑过主成分分析方法后,进一步引入其衍生方法核主成分分析。将利用标准正交化转化为
引入高斯核函数k
δ值由经验可知取值为2[3],同样将每一个因素向量的数据带入计算相关性,可得出高斯核函数矩阵K
K=
再利用matlab软件求出K矩阵的特征值λ以及对应的特征向量ε,考虑K矩阵的贡献率Cr和累计贡献率Cra,同样取Cra在85%以上的情况,得出基于核主成分分析的教练排名。
主成分分析是一种很好的降维方法,但本质上是利用不同因素之间的线性映射解决问题,如不同因素之间有某种非线性关系时,便不易解释它们其中的关系。
根据模式识别的理论,低维空间中线性不可分的模式通过非线性映射到高维空间可实现线性可分,主成分分析法会在非线性函数的形式和参数中出现问题,而最大的障碍则是高维特征空间运算时存在的“维数灾难”[4],利用核主成分分析技术则能尽可能的避免此类问题。
2 综合评价模型
2.1 不同年代对模型的影响
对于同一联赛,不同的赛季对于教练员来说会有不同的难度,教练在一个竞争激烈的赛季取得成功的难度必然大于在一个强弱差距悬殊的赛季。为量化不同年份的竞争性,搜集不同赛季的联赛平均技术统计,通过核主成分分析方法,得出综合考虑所有因素在上述不同年份竞争力因子,在基础模型的基础上,将时间作为重要的参评依据加入核主成分分析模型中。
可知ky在1989年时取得最大值,观察数据可知1989年各球队的平均得分、平均命中数都属于历史最高值,说明这一年的比赛竞争激烈,也说明该年教练竞争力强,说明ky与教练的评分呈正相关。为了便于数据处理,需要将ky归为正数。为此,考虑直线映射,将ky的范围归0~1的闭区间内。即将minky通过线性变换取到1;minky通过线性变换取到0,此时经过改进后的年份竞争力因子ky,但由于扩大了ky的取值范围,增大了了不同ky取值之间的差异度,造成了一种不公平的现象。为解决该问题,引入偏大型柯西隶属分布函数[5]
根据定义可得:
利用matlab软件代入求解可以得出解:
又由于ky系数需要作为系数乘在前一个模型中的Skp上
再将年份系数考虑到核主成分分析模型中,由于一个教练不止执教一个赛季,这里考虑的年份系数应对该教练所执教的年份加权取平均值
此种平均值综合考虑了年份系数的权重影响,减小了极端的年份对数据的影响,更能体现一个教练的真实水平。
2.2 不同性别对模型的影响
按照基础模型所述的过程,将女子运动教练员的数据进行核主成分分析处理,再调用女子项目的不同赛季的联赛平均技术统计计算出女子项目每一年的竞争力因子ky,进而计算每个教练的所有执教赛季的加权平均值,得出改进后的教练评分Skp。
考虑到同项目男子项目和女子项目的水平是不同的,间接导致了男子教练和女子教练的执教难度不同,于是引入不同性别的竞争力因子ks。
借助ky指数考虑所有分男女的主要球类项目,将其中的所有性别的项目的再取均值得到ks。
ks(m)=
≈1.4976
同理可得1.4152,将所得的ks(m)、ks(w)分别与对应性别的Skp求积,得到考虑性别的Skp。
2.3 不同体育项目对模型的影响
由于不同项目的各项 技术统计是不同的,通过核主成分分析方法,得出综合考虑所有因素上述不同年份竞争力因子ky通过BP神经网络的方法,遍历各项目历年的ky,进而归纳出每个项目的总体ky趋势,分析该趋势得出不同项目的竞争力因子k8。
通过BP神经网络自身的提取数据能力,利用Matlab得到并储存其趋势
再将从低到高排序,并计算各年度平均竞争力因子的=0.0528,将其带入进行对比,得出其所在的位置占总体的百分比定义为该项目的竞争系数。endprint
3 模型的改进
通过综合评价模型,能够综合考虑不同年代、性别和运动项目对评价教练的影响,但仅能得到一个改进的Skp值,它只能用于排名,却不能进一步地分析出每名教练的特性。为了分析每名教练的特性,需要搜集每名教练每年的数据,通过分析找出传奇教练们的共性与特性。
绘出Skp图像后,利用拟合的方法,用不同类型的拟合度分别代表职业生涯晚期的教练表现指数;职业生涯中期的教练表现指数;职业生涯早期的教练表现指数;教练表现的波动指数。
先分析每个教练的职业生涯晚期的教练表现指数,当Skp随年份增加而有较强的递增趋势时,称该教练的职业生涯晚期的教练表现指数较高,以Pat Summitt教练为例。
其中对一次函数斜率a进行t统计量分析。
由于t分布趋近于正态分布,因此取显著性水平为0.05,近似地有
而=0.999>0.95,符合判定要求。再进行Jarque-Bera检验。
由=41.18%≥5%,也符合判定要求,即通过了Jarque-Bera检验。从而得出Pat Summitt的Skp是整体递增的,说明改教练在生涯晚期的战绩比生涯早期的战绩好。
同理将教练的Skp曲线分别与,,进行拟合,用拟合度P对应出其它波动指数。
4 结语
基于核主成分分析模型建立了综合评价模型,该模型同时考虑了不同年代和不同性别项目对模型的影响。再利用直线映射和柯西隶属函数,得到了不同年份的竞争力曲线;进而利用均值方法,得到男女项运动的竞争力指数,再根据BP神经网络求出不同项目的竞争力指数,再将不同的竞争力指数带入核主成分分析模型,得出改进后的综合评价模型。分析综合评价模型筛选后的每一名优秀教练,利用Matlab拟合和参差项检验,通过图像匹配得到每一名教练的战绩平稳性指数、战绩提升指数和教练类型。Matlab实验分析数据表明,基于核主成分的教练评价模型能够得到更加精确的传奇教练评价。
参考文献
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint
3 模型的改进
通过综合评价模型,能够综合考虑不同年代、性别和运动项目对评价教练的影响,但仅能得到一个改进的Skp值,它只能用于排名,却不能进一步地分析出每名教练的特性。为了分析每名教练的特性,需要搜集每名教练每年的数据,通过分析找出传奇教练们的共性与特性。
绘出Skp图像后,利用拟合的方法,用不同类型的拟合度分别代表职业生涯晚期的教练表现指数;职业生涯中期的教练表现指数;职业生涯早期的教练表现指数;教练表现的波动指数。
先分析每个教练的职业生涯晚期的教练表现指数,当Skp随年份增加而有较强的递增趋势时,称该教练的职业生涯晚期的教练表现指数较高,以Pat Summitt教练为例。
其中对一次函数斜率a进行t统计量分析。
由于t分布趋近于正态分布,因此取显著性水平为0.05,近似地有
而=0.999>0.95,符合判定要求。再进行Jarque-Bera检验。
由=41.18%≥5%,也符合判定要求,即通过了Jarque-Bera检验。从而得出Pat Summitt的Skp是整体递增的,说明改教练在生涯晚期的战绩比生涯早期的战绩好。
同理将教练的Skp曲线分别与,,进行拟合,用拟合度P对应出其它波动指数。
4 结语
基于核主成分分析模型建立了综合评价模型,该模型同时考虑了不同年代和不同性别项目对模型的影响。再利用直线映射和柯西隶属函数,得到了不同年份的竞争力曲线;进而利用均值方法,得到男女项运动的竞争力指数,再根据BP神经网络求出不同项目的竞争力指数,再将不同的竞争力指数带入核主成分分析模型,得出改进后的综合评价模型。分析综合评价模型筛选后的每一名优秀教练,利用Matlab拟合和参差项检验,通过图像匹配得到每一名教练的战绩平稳性指数、战绩提升指数和教练类型。Matlab实验分析数据表明,基于核主成分的教练评价模型能够得到更加精确的传奇教练评价。
参考文献
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint
3 模型的改进
通过综合评价模型,能够综合考虑不同年代、性别和运动项目对评价教练的影响,但仅能得到一个改进的Skp值,它只能用于排名,却不能进一步地分析出每名教练的特性。为了分析每名教练的特性,需要搜集每名教练每年的数据,通过分析找出传奇教练们的共性与特性。
绘出Skp图像后,利用拟合的方法,用不同类型的拟合度分别代表职业生涯晚期的教练表现指数;职业生涯中期的教练表现指数;职业生涯早期的教练表现指数;教练表现的波动指数。
先分析每个教练的职业生涯晚期的教练表现指数,当Skp随年份增加而有较强的递增趋势时,称该教练的职业生涯晚期的教练表现指数较高,以Pat Summitt教练为例。
其中对一次函数斜率a进行t统计量分析。
由于t分布趋近于正态分布,因此取显著性水平为0.05,近似地有
而=0.999>0.95,符合判定要求。再进行Jarque-Bera检验。
由=41.18%≥5%,也符合判定要求,即通过了Jarque-Bera检验。从而得出Pat Summitt的Skp是整体递增的,说明改教练在生涯晚期的战绩比生涯早期的战绩好。
同理将教练的Skp曲线分别与,,进行拟合,用拟合度P对应出其它波动指数。
4 结语
基于核主成分分析模型建立了综合评价模型,该模型同时考虑了不同年代和不同性别项目对模型的影响。再利用直线映射和柯西隶属函数,得到了不同年份的竞争力曲线;进而利用均值方法,得到男女项运动的竞争力指数,再根据BP神经网络求出不同项目的竞争力指数,再将不同的竞争力指数带入核主成分分析模型,得出改进后的综合评价模型。分析综合评价模型筛选后的每一名优秀教练,利用Matlab拟合和参差项检验,通过图像匹配得到每一名教练的战绩平稳性指数、战绩提升指数和教练类型。Matlab实验分析数据表明,基于核主成分的教练评价模型能够得到更加精确的传奇教练评价。
参考文献
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint