影响因素选择和加权的运动成绩预测模型
2021-06-24朱坚
朱坚
(南京航空航天大学 体育部, 江苏 南京 210016)
0 引言
随着我国经济水平的不断提高,人们越来越清楚身体健康的重要性,体育锻炼成为了人们一种保持身体健康的重要手段。在大学中,与运动相关的体育课成为了学生选择的热门课,运动成绩预测可以帮助老师、教练了解运动员的成绩变化态势,更好的制定相应的训练模式,因此运动成绩预测一直是体育研究领域的一个重要方向[1-3]。
针对运动成绩预测问题,国内外的学者和研究人员进行了有效的探索和研究,尤其是一些发达国家,对运动成绩预测的研究相当成熟,出现许多好的运动成绩预测模型,而国内对运动成绩预测相对较晚,但是发展态势很好,也存在一些好的运动成绩预测模型[4-5]。可以将运动成绩预测的研究划分为两个阶段,第一个阶段称之为传统阶段,该阶段主要模型有:多元线性回归法的运动成绩预测模型和指数平滑法的运动成绩预测模型,它们考虑运动成绩的相关因素比较少,对运动成绩预测问题进行了相应的简化,因此运动成绩预测建模效率快,但是由于简化了运动成绩预测问题,使得运动成绩预测结果与实际运动成绩预测的偏差比较大,导致运动成绩预测精度低,实际意义不大[6-7];第二阶段为现代建模建阶段,该阶段模型主要有:灰色理论的运动成绩预测模型和人工神经网络的运动成绩预测模型,它们可以更好地实现运动成绩预测建模,运动成绩预测结果得到了有效的改善[8-9],但是它们同样存在一些不足,如运动成绩预测结果不稳定,运动成绩预测误差大[10]。
为了减少运动成绩的预测误差,准确刻画运动成绩预测变化特点,提出了基于影响因素选择和加权的运动成绩预测模型,该模型采用灰色关联分析法选择运动成绩影响因素,并确定每一个影响因素的权值,然后采用支持向量机对运动成绩历史数据进行建模与挖掘,最后在相同条件下与其它运动成绩预测模型进行了对照实验,实验结果验证了本文运动成绩预测模型的优越性。
1 影响因素选择和加权的运动成绩预测模型
1.1 运动成绩的影响因素分析
在进行运动成绩建模与预测时,首先要分析和确定影响运动成绩预测结果的一些影响因素,影响运动成绩预测结果的因素有很多,有主观因素,有客观因素。以100米跑为例,本文根据相关文献确定运动成绩预测模型的影响因素,如表1所示。
表1 运动成绩预测结果的影响因素
1.2 运动成绩的影响因素选择和加权
灰色关联分析是一种多因素分析方法,可以比较直观地描述每一个因素对问题求解的影响程度。根据表1中的运动成绩预测结果的影响因素与运动成绩预测之间的灰色关联度,能够灰色关联分析筛选与运动成绩变化特点最相关的影响因素,从而提高运动成绩预测效果,运动成绩预测结果影响因素的选择步骤如下。
Step1:把运动成绩作为参考数列y(k),运动成绩影响因素作为比较序列xi(k)。
step2:从表1可以看出,运动成绩影响因素值的差异比较大,所以对它们进行无量纲化处理,如式(1)。
(1)
Step3:计算运动成绩与运动成绩影响因素之间的对应关联系数,如式(2)。
ξi(k)=
(2)
式中,ρ为分辨系数。
Step4:计算关联度,其值大小描述影响因素对运动成绩预测结果的影响程度,值越大那么表示影响就越大,不然就越小,如式(3)。
(3)
采用Matlab 2018工具箱编程实现灰色关联度分析,每一种影响因素与运动成绩的关联度如表2所示。
表2 每一种影响因素与运动成绩的关联度
根据表2的关联度对影响因素进行排序,选择联度较大的5个影响因素(关联度大于0.3)作为运动成绩预测建模的输入向量,同时将关联度作为对运动成绩影响因素的值。
1.3 运动成绩预测建模的算法
针对人工神经网络,灰色理论存在的弊端,本文选择支持向量机进行运动成绩的建模与预测。设运动成绩的训练样本集合为{xi,zi},i=1,2,…,n,xi为运动成绩影响因素的值;zi为运动成绩的期望值;φ(x)为x到高维特征空间φ(x)映射,那么可以建立线性回归函数,如式(4)。
f*(x)=ω·φ(x)+b
(4)
式中,ω·φ(x)为内积。
因为ω和b均为未知,引入松弛变量ξ,ξ*≥0对它们进行求解,这样可以得到优化问题[11],如式(5)。
s.t.
(5)
式中,C为惩罚系数,描述泛化能力和拟合精度的平衡;ε为回归误差要求。
为了对式(5)进行求解,引入拉格朗日算子α,α*建立拉格朗日函数,如式(6)。
(6)
(7)
式(7)约束条件为式(8)。
(8)
这样得到运动成绩的回归函数,如式(9)。
(9)
式中,核函数K(x,xi)为式(10)。
(10)
1.4 影响因素选择和加权的运动成绩预测模型的工作原理
影响因素选择和加权的运动成绩预测模型的工作原理为:首先分析运动成绩预测模型的研究现状,得到影响运动成绩预测结果的影响因素,然后采用灰色关联分析法对运动成绩预测的影响因素进行选择,并对影响因子的权值进行确定,再与相对应的运动成绩构成训练样本集合,最后采用支持向量机对运动成绩的训练样本集合进行学习,建立运动成绩预测模型,如图1所示。
图1 影响因素选择和加权的运动成绩预测模型的工作原理
2 运动成绩的实例分析
2.1 实验数据
为了分析本文影响因素选择和加权的运动成绩预测模型的性能,采用Matlab 2018作为实验平台,选择不同高校学生的100米跑成绩作为实验数据,共得到了10个高校的历史数据,数据分布如表3所示。
表3 运动成绩预测的数据分布
由于篇幅有限,就没有列出相应的影响因素值。在相同条件下,选择人工神经网络中的BP神经网络,以及支持向量(没有进行影响因素选择和加权)进行运动成绩预测的对照实验,采用运动成绩预测精度和建模效率对运动成绩预测模型的性能进行分析。
2.2 运动成绩预测的预测精度分析
3种模型的运动成绩预测精度变化曲线如图2所示。
图2 不同模型的运动成绩预测精度对比
图中可以看出,本文模型的运动成绩预测精度始终高于两种对比模型,有效地减少了运动成绩预测误差,获得了更加理想的运动成绩预测结果,这表明本文方法结合了灰色关联分析法和支持向量机的优点,克服了当前运动成绩预测模型存在的不足,对比结果验证了本文模型的有效性。
2.3 运动成绩预测的预测效率分析
3种模型的运动成绩预测建模时间统计结果,如图3所示。
图3 不同模型的运动成绩预测建模效率对比
图中可以看出,本文模型的运动成绩预测建模时间始终少于两种对比模型,有效地减少了运动成绩预测复杂度,这是因为引入了灰色关联分析法进行影响因素选择,减少了输入向量的数量,提高了运动成绩预测建模效率,与运动成绩数据向大规模发展的方向相适应,具有更加广泛的发展前景。
3 总结
针对当前运动成绩预测精度低的难题,以获得理想的运动成绩预测结果为目标,提出了影响因素选择和加权的运动成绩预测模型,该模型引入灰色关联分析法确定与运动成绩变化特点最相关的影响因素,减少了运动成绩预测模型的输入向量数量,加快了运动成绩的建模速度,然后采用支持向量机对运动成绩历史数据进行学习,克服了人工神经网络等传统模型的缺陷,提高了运动成绩预测精度,为运动成绩预测提供了一种新的研究思路。