最小二乘支持向量机和预测误差校正的运动员成绩预测
2018-03-03王娟娟
王娟娟
摘 要: 为了获得更好的运动员成绩预测结果,提出最小二乘支持向量机和预测误差校正的运动员成绩预测模型。首先通过提升小波和最小二乘支持向量机对运动员成绩进行建模和预测,然后通过误差校正方式对运动员成绩的预测结果进行校正,最后通过运动员成绩预测实例对模型的有效性进行测试,并与其他运动员预测模型进行对比实验,验证其优越性,结果表明,所提模型降低了运动员成绩的预测误差,并且通过误差校正提高了运动员成绩预测结果的稳定性,预测精度要优于其他运动员成绩预测模型。
关键词: 运动员成绩; 最小二乘支持向量机; 误差校正; 预测模型; 预测误差; 预测精度
中图分类号: TN911.1?34 文献标识码: A 文章编号: 1004?373X(2018)05?0163?04
Abstract: In order to get better performance prediction results of athletes, an athletes′ performance prediction model based on least square support vector machine and prediction error correction is proposed. The lifting wavelet and least square support vector machine are used to model and predict the athletes′ performance. And then the error correction method is used to correct the prediction result of athletes′ performance. The validity of the model was tested with the prediction instance of the athletes′ performance. The superiority of the model was verified by means of contrast experiment of other athletes′ performance prediction models. The results show this model can reduce the prediction error of the athletes′ performance, improve the stability of athletes′ performance result by means of error correction, and its prediction accuracy is higher than that of other athletes′ performance prediction models.
Keywords: athletes′ performance; least square support vector machine; error correction; prediction model; prediction error; prediction accuracy
0 引 言
近年來,随着国民经济水平的不断提升,运动员水平也不断提高,运动员成绩引起了人们的广泛关注。运动员成绩预测可以帮助教练、运动员了解自己的竞技水平,可以根据运动员成绩制定相应的训练方案,因此运动员成绩预测发挥着越来越重要的作用。
根据建模方法的不同,运动员成绩预测模型可以划分为两类:线性预测模型和非线性预测模型。由于运动员成绩受到多种因素的影响,如测试环境、运动员心理等,运动员成绩具有一定的非线性变化特点,因此,线性预测模型的运动员预测误差大,无法保证运动员成绩的预测精度。而非线性模型可以描述影响因素和运动员成绩间的变化关系,成为当前的主要研究方向。非线性运动员预测模型可以分为两类:第一类为基于时间序列的运动员成绩预测模型,通过运动员成绩的历史数据分析运动员成绩变化特点,根据数据在时间上的相关性实现运动员成绩预测,主要包括:ARMA、指数平滑法等;第二类是基于机器学习算法的运动员成绩预测模型,主要有:神经网络、支持向量机回归等,两类模型有各自的优点,同时也存在一定的局限性,如ARMA模型要求运动员成绩变化比较平稳,而指数平滑法需要大量的历史数据。而神经网络的网络结构难以确定,支持向量机的核函数和参数有待优化,它们的运动员成绩预测精度难以满足实际应用要求。因此,当前急需要针对运动员成绩的随机性和非稳定性建立一种有效的运动员成绩预测模型。
为了提高运动员成绩的预测精度,提出最小二乘支持向量机和预测误差校正的运动员成绩预测模型。结果表明,本文模型是一种有效的运动员成绩预测模型,通过误差校正具有较高的运动员成绩预测精度。
1 相关理论
1.1 提升小波
提升小波算法是一种改进的小波算法,通过预测和更新算子实现小波变换的提升,属于第二代小波。相对于标准小波变换,提升小波基的构造与傅里叶变换无关,同时不要进行频谱分析,通过非平移就可以构造小波,可以用于随机性变化较强烈的运动员成绩数据分析,提取主要变化特征,基本工作步骤如下:
1) 将运动员成绩划分为独立的奇偶两部分,其中偶部分用表示,奇部分用表示,则有:
2) 用对进行预测,预测结果为与之间的差值为,其又称为小波系数,与原始信号的高频部分相对应,预测过程可以描述为:
式中,表示预测算子,可以采用 进行描述,可得:
3) 运动员成绩经过分裂后,子集的某些整体特征与原始运动成绩有一定的差异,为了维持运动员成绩的整体特征,需要进行一定更新,将更新过程用算子代替,则有:endprint
式中表示原始数据的低频部分。
更新算子也可以取不同函数,如:
运动员成绩经过提升小波分解后,得到低频和高频两部分;对于低频部分还可以进一步分解,得到和进行次分解后,运动员成绩可以描述为,具体流程如图1所示。
运动员成绩的提升小波重构可以表示为:
1.2 最小二乘支持向量机
采用提升小波对运动员数据进行处理后,最小二乘支持向量机对处理后的数据进行训练和建模。设其中表示运动员成绩的特征,表示输出结果,最小二乘支持向量机分类问题可表示为:
基于KKT理论可知,从而可得:
最小二乘支持向量机的最优决策函数变为:
式中是核函数。
选择RBF径向基函数作为核函数,具体为:
式中表示宽度参数。
最小二乘支持向量机的最优决策函数基于RBF径向基函数的最小二乘支持向量机的最优决策函数,最终为:
由于运动员成绩变化的随机性,采用最小二乘支持向量机对其进行归一化处理,具体为:
式中和分别表示运动员成绩的最大值和最小值。
最后运动员成绩的最终预测值要进行反归一化处理,即:
2 最小二乘支持向量机和预测误差校正的运动员成绩预测模型
虽然最小二乘支持向量机具有优秀的泛化性能,而运动员成绩变化具有一定的规律性,同时也有一定的随机性,是一种复杂多变的数据,采用单一最小二乘支持向量机只能对运动员成绩的非线性特点进行拟合,对运动员成绩的非平稳性无法有效进行拟合。
采用提升小波的多尺度分解特性,可以从运动员成绩中提取不同成分,不同成分对应不同的运动员成绩变化特性,实现运动员成绩变化特征的有效性分离,有利于最小二乘向量机分开预测,为此,本文首先采用提升小波对运动员成绩进行分解,然后采用最小二乘支持向量机对不同成分分别进行建模预测,最后采用提升小波重构得到运动员成绩的预测结果。最小二乘支持向量机的运动员成绩预测结果,大多数样本预测精度可以满足实际应用要求,但是有部分样本点会出现较大的误差值,需要进行校正。为了进一步提高运动员成绩预测精度,采用误差预测方法实现预测结果校正。基于最小二乘支持向量机和预测误差校正的运动员成绩预测模型的工作流程如图2所示。
3 运动员成绩预测的应用实例
3.1 运动员成绩
运动员成绩来自一个运动3年的100 m跑训练成绩(单位:s),共有450個样本,最后100个样本组成运动员成绩建模的验证样本集,对建立的运动员成绩预测模型泛化能力进行测试,具体数据如图3所示。
3.2 网络流量的小波分解
采用提升小波对图3中的运动员成绩进行分解,得到的结果如图4所示。从图4可以看出,经过提升小波分解,运动员成绩的变化特征更加清楚,便于后续最小二乘支持向量机的建模。
3.3 结果与分析
对于不同分量,采用最小二乘支持向量机进行训练,运动员成绩的低频分量的参数为:100.78,8.62,运动员成绩的高频分量的参数为:187.15,2.96,建立低频分量和高频分量的运动员成绩预测模型,最终运动员成绩预测结果如图5所示。从运动员成绩预测结果可以看出,本文模型获得了较高的运动员成绩预测精度,主要是因为可以描述运动员成绩的随机性和非平稳性,并通过误差校正改善了运动员成绩的预测结果。
3.4 与经典运动员预测模型的精度比较
选择当前经典运动员预测模型作为对比模型,具体为:BP神经网络(BPNN)、支持向量机(SVM)、小波分析+最小二乘支持向量机(W?LSSVM1)、没有误差校正的提升小波分析+最小二乘支持向量机(W?LSSVM2),采用运动员成绩的预测精度作为评价指标,所有模型的运动员成绩预测精度如表1所示。在所有模型中,本文模型的运动员成绩预测精度最高,主要是因为对比模型存在一定的局限性,无法准确描述运动员成绩变化特点,对比结果证明了本文模型建模思路的正确性,并验证了本文模型的优越性。
4 结 语
针对运动员成绩的随机性和规律性,本文建立了基于最小二乘支持向量机和预测误差校正的运动员成绩预测模型,采用提升小波对运动员成绩进行建模,通过最小二乘支持向量机对不同分量进行预测,然后通过误差校正对样本点进行校正,提高运动员成绩预测结果的稳定性,并且可以有效提高运动员成绩的预测精度。
参考文献
[1] 赵波.十项全能世界顶尖男子运动员成绩分析及预测研究[J].体育文化导刊,2013(3):76?79.
ZHAO Bo. Analysis and prediction of the results of ten all?around world top male athletes [J]. Journal of sport history and culture, 2013(3): 76?79.
[2] 赵丙军.运用多元回归方法建立我国男子跳远项目训练模型的研究[J].西安体育学院学报,2011,18(1):81?82.
ZHAO Bingjun. Model system on main training targets of men′s jumping [J]. Journal of Xian Institute of Physical Education, 2011, 18(1): 81?82.
[3] 魏春玲.我国十项全能运动成绩的因子分析及灰色系统回归预测研究[J].体育科学,2004,24(11):66?69.
WEI Chunling. Factor analysis and grey system regression prediction study on the performance of ten all?around sports in China [J]. China sport science, 2004, 24(11): 66?69.endprint
[4] 王宗平,孙光.应用BP神经网络算法对运动成绩预测的实证研究[J].南京体育学院学报,2006,20(4):109?111.
WANG Zongping, SUN Guang. Demonstration on the athletic achievements forecasting based on back propagation neural network [J]. Journal of Nanjing Institute of Physical Education, 2006, 20(4): 109?111.
[5] 陈志强,杨德芳,黄明教.建立体育多因素聚类的灰色系统回归预测模型方法研究[J].中国体育科技,2001,37(2):13?16.
CHEN Zhiqiang, YANG Defang, HUANG Mingjiao. The research on model of gray system regress prediction of multivariate cluster on physical education [J]. China sport science and technology, 2001, 37(2): 13?16.
[6] 庄冲,王宗平.灰色系统模型与BP神经网络模型在体育成绩预测方面的比较研究[J].南京体育学院学报,2006,20(6):134?135.
ZHUANG Chong, WANG Zongping. Comparing of gray and neural network model of forecasting in athletic achievements [J]. Journal of Nanjing Institute of Physical Education, 2006, 20(6): 134?135.
[7] 李征宇,闫生.神经网络模型在运动成绩预测中的应用[J].哈尔滨体育学院学报,2009,27(2):110?113.
LI Zhengyu, YAN Sheng. The nerve network model application in the forecast of sports result [J]. Journal of Harbin Institute of Physical Education, 2009, 27(2): 110?113.
[8] 戴敏,黄亚楼.基于数据挖掘的运动员体能测试数据分析[J].计算机工程与应用,2003,9(2):38?40.
DAI Min, HUANG Yalou. Data analysis of athletes′ physical fitness test based on data mining [J]. Computer engineering and applications, 2003, 9(2): 38?40.
[9] 龙斌.基于支持向量机的刘翔110 m栏成绩预测[J].天津体育学院学报,2009,24(4):330?333.
LONG Bin. SVM?based prediction of Liu Xiang′s achievements in 110 m hurdle [J]. Journal of Tianjin Institute of Physical Education, 2009, 24(4): 330?333.
[10] 孙群,刘国璧,程伟,等.基于模糊神经网络的刘翔110 m栏成绩预测[J].重庆科技学院学报(自然科学版),2011,10(2):104?107.
SUN Qun, LIU Guobi, CHENG Wei, et al. Research on Liu Xiang′s achievements in 110 m hurdle based on fuzzy neural network [J]. Journal of Chongqing University of Science and Technology (natural science edition), 2011, 10(2): 104?107.endprint