基于统计模型的体育评分数据处理研究
2016-12-28柯伟
柯 伟
(福州职业技术学院 ,福建 福州 350108)
基于统计模型的体育评分数据处理研究
柯 伟
(福州职业技术学院 ,福建 福州 350108)
体育评分是体育竞技中的重要部分,因为直接影响到运动员的成绩及体育竞技的公平、公正,并贯穿于整个体育竞技的整个过程当中,而统计模型又是体育评分的基础。在介绍评分数据特征的基础上探讨了统计模型构建及模型的参数估计,最后给出体育评分数据处理。
统计模型;体育评分;数据处理
编者按:系统的研究过程和科学的研究方法是产生高水平职业教育研究成果的基本条件。当前,本刊来稿中的一个突出问题是研究方法不够明确,导致结论可靠性差,影响刊物质量提升。这篇论文采用了定量分析和定性分析相结合的方法,很值得借鉴。
0 引言
主观评分方式是由多名测试人员根据评分规则独立自主地针对某个受测试人员进行个人评分,已经频繁出现在市场调查研究中,尤其广泛应用在竞技体育领域,比如在跳水、武术以及体操等比赛项目中,运动员的成绩往往会由多名经验丰富的裁判进行主观评分[1]。但是由于受到客观和主观等因素的限制,各个裁判人员对于同一名运动员的评价也各不相同,因此需要对于评分成绩进行处理,以此得到对于该运动员的更为客观的评价,这已经成为竞技体育项目的重要环节,并且直接决定了该运动员的比赛名次。在具体的竞技比赛当中,为了提高比赛的观赏性和客观性,规则制定人员不断的修改评分方式,因此针对主观评分的数据处理方面也有一定的研究成果。但是,相对而言国内外有关评分的计算方法的研究还是比较少,而且计算方式过于简单而且缺乏客观理论支持。现阶段,关于主观评分的统计模型的构建和分析理论还没有系统化和体系化,本研究以主观评分方式中的数据为研究对象,并根据数据构建数据模型,然后利用统计学中的参数估计方法来改进评分处理方式,从而让主观评分方式更加客观和有效。
1 主观评分数据的特征
1.1 误差来源的多样性
如今,在很多竞技比赛过程中,主观评分数据是由多名裁判员共同评分得到的结果,显然运动员的真实数值是确定的,但是裁判员的评分标准和角度并不一致,这也意味着很多裁判的评分数值存在着误差[2]。当然,评分数值的误差来源也会多种多样,比如比赛环境、裁判员的视角、业务水平以及工作态度都会对最终的比赛成绩造成影响,尤其是裁判的主观意愿对评分结果的影响比较大,从而让主观评分数据具有强烈的个人主观性,这也是主观评分数据的最基本的特征。
1.2 数据合理程度的不均衡性
与客观评分数据相比,主观评分数据是针对同一个测试对象进行的多项测试结果,理论上来说测试的结果应该基本相同,不应该具有很大的评分误差。如果多次的测量结果误差较大,则表明测试数据中有不合理的项目存在,而且评分数据的合理性是相对的,有些测试的合理性比较高,而有些测试的合理性较低,甚至存在不合理测试的现象。需要说明的是,由于运动员的真实数值虽然存在,但是未知,因此至今还没有一个权威的评价数据合理性的标准。
1.3 数据的权威性
虽然主观评分数据不够客观,但是每个评分数据是每个裁判根据运动员的表现评分得到的,而且裁判员是严格按照竞技比赛的标准进行评比和筛选的,运动员的成绩现在只能由裁判员进行主观评定。综合来讲,主观评分数据的权威性只在有限的数据上体现,但是运动员的成绩必须为一个确定的数值,还要考虑到竞技体育的公平性和平等性,这也给主观评分数据处理提出了更高的要求。
2 基于统计模型的主观评分数据处理
2.1 主观评分数据的统计模型
以统计学为角度,主观评分数据具有明显的数理统计特征,以测量学为角度,主观评分数据是多名裁判员对于运动员的成绩的观测值,而且每个观测值都是裁判员对于运动员的场上发挥的一种认定,每位运动员正常发挥都有一个稳定的分值,但是裁判在打分时由于角度和动作的理解不同会导致最终评分有差异,而且差异范围有大有小,为了控制差异范围,针对主观评分数据进行处理时,需要考虑到不同数据的地位以及价值[3]。以统计学为角度,某个裁判员针对运动员的主观评分是一个随机过程,并将该评分数据定义为随机变量组,其中随机变量组为未知的,并且每个都不相同。需要说明的是,既表示为个统计总体,而且还表示为个样本,并且样本容量都是1。数理统计的价值就是利用的观测值来估计运动员的真实数值,此时的抽样误差并不是基于之间的误差,而是根据所有计算得到的方差。本研究观测数值构建主观评分数据的统计模型,并利用成熟的参数估计的方法来估计运动员的真实水平,从而让数理统计方面的技术得到广泛应用。
本研究将上述模型(1)作为基于主观评分数据的重要模型,并且进一步分析:
1)根据裁判员的评分准则,运动员的竞技体育表现存在一个真实数值为,且每位裁判员给出的主观评分数据为随机变量,满足期望值为,即
2.2 统计模型的参数估计
在上述的统计学模型中,如果已知则利用参数估计的加权最小二成算法得到:
其中为体评分数据的最小单位,可根据具体比赛项目而定,比如跳水比赛的最小单位为0.5;体操比赛最小单位为0.1。根据公式(10)计算得到的参数估计量。
具体来讲,公式(10)为基于主观评分数据的重要处理方式,其可以对运动员的真实成绩进行估计,其中的权值主要由决定,这体现出如何根据来体现评分数据的合理性,而且运动员的真实数值的估计量不是,而是。在实际的统计过程中,本研究利用公式(l0)得到初始估计值,记作,而且公式(l0)的由代替进行计算得到,再由代替进行计算,由此重复地迭代计算下去,当之间的误差小到一定范围内,比如范围可以定为0.001。
针对竞技体育比赛,主观评分数据的统计处理既要有理论性,有要具有统计特性,还要体现出体育的竞技性,因此基于主观评分数据的处理需要具有一定的主观性。比如公式(9)中的常数就是人为设定的;公式(10)中的参数会直接决定了所有权值的区分水平。就近几年的竞技体育比赛来看,在范围内的波动比较合理,但是如果超过这个范围,并在范围内,则属于一般合理情况,而在范围外,则属于不合理现象。主观评分数据处理的基本准则就是平等性和公平性,然后利用参数代入迭代法来进行最后的参数估计处理。
2.3 主观评分数据的处理
现阶段,运动员的主观评分方法都是按照多个裁判员的主观评分数据求平均取得,有时候也会采用舍去最高值和最低值后求平均算的,但是这些处理方式并非能够体现出运动员的真实水平,因此这种参数估计方式也很难保证评分结果的真实性和有效性[4]。又由于裁判的数量十分有限,因此样本的数量也相应较少,如果还要舍去最高分和最低分,有效的数据量将十分有限。在这种极端情况下,基于运动员真实水平地总体分布的规律性很难直观地体现出来,因此利用均值直接作为运动员真实成绩的做法值得商榷。
本研究尝试利用非参数估计方法来构建新型的评价方式,从而更好地体现运动员的成绩。需要注意的是,非参数统计方法并不是以运动员的真实成绩作为评价的参考对象,因此并不会受到样本数理过少的影响。改进的评价方法直接将某个裁判员的评分成绩与其他成绩进行合理性分析,从而分析出哪位裁判员的成绩更具合理性,基于合理性的评价方式为运动员的评分方法提供了良好的发展方向。评分数据的合理性的比较标准有同分值优势标准以及中心优势标准,也就是将数据中比较集中的区域作为优势区域,其合理性也就越高;而偏离中心的数据属于合理性较低的范畴;如果出现同分的情况,则认为其合理性较高,其权值数相应地提高。
表1 裁判员评分数据一览表
2.3.2 个体客观性得分
本研究根据离心距数值的大小来评估裁判员的评分水平,具体来讲,如果离心距为零,则表示运动员得到的客观值满分;如果离心距越大,则得分越低;如果离心距大于规定的范围,则得分为零[5]。现假设运动员分数最小单位为△,当离心距大于△的倍时,其得分为零。由此得出该评分公式:
而第位裁判员的个体客观性评分为:
根据公式(12)可知,最小得分单位与具体体育竞技项目有关,比如体操比赛的最小得分单位为0.1,跳水比赛的最小得分单位为0.5等[6]。参数并不是绝对的,如果值越大,则表明裁判员的评分偏高;如果值越小,则表明裁判员的评分偏低。对于主观评分数据的影响还体现在区分度上,如果值越大,则表明评分的区分度较高;如果值越小,则表明评分的区分度越低。在具体应用中,一般将值设定在不小于整体的离心距。比如在第15届亚运会跳水比赛中,得到裁判员评分的离心距为2.67,在根据跳水项目的特点设定△值为6,因此上述的公式(12)和(13)分别为:
3 结论
体育评分数据处理不仅关系到每个运动员的个人成绩,还关系到整个体育运动项目的顺利进行,如何找到一种合理恰当的数据处理模型是体育评分关键所在。本研究在传统的主观评分方式基础上提出了一种新式的评分方式,其方式区别于一般的参数估计方式,而是以裁判组的评分合理性为研究对象,以评分的区分度来体现评分的合理性。并在详细介绍了统计模型的参数估计方式后,具体给出了体育主观评分数据的统计模型,采用离心距的方式来评估评分方式的优劣,对体育评分数据处理问题提供了一定的参考价值。
[1] 黄宝宏.论体育教学评价中信息的统计处理[J].体育科技, 2006(l):72-76.
[2] 陈志强,卢芬.技能类运动竞赛裁判员评分合理性评价方法研究[J].中国体育科技,2001,37(8):23-25.
[3] 何江川.主观评分裁判员水平非参数评价方法的研究[J].吉林体育学院学报,2005,21(1):68-69.
[4] 魏登云.主观评分误差的非参数处理方法[J].中国体育科技,2001,37(3):38-40.
[5] LYSANN DAMISCH, THOMAS MUSSWEILER, HENNING PLESSNER. Olympic Medals as Fruits of Comparison? Assimilation and Contrast in Sequential Performance Judgments[J]. J Experimental Psycho1,2006,12(3):166-178.
[6]刘钦龙,谢辰.主观评分结果评价的误区与对策[J].湖北体育科技,2006,25(5):532- 534.
Research on the Data Processing of Sports Score Based on the Statistical Model
KE Wei
(Fuzhou Plytechnic, Fuzhou 350108, China)
Sports score is the most important part of sport, affecting the performance of athletes and physical sporting fairness and justice throughout the whole process of sports competition, and the basis of statistical model and sports scores. This article introduces the grading data characteristics on the basis of the statistical model building and model parameter estimation is discussed. Finally, the sports score data processing is presented.
statistical models; sports scores; data processing
G80-32
A
1674-943X(2016)04-0061-04
2016 - 11 - 19
柯 伟(1980 - ),男,汉族,福建泉州南安人,硕士,讲师,主研方向为高校体育教育。