福建省青少年体操锦标赛E裁评分客观性分析
——以2021年男子体操单项决赛为例
2022-11-07王丰彩
李 明,王丰彩
(集美大学诚毅学院,福建 厦门 361021)
体操是我国体育的传统优势项目,不仅具有观赏性,而且也广受大众的喜爱。福建省尤为重视该项目的发展,并将体操项目列入后备人才培养模式创新试点,在运动员、教练员、裁判员培养机制上给予大力支持。裁判员是体操比赛中的执法官,裁判员评分的准确性和客观性对比赛的结果有着关键性的影响[1],决定了比赛的公平、公正性。2021年福建省青少年体操锦标赛在泉州海峡体育中心体育馆举行,共有来自福建省内各设区市、平潭综合试验区、省重点传统校的9个代表队,总计169名运动员参赛。本届比赛采用《2017—2020年国际竞技体操评分规则》和《中国青少年体操训练教学大纲》中附件1的“中国少年儿童体操比赛规定动作及评分标准”。在男子竞技体操评分规则中,D组裁判打难度分,E组裁判打完成分,两组裁判给分均是独立的,去掉最高分和最低分,最后的平均分即为参赛队员的最后得分。因同年龄段的参赛队员难度分差异性不是很大,因此,E组裁判评分的客观性对比赛结果起着决定的作用。本研究以2021年福建省青少年体操锦标赛男子单项决赛成绩中E组裁判的评分作为研究对象,对裁判员评分的客观性进行分析,以此为依据,了解福建省体操裁判评分的准确性、客观性和执裁评分的经验,对裁判员评分机制的公平性研究和裁判员的遴选、培养工作具有一定的现实意义。研究分析并提出相应对策,以期提高福建体操裁判执裁水平,保证福建各类体操赛事的成绩准确性和竞赛公正性,对运动员和教练员负责,进一步促进福建体操项目竞技水平和赛事推广的健康发展。
1 研究对象与方法
1.1 研究对象
以2021年福建省青少年体操锦标赛乙组、丙组、丁组男子鞍马、单杠、吊环、跳马、双杠、自由操的6个单项决赛前八名运动员的完成情况E分为研究对象(因甲组参赛运动员较少,不作为本次研究对象)。
1.2 研究方法
1.2.1 文献资料法
通过文献资料法查阅中国知网和2016年国际体操联合会男子体操评分规则,结合2021年福建省青少年锦标赛成绩册对相关研究文献进行内容梳理,为论文研究提供有力的理论支撑和参考。
1.2.2 实地观察法
对2021年福建省青少年体操锦标赛中的男子单项决赛6个项目中的运动员完成情况和赛事运行情况进行实地观察,便于结合赛场上运动员的临场发挥及动作表现研究裁判员的评分情况。
1.2.3 数理统计法
运用统计软件SPSS23.0中的相关性分析、方差分析和极差分析,结合Microsoft Office Excel2010对2021年福建省青少年体操锦标赛男子单项决赛E组裁判评分数据进行统计分析,对裁判员执裁客观性进行综合评价。
2 结果与分析
2.1 客观性检验
应用SPSS23.0统计软件,对2021年福建省青少年体操锦标赛男子体操单项决赛中E组裁判员对前八名运动员动作完成质量的评分进行肯德尔和谐系数(Kendall’s W)处理和计算,即检验其一致性系数,客观反映男子体操单项决赛中3个组别6个项目的E组裁判员评分的一致性情况。
从表1、表2、表3中男子乙组、丙组、丁组单项决赛6个项目检验统计结果可以看出,渐进显著性P值均小于显著水平0.05,Kendall’s W检验结果中除丁组的吊环一致性系数为0.577和自由体操一致性系数为0.503之外,其他组别的各项目评分一致性系数都在0.7以上。从统计学角度来看,男子乙组、丙组、丁组6个单项决赛中运动员个体的得分存在显著差异,说明三个组别的E组裁判员的整体评分标准一致性较高。输出的分析结果说明:比赛中运动员动作差异区分度较高,裁判员的评分虽然有一定的误差,但是相比运动员之间显著的动作技术差异,评分的误差对运动员最终得分的影响不大。从个案样本一致性结果来看,男子乙组双杠项目的E组裁判评分一致性系数最高为0.973,说明乙组双杠裁判的评分客观性最高;而在丙组和丁组双杠项目中,裁判评分的一致性系数分别为0.940和0.896,也相对较高,反映了在双杠项目中裁判评分标准一致,现场评分较为精准。男子丁组的吊环和自由体操两个项目的E组裁判评分一致性系数相对较低,相对其他决赛项目来看,丁组吊环和自由体操两个项目的一致性数据反应了该项目中E组裁判的业务水平存在差异,评分的标准和尺度不一致。另外,丁组的自由体操项目评分的渐进显著性P值为0.014,大于显著性水平0.01而小于显著性水平0.05,虽然渐进显著性水平具有显著差异,但结合一致性系数检验结果也反应出该项目的E组裁判对该项目评分尺度的把控不准确,整体业务水平有待提高。从现场观察及成绩册上的评分数据来看,丁组决赛的吊环项目中难度分均相同,而丁组自由体操项目中除了一名队员的难度分为4.4分,其余7名运动员的难度分均为5分,所以在这2项中,完成分即E分的高低基本决定了运动员最终成绩的高低,E分的不客观会直接对比赛结果造成不良影响。另外,项目的动作特征也是影响评分一致性的重要因素,单杠、双杠项目动作有动有静,过程较为舒缓,有利于裁判的仔细观察和思考斟酌,因此以上项目裁判员评分较准确,客观一致性也高;而跳马和自由体操等项目,其动作较为连贯,甚至是瞬间一气呵成,留给裁判员观察思考的时间很少,这对裁判员的执裁水平和经验是很大的考验。
表1 男子乙组单项决赛E组裁判员评分的一致性系数检验分析
表2 男子丙组单项决赛E组裁判员评分的一致性系数检验分析
表3 男子丁组单项决赛E组裁判员评分的一致性系数检验分析
2.2 方差检验
为了检验裁判员评分标准对运动员E分这个独立因变量均值是否存在显著差异,采用SPSS统计软件中的单因素方差分析对2021年福建省青少年体操锦标赛男子体操单项决赛中前8名运动员动作完成质量情况进行了检验,通过方差分析输出情况得出男子体操单项决赛中6个项目的方差齐性检验统计量。
从表4的方差同质性检验分析输出可以看出:丙组的跳马乙组、丙组、丁组3个组别中的6个项目的E组裁判员评分方差同质性检验显著性均大于显著水平0.05,这说明3个组别中6个项目的E组裁判员评分数据的总体方差不存在显著差异。再结合Levene统计量来看,可以认为3个组别中6个项目的总体方差相等,即满足方差齐性这个前提条件,可以进行计算分组均值相等的Levene统计量,进一步检验组方差是否相等和各单项E组裁判员评分的一致性方差分析情况。
表4 男子单项决赛6个项目的方差同质性检验分析
从单因素方差分析输出情况6个项目单项决赛可以看出(表5、表6、表7),如果仅考虑裁判员单个因素的影响,3个组别中6个项目的E组裁判员的评分标准没有显著差异(P>0.05),即整体裁判员的评分标准和尺度较为一致,可以认为3个组别中6个项目的E组裁判员评分标准差异较小,没有对运动员决赛成绩产生显著影响,能客观反映参赛运动员的真实水平。同时也体现出:虽然裁判员对所有运动员的总体评分尺度较为一致,没有倾向性的偏高或偏低,但对于水平相近的运动员来讲,裁判员评分的区分度不高,仍有待进一步提高辨识度。[1]造成这种结果的原因可能有两方面:一方面从客观角度看,运动员运动水平较为接近,裁判员在评分时难以评判出高低;另一方面从主观角度来看,裁判员在评分过程中相对保守,为让自己的评分成为有效分,评分的波动范围较小,从而降低了区分度。[2-8]
表5 男子乙组单项决赛各单项E组裁判员评分一致性方差分析
表6 男子丙组单项决赛各单项E组裁判员评分一致性方差分析
表7 男子丁组单项决赛各单项E组裁判员评分一致性方差分析
2.3 极差分析
为寻找影响E组裁判员评分一致性的主要因素,采用SPSS23.0统计软件中的描述统计分析,并结合Microsoft Office Excel2003软件,运用极差分析对2021年福建省青少年体操锦标赛男子单项决赛E组裁判评分出现极差的频率进行分析统计,结果如表8、表9、表10和图1所示。
表8 男子乙组单项决赛各单项E组裁判员扣分出现极差的频率 (次)
表9 男子丙组单项决赛各单项E组裁判员扣分出现极差的频率 (次)
表10 男子丁组单项决赛各单项E组裁判员扣分出现极差的频率 (次)
图1 E组裁判评分极差分值与出现总次数对应图
通过表8、表9、表10对男子体操单项决赛E分的分析和统计可以看出:E组裁判对运动员的评分极差在0.1~1.9之间波动。结合图1的E组裁判评分极差分值与出现总次数对应图可以看出:汇总3个组别的评分极差值和出现次数,最小评分极差为0.1,在3个组别比赛中共出现了5次;最大评分极差为1.9,分别在丙组和丁组双杠决赛中各出现了1次;出现最多的评分极差为0.7,在比赛中出现了20次;所有极差值在不同位置出现的次数大致成偏正态分布,符合统计学的要求。极差值的出现机率和位置说明了裁判员个体间评分存在差异,有一定的随机误差,而且在部分项目中,裁判员的评分差异较大。[2]例如在丙组和丁组双杠决赛项目的评分中,裁判的评分极差值为1.9分,这说明裁判员对个别运动员的评分争议较大,评分数据的客观性受到质疑。另外,3个组别中的最高极差都出现在双杠项目中,这说明该项目中个别裁判员评分出现较大的随机误差,评分的精准度和执裁水平有待于进一步提高。虽然裁判员的评判结果出现明显的个体间差异,但是依据体操竞赛规则去掉最高分和最低分,仅出现一次差异显著的评分并不会影响整体裁判员的最终评分结果。
3 结论
(1)青少年体操锦标赛男子体操单项决赛中,大部分单项的E组裁判员的整体评分客观一致性较高,对评分尺度的把握相对较为一致。但个别单项如吊环、跳马、自由体操等,评分存在一定的差异性,分析其原因主要是裁判团队的执裁水平不一和项目的动作特征差异。
(2)各个项目的裁判员评分的客观一致性系数虽然较高,但通过评析裁判员评分客观性的一系列指标数据后发现:个别裁判员评分的随机误差稍大,裁判员队伍水平参差不齐,部分裁判执裁经验不足,执裁水平有待提高。
(3)极差值和无效分的出现机率和出现位置,也反映了个别裁判员评分标准出现偏差,虽然这会使评分数据的客观性受到轻微质疑,但并不影响最终比赛成绩的可信度和评分结果。
(4)裁判员对所有运动员的总体评分标准和尺度较为一致,但对于水平相近的运动员来讲,裁判员评分的区分度不高,仍有待进一步提高辨识度。
4 建议
(1)优化裁判团队培养模式,实施裁判员继续教育机制,对现有裁判团队定期组织业务培训,提高现有裁判员执裁水平。可利用理论讲解、案例探讨、对比赛视频模拟评分、实际操作等手段,强化业务练习,提高裁判员评分的准确度和辨识度,丰富执裁经验,在比赛中有效、合理地控制和处理评分误差,降低无效分的出现机率,提高比赛评判的准确性。
(2)强化裁判员的思想政治教育,在比赛中严格落实回避制度,同时加强监督监控机制,完善奖惩措施,出现重大过错时应追责,排除执裁过程中的主观因素干扰,使得裁判的评分更加公正、客观、准确,提高比赛评判的公正性。