累进记分在体育高考评分标准中的应用研究
2021-07-22郭孟仙覃朝玲
王 峰,郭孟仙,覃朝玲
累进记分在体育高考评分标准中的应用研究
王 峰1,郭孟仙2,覃朝玲3
1.重庆商务职业学院,重庆,401331;2.潼南卧佛初级中学校,重庆,402682;3.西南大学体育学院,重庆,400715。
体育高考是普通高考的重要组成部分,是为高校体育专业选拔人才的专业测试。通过对重庆市2013年至2018年体育高考掷实心球项目的考试成绩进行分析,发现了现行评分标准不足之处,表现在:①满分人数过多(男生22.5%,女生30.76%);②男女分数存在显著差异(P<0.05);③考试难度和区分度偏低;④旧标准记分方式为等距记分,未能体现“运动成绩越高,所获分数越高”的记分原则。为弥补旧标准的不足,利用累进记分模型进行修正,得到了新的评分标准。新标准下分数表现:①满分人数显著降低(男生0.13%,女生1.29%);②男女分数无显著差异(P>0.05);③考试难度和区分度得到改善;④新标准下,运动成绩越高,所获分数越高,符合体育运动记分原则。新标准能够弥补旧标准的不足,也符合体育运动记分原则。对实现实心球项目评分标准公平公正,科学合理选拔体育人才具有重要意义。
重庆市;体育高考;掷实心球;评分标准;累进记分
体育高考是普通高考的重要组成部分,是经教育部授权由省级教育考试机构组织的国家级教育考试(贾海生 2019)。是经过教育部批准的招生高校根据本校高水平运动队项目的建设需要,从参加全国普通高校统一招生考试的学生中特招有体育项目特长且又符合高等学校年度招生工作规定的学生。体育高考是为高校体育专业选拔人才的专业测试,包含单独招生和体育统考[1]。体育统考因参与人数多,社会影响大而备受关注,甚至有学者提出将体育统一纳入高考,认为体育进高考是完善高考制度、改善青少年体质、体现公平公正的需要[2][3][4][5]。
体育高考作为高校体育专业人才的选拔性测试,其评分标准对入校学生素质起着决定性作用(靳卫平,梁锋 2013),也直接决定了选拔出来的体育人才的优劣。2003年,国家体育总局废止了实施15年之久的《普通高等学校体育专业招生暂行规定》,各省市可以依据改革标准自行确定术科测试项目、内容、比例和评分标准,高校有权决定录取办法[6]。自改革以来,各地体育高考评分标准呈现出多种迥异模式。最新研究指出近20年来多省市实行的“身体素质”模式已背离高考改革初衷,进而提出“X+1+1”模式(身体素质+非专项基本运动技能+专项),强调的是在身体素质的基础上全方位考查,考查内容趋于全面[7]。身体素质包含速度、力量、耐力、柔韧、上肢爆发力及下肢爆发力等。掷实心球是测量上肢爆发力的一种运动方式,已在多省市体育高考中得以运用(如重庆市)。但有学者指出,重庆市体育高考中,实心球成绩方差不齐性,男女实心球分数存在显著差异(女生优于男生),并据此指出其等距加分的记分方式不科学合理[8]。评分标准与办法不够科学合理是造成不同群体考生分数差异大、成绩分数不对等的主要原因[9]。体育高考评分标准难度低,容易导致满分人数过多,进而达不到体育人才选拔的目的[10]。修正和完善体育高考评分标准,科学合理评价学生运动能力,有利于公平公正选拔体育人才,促进体育事业发展。
1 研究对象与方法
1.1 研究对象
以2013年到2018年参加重庆市体育高考考生的实心球成绩数据作为研究对象。详见表1。
表1 重庆市2013年到2018年实心球项目考生(人)
数据来源:重庆市教育考试院(http://www.cqksy.cn/site3/default.html)
1.2 研究方法
1.2.1 文献资料法 在CNKI检索国内有关体育高考评分标准的文献资料,重点是体育统考评分标准的起源、发展、变革与现状。再检索重庆市体育高考评分标准资料,把握重庆市体育高考评分标准的概况,尤其是掷实心球项目评分标准的特点与不足。
1.2.2 专家访谈法 在搜集相关资料的基础上,有针对性地访问了西南大学体育学院(重庆市体育高考承办单位)的多位专家,具体包括3位教授,4位副教授。重点访问他们对于现行体育高考评分标准的意见与建议;他们的建议对研究的目的及研究方式思路等方面提供了有力的支撑。
1.2.3 数理统计法 对研究涉及到的数据,运用SPSS17.0等软件进行了描述性分析、T检验等分析,根据得到的检验指标来对评分标准进行评判。
2 结果与分析
2.1 原标准下的重庆市2013到2018年掷实心球项目的考试分析
2.1.1 成绩分布状态
(1)男生的掷实心球成绩分布
将2013-2018年男生掷实心球成绩数据进行汇总分析后,结果如表2所示。
表2 男生成绩分布表
上表显示,6年内的男生成绩呈偏态分布,表现为高分段人数较多、满分率高(平均满分率为22.25%),并且有逐年增高趋势。
(2)女生掷实心球成绩分布
将2013-2018年女生掷实心球成绩数据进行汇总分析后,结果如表3所示。
表3 女生成绩分布表
上表显示,6年内的女生成绩呈偏态分布,表现为高分段人数较多、满分率高(平均满分率为30.76%),并且有逐年增高趋势。
2.1.2 男女考生成绩差异比较
将2013年到2018年6年内男女考生成绩进行差异比较,结果如下表。
表4 男女考生成绩差异比较
上表显示,6年内,男生总平均分84.37分,标准差12.38分;女生总平均分83.85分,标准差14.93分。方差齐性检验下,F=392.51,P=0.00<0.05,方差不齐,选择不等方差t检验,结果显示P=0.03<0.05,说明旧标准下,男女分数存在显著差异,表现为男生分数高于女生分数。
2.1.3 考试难度与区分度分析 在体育高考中,测量标准要具备可靠性、客观性和有效性,方能使测量结果更加准确可靠,才能够达到选拔人才的目的。掷实心球作为体育高考的必考项目之一,还应有一定的鉴别性,即包含一定的难度与区分度,这样才能做到择优录取。
考试难度的计算公式为P=平均分/满分 方程一
考试区分度计算公式为D=(PH—PL)/满分值 方程二
(PH为27﹪高分组的平均分,PL为27﹪低分组的平均分)
难度P越大,测试越简单,反之越难。区分度D越大,区分效果越好,反之越差。
对2013到2018年掷实心球项目的考生成绩进行均值分析,得出结果如表5所示。(高低分组比例均为27%,小数按四舍五入取整)
表5 各组数据均值一览表(旧标准)
利用表5数据,用方程一和方程二得出这6年考试的难度和区分度。结果如表6所示。
表6 考试难度、区分度一览表(旧标准)
表6显示,这6年的考试难度系数都在0.8以上,即掷实心球项目测试的难度较低;这6年的考试区分度系数均在0.4以下(2018年,女生略大于0.4),区分度较低。由于难度和区分度均不佳,直接导致高分人数和满分人数均较多,高分人数过于集中。带来的后果是优秀人才的选拔难度越来越大,因此有必要探讨现行掷实心球项目评分标准(旧标准)的科学合理性。
2.2 旧标准分析
对2013到2018年重庆市体育高考掷实心球项目成绩进行统计,分析其现行评分标准,结果表7、表8所示。分差不合理之处已在表中用粗斜体进行了标注。
表7 实心球距离、成绩与差值一览表(男)
注:“分差”栏为该成绩段与相邻高分成绩段的分数之差。
表8 实心球距离、成绩与差值一览表(女)
注:“分差”栏为该成绩段与相邻的高分成绩段的分数之差。
上表显示,旧标准是以0.05m为评分间距,采用等距记分方式,但该记分方式存在的问题有:(1)在同一分数段内,原始成绩高的考生与原始成绩低的考生所获得的分数值相同,违背“运动成绩越高,难度越大,获得分数也应越多”的记分原则;(2)在部分成绩段之间,随原始成绩的提高,其分数反而下降(表中粗斜体处),尽管下降分数不多(0.01分至0.02分),但其记分方式完全违背该原则,打破了评分标准的科学合理性。因此需要对评分标准进行修改完善。
旧标准存在两大问题,(1)是测试难度低,男生满分点取14.8m,女生满分点取10m,实际考试中,约1/3到1/4的考生能够取得满分,这是旧标准存在的最大问题。(2)是等距记分方式不佳,既违背运动记分原则,又未能做到合理分段。
2.3 新标准的修定
2.3.1 修定原则 体育高考评分标准的制定,需要遵循两个原则:(1)是有科学合理的依据;(2)是满足竞技体育规律(运动水平越高,难度越大,每提高一个单位成绩增加的分值也就越高;反之,运动水平越低,难度就越低,每提高一个单位成绩所增加的分值也就越低),这样方能体现评分标准的科学合理性。竞技体育运动规律原理如图1所示。
图1 成绩与分数原理图
原理图中,横轴为成绩,大小顺序为A<B<C<D,间距为AB=BC=CD;纵轴为分数,大小顺序为a<b<c<d,间距为ab<bc<cd[11]。
2.3.2 新标准60分点与100分点确定的依据 苗爱芹等学者通过研究提出,采用累进记分法制定的评分标准能够符合体育运动的客观规律[12],可以作为体育高考评分标准的制定依据。采用累进记分模型的评分标准能够与体育运动的客观规律更加贴合,有利于体育人才的选拔,有利于为国家选拔更优秀的体育人才。在体育考核与评分中,越来越多的学者采用累进记分方法进行评分。计算式为Y=RD2-Z,其中Y为因变量,R和Z为常数项,D为自变量(D=5+(X-`X)/S)。该公式下,分数随成绩提高而升高[13],满足竞技体育运动规律。依据正态分布原理,`X±3S(`X:样本均值,S:样本标准差)能够涵盖99.93%的样本面,在评分应用中,可认为囊括了全部考生;因此,人们习惯将`X+3S定为100分,把`X﹣S定为60分[14]。但有研究表明,按此标准,会导致17%的考生成绩低于60分以下,打击了考生的积极性,进而提出满分点为`X+2S,及格点为`X﹣1.5S[15],此时及格点以下人数仅占约6.6%,对考生积极性打击不大。详见表9所示。
表9 等距标准差五等级划分法[16]
本研究中,新标准满分点取`X+2S,及格点取`X﹣1.5S,男女标准相同。(相关研究中,有研究者对男女考生采取了不同的取值标准;考虑到体育高考的重要性,为保证男女性别间也能够做到公平公正,本研究采取男女相同的取值标准)选定满分点与及格点后,需对D值的取位进行界定[17],依据如表10所示。
表10 按0.5S间距排列的D值对应表
表10显示,当满分点取`X+2S,及格点取`X﹣1.5S,对应的D值分别为7和3.5。另通过计算得知男生均值为13.37m,标准差为1.53m,女生均值为9.41m,标准差为1.12m,代入公式求出D值。在知晓D值、S值和`X值后,根据累进记分方程可得出未知数X,即考生掷实心球的原始成绩。按照此原理得出新标准下男生的满分点取16.44m,及格点取11.08m,女生的满分点取11.65m,及格点取7.73m。男女生的累进记分方程分别为:
男:Y=1.09D2+46.67,(D=5+(X-13.37)/1.53) 方程三
女:Y=1.09D2+46.67,(D=5+(X-9.41)/1.12) 方程四
2.4 新标准下的成绩分布与考试分析
2.4.1 成绩分布比较 利用新标准(方程三、方程四)对原始成绩进行分数换算,同时对其进行正态性检验,得出结果如图2-图5所示。
图2 旧标准下男子百分制分数P-P图
图3 新标准下男子百分制分数P-P图
图4 旧标准下女子百分制分数P-P图
图5 新标准下女子百分制分数P-P图
上图显示,新标准的期望值与观测值贴合程度比旧标准更好,表明新标准下的成绩正态分布显著改善。
对新标准下男女考生成绩进行正态性检验,结果如表11、表12所示。
表11 新标准下男生成绩
表12 新标准下女生成绩
上表显示,这6年内,男生满分总数28人,全部考生20 252人,满分率为0.13%;女生满分总数60人,全部考生4669人,满分率为1.29%。与旧标准下的成绩相比较,满分率显著降低。新标准的成绩分布比旧标准更贴合正态分布,满分率也显著降低。
2.4.2 新标准下男女考生差异比较
利用新标准,将2013年到2018年6年内男女考生成绩进行差异比较,结果如下表。
表13 男女考生成绩差异比较
上表显示,6年内,男生总平均分75.03分,标准差10.34分;女生总平均分74.92分,标准差10.4分。方差齐性检验下,F=5.75,P=0.02<0.05,方差不齐,选择不等方差t检验,结果显示P=0.51>0.05,说明新标准下男女分数无显著差异。
2.4.3 新标准的难度与区分度 用新标准(方程三、方程四)对原始成绩进行分数换算,汇总结果如表14所示(分组依据同上)。进一步计算出新标准的难度区分度,结果见表14。
表14 各组数据均值一览表(新标准)
表15 考试难度、区分度一览表(新标准)
表15显示,2013到2018年的考试难度系数均在0.8以下;考试区分度系数介于0.23-0.27之间。将新旧标准下的成绩进行配对样本T检验,结果显示,相关性极为显著(R=0.998,P<0.01),差异极为显著(P<0.01);表示新标准能够显著改善考试的难度与区分度。考试难度系数得到显著降低(考试难度提高);区分度系数显著降低(区分度效果降低),尽管区分度降低,但这是考试难度增加、相同成绩水平考生人数更加密集所带来的必然结果,且新标准下的区分度更稳定,有利于考试的公平性,能够证明新标准对于考试难度区分度有改善作用。
2.5 新标准下分数增长态势
依据新标准(方程三、方程四)对原始成绩进行分数换算,用Geogebra对分数进行作图,得出新标准下原始成绩与分数对应图,结果如图6和图7所示。横轴为原始成绩(米),纵轴为百分制分数(分)。
图6 新标准下成绩分数对应图(男)
图7 新标准成绩分数对应图(女)
新标准下,男女原始成绩与分数的曲线斜率是逐渐增加的,即原始成绩每增加一个单位距离,其对应增加的分数逐渐增多。符合体育运动测试的客观规律,说明新标准合理。
3 结 语
(1)旧标准下,掷实心球项目的满分人数多;男女分数存在显著差异(P<0.05);考试难度低,区分度不佳;旧标准记分方式为等距记分,相同分数段内的原始成绩高者与原始成绩低者得分相同,未能体现“运动成绩越高,所获分数越高”的记分原则,不利于体育人才的选拔。
(2)新标准下,掷实心球项目满分人数显著减少;男女分数不存在显著差异(P>0.05);考试难度增加;新标准采取累进记分,符合体育运动记分原则,保证了评分标准的科学合理性,有利于体育人才选拔。
4 不 足
新标准采用累进记分方程,满分点取`X+2.5S,及格点取`X﹣1.5S,计算出来的分数相较于旧标准下的分数有着显著的改善效果(表现在满分人数、高分段考生数量显著减少)。但对于考试的区分度,新标准仍然不能够做到显著改善(表现在原始成绩差距小的考生,其对应分数几乎相同)。造成这一现象的主要原因在于考生原始成绩分布密集,导致换算出的分数相差无几,进而导致区分度的效果低。由此提出疑问,累进记分方式下,如何对密集分布的原始成绩进行有效的区分及换算?有无比累进记分更优的记分模型?这两点仍然需要探索。
[1] 王树宏,谷晨旭. 全国体育高考统考模式改革的回顾与前瞻[J]. 体育学刊,2018,25(06):90~95.
[2] 陈伟忠,胡中锋. 体育进高考的路径选择[J]. 体育学刊,2018,25(03):122~125.
[3] 李 强,梁建平. 将体育纳入高考的必要性与可行性研究[J]. 北京体育大学学报,2012,19(06):85~89.
[4] 王金玲,宋尽贤. 将体育纳入高考评价体系的必要性[J]. 体育学刊,2012,26(03):100~102.
[5] 徐大成. 高中体育与健康课程的“非应试之苦”——体育纳入高考势在必行[J]. 山东体育学院学报,2013,22(05):114~118.
[6] 王树宏. 我国高校体育专业招生考试制度研究进展[J]. 成都体育学院学报,2009,35(10):78~81.
[7] 王树宏,谷晨旭. 全国体育高考统考模式改革的回顾与前瞻[J]. 体育学刊,2018,25(06):90~95.
[8] 覃朝玲,夏思永,郭立亚,等. 重庆市高校体育专业招生术科测试成绩透析[J]. 西南师范大学学报(自然科学版),2007,32(05):142~145.
[9] 邵民和,王 健,杨晓爱. 普通高校体育教育专业招生体育测试项目设置思考[J]. 天津体育学院学报,1998,00(01):67~71.
[10] 付戈弋. 体育高考身体素质成绩分析[J]. 体育学刊,2000,44(02):102~104.
[11] 苗爱芹,党立英. 对山东省体育高考几个问题的思考[J]. 山东体育学院学报,2000,16(02):74~75.
[12] 王路德. 体育统计方法及程序[M]. 人民体育出版社,1990.
[13] 丛湖平. 体育统计方法[M]. 2001.
[14] 马忆南,张 莉. 体育统计中累进记分方程的D值合理选位探讨[J]. 中国科技信息,2013,111(06):173~173.
[15] 孙庆祝,郝文亭,洪 峰. 体育测量与评价(第2版)[M]. 高等教育出版社,2011.
[16] 曾凡波,覃朝玲,陈 丽. 体育高考评分标准研究——修正体育高考立定跳远项目评分标准[J]. 西南师范大学学报:自然科学版,2010,35(03):132~137.
[17] 陈 丽,覃朝玲,曾凡波,等. 体育高考评分标准研究——修正体育高考5米3向折返跑项目评分标准[J]. 西南师范大学学报:自然科学版,2010,41(01):186~191.
[18] 杨文勋,姜达维. 体育院系招生身体素质考试项目的设计和评分标准数学模型的初探[J]. 体育科学,1983,02(03):16~25.
[19] 沈巧儿,李建设. 我国高校体育专业招生考试项目设置与评价标准的综述[J]. 北京体育大学学报,2001,35(04):525~527.
[20] 陈 明,姜晓珍,奇哪日图,等. 铅球技术考试标准的探讨[J]. 首都体育学院学报2003,34(04):101~103.
An Application Research of Progressive Scoring in the Sports College Entrance Examination Criteria
WANG Feng1, GUO Mengxian2, TAN Chaoling3
1.Chongqing Business Vocational of College, Chongqing, 401331, China;2.Tongnan Reclining Buddha Junior High School, Chongqing, 402682, China;3.School of Physical Education, Southwest University, Chongqing, 400715, China.
The college entrance examination for physical education is an important part of the college entrance examination. Through the analysis of the scores of the practical ball in the physical education college entrance examination in chongqing from 2013 to 2018, the deficiencies of the current scoring standards were found, which were as follows: (1) there were too many full marks (22.5% for boys and 30.76% for girls); (2) The scores of men and women were significantly different (P < 0.05); (3) examination difficulty and distinction is low; (4) the old standard scoring method is equal distance scoring, failed to reflect “the higher the sports score, the higher the score” scoring principle. In order to make up for the deficiency of the old standard, the new standard is obtained by using the progressive scoring model. (1) the number of students with full marks decreased significantly (0.13% for boys and 1.29% for girls); (2) There was no significant difference between male and female scores (P >.05); (3) examination difficulty and distinction improved; (4) Under the new standard, the higher the sports score, the higher the score, in line with the sports score principle. The new standards can make up for the shortcomings of the old standards, but also in line with the sports scoring principle. It is of great significance to realize fair and fair scoring standards of solid ball and scientific and reasonable selection of sports talents.
Chongqing; Sports college entrance examination; Solid ball; Grading criteria; Progressive score
1007―6891(2021)04―0127―06
10.13932/j.cnki.sctykx.2021.04.28
G80-32
A
2019-12-16
2020-02-24