美国青少年体质健康评价系统及其启示
2014-11-16许明思谢叶寿
许明思,谢叶寿
(1.安徽工程大学 体育学院,安徽 芜湖 241000;2.南京师范大学 体育学院,南京 210097)
青少年兴则国家兴,青少年强则国家强。人类发展文明史表明,任何一个国家或民族都会把青少年一代体质健康问题放在极为重要的位置来考虑。党的十八届三中全会《决定》强调要“强化体育课和课外锻炼,促进青少年身心健康、体魄强健”,这是继《中共中央国务院关于加强青少年体育增强青少年体质的意见》(中发[2007]7号)颁布以来,我国政府对青少年体育工作提出的重要而明确的要求,这必将对我国学校体育工作产生深远的影响。
2010年第六次全国学生体质健康监测表明,我国青少年学生的耐力、力量、速度等体能指标持续下降,视力不良检出率居高不下,超重和肥胖青少年的比例明显增加。如何把《决定》中提出的要求落实在具体工作上,是每个体育工作者需要思考的问题。他山之石,可以攻玉,20世纪50年代的美国社会也遇到过同样的问题,而美国青少年体质健康的评价系统无论理论上还是实践上都可以为我国学生体质健康测试工作提供有益的启示与借鉴。
1 青少年体能、体力活动与健康的关系
青少年肥胖问题已经成为当前全球性的公共卫生问题。统计数据表明,美国2—19岁青少年儿童中约有31.7% 存在体重超重或肥胖问题[1]。美国疾病控制与预防中心在1976—1980年和2007—2008年期间两次对美国人的健康状况做了调查,发现成人的肥胖率上升到原来的两倍(由15%增加到34%),而儿童青少年的肥胖率增加到原来的三倍多(由5%增加到17%)[2]。成人肥胖者发生多种疾病的可能性极大,包括Ⅱ型糖尿病、前列腺癌、睡眠呼吸暂停综合征、下肢浮肿、腰腿关节疼痛及骨质疏松等[3]。那些超重及肥胖的儿童成年后同样延续肥胖,有调查显示,6—8 岁的肥胖儿童成年后延续肥胖的可能性比那些孩提时体重正常的同龄人高出10 倍[4]。除增加了易发生某种疾病的风险,肥胖儿童往往还患有心理方面的疾病,严重影响到他们的生活质 量[5]。Rebekah M 等人[6]认为体力活动不足(Insufficient Physical Activity)是导致儿童青少年肥胖的因素之一。根据《美国人体力活动指南》(Physical Activity Guidelines for Americans)的要求,儿童与青少年每天应该参加不少于60分钟的体力活动。而美国高中阶段的学生中,只有43.7%的男生和25.6%的女生能做到每周5天、每天至少一个小时的体力活动。
“Physical Activity”译为体力活动或身体活动,指任何由骨骼肌收缩而引起的导致能量消耗的身体行为,包括体育锻炼、职业性的、家务性的日常活动和休闲娱乐活动。而“Physical Fitness”译为体能或体适能,指人体从事体力活动的相关能力,是评价个人健康状况的重要综合指标,包括与健康相关的(health-related)和与技能相关的(skillor performance-related)参数指标,目前,国际上对体能的认识逐渐趋于一致,即重视与健康相关的指标(如心肺功能、肌肉力量与耐力、身体成分和柔韧性),而与技能相关的指标在体能测试中已被取消[7]。身体活动和体能相互制约,两者都受到遗传、生活方式及环境等因素的影响,Blair(2001)等人[8]认为,体力活动和体能各自独立地影响人的健康水平,也就是说“即便一个人体能很好,也要通过积极的身体活动保持健康;而对于那些体能较差的人,也可以通过身体活动获得健康。”关于体力活动和体能在人的整个生命周期里如何影响健康,Morrow 和Ede基于前人的研究成果,建立了一个体力活动、体能与健康相互联系的模型框架(图1)[9],图中的实线表明了两者之间的关联已经被大量文献证实,而虚线表明两者间的关联缺乏相关支撑资料。
图1 体力活动、体能与健康之间的相互关系
2 美国青少年体质健康测试评价系统的历史演进
美国社会组织对青少年体质健康的关注可追溯到1885年,这一年美国健康、体育、休闲与舞蹈协会(American Alliance for Health,Physical Education,Recreation and Dance以下简称AAHPER/AAHPERD)成立。而美国政府对青少年体质健康的重视源于两篇学术文章,1953年12月,医学博士汉斯·克劳斯和邦妮·普鲁登在其论文《肌肉力量与健康》(Muscular Fitness and Health)中指出:“20世纪富足的生活方式使美国人生活变得方便的同时,也让成人和儿童的力量素质快速下降。”之后,克劳斯又与苏妮亚·韦伯博士合作开发了一套针对肌肉力量测试的“克劳斯—韦伯体测项目”(Kraus-Weber Tests),其研究结果发表在《纽约州医学杂志》(New York State Journal of Medicine)上。该研究在全美公立学校中抽取4 400名年龄在6—16岁的学生与3 000名来自瑞士、意大利和奥地利的同龄人进行对比研究,在四个项目(直腿上举、仰卧起坐、俯身两头起和触足卷体)的测试中,56%的美国学生至少有一项测试不及格,而欧洲学生不及格的比例仅为8%。克劳斯博士把该结果归因于美国青少年的生活方式。克劳斯等人的研究结果震惊了美国社会,并得到了白宫的关注和回应,1956年7月,时任总统艾森豪威尔成立了“青少年体质总统委员会”(President’s Council on Youth Fitness,PCYF,后来叫做President’s Council on Physical Fitness,PCPF,现在被称为President’s Council on Physical Fitness and Sports,PCPFS),旨 在教育、促进和鼓励美国青少年采取积极的生活方式以应对体质下降问题。
1958年,AAHPER 的研究委员会推出“青少年体质测试系统”(Youth Fitness Tests,以下简称YFT),并依据全美5—12年级学生的体测数据发布了全国统一的测试标准手册,项目包括:引体向上(男)/修改后的引体向上(女)、直腿仰卧起坐、往返跑、立定跳远、50码加速跑、垒球掷远、600 码跑(走)以及三种备选的水上运动项目。1966年,时任美国总统约翰逊根据该测试项目(AAHPER’s YFT)设立了“总统奖励计划”(Presidential Award Program),即奖励那些所有体测项目得分均在85%分位的10—17岁的学生。20世纪70年代,AAHPER’s YFT 的测试项目、理念及奖励计划越来越引起体育工作者和相关研究人员的不满,因此AAHPER 下属的评估委员会和体质委员会成立了一个联合工作组,着手修改YFT 的测试项目,具体为:将德克萨斯州体质—运动能力测试系统(Texas Physical Fitness-Motor Ability Test)中的长距离跑项目作为备选测试项目,将加利福尼亚1分钟屈膝仰卧起坐替换原先的直腿仰卧起坐,并删掉了垒球掷远项目,随后发布了新的YFT测试手册。1975年,由于对体质概念认识的不断深入,AAHPER 将测试目标由重视运动技能转向重视身体功能与健康,并开始对YFT 进行大的修改,最终确立的测试指标包括心肺功能、身体成分,腹部与下腰部—腘绳肌功能。1980年,AAHPERD 的“健康相关体能测试系统”(Health Related Fitness Test,以下简称HRPFT)正式推出,并作为今后主要的测试系统。1988年,AAHPERD 的最佳体质计划(Physical Best,PB)替代了之前的YFT 与HRPFT。由于评价方法的不同,1985年,总统体质与运动委员会(President’s Council on Physical Fitness and Sports,PCPFS)在全美实施了“全国学生体质调查”(School Population Fitness Survey)后,并推出了青少年体质测试与奖励计划,测试项目包括:引体向上(男)、曲臂悬垂(女)、仰卧起坐、1英里跑、往返跑及坐位体前屈。在此之前,尽管PCPFS决定着总统奖励计划的实施标准,但PCPFS仍把青少年的测试项目和奖励计划分配的决定权交由AAHPER 负责,而现在政策发生了改变。
1985年,AAHPERD 和PCPFS组建了联合工作组,试图提出一个能让AAHPERD、PCPFS和库珀有氧运动研究中心(Cooper Institute for Aerobics Research,CIAR)三方都认可的、折中的体质测试解决方案,但该方案需要设计两套计算程序,一种为AAHPERD 的标准参照评价系统,一种为PCPFS的常模参照评价系统。而CIAR 认为重新设计两套计算机程序是不现实的,于是,查尔斯·斯特林(德克萨斯州体质健康—运动能力测试创始人于1981年加入库珀有氧运动研究中心)等人采用由1 英里跑、修改的仰卧起坐、坐位体前屈、引体向上/曲臂悬垂、身体成分以及往返跑(备选项目)组成的体测项目,开发出了FITNESSGRAM。总之,由于AAHPERD、PCPFS 与CIAR 三方在体质测试的理念与评价标准上存在差异,20世纪80年代之前,美国社会没有形成统一的青少年体质测试系统。直到2012年9月,由美国健康、体育、休闲与舞蹈协会(American Alliance for Health,Physical Education,Recreation and Dance,AAHPERD)、美国业余运动员协会(Amateur Athletic Union,AAU)、美国疾病控制与预防中心(The Centers for Disease Control and Prevention,CDC)、美国体能运动与营养总统委员会(The President’s Council on Fitness,Sports & Nutrition)、库珀研究院(Cooper Institute)以及美国人体运动出版社(Human Kinetics)共同合作,推出了“总统青少年体能计划”(President’s Youth Fitness Program)。
表1 美国三种不同的青少年体质测试系统[10]
3 几种不同的评价方式在青少年体质健康测试中的应用
3.1 常模参照评价
所谓常模参照评价(Normative-Referenced Standards)是将被评价者的水平与常模相比较,以考察其在团体中的相对位置为目的的评价[11]。其原理是利用全国或地区性的大样本参照人群进行测试,按年龄、性别分别制定出各群组的百分位数表,作为评价该组群的常模,然后将个体得分与这些常模相比较,由所处的相对位置来评价个体的高低。美国总统体质与运动委员会的总统挑战计划就是按照常模参照评价的(2012年总统青少年体能计划推出,该测试计划采用了FITNESSGRAM 评价系统,因而评价方式也由常模参照评价改为标准参照评价),即要求学生所有的体质测试项目得分均在85%分位以上(如果一个同学的体能评定得分的百分位等级是85,则说明这位同学体质测试得分比占总人数的85%的学生要高)才有资格获得总统体质奖励,而得分在50%分位的同学可以获得国家体质奖励[12]。我国的《国家学生体质健康标准》也是采用百分位数区分学生体质健康水平等级的。
百分等级常模参照就是基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。常模参照评价直观、容易理解、便于解释,在许多能力及学业考试中得到广泛的应用,但也存在一些局限性,百分位等级评价只能描述群组中个体的差异及相对位置,无法了解和确定个体在测试内容上掌握的绝对水平,无法明确个体达到什么样的程度为适宜水平[13]。
3.2 标准参照评价
表2 FITNESSGRAM 评价有氧能力(最大摄氧量)的划分标准 ml/kg/min
1962年,学者Glaser首次提出标准参照评价(Criterion-Referenced Standards),“它是依据事先明确规定的知识能力标准而制定,并据此标准可以对被测试者的成绩做出解释的一类测验”。该评价是判断参加测试的学生是否具有某项能力、掌握某种知识的测试,判断标准是学生是否已经达到预先设置的划界分数(cut-off score)。根据划界分数,可以把标准参照评价的成绩分为“掌握—未掌握”或“合格—不合格”。因此,划界分数或者说合格线的确立,是标准参照评价编制中的核心与关键。目前国际上通用的划界分数确立方法是基于考试内容的“专家判断法”,它是学科专家对最低能力表现(处于及格分数边缘)的学生正确回答某道题目的概率的判断,并以此估计学生对知识、技能的掌握程度[14]。
1987年,FITNESSGRAM 评价系统采用了标准参照评价[15],并基于经验判断、实证分析和专家判断法确立了划界分数。学生体质测试得分在划界分数之上被归类为可接受的,而不记录也不公布那些得分在划界分数之下的学生成绩。1992年,健康体能区域(heathy finess zones,HFZ)替代了单一的划界分数。2013年,评价有氧能力的标准划为三类(表2),分别为“健康体能区(HFZ)”“需提高(Needs Improvement,NI)”以及“需提高—健康风险(Needs Improvement-Health Risk)”。
3.3 基于个人进步的评价
基于个人进步的评价(Improvement in Performance)是根据同一个人在两次体质测试中的得分情况进行判断的,该方法是一种个体化的评价方式,主要评价学生的体质所获得分进步幅度和努力程度。然而在实际操作中,研究者不能确保测试程序或方法的准确性,即测量的效度问题。由于测试人员的要求不同、测试仪器的不同、测试当天的环境因素、学生个人因素等等,很难通过两次测试中学生成绩的提高(或降低)来评价学生。
4 借鉴与启示
目前我国《国家学生体质健康标准》(2007 版)的测试项目中有许多反映学生运动能力的技能指标,如投沙包、踢毽子、掷实心球、篮球运球等等,因此在测试指标的选择上应该更注重学生与健康相关的体能指标。此外,《国家学生体质健康标准》中使用“身高标准体重”来反映学生超重、肥胖和营养不良,而国际学术界已公认把“体重指数”(Body Mass Index,BMI)作为筛查儿童青少年肥胖的首选指标,因此在评价学生体型特征时,应与国际青少年体型评价标准接轨,选择体重指数(BMI)替代身高标准体重。
在评价方式上,尽管常模参照评价有很多优点,比如学生的测试成绩具有可比性,即学生可以与所在的群体中其他同学进行比较。我国的《国家学生体质健康标准》(2007版)即采用百分位数法把学生的体质健康水平分为优秀、良好、及格和不及格四个等级。但是,由于学生的体质测试成绩往往与其评奖评优相关,而且体测成绩不及格者按肄业处理,在这样的评价体系下,学生为了取得理想的成绩往往不择手段,如前段时间就有媒体报道,某高校有同学花钱找人代跑800米。而过分关注在集体中的位置排名,对于那些身体素质差的同学容易产生挫败感。因此,建议在青少年体质测试中,采用标准参照评价来替代常模参照评价。
[1]Ogden C L,Carroll M,Curtin L,et al.Prevalence of high body mass index in US children and adolescents,2007-2008[J].Journal of American Medical Association,2010,303(3):242-249.
[2]Ogden C L,Flegal K M,Carroll M D,et al.Prevalence and trends in overweight among US children and adolescents,1999-2000[J].Journal of the American Medical Association,2002,288(14):1728-1732.
[3]Expert Panel on the Identification,Evaluation,and Treatment of Overweight in Adults.Clinical guidelines on the identification,evaluation,and treatment of overweight and obesity in adults:executive summary[J].The American Journal of Clinical Nutrition,1998,68(4),899-917.
[4]Freedman D S,Khan L K,Serdula M K,et al.The re-lation of childhood BMI to adult adiposity:the Bogalusa Heart Study[J].Pediatrics,2005,115(1):22-27.
[5]Schwimmer J B,Burwinkle T M,Varni J W.Health-Related Quality of Life of Severely Obese Children and Adolescents[J].Journal of the American Medical Association,2003,289(14):1813-1819.
[6]Steele R,Brage S,Corder K,et al.Physical activity,cardiorespiratory fitness,and the metabolic syndrome in youth[J].J.Appl.Phyiol,2008,105(1):342-351.
[7]李强,何江川.体质研究有关概念辨析及健康促进应用谈论[J].河北体育学院学报,2010,24(2):76-79.
[8]Blair S N,Cheng Y,Holder J S.Is physical activity or physical fitness more important in defining health benefits?[J].Medicine and Science in Sports and Exercise,2001,33(S6):379-399.
[9]Morrow J R,Ede A.Statewide physical fitness testing:a big waist or a big waste?[J].Research Quarterly for Exercise and Sport,2009,80(4):696-701.
[10]李红娟,王正珍,罗曦娟.美国青少年体质测定系统的演进[J].北京体育大学学报,2013(10):51-58.
[11]戴海崎,张峰,陈雪枫.心理与教育测量[M].广州:暨南大学出版社,1999.
[12]Plowman S A,Sterling C L,Corbin C B,et al.The History of Fitnessgram[J].Journal of Physical Activity and Health,2006,3(S2):5-20.
[13]Hartman J G,Looney M A.Norm-referenced and criterion-referenced reliability and validity of the backsaver sit-and-reach[J].Measurement in Physical Education and Exercise Science,2003(7):71-87.
[14]陈梦竹,张敏强.Bookmark法设置划界分数的研究述评[J].心理科学进展,2009,17(5):1102-1108.
[15]Looney M A,Gilbert J.Validity of alternative cut-off scores for the back-saver sit and reach test[J].Meas-urement in Physical Education and Exercise Science,2012(16):268-283.